В поисках утраченного автора
Математически доказано, что «Тихий Дон» написал один человек
К 115-летию Михаила Шолохова (оно отмечалось в конце мая) отечественные исследователи подтвердили: «Донские рассказы» и роман-эпопею «Тихий Дон» написал один человек. О том, можно ли ставить точку в споре о происхождении одного из лучших романов о Гражданской войне, а также о том, каким образом исследователи с математической точностью распознают автора через его произведение, «Огоньку» рассказал доцент Школы лингвистики НИУ ВШЭ Борис Орехов.
Давний спор о принадлежности Михаилу Шолохову эпопеи «Тихий Дон» — один из самых детективных кейсов отечественной литературы
Фото: Виктор Темин / Фотоархив журнала «Огонёк»
Одной из наиболее проверенных методик в этой области сегодня считается Delta — изобретение специалиста по компьютерной лингвистике Джона Бёрроуза (Университет Ньюкасла, Австралия).
Этот компьютерный алгоритм позволяет выявить личность автора, замеряя наиболее частотные слова в текстах, иногда даже не схожих по теме, и тем самым распознавая в стиле неповторимый рисунок, свойственный тому или иному писателю.
После 20 лет применения на Западе (азиатские языки — предмет отдельного разговора) к Delta обратились и отечественные исследователи.
Delta бессознательного
Когда в 2013 году несколько британских издательств получили для ознакомления рукопись под названием «Зов кукушки» от некоего Роберта Гэлбрейта, бывшего члена отдела спецрасследований Королевской военной полиции, на нее мало кто обратил внимание. Через некоторое время в романе, уже опубликованном и оцененном большинством критиков как слишком «тихий» для успешного детектива, разглядели приметы очень легко узнаваемой саги о Гарри Поттере. Ясность в споре между издателями, медиа и читателями внес лингвист Питер Милликан. При помощи метода Бёрроуза он сопоставил текст, без всяких сомнений принадлежащий Роулинг, с детективом, авторство которого на тот момент было под вопросом,— программа безошибочно распознала перо создательницы Гарри Поттера, несмотря на псевдоним автора с военным прошлым. Через некоторое время свое авторство признала и сама Роулинг, издатели назвали этот литературный обман виртуозным, а количественным методом атрибуции заинтересовалась широкая публика. Тема, можно сказать, стала модной.
Математическая статистика раскрыла еще одну загадку, скрытую в черновиках «Тихого Дона»: установлено, что все четыре тома написаны одним автором
Фото: Wikipedia
Впрочем, сам изобретатель Джон Бёрроуз за сенсациями, похоже, не гнался: свой метод он использовал впервые на произведении, не вызывающем вопросов, чтобы подтвердить гипотезу, а не раскрыть очередную литературоведческую загадку.
— Бёрроуз разработал эту методику в начале 2000-х годов,— пояснил «Огоньку» Борис Орехов, кандидат филологических наук и доцент Школы лингвистики НИУ ВШЭ.— Причем он не пытался решить какую-то конкретную текстологическую проблему, то есть не хотел выяснить, кто написал какое-то произведение. Он пытался создать некий универсальный метод, который работал бы всегда, независимо от того, что занимает исследователя в конкретный момент. Обычно же все происходит наоборот: нам хочется решить проблему «Тихого Дона», Шекспира, и именно ради решения этой проблемы мы начинаем что-нибудь такое количественное придумывать. А Бёрроуз проверил работоспособность своего метода на произведении, о котором все всё знают,— это был «Потерянный рай» Джона Мильтона. То есть поставил эксперимент, в котором не было неизвестных переменных. И Delta показала, что по количественным показателям это произведение действительно больше всего похоже на то, что написал Джон Мильтон.
Важное условие, соблюдения которого требует методика, связано с объемом текста — он должен быть достаточно большим (5 тысяч слов, еще лучше — 10 тысяч), чтобы в нем могла проявить себя личность автора. Подсчитываются только служебные части речи (они наиболее часто встречаются в любом тексте), а не те, которые задают тему текста,— существительные, глаголы. По частотности их употребления, которая подсчитывается по определенной схеме, и определяется стиль. Интересно, подчеркивает исследователь, что стиль — это автономная система, которая сохраняется порой независимо даже от потрясений в личной жизни человека.
— Автор не может сопротивляться своей сущности, если он пишет что-то достаточно длинное,— объясняет «Огоньку» Борис Орехов.— А если мы имеем дело с коротким текстом, то статистические факторы не успеют прийти в соответствие с авторской волей. Хотя авторская воля не совсем правильный термин, потому как воля — это что-то сознательное, что автор контролирует, что он хочет вложить в свой текст. Особенность же Delta и других статистических методов в том, что они пытаются работать с тем, что автор не контролирует. Почему? Потому что, когда ты что-то контролируешь, ты можешь это подделать.
Вычислить Шолохова
После того как в течение 20 лет исследователи не раз убеждались, что метод работает не только на литературном материале, написанном на английском, но и на арабском, немецком, польском и других языках, к нему обратились и российские специалисты. Для начала — чтобы проверить его убедительность и надежность на произведениях, авторство которых не вызывает вопросов (впервые на русском языке о Delta написали лингвисты Даниил Скоринкин и Анастасия Бонч-Осмоловская). А затем — чтобы применить его для решения одной из самых сложных и болезненных дилемм отечественной литературы ХХ века, связанной с установлением авторства романа «Тихий Дон». Вызванные молодостью автора (первый том эпопеи был опубликован, когда Михаилу Шолохову было чуть больше 20 лет) и признаками двойного авторства (их выявили уже в 1970-е годы), сомнения в отношении авторства делали «Тихий Дон» кейсом крайне привлекательным для тестирования метода Бёрроуза.
Не вдаваясь в детали полемики об авторстве, напомню. Вскоре после выхода «Тихого Дона» возникли слухи о том, что настоящим автором эпопеи могут быть участник Белого движения, донской писатель и казак Федор Крюков, и Александр Серафимович, автор книги «Железный поток», и журналист Виктор Севский, собственными глазами видевший войну на Дону.
— Главное — поместить работы Шолохова в правильный контекст,— отмечает исследователь.— Нужно было взять тексты, современные Шолохову и написанные в Советской России, ведь одновременно с ним существовала литературная эмиграция, но она говорила на другом литературном языке. К тому же важно брать тексты жанрово однородные. Например, есть ведь мнение, что какие-то части «Тихого Дона» написал Николай Степанович Гумилев, но проверить это с помощью Delta невозможно, потому что от Гумилева до нас не дошло других образцов художественной прозы.
Исследование, проведенное Борисом Ореховым из ВШЭ и Натальей Великановой из МГУ, доказало крайнюю чувствительность математического метода к такому сложному явлению, как авторский стиль, способный меняться на протяжении жизни писателя.
— Я бы не сказал, что Delta показала — «Тихий Дон» написал Шолохов,— подчеркивает Орехов.— Она показала, что «Тихий Дон» написан одним человеком, а это не очевидно: например, гипотеза, связанная с Федором Крюковым, предполагает, что первые тома написал кто-то один, а над последующими трудился кто-то другой. Второе — Delta показала, что «Тихий Дон» написан тем же человеком, который написал «Донские рассказы». И если мы считаем, что это Шолохов, тогда да, и «Тихий Дон» тоже его роман. Но есть, к слову, и такие люди, которые считают, что Шолохов вообще ничего не писал. И вот с такими людьми уже с помощью Delta спорить невозможно.
Среди великого множества количественных методов, активно развивающихся даже не в последнее 20-летие, а примерно с середины XIX столетия, специалисты затрудняются назвать более убедительный и устойчивый в отношении определения авторства, чем метод Бёрроуза. Что касается русскоязычного мира, то применение этого метода постепенно выходит за рамки художественных текстов и может быть столь же эффективным в области современных медиа.
— К примеру, есть несколько сложных случаев каких-то резонансных журналистских текстов, которые были опубликованы под псевдонимами,— добавил исследователь.— Вот буквально недавно под моим руководством на отличную оценку была защищена выпускная квалификационная работа, в которой студентка как раз с помощью Delta определила, кто именно написал несколько текстов, которые прозвучали в журналистском сообществе.