Генетики и лингвисты проследили, как складывался генофонд балто-славянских народов
лингвистика и генетика
В сентябре 2015 года в журнале PLOS ONE были опубликованы результаты многолетнего исследования генофонда славянских и балтских народов. Коллективу российских и зарубежных генетиков удалось проследить, как генофонд славян впитывал местные популяции при расселении по Европе: именно этот глубинный субстрат лежит в основе генетических различий восточных, западных и южных славян. Лингвисты же построили уточненное дерево балто-славянских языков. Исследователи нашли высокую корреляцию генетического разнообразия с лингвистическим, но еще большую — с географическим соседством популяций.
Кто такие славяне? На этот счет в разных кругах общества существуют разные мнения, но между учеными разногласий нет: славяне — это народы, говорящие на славянских языках. Ближайшие родственники славян по языку — балтские народы, они куда ближе к нам, чем германоязычные, романоязычные и другие народы нашей индоевропейской семьи. Балтийские и славянские языки объединяют в одну группу, и именно носители этих языков — балто-славянские народы — стали объектом большого междисциплинарного исследования, проведенного под руководством одного из авторов этой статьи — Олега Балановского и академика Рихарда Виллемса (Эстонский биоцентр и Тартусский университет). В работе участвовали исследователи из многих стран, в которых славянские и балтские народы составляют большинство населения: России, Украины, Белоруссии, Литвы, Хорватии, Боснии и Герцеговины, а также ученые Эстонии, Великобритании и консорциум международного проекта Genographic.
Что такое гаплогруппа
На балто-славянских языках говорит примерно треть современных европейцев, а по площади балтские и славянские народы занимают около половины Европы. По оценкам лингвистов, общий корень этих языков — прото-балто-славянский язык — отделился от других индоевропейских языков в интервале от 7000 до 4500 лет назад. Примерно 3500-2500 лет назад балтская и славянская языковая ветви разошлись, а славянская ветвь, в свою очередь, разделилась на восточные, западные и южные славянские языки. В раннем средневековье — примерно 1400-1000 лет назад — славянские языки быстро распространились по огромным европейским территориям: происходила так называемая славянизация Европы. Славяне приходили туда, где проживали другие популяции: в Восточной Европе — балтские, финно-угорские и тюркские, в Центральной Европе — носители германских языков, на Балканах — местные разноязыкие популяции. Как взаимодействовали эти народы и как в результате сформировался генофонд современных славян, стало главным вопросом исследования.
Генофонд славян в трех зеркалах
Авторы изучили практически все современные народы, говорящие на языках балто-славянской группы, — всего шестнадцать. Это балтские народы — латыши и литовцы; восточные славяне — белорусы, русские, украинцы; западные славяне — кашубы, поляки, словаки, сорбы, чехи; южные славяне — болгары, боснийцы, македонцы, сербы, словенцы, хорваты. Их генофонд изучили по трем разным системам генетических маркеров: 1) Y-хромосома (отцовские линии наследования), 2) митохондриальная ДНК (мтДНК) (материнские линии наследования), 3) маркеры на остальных хромосомах — аутосомах; поскольку они распределены по всему геному, их называют широкогеномными, или полногеномными, или аутосомными. Каждый народ был представлен не одной, а несколькими региональными популяциями, так что общее количество исследуемых популяций достигает 62.
Генетические соотношения друг с другом всех изученных народов, установленные в результате исследования, показаны на рисунке 02 .
Как видно и по широкогеномным маркерам, и по Y-хромосоме [рис. - 01А - 01 В], большинство балто-славянских популяций выстраиваются вдоль оси север-юг. Восточные славяне — русские, белорусы и украинцы — образуют четко выраженную группу; внутри нее они друг с другом соприкасаются, но почти не перекрываются. Исключение составляют северные русские, которые генетически отдалены от остальных восточных славян и тяготеют к соседним финно-угорским популяциям. Из западных славян поляки наиболее близки к восточным славянам, а чехи и, в меньшей степени, словаки смещены в сторону немцев и других западноевропейских популяций. Южные славяне образуют дисперсную группу, которая поделена на западный (словенцы, хорваты и боснийцы) и восточный (македонцы и болгары) регионы с сербами посередине. При этом словенцы генетически близки к венграм (географически близкий, но не славянский народ), а восточная ветвь южных славян группируется с неславянскими, но географически близкими румынами и до некоторой степени с греками. Балтские народы — латыши и литовцы — обнаруживают генетическую близость к эстонцам, говорящим на языке финно-угорской группы, и к некоторым восточным славянам (белорусам).
Результаты по митохондриальной ДНК выражены не так четко, как по двум другим системам, но указывают на ту же тенденцию.
Как искали общих предков в геноме
Для сравнения генофондов разных популяций в арсенале генетиков есть метод Admixture ("смешение", или "состав"). С его помощью можно проанализировать сотни тысяч генетических маркеров во множестве популяций и вычленить небольшое число базовых генетических компонентов. В результате каждая популяция оказывается составленной изо всех этих компонентов, но в разных пропорциях. А поскольку каждый компонент преобладает в каком-то одном регионе мира, то доля этого компонента в других популяциях покажет степень их родства с населением этого региона и друг с другом. В данной работе этот метод выдал картину, представленную на рис. 2.
Как видно, у балто-славянских популяций почти весь спектр представлен двумя цветами: синим (предковый компонент k3) и голубым (предковый компонент k2), хотя и в разных пропорциях. Во все европейские популяции большой вклад вносит k3 (синий), а k2 (голубой) более характерен для популяций Средиземноморья, в том числе для южных славян, тогда как у западных и восточных славян его заметно меньше. Зато у восточных славян есть еще немного желтого цвета, это компонент k5, который больше выражен у северных русских. По происхождению этот компонент сибирский, поскольку, как видно на графике, он составляет основную часть спектра для популяций Сибири.
Еще один метод, которые используют генетики, это IBD-анализ (identical by descent — "идентичные по происхождению"). У людей из разных популяций оценивают число фрагментов генома, полученных ими от общих предков. Если таких фрагментов оказывается много, значит, популяции находятся между собой в довольно близком родстве. Этим методом сравнили западных и восточных славян (объединив их в одну группу "западно-восточных", поскольку уже доказали их сходство) с южными славянами и с окружающими их народами. Оказалось, что больше всего общих фрагментов генома западные и восточные славяне имеют с популяциями Северо-Восточной Европы (литовцы, латыши, эстонцы, карелы, вепсы, северные русские), несколько меньше — с южными славянами, а также неславянскими народами Балкан (венграми, румынами и гагаузами) и меньше всего — с народами Поволжья, Западной Европы, Кавказа и с греками. Получается непростая картина. С одной стороны, славянские популяции проявляют явное генетическое сходство между собой, с другой — иногда они проявляют большее сходство с неславянскими популяциями, с которыми живут по соседству.
Локализация славянской прародины
Гены, языки, география
Значительная доля работы в этом исследовании принадлежит лингвистам, которые реконструировали дерево родства балто-славянских языков. Новизна его состоит в том, что они использовали метод лексикостатистики и перепроверили большой массив данных. Лексикостатистика занимается выявлением скорости языковых изменений и определением времени разделения родственных языков и степени родства между ними. Исходным материалом послужили лексические списки (списки Сводеша) 20 современных балто-славянских языков и диалектов. Уточненное дерево представлено на инфографике [--стр. 24].
После разделения балтской и славянской ветвей самая первая развилка на славянской ветви — тройная. Это разделение славян на западную, восточную и южную ветви датируется временем около 1900 лет назад. Дальнейшее разделение славянских языков началось в V-VI веках (около 1300-1500 лет назад): восточная ветвь разделилась на русский и украинский/белорусский, западная ветвь — на чешско/словацкий, протосорбсколужицкий и польский/кашубский, южная ветвь — на сербско-хорватский, болгарский, македонский. Выделение современных языков произошло 1000-500 лет назад. Такая датировка дерева хорошо соответствует историческим и археологическим данным.
К генетическому и лингвистическому измерению для каждой популяции добавили еще одно — географическое положение, — и статистически измерили роли, которые сыграли география и языки в формировании генетического разнообразия балто-славянских народов. География играет двойную роль. С одной стороны, это фактор географического соседства, который сближает генофонды через смешанные браки между соседями. С другой стороны, география может отражать и происхождение, когда родственные народы не уходят далеко друг от друга, а расселяются на соседние территории. Языки — это маркер родства народов, который совпадает с родством генофондов, если гены унаследованы от общих предков вместе с общим языком, или не совпадает, если язык сменили, а генофонд остался почти прежним. В случае славян выявилась очень высокая корреляция между генетикой и географическим положением популяций (0,80-0,95), но также высока связь между генетикой и лингвистикой (0,74-0,78). Такие цифры корреляций редко получаются в подобных исследованиях, и они говорят о действительно тесной связи между генетикой, географией и лингвистикой. Тщательный подход к отбору материала и методов позволил создать очень чистое зеркало, в котором генетика, география и лингвистика отражаются похожими, как братья. География и генетика — почти близнецы, а лингвистика чуть от них отличается.
Генофонд впитывает как губка
Из полученных результатов складывается определенная картина формирования генофонда современных славян, и эта картина объясняет, как возникли различия между разными славянскими ветвями. Популяции, которые славяне ассимилировали, осваивая пространства Европы, составили генетический субстрат, который они впитали в свой генофонд. Этих субстратов было два. Восточноевропейский субстрат приняли в себя западные и восточные славяне (в данных по Y-хромосоме эти популяции несут высокие частоты гаплогруппы R1a). Другой, южноевропейский субстрат, впитали в себя южные славяне (их особенностью являются высокие частоты Y-хромосомной гаплогруппы I2a).
Какие же выводы можно сделать из такого обширного исследования, каков результат синтеза генетики и лингвистики?
Прежде всего тот, что в генофонде славянских популяций преобладает дославянский субстрат из ассимилированных ими популяций: восточноевропейский для западных и восточных славян и южноевропейский для южных славян. Во-вторых, оказалось, что, несмотря на дославянский субстрат, западные и восточные славяне образуют довольно целостную генетическую группу. Возможно, это произошло потому, что основным субстратом могли быть балтские популяции (балтская речь некогда звучала вплоть до Оки), а сами балты, как мы видели, лингвистически и генетически родственны славянам. Объединенная группа современных западных и восточных славян отличается как от своих западных соседей (германоязычных популяций), так и от соседей восточных и северных (финно-угорских народов). Большое сходство с соседями обнаруживается только иногда и только на периферии славянского ареала. Например, чехи генетически похожи на своих немецких соседей на западе (в отличие от поляков и сорбов). Аналогично, северные русские имеют ярко выраженное сходство с финно-угорскими и балтскими популяциями. Вероятно, когда шла волна заселения с Новгородской Руси на Русский Север, переселенцы приносили с собой язык, религию, но ассимилировали финно-угорское и балтское дославянское население, которое жило на этих территориях. Что же касается южных славян, они ассимилировали значительную часть дославянского населения Балкан, которая обладала иным генофондом, чем ассимилированное восточными и западными славянами население Восточно-Европейской равнины. Потому южнославянские популяции и обнаруживают большее сходство с неславянскими популяциями Балкан (румынами и венграми), чем с другими славянскими народами.
Этот процесс ассимиляции местного населения, который обнаружили у славян, — не исключение. То же происходило при распространении по Евразии носителей индоевропейских языков: передавались языки и в очень малой степени — гены. Поэтому языки, распространенные в Европе и в Индии, родственны друг другу, а между генофондами нет почти ничего общего. Сходные процессы происходили и при распространении тюркских языков.
Основа этноса — не генетика, а самосознание
Основатель геногеографии Серебровский сравнивал генофонд с морем и его течениями. Как и в море, нельзя провести четкую границу между пластами генофонда, но можно проследить за течениями, которые несут определенные генетические маркеры. Такими маркерами служат определенные гаплогруппы, но их нельзя отождествлять с конкретными народами, как делают некоторые последователи скандально известного Анатолия Клесова, создателя так называемой ДНК-генеалогии. Мы знаем, что гаплогруппа R1a наиболее часто встречается у восточных и западных славян, так же как гаплогруппа I2a — у южных. Но это не значит, что какую-то одну гаплогруппу можно гордо именовать "славянской" и только по ней судить об исторических миграциях народа. Ведь люди с какой-то одной гаплогруппой никогда не жили сами по себе и любая популяция — что в древности, что сейчас — состоит из носителей разных гаплогрупп, точно так же как она состоит из носителей разных групп крови.
Генетические различия между популяциями не мешают им быть частями одного народа. Потому что этнос — это понятие не генетическое. Главное, что его определяет, это самосознание людей, а оно выражается языком. Поэтому северные и южные русские — это один народ, говорящий на одном языке, а русские и болгары нередко понимают друг друга без переводчика, несмотря на перечисленные выше генетические различия восточных и южных славян.
Рис. 01 Генетическая структура балто-славянских популяций в сравнении с другими народами Европы по трем генетическим системам
01А представляет результаты для широкогеномных SNP-маркеров. Каждая точка — один изученный человек, а цветных кружки обозначают "центр тяжести" облака представителей одного народа.
01В представляет результаты по Y-хромосоме, полученные на основании частот ее гаплогрупп. Каждый кружок обозначает одну из региональных популяций какого-либо народа, а цвет кружков указывает, что это за народ.
01С отражает результаты, полученные по частотам гаплогрупп митохондриальной ДНК (мтДНК). Кружки опять обозначают популяции.