Генетики и лингвисты проследили, как складывался генофонд балто-славянских народов
лингвистика и генетика
В сентябре 2015 года в журнале PLOS ONE были опубликованы результаты многолетнего исследования генофонда славянских и балтских народов. Коллективу российских и зарубежных генетиков удалось проследить, как генофонд славян впитывал местные популяции при расселении по Европе: именно этот глубинный субстрат лежит в основе генетических различий восточных, западных и южных славян. Лингвисты же построили уточненное дерево балто-славянских языков. Исследователи нашли высокую корреляцию генетического разнообразия с лингвистическим, но еще большую — с географическим соседством популяций.
Кто такие славяне? На этот счет в разных кругах общества существуют разные мнения, но между учеными разногласий нет: славяне — это народы, говорящие на славянских языках. Ближайшие родственники славян по языку — балтские народы, они куда ближе к нам, чем германоязычные, романоязычные и другие народы нашей индоевропейской семьи. Балтийские и славянские языки объединяют в одну группу, и именно носители этих языков — балто-славянские народы — стали объектом большого междисциплинарного исследования, проведенного под руководством одного из авторов этой статьи — Олега Балановского и академика Рихарда Виллемса (Эстонский биоцентр и Тартусский университет). В работе участвовали исследователи из многих стран, в которых славянские и балтские народы составляют большинство населения: России, Украины, Белоруссии, Литвы, Хорватии, Боснии и Герцеговины, а также ученые Эстонии, Великобритании и консорциум международного проекта Genographic.
Что такое гаплогруппа
На балто-славянских языках говорит примерно треть современных европейцев, а по площади балтские и славянские народы занимают около половины Европы. По оценкам лингвистов, общий корень этих языков — прото-балто-славянский язык — отделился от других индоевропейских языков в интервале от 7000 до 4500 лет назад. Примерно 3500-2500 лет назад балтская и славянская языковая ветви разошлись, а славянская ветвь, в свою очередь, разделилась на восточные, западные и южные славянские языки. В раннем средневековье — примерно 1400-1000 лет назад — славянские языки быстро распространились по огромным европейским территориям: происходила так называемая славянизация Европы. Славяне приходили туда, где проживали другие популяции: в Восточной Европе — балтские, финно-угорские и тюркские, в Центральной Европе — носители германских языков, на Балканах — местные разноязыкие популяции. Как взаимодействовали эти народы и как в результате сформировался генофонд современных славян, стало главным вопросом исследования.
Генофонд славян в трех зеркалах
Авторы изучили практически все современные народы, говорящие на языках балто-славянской группы, — всего шестнадцать. Это балтские народы — латыши и литовцы; восточные славяне — белорусы, русские, украинцы; западные славяне — кашубы, поляки, словаки, сорбы, чехи; южные славяне — болгары, боснийцы, македонцы, сербы, словенцы, хорваты. Их генофонд изучили по трем разным системам генетических маркеров: 1) Y-хромосома (отцовские линии наследования), 2) митохондриальная ДНК (мтДНК) (материнские линии наследования), 3) маркеры на остальных хромосомах — аутосомах; поскольку они распределены по всему геному, их называют широкогеномными, или полногеномными, или аутосомными. Каждый народ был представлен не одной, а несколькими региональными популяциями, так что общее количество исследуемых популяций достигает 62.
Генетические соотношения друг с другом всех изученных народов, установленные в результате исследования, показаны на рисунке 02 .
Как видно и по широкогеномным маркерам, и по Y-хромосоме [рис. - 01А - 01 В], большинство балто-славянских популяций выстраиваются вдоль оси север-юг. Восточные славяне — русские, белорусы и украинцы — образуют четко выраженную группу; внутри нее они друг с другом соприкасаются, но почти не перекрываются. Исключение составляют северные русские, которые генетически отдалены от остальных восточных славян и тяготеют к соседним финно-угорским популяциям. Из западных славян поляки наиболее близки к восточным славянам, а чехи и, в меньшей степени, словаки смещены в сторону немцев и других западноевропейских популяций. Южные славяне образуют дисперсную группу, которая поделена на западный (словенцы, хорваты и боснийцы) и восточный (македонцы и болгары) регионы с сербами посередине. При этом словенцы генетически близки к венграм (географически близкий, но не славянский народ), а восточная ветвь южных славян группируется с неславянскими, но географически близкими румынами и до некоторой степени с греками. Балтские народы — латыши и литовцы — обнаруживают генетическую близость к эстонцам, говорящим на языке финно-угорской группы, и к некоторым восточным славянам (белорусам).
Результаты по митохондриальной ДНК выражены не так четко, как по двум другим системам, но указывают на ту же тенденцию.
Как искали общих предков в геноме
Для сравнения генофондов разных популяций в арсенале генетиков есть метод Admixture ("смешение", или "состав"). С его помощью можно проанализировать сотни тысяч генетических маркеров во множестве популяций и вычленить небольшое число базовых генетических компонентов. В результате каждая популяция оказывается составленной изо всех этих компонентов, но в разных пропорциях. А поскольку каждый компонент преобладает в каком-то одном регионе мира, то доля этого компонента в других популяциях покажет степень их родства с населением этого региона и друг с другом. В данной работе этот метод выдал картину, представленную на рис. 2.
Как видно, у балто-славянских популяций почти весь спектр представлен двумя цветами: синим (предковый компонент k3) и голубым (предковый компонент k2), хотя и в разных пропорциях. Во все европейские популяции большой вклад вносит k3 (синий), а k2 (голубой) более характерен для популяций Средиземноморья, в том числе для южных славян, тогда как у западных и восточных славян его заметно меньше. Зато у восточных славян есть еще немного желтого цвета, это компонент k5, который больше выражен у северных русских. По происхождению этот компонент сибирский, поскольку, как видно на графике, он составляет основную часть спектра для популяций Сибири.
Еще один метод, которые используют генетики, это IBD-анализ (identical by descent — "идентичные по происхождению"). У людей из разных популяций оценивают число фрагментов генома, полученных ими от общих предков. Если таких фрагментов оказывается много, значит, популяции находятся между собой в довольно близком родстве. Этим методом сравнили западных и восточных славян (объединив их в одну группу "западно-восточных", поскольку уже доказали их сходство) с южными славянами и с окружающими их народами. Оказалось, что больше всего общих фрагментов генома западные и восточные славяне имеют с популяциями Северо-Восточной Европы (литовцы, латыши, эстонцы, карелы, вепсы, северные русские), несколько меньше — с южными славянами, а также неславянскими народами Балкан (венграми, румынами и гагаузами) и меньше всего — с народами Поволжья, Западной Европы, Кавказа и с греками. Получается непростая картина. С одной стороны, славянские популяции проявляют явное генетическое сходство между собой, с другой — иногда они проявляют большее сходство с неславянскими популяциями, с которыми живут по соседству.
Локализация славянской прародины
Гены, языки, география
Значительная доля работы в этом исследовании принадлежит лингвистам, которые реконструировали дерево родства балто-славянских языков. Новизна его состоит в том, что они использовали метод лексикостатистики и перепроверили большой массив данных. Лексикостатистика занимается выявлением скорости языковых изменений и определением времени разделения родственных языков и степени родства между ними. Исходным материалом послужили лексические списки (списки Сводеша) 20 современных балто-славянских языков и диалектов. Уточненное дерево представлено на инфографике [--стр. 24].
После разделения балтской и славянской ветвей самая первая развилка на славянской ветви — тройная. Это разделение славян на западную, восточную и южную ветви датируется временем около 1900 лет назад. Дальнейшее разделение славянских языков началось в V-VI веках (около 1300-1500 лет назад): восточная ветвь разделилась на русский и украинский/белорусский, западная ветвь — на чешско/словацкий, протосорбсколужицкий и польский/кашубский, южная ветвь — на сербско-хорватский, болгарский, македонский. Выделение современных языков произошло 1000-500 лет назад. Такая датировка дерева хорошо соответствует историческим и археологическим данным.
К генетическому и лингвистическому измерению для каждой популяции добавили еще одно — географическое положение, — и статистически измерили роли, которые сыграли география и языки в формировании генетического разнообразия балто-славянских народов. География играет двойную роль. С одной стороны, это фактор географического соседства, который сближает генофонды через смешанные браки между соседями. С другой стороны, география может отражать и происхождение, когда родственные народы не уходят далеко друг от друга, а расселяются на соседние территории. Языки — это маркер родства народов, который совпадает с родством генофондов, если гены унаследованы от общих предков вместе с общим языком, или не совпадает, если язык сменили, а генофонд остался почти прежним. В случае славян выявилась очень высокая корреляция между генетикой и географическим положением популяций (0,80-0,95), но также высока связь между генетикой и лингвистикой (0,74-0,78). Такие цифры корреляций редко получаются в подобных исследованиях, и они говорят о действительно тесной связи между генетикой, географией и лингвистикой. Тщательный подход к отбору материала и методов позволил создать очень чистое зеркало, в котором генетика, география и лингвистика отражаются похожими, как братья. География и генетика — почти близнецы, а лингвистика чуть от них отличается.
Генофонд впитывает как губка
Из полученных результатов складывается определенная картина формирования генофонда современных славян, и эта картина объясняет, как возникли различия между разными славянскими ветвями. Популяции, которые славяне ассимилировали, осваивая пространства Европы, составили генетический субстрат, который они впитали в свой генофонд. Этих субстратов было два. Восточноевропейский субстрат приняли в себя западные и восточные славяне (в данных по Y-хромосоме эти популяции несут высокие частоты гаплогруппы R1a). Другой, южноевропейский субстрат, впитали в себя южные славяне (их особенностью являются высокие частоты Y-хромосомной гаплогруппы I2a).
Какие же выводы можно сделать из такого обширного исследования, каков результат синтеза генетики и лингвистики?
Прежде всего тот, что в генофонде славянских популяций преобладает дославянский субстрат из ассимилированных ими популяций: восточноевропейский для западных и восточных славян и южноевропейский для южных славян. Во-вторых, оказалось, что, несмотря на дославянский субстрат, западные и восточные славяне образуют довольно целостную генетическую группу. Возможно, это произошло потому, что основным субстратом могли быть балтские популяции (балтская речь некогда звучала вплоть до Оки), а сами балты, как мы видели, лингвистически и генетически родственны славянам. Объединенная группа современных западных и восточных славян отличается как от своих западных соседей (германоязычных популяций), так и от соседей восточных и северных (финно-угорских народов). Большое сходство с соседями обнаруживается только иногда и только на периферии славянского ареала. Например, чехи генетически похожи на своих немецких соседей на западе (в отличие от поляков и сорбов). Аналогично, северные русские имеют ярко выраженное сходство с финно-угорскими и балтскими популяциями. Вероятно, когда шла волна заселения с Новгородской Руси на Русский Север, переселенцы приносили с собой язык, религию, но ассимилировали финно-угорское и балтское дославянское население, которое жило на этих территориях. Что же касается южных славян, они ассимилировали значительную часть дославянского населения Балкан, которая обладала иным генофондом, чем ассимилированное восточными и западными славянами население Восточно-Европейской равнины. Потому южнославянские популяции и обнаруживают большее сходство с неславянскими популяциями Балкан (румынами и венграми), чем с другими славянскими народами.
Этот процесс ассимиляции местного населения, который обнаружили у славян, — не исключение. То же происходило при распространении по Евразии носителей индоевропейских языков: передавались языки и в очень малой степени — гены. Поэтому языки, распространенные в Европе и в Индии, родственны друг другу, а между генофондами нет почти ничего общего. Сходные процессы происходили и при распространении тюркских языков.
Основа этноса — не генетика, а самосознание
Основатель геногеографии Серебровский сравнивал генофонд с морем и его течениями. Как и в море, нельзя провести четкую границу между пластами генофонда, но можно проследить за течениями, которые несут определенные генетические маркеры. Такими маркерами служат определенные гаплогруппы, но их нельзя отождествлять с конкретными народами, как делают некоторые последователи скандально известного Анатолия Клесова, создателя так называемой ДНК-генеалогии. Мы знаем, что гаплогруппа R1a наиболее часто встречается у восточных и западных славян, так же как гаплогруппа I2a — у южных. Но это не значит, что какую-то одну гаплогруппу можно гордо именовать "славянской" и только по ней судить об исторических миграциях народа. Ведь люди с какой-то одной гаплогруппой никогда не жили сами по себе и любая популяция — что в древности, что сейчас — состоит из носителей разных гаплогрупп, точно так же как она состоит из носителей разных групп крови.
Генетические различия между популяциями не мешают им быть частями одного народа. Потому что этнос — это понятие не генетическое. Главное, что его определяет, это самосознание людей, а оно выражается языком. Поэтому северные и южные русские — это один народ, говорящий на одном языке, а русские и болгары нередко понимают друг друга без переводчика, несмотря на перечисленные выше генетические различия восточных и южных славян.
Рис. 01 Генетическая структура балто-славянских популяций в сравнении с другими народами Европы по трем генетическим системам
01А представляет результаты для широкогеномных SNP-маркеров. Каждая точка — один изученный человек, а цветных кружки обозначают "центр тяжести" облака представителей одного народа.
01В представляет результаты по Y-хромосоме, полученные на основании частот ее гаплогрупп. Каждый кружок обозначает одну из региональных популяций какого-либо народа, а цвет кружков указывает, что это за народ.
01С отражает результаты, полученные по частотам гаплогрупп митохондриальной ДНК (мтДНК). Кружки опять обозначают популяции.
ис. 02 Результаты оценки спектра предковых компонентов популяций мира по методу Admixture
Число заданных предковых популяций k=6. На нижней панели в увеличенном масштабе показаны спектры предковых компонентов для популяций Европы.