Как соотносятся между собой народы Восточной Европы с точки зрения популяционной генетики?

Jan 04, 2022 20:00


В ближайшие пару недель  в этом блоге будет довольно много постов про древнюю генетику, где я буду сравнивать древние группы с современными. Но сначала хотелось бы  дать этакий пролог про генетику наших современников.  Я решил показать, что же представляют собой жители Восточной Европы с точки зрения генетики.  В общем, сегодня поглядим, как соотносятся между собой русские, украинцы, белорусы,  прибалтийские и различные финно-угорские группы.  На сегодняшний день генетика современных популяций исследована очень хорошо.  Это огромное количество образцов со всего мира.  Различных этнических групп. Более того, много региональных выборок. К примеру,  есть множество выборок русских -  русские Курска, русские Костромы, русские Пскова и так далее. То же самое и со многими другими народами. Это помогает лучше понять разнообразие разных этносов. Впрочем, пожалуй, тут более уместен термин популяция. Потому, что мы будем говорить сугубо о биологии. А этнос все же не чисто биологическое понятие. И мы в этом убедимся, увидев, как часто в пределах одного этноса существуют сильно различающиеся популяции и напротив, близкие популяции бывают разделены между разными этносами.

Что будем для этого использовать? Во-первых, нам поможет громадная база по аутосомным данным различных современных популяций, размещенная на ресурсе G25Vahaduo. Строго говоря, там не только современные образцы, но и древние. Но сегодня будем пользоваться разделом с нашими современниками. Через этот ресурс мы будем смотреть дистанции до современных популяций. Т.е. к кому ближе всего та или иная группа. Тут все очень наглядно и просто. Ниже могу разместить краткую памятку  для тех, кто пожелает воспользоваться этим инструментом самостоятельно.

Второй инструмент, который нам поможет - это PCA плот Северной Европы.  Звучит наверное страшно, но на самом деле не все так сложно. PCA  - это principal component analysis анализ по методу главных компонент. Интересная штука, математический прием, позволяющий решить множество задач в самых разных областях. Про него есть большая и тяжелая для гуманитариев статья на Википедии, но попробую объяснить кратко и просто.  PCA позволяет выделить самую суть изменчивости из множества  признаков по которым сравниваемые объекты будут различаться.  Т.н. главные компоненты. Их обычно находят две, иногда три или четыре, и их можно представить как оси. В результате можно построить график с двумя осями, а уже на этом графике увидеть как расположится тот или иной предмет.  Очень удобная штука. Позволяет увидеть реальные отличия. Применятся в огромной массе областей - статистике, математике, биологии, антропологии, генетике, археологии и еще много, много где. В этом блоге, кстати, такие графики уже попадались.  В серии постов про антропологию современного населения их было очень много.

В общем, я сейчас покажу все наглядно.  Есть такие PCA для различных частей мира, отражающие генетическое разнообразие. Мы будем пользоваться PCA для Северной Европы. Посмотреть можно здесь. Вот как это выглядит.



По сути, это и есть график с осями. В зависимости от отношения к этим осям, расположились различные образцы разных народов. На картинке они сгруппированы по языковым группам и обозначены цветом. Сиреневые крестики - германоязычные группы, зеленые крестики - кельтские группы,  серые треугольники, опущенные вниз - латиноязычные группы, зеленые треугольнки, направленные вверх - германо-романские группы, типа бельгийцев. Красные ромбы - балты, коричневые треугольники влево - славяне, оранжевые вправо - уралоязычные группы.  На самом деле, как  мы увидим, одна языковая принадлежность может  объединять генетические разные группы.  Или наоборот - генетически схожее население говорит на совсем разных языках. Но такая группировка все равно удобна.


Вообще, этот график не двухмерный. Он трехмерный, но для нас сейчас это не так важно, посколько все равно покажет ясные отличия или сходства.  Этот же график, только трехмерный, можно посмотреть здесь.

А сейчас вернемся к нашему двухмерном графику. Каждая цветная точка здесь  - отдельный образец. Если мы зайдем на сайт и подведем курсор к какой-нибудь из них, то можем увидеть обозначения типа Russian_Smolensk с номером академического образца, ну или любое другое обозначение, в зависимости от того, к чему мы подвели курсор. Т.е. это отдельный образец. Однако, мы будем оперировать выборками - т.е. совокупностями этих образцов. Потому, что, скажем, образцов Russian_Smolensk может быть много, типа Russian_Smolensk1, Russian_Smolensk2 и так далее. А выборка - это совокупность всех образцов Russian_Smolensk. B ее характеристики будут отличаться от других выборок.

Ах, да. Стоит напомнить, что все эти образцы взяты не с бухты-барахты. Они собирались генетиками в результате экспедиций, обычно в сельской местности, где к людям выдвигались определенные критерии, типа чтобы бабушки и дедушки  были родом из этой местности.  Так, что с этим все строго.

Пожалуй, стоит начать и все будет наглядно. Проще всего начать, наверное с жителей Прибалтики. Латыши и эстонцы, к сожалению, представляют по одной выборке, а вот литовцы богаты региональными группами.  Обозначаются они по литовски, поэтому вот краткая памятка.

PA - Южная Аукштайтия, PZ - Южная Жемайтия, RA - Восточная Аукштайтия, SZ - Северная Жемайтия, VA - Западная Аукштайтия, VZ - Западная Жемайтия.

Итак, сначала посмотрим дистанции до других народов.  Сейчас все увидите и поймете. Вот дистанции от эстонцев и от латышей до ближайших 10 групп. Как видим, ниже перечислены разные группы, типа Russian_Pskov или Lithuanian_SZ. Рядом с ними указано числовое значение. Чем оно меньше,  тем группа ближе.  По практике можно сказать, что значения меньше 0,025... это очень близко. Цвет тут тоже играет вспомогательную роль. Чем более насыщенный зеленый - тем ближе.



Мы видим, что латыши ближе всего к различным группам литовцев и эстонцам, а эстонцы русским Пскова и балтским группам.

Теперь стоит рассмотреть оставшихся балтов - литовцев. Их шесть групп.



Мы можем увидеть, что большинство литовских групп ближе всего к другим балтам и эстонцам. Лишь у западных и южных аукштайтов высоко поднялись белорусы или псковичи. Это указывает нам на то, что эти литовские группы немного отличаются от остальных.

А вот как расположились рассмотренные группы на PCA. Пока, возможно, еще не все понятно, но чем больше групп мы будем добавлять, тем больше будет ясности.



Можно заметить, что все балты расположены недалеко друг от друга и рядом с красными ромбами, обозначающими балтские образцы. Только южные и западные аукштайты уже в окружении как ромбов, так и славянских треугольничков. В то же время эстонцы уже среди оранжевых значков финно-угров. Кажется, что эстонцы тут далеко от балтов. Но на деле в этом случае немного мешает то, что плот двухмерный. На деле он трехмерный и балты ближе к поверхности, а финно-угры в глубине. Представьте, что смотрите в аквариум сверху. Все эти цветные флашки находятся в воде, но какие-то глубже, а какие-то ближе к поверхности. Так и тут. Поэтому цифры дистанции точнее, но на графике можно увидеть пространственное расположение хотя бы в двухмерной плоскости.

Теперь стоит рассмотреть белорусов. Мы помним, что они оказались близки к аукшайтам. Посмотрим, кто же близок к самим белорусам. Жаль только, что тут одна выборка, а не хотя бы парочка региональных.



Как видим, ближе всего смоляне. Учитывая историю региона, оно и не удивительно. Однако на втором месте те самые южные аукштайты. Видимо, это отражает генетические взаимовлияния и у белорусов, и у южных аукштайтов. Стоит заметить, что остальные балтские группы не вошли в первую десятку, уступив славянским - украинцам и белорусам.

На PCA мы их разместим позднее, а сейчас можно перейти к украинцам.  Нам доступны выборки следующих групп - Чернигов, Сумы, Житомир, Ровно, Днепр,  Закарпатье, Львов. Естественно, речь не о городах, а о регионах. Посмотрим на дистанции этих групп.



Как мы можем увидеть, большинство украинских групп сходны между собой, а также близки южным русским, белорусам, иногда полякам.  Зато у жителей Закарпатья появляются центральноевропейские этносы - венгры, словаки, словенцы,  чехи, а также хорваты и даже боснийцы. У жителей Львова это менее выражено, но тоже присутствует. Теперь посмотрим, как разместятся украинцы и белорусы на PCA.



Можно видеть, что большая часть украинских групп разместилась довольно компактно, за исключением львовлян и жителей Закарпатья, что нам и демонстрировали дистанции. Эти регионы сильнее сдвинуты к Центральной Европе. Белорусы же сдвинуты от украинцев в сторону балтов.

Прежде, чем перейти к русским, нужно рассмотреть финно-угорские группы Восточной Европы - финнов, эрзю, мокшу, ижору, карел, коми, вепсов. Сперва рассмотрим финнов. Их четыре выборки: юго-западные, юго-восточные, восточные и северные.





Ближе всего они к ижоре, карелам, вепсам. На PCA наши финские группы расположились довольно далеко от тех популяций, что мы рассматривали ранее. И можно заметить, что южные финны немного сдвинуты в сторону германоязычных групп, показанных сиреневыми крестиками.



Теперь посмотрим, как расположатся  карелы, ижора, вепсы и коми. Вот, что у них по дистанциям.



А вот, что на PCА.



И наконец, добавим мордву - мокшу и эрзю.



А вот они на PCA.



Видим, что они заняли место между рассмотренными ранее славянами и финно-уграми.  Занятно, что эрзя и мокша расположились на PCA рядом с эстонцами.  Но при этом по дистанциям они ни у кого не выскакивают. Тут как раз виден недочет двухмерного PCA. В трехмерном пространстве, если искать аналогии с аквариумом, эстонцы ближе к поверхности, но не так близко, как балты, а мордва в глубинах, пусть и выглядят они  сверху рядом с эстонцами.

Теперь самое время рассмотреть русских. Мы видели, что по дистанциям русские группы выскакивали то там, то сям. Разные русские группы были попали в десятку у всех рассмотренных нами популяций. Но рассмотреть русские группы стоит дифференцированно. Начнем с русских юга - белгородских, воронежских, курских, орловских. Мы помним, что они выскакивали близко по дистанциям у украинцев. То же самое и у этих групп. В первой десятке у них соседние русские и украинские группы вперемешку.



Это говорит о том, что генофонд у этих групп не очень сильно различается.



Интересно, что при этом белгородские и воронежские русские  расположились ближе к украинцам, чем куряне и орловчане. Это не должно удивлять, учитывая, что и Белгородская, и Воронежская области - зоны украинской колонизации. Не знаю насчет белгородской выборки, где именно, в каких населенных пунктах она собиралась, но воронежская исследовалась  в Репьевке, кажется Балановским. Это село, изначально населенное украинцами. Сейчас там уже смешанное население.

А вот, что по дистанциям у русских запада - псковичей и смолян. Ранее мы уже видели, что они выскакивали у балтов и белорусов.



Очередь за русскими центра.  За них отдуваются Калуга, Рязань, Тверь, Ярославль.



В десятке в основном  остальные русские группы, но видно, что расстояния уже увеличиваются по сравнению с русскими юга. Жителя Ярославской области начинают дистанция с 0,017 - она близкая, но заметно дальше, чем у остальных групп.  Если расположим все эти группы на PCA, то увидим их особенности. Например, псковичи сдвинуты к балтам, ярославцы и тверичи в сторону мокши и эрзи.



Вообще, если бы я поставил показывать в дистанциях не 10 ближайших групп, а скажем, 20, то мы увидели бы, что у каких-нибудь рязанцев выскочила бы мокша, а у орловчан - нет.  Т.е. первые впитали какой-то местный субстрат, близкий к мокше. По крайне мере, больше, чем предки орловчан.



У тверичан и ярославичей еще и кроме мокши появятся балты, но далеко. Да и в целом, все центральные русские гораздо ближе к остальным русским, чем к неславянским группам.

И наконец, пора перейти к самой специфичной группе - русским севера. Их представляют выборки из Пинеги, Пинежского, Красноборского и Лешуконского районов Архангельской области, а также добавим к ним костромичей.



Можем увидеть, что у выборок из Архангельской области ни одна из рассмотренных ранее групп не появилась в первой десятке.  Они близки либо друг к другу, либо к коми, вепсам, карелам и другим финно-уграм. Эти люди очень сильно отличаются от центральных и южных русских.

Костромичи занимают скорее среднее положение. И они ближе всего к мокше и русским Красноборского района, расположились между ними. Остальные русские  уже где-то в конце ближайшей десятки.



Все это мы увидим и на PCА.. Вот здесь в итоге основная масса народов Восточной Европы.



В качестве бонуса ваш покорный слуга и его дистанции до популяций.



На этом в общем-то и все. На этой неделе будем делать подобное, но для древних образцов.  Посмотрим к кому они ближе всего и как расположатся на PCA.

И как обещал - краткая инструкция как всем этим пользоваться для тех, у кого такое желание возникнет.

1. Заходим на сайт.

https://g25vahaduo.genetics.ovh/G25modern-scaled-averages.htm

Здесь во вкладке Source видим внушительный список популяций - различных народов, этнических  и региональных групп.

2. Находим интересующую нас группу, например Tatar_Kazan. Выделяем и копируем всю строку. Она выглядит так.

Tatar_Kazan,0.1092702,0.0107019,0.0614126,0.0440274,-0.0058471,0.0094608,0.0081711,0.0109876,-0.0074572,-0.0219385,0.0025608,-0.0068479,0.0129221,-0.0073152,-0.0094378,-0.0036717,0.0015345,0.0001949,-0.0072615,-0.0042423,-0.0001632,0.0009035,-0.006845,0.0008527,-0.0001105

3. Теперь кликаем другую вкладку - Target и вставляем туда то, что скопировали.
4. Переходим во вкладку Distance.

Видим, что справа там у нас отображаются наши казанские татары.



На них надо будет кликнуть. По умолчанию стоит отображение 25 самых близких групп.  Но можно настроить, чтобы показывало 10.  Для этого в MAX OUTPUT NUMBER меняем 25 на 10. После того, как кликнули  Tatar_Kazan,  у вас отобразится следующее.



Опять же, ориентируйтесь на цифры. Близкое расстояние - это меньше 25.

5. При желании можно также поместить популяции на PCA. Для этого мы точно также копируем строчку с популяцией и заходим на другой ресурс, с плотом.

https://vahaduo.github.io/g25views/#NorthEurope

Это ссылка на плот Северной Европы, но вы можете нажать на Choose PCA и выбрать любой из подходящих. Например, чтобы сравнить китайцев и монголов, вам явно Северная Европа не подойдет - и те, и те улетят за плот. Но зато там можно выбрать плот East Asia.

Скопированную строчку вставляем в пустую строку правее Choose PCA и жмем Enter. Вуаля.



6. Опять же, не забываем про то, что этот двухмерный рисунок отображает трехмерном пространство.  Посмотреть трехмерные реалии можно здесь.

https://vahaduo.github.io/3d/g25/northeurope/

Там нашу скопированную строку нужно вставить в Add custom point, нажать Load и покрутить мышкой.

7. Покажу как это работает на деле.

Я добавил на трехмерный плот казанских татар и русских Пинеги и Пинежского района. По умолчанию перед нами тот же ракурс, что и на двухмерном PCA. На нем видим, что все три группы  расположились вроде как не сильно далеко.



Но мы помним, что дистанции у татар были  большие до соседних групп, а дистанции до двух русских северных групп были огромные, такие же как от татар до саамов.  Если мы немного крутанем мышкой, то увидим, что расстояние между пинежскими русскими и казанскими татарами очень значительное. Сработал "эффект взгляда на аквариум сверху".

Татары окажутся на дне аквариума, а пинежане сильно ближе к поверхности.



8. И напоследок. Вы можете сравнить современные группы и древние. Алгоритм тот же самый, но база древних образцов здесь.

https://g25vahaduo.genetics.ovh/G25ancient-scaled.htm

Но тут нужно знать о самих образцах. Скажем, нам нужен древнерусский образец из-под Владимира. Он найден рядом  с ручьем Сунгирь, близко от знаменитых верхнепалеолитических стоянок. Находим в Source RUS_Sunghir_MA:Sunghir Теперь переходим на страницу с современными группами.

https://g25vahaduo.genetics.ovh/G25modern-scaled-averages.htm

И вставляем в таргет. Далее  аналогично тому, что делали раньше.

Получаем.



Можно делать и наоборот - искать аналоги современным группам среди древних. Надеюсь, инструкция была полезна.  А на этой недели вас будет ждать кое-что интересное по древним образцам и их связям с современными группами

современное, генетика

Previous post Next post
Up