Геномика этнических групп России

Гахраман Гумбатов
Геномика этнических групп России
Эльза Хуснутдинова
ФГБУН Институт биохимии и генетики Уфимского научного центра РАН, Башкирский государственный университет, Уфа, Россия
С целью изучения структуры генофонда и генетической истории современных народов Волго-Уральского региона, Средней Азии, Сибири и Северного Кавказа нами проведен комплексный анализ трех типов молекулярно-генетических маркеров: аутосомных, митохондриальных и У-хромосомных. В ходе исследований  проанализированы геномы 10 000 индивидов из 50 популяций  Евразии. Полногеномный анализ 610 000 SNPs был проведен с использованием биоинформатических подходов и соответствующих программ: ADMIXTURE, SmartPCA, BEAGLE, ChromoPainter, fineSTRUCTURE, GLOBETROTTER.

В результате комплексного анализа полиморфизма мтДНК, У-хромосомы и полногеномных данных впервые получены детальные характеристики структуры генофонда народов Волго-Уральского региона, Кавказа, Сибири и Средней Азии, выявлены эволюционные взаимосвязи при формировании  их генофонда, сформирована целостная картина  генетических взаимоотношений между изученными популяциями.  Установлено, что региональная генетическая дифференциация выражена слабее, нежели дифференциация согласно языковым семьям, что свидетельствует о том, что, несмотря на общность языка анализируемых народов и известные исторические и этнографические данные об их общих исторических корнях, территориальная близость, по-видимому, привела к сглаживанию существовавших ранее этногенетических различий и большей генетической близости нынешних популяций, чем их историческая лингвистическая и этнокультурная общность. По аутосомным локусам популяции Волго-Уральского региона являются более дифференцированными, чем популяции Средней Азии или Северного Кавказа, что согласуется с лингвистическими и антропологическими данными о сложности этногенеза народов данного региона России, в пределах которого проходил наиболее активный процесс контактов и взаимодействия групп с различными расовыми и антропологическими характеристиками.
     Изучение географического распространения гаплогрупп мтДНК  в изученных нами популяциях Волго-Уральского региона, Средней Азии и Северного Кавказа показало, что в популяциях, ближе расположенных к границе между Европой и Азией, заметно возрастает как частота, так и уровень разнообразия типов мтДНК, характерных для популяций Сибири и Центральной Азии. В популяциях Волго-Уральского региона (татар, русских, северо-западных башкир, чувашей, мордвы, удмуртов, коми-пермяков и коми-зырян) преобладающими являются западно-евразийские линии мтДНК (82,7%), за исключением пермских и юго-восточных башкир, в генофонде которых с высокими частотами обнаружены восточно-евразийские гаплогруппы F1b (22,9%) и D4 (14,6%). В результате полного секвенирования 33 митохондриальных геномов, принадлежащих парагруппе H*, в популяции удмуртов  обнаружена ранее не описанная гаплогруппа мтДНК Н99, которая, вероятно, имеет автохтонное происхождение, поскольку проведенный скрининг показал отсутствие этой гаплогруппы в других популяциях Волго-Уральского региона, а также в популяциях эстонцев, русских, армян и иранских азербайджанцев. В популяциях архангельских башкир, чувашей и марийцев впервые обнаружена линия гаплогруппы мтДНК Н55, определяемая заменой С9449Т, что свидетельствует о наличии межэтнических контактов между популяциями региона по женской линии. Сравнительный анализ  с литературными данными позволил проследить четкий  градиент увеличения азиатских линий мтДНК с запада на восток и показать, что лингвистическое сходство популяций играет меньшую роль, чем географическая близость или отдаленность популяций.
       Анализ распределения частот гаплогрупп Y-хромосомы в популяциях Волго-Уральского региона показал, что основная доля приходится на три гаплогруппы: R1b-M269, R1a-M198 и N-M231, частоты которых в сумме в разных популяциях составляют от 49% до 100%. Впервые выявлено, что доминирующей линией гаплогруппы R1a-M198 Y-хромосомы в популяции башкир является R1a-Z2125, что связано с переднеазиатским и среднеазиатским влиянием. В других популяциях Волго-Уральского региона обнаружено преобладание линий R1a-M558 и R1a-М458, которые определяют восточноевропейское влияние. Впервые показано, что наиболее распространенной линией гаплогруппы R1b-M269 Y-хромосомы в Волго-Уральском регионе является R1b-Z2105, которая была обнаружена в популяциях башкир (36,2%), удмуртов, (21,2%), коми (8%), мордвы (6,8%), бесермян (3,8%), и чувашей (2,3%).
      Полногеномный анализ 610 000 SNPs в популяциях Волго-Уральского региона позволил сделать вывод о наличии в них генетических компонент, имеющих различное происхождение, связанное как с западно- и восточно-евразийскими источниками, так и, в меньшей степени, с Передней Азией и, вероятно, Южной Азией. В то же время, для популяции башкир показано повышенное содержание восточно-евразийского компонента, а популяция мордвы демонстрирует сходство с популяциями Восточной Европы, в особенности, с русскими Севера.
       В результате полногеномного анализа 610 000 SNPs в 24  тюркоязычных популяциях Сибири, Центральной Азии, Волго-Уральского региона, Северного Кавказа, Закавказья, Ближнего Востока и Балкан нами впервые показано Южносибирское происхождение единого генетического пласта у всех тюркоязычных групп. Полученные нами датировки времени метисации тюркоязычных народов на основе анализа длин хромосомных сегментов различного происхождения варьируют в пределах от 410 г н.э. до1190 г н.э., что перекрывается с историческим периодом активных миграций тюркоязычных кочевников (с 6 по 11вв н.э.).(Российский генетик на госслужбе не мог не подчиниться обшероссийско-ирано армянской концепции происхождения тюркских народов. Без "алтайской гипотезы" российские подвластные учёные будут выглядеть среди своих коллег "белой вороной"- Гумбатов Гахраман).
      В результате анализа полиморфизма кодирующего региона и ГВС1 мтДНК получена детальная характеристика генетической структуры популяций Кавказа (андийцев, аварцев, багуалинцев, чамалинцев, чеченцев, даргинцев, ингушей, кумыков, лезгин, табасаран, абхазов, армян, мегрелов, южных и северных осетин, абазин, адыгов, балкарцев, черкесов, кабардинцев, карачаевцев, караногайцы и кубанских ногайцев). Подавляющее большинство (90.4%) линий мтДНК в популяциях Кавказа относятся к западно-евразийским кластерам, небольшое число образцов (8.5%) относится к восточно-евразийским гаплогруппам. На основании данных о полногеномной изменчивости мтДНК реконструирована филогения гаплогруппы Н и ее субклейдов. Эволюционный возраст субгрупп гаплогруппы H варьирует в широком диапазоне от 10100 до 48400 лет. В этнических группах  Кавказа впервые описаны новые субклейды гаплогруппы H мтДНК: H19, H20 и H21.  Показано, что наиболее вероятным местом возникновения гаплогруппы Н является территория Южного Кавказа/Ближнего Востока. Полученные результаты свидетельствуют о начале экспансии гаплогруппы Н до последнего ледникового максимума, с наиболее старыми линиями, встречающимися с максимальной частотой на Южном Кавказе и северной части Ближнего Востока. На основании изучения распределения частот гаплогрупп Y-хромосомы показано, что популяции Кавказа характеризуются высокой частотой гаплогрупп G-M201 (большей частью представленной G2-P287), J-12f2 (J1-M267 и J2-M172) и R1-M173 (большей частью представленной R1a1a-M17 и R1b1b2-M269). Подобный профиль распределения частот гаплогрупп характерен только для автохтонных популяций Кавказа и не встречается больше нигде в мире. Показано, что этнические группы западной и восточной части Северного Кавказа отличаются по результатам анализа частот гаплогрупп Y-хромосомы. С другой стороны, анализ гаплотипов в программах CHROMOPAINTER и fineSTRUCTURE демонстрирует существенную связь генетической структуры популяций Кавказа с географией. Результаты исследования являются существенным вкладом в сумму знаний об особенностях генофондов коренного населения Кавказа.
На основе данных полногеномного анализа SNPs нами впервые показано, что популяции Кавказа демонстрируют существенно более единообразную генетическую структуру, чем можно было бы предполагать, исходя из выраженного этнического и лингвистического разнообразия региона. Нами установлено, что их формирование происходило на основе гетерогенного генетического субстрата переднеазиатского происхождения с последующим существенным дрейфом генов в изолированных популяциях. Впервые показано существование отчетливого потока генов из популяций Восточной Европы в популяции Кавказа. 

Исследования коренных народов Сибири (якутов, эвенов, эвенков, долган и юкагир) по данным трех систем маркеров показало, что Саха (Якутия) была заселена в результате повторяющихся экспансий из Южной Сибири, хотя имел место и небольшой поток генов из района нижнего Амура и/или Камчатки. Наличие небольшого западно-евразийского компонента свидетельствует в пользу как недавнего и продолжающегося смешивания с представителями Восточной Европы, так и древнего потока генов из Западной Евразии.