Новая генетика и ДНК-информатика

Михаил Курносов
               
                КУРНОСОВ М. Н.



                НОВАЯ ГЕНЕТИКА
                И
                ДНК-ИНФОРМАТИКА
                (ПРОЕКТ НЕОГЕРМЕТИК)





                2013
       





               









                НАУЧНОЕ ИЗДАНИЕ.
*****        Курносов Михаил Николаевич. Copyright (C). 2013.           *****






















                ПРЕДИСЛОВИЕ.

 Термин "новая генетика" я применяю для постгеномной эпохи в биологии.  Это
время началось примерно с 2003 года,  когда был опубликован впервые геном человека. Биология и медицина вступила на новый,более высокий уровень знаний.
Нам  понятно,  что  секвенирование  геномов   проводится  не  только из-за
теоретического интереса.    Все в настоящее время направлено на то,  чтобы
научиться влиять на гены как человека,  так и других организмов.
Новая генетика ставит и новые цели - это изменение самой биологии человека,
а именно влияя на гены сделать человека невосприимчивым к обычным болезням,   значительно продлить жизнь человека,  сделать его максимально устойчивым к
вредным   факторам среды   (излучениям,  высокой и низкой температуре,  повышенному или пониженному парциальному давлению кислорода в воздухе,  измененному давлению), а также сделать человека независимым от обычной пищи,  устойчивым к химическим мутагенам,  невосприимчивым к микробам и вирусам,  с высокой скоростью регенерации повреждений. Управление генами
человека скоро выйдет на новый уровень,  что изменит всю его жизнь.
После того , как геном был определен в виде нуклеотидной последовательности,  стало ясно,  что знаем мы о генах очень мало, и сегодня , несмотря на вал научных работ, я могу утверждать,  что в познании генома и генетике человека
все  еще только начинается и окончательного изучения работы генома можно
ожидать через 20-30 лет.
Геном человека представляет настолько информационно большую величину, которую сегодня даже трудно представить. Так как дело не только в количестве
нуклеотидов ДНК, а именно в их сочетаниях в каких-то оригинальных участках, доменах, мотивах, повторах. Это придает геному человека гораздо более
информационную емкость, чем только сама последовательность. Этим сейчас занимается ДНК-информатика. Расшифровка биологического значения и функций участков ДНК, моделирование и создание новых информационных участков ДНК и
так далее. Я приведу в этой книге те примеры, которые сам разрабатывал.
В науке сегодня ведуться работы по созданию геномодифицированного человека. В одних странах это под запретом, но я думаю, что ненадолго. Как только люди поймут , что опасность, которую предполагали от этого, настолько мала по сравнению с пользой, которую принесет для человека его геномодификация, то
эти запреты будут сняты. Главное время не упустить. Работы можно начать в
любое время сегодня, были бы средства и желание развивать науку.
У человечества нет другого пути, либо болеть,  рано умирать и быть уязвимым в окружающей среде, либо изменить человека.
Мой проект я назвал NEOGERMETIC, что означает новый зародыш, росток,стволовая клетка. Это негосударственный, частный научный проект. Он находится в
постоянной моей разработке. Проект НЕОГЕРМЕТИК включает в себя разработку способов кодирования текстов в ДНК, внесение этой ДНК  в геном для
длительного хранения. Также рассматриваются вопросы поиска в ДНК человека и других организмов разумных текстов.
Эта книга в виде отдельных статей описывает разные способы преобразования генетической информации в другие виды информации. Также поиск в ДНК возможных
участков, несущих информацию, не связанную с работой генов, то есть разумных
текстов, похожих на тексты обычных книг.
В других главах затронуты вопросы старения в связи с митохондрией и транспозонами. Работы продолжаются несколько лет и возможные открытия еще впереди. В книге даны разработки пока теоретических подходов, начальная информация для других ученых, которые будут заниматься тем же, что и я.
Если в геноме какого-то организма будут найдены разумные тексты в виде
послания или просто технологические разумные метки высшей цивилизации,
проводившей генные операции, то это будет означать самое выдающееся открытие
в истории человечества.






                3
Уже сегодня ученые могут ввести в ДНК участки с любыми текстами. Чтобы знать, что надо искать в геноме, надо научиться вводить тексты в ДНК. Это описывают
несколько глав в этой книге. Итак, представляю Вам мою книгу, и что было разработано по мере моих сил за последние 8 лет. Материалы могут быть
спорными по некоторым местам, но это и есть наука – от гипотез и черновых наработок через теорию к практике.
Возле каждой главы стоит дата публикации статьи в интернете на моем сайте
www.neogermetic.narod.ru , поскольку в науке все стремительно меняется.
Частично книга дописывалась в течение 2013 года.
 01 мая 2013 г.


                ВВЕДЕНИЕ В СОВРЕМЕННУЮ ДНК ИНФОРМАТИКУ.2013.

 ДНК информатика нужна для теоретического просчитывания биологического эксперимента. Работы с генами и ДНК очень дороги, поэтому ученые сначала моделируют опыты на компьютере, после этого проводят опыты с молекулами,
генами и живыми клетками.
Этому и предназначена настоящая книга. На примерах:
проекта по музыке генов,
проекта по изменению митохондрий,
проекта по дефрагментации генов,
проекта по поиску и записи в ДНК текстов,
проекта по управляемому наномашинами мутагенезу в
этой книге проведено теоретическое обоснование подходов к этим экспериментам. Все эти мои проекты объединены в общий проект, который я назвал
"Неогерметик" или "Neogermetic".
В этом и заключается моя роль, как автора книги. С одной стороны , я разрабатываю реальные проекты для будущей генетики, а с другой стороны на их примерах , я показываю, как информатика ДНК применяется в биологии и
медицине.
Для информационного обеспечения задуманного эксперимента, ученый вначале накапливает нужную информацию. ДНК информатика в современном мире очень тесно связана с Интернет ресурсами и уже не мыслима без них. В Интернете находятся
от сотен гигабайт до терабайт информации по разным разделам генетики и биоинформатики. Такое количество не может вместить ни одна книга, и роль книг сегодня – это дать общее направление для работы.
В первую очередь надо закачать геномы организмов,  с которыми предстоит работать. Их адрес www.ncbi.nlm.nih.gov/genomes, где для нужного вида есть полная последовательность нуклеотидов в геноме для отдельных хромосом.
Выберем, для примера каталог Homo sapiens (H_sapiens) - человек.
Примеры для человека хромосома 1 генома в виде контигов.
Например, ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
hs_alt_HuRef_chr1. fa. gz  - архив хромосомы 1 в формате
фаста, то есть без описаний генов,
hs_alt_HuRef_chr1. gbk. gz - архив последовательности
нуклеотидов в ДНК и описание генов,
hs_alt_HuRef_chr1. gbs. gz - архив только описания генов
в хромосоме 1 или аннотация генома, 
hs_alt_HuRef_chr1. mfa. gz - архив помеченных или
маскер-повторов в ДНК хромосомы.
Собранная в нить хромосома 1, для примера
ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
Assembled_chromosomes/seq/hs_ref_GRCh38_alts. fa. gz
ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
Assembled_chromosomes/seq/hs_ref_GRCh38_alts. mfa. gz
ftp://ftp. ncbi. nlm. nih. gov/genomes/H_sapiens/
Assembled_chromosomes/gbs/hs_ref_GRCh38_chr1. gbs. gz
Это архивы ДНК в формате фаста и маскер-повторов, и
описание или аннотация всех генов и их места на хромосоме 1.

                4
Для изучения повторов в геноме или каком-то участке ДНК можно для UNIX-компьютера использовать программу для поиска повторов - Repeatmasker.
Программа на сайте www.repeatmasker.org , а базы повторов на сайте
www.girinst.org , на этом же сайте есть онлайновый сервис для поиска повторов ДНК. Для этого надо вставить в окно формы исследуемый участок ДНК, и через несколько минут подгрузится полная аннотация этого участка.
Для изучения взаимодействий генов и их продуктов между собой полезны базы
генных сетей в виде граф. Их адрес www. pid. nci. nih. gov ,
а для закачки баз ftp://ftp1. nci. nih. gov/pub/pid.
Там представлены следующие разделы:BIOCARTA,KEGG,NCI-NATURE CURATED,
REACTOME, представляющие собой базы взаимодействия путей.
Это базы различных путей - метаболических, регуляционных, и других. В них представлены все известные гены и их продукты во взаимодействии с другими
генами и белками.
Представлены файлы с расширением . svg и . jpg, по названию гена определяется индекс рисунка, а в самом рисунке показаны связи его с другими генами в сети.
Например, ген POT1. Надо поисковиком найти это слово в файлах . svg , получим индекс - 200074. svg NCI-NATURE CURATED. По этому индексу надо смотреть
рисунок - 200074. jpg. В рисунке находим наглядно в этих генных сетях, где участвует этот ген в обслуживании теломеры в шелтерин-комплексе. Видно его взаимодействие с другими генами и их продуктами.
Для изучения продуктов генов - РНК или белка полезна база находящаяся на NCBI
в каталоге для каждого вида организма - файл protein.gbk , в котором представлены трансляты генов, и даны функции белка, а также большое
количество литературы для каждого гена. Для РНК, файл аналогично имеет
название rna.gbk.
Чтобы закачивать журнальные статьи по генетике, надо в поисковой системе NCBI, которую можно открыть на его главной странице, выбрать раздел PubMed или Pub,
и в строку поиска ввести нужный ген, или название статьи, или авторов. После этого выводится список статей по выбранной теме, хранящихся на NCBI.
Специализированных баз белков много,к примеру приведу адреса нескольких баз: http://www.pdb.org,
http://www.uniprot.org,
http://www.genome.ucsc.edu,
http://www.expasy.org.
Последняя работает по ftp-протоколу,например taxonomic_divisions/uniprot_sprot_human. dat. gz, при этом закачен будет
архив базы белков человека. Открыв его просмотр, для примера, программой
Windows Commander - клавиша F3, в поисковой строке - клавиша F7, набрать Name=POT1. После чего в файле будет найдено полное описание белка гена POT1,
для примера.
База сигнальных пептидов, необходимых для направления белка в нужное место в клетке, например в ядро или митохондрию.  SPDB по адресу:
www.proline.bic.nus.edu.sg/spdb/index.
Как правило, все крупные серверы генетических баз данных имеют доступ по
http-протоколу интернет, при котором открываются обычные страницы интернета и
доступ по ftp-протоколу, по которому идет только обмен файлами.
Для закачки баз данных лучше и быстрее использовать ftp. Для этого надо иметь
на компьютере любой ftp-клиент, программу для закачки файлов. Я использую для закачки файлов по ftp обычный файл-менеджер Windows Commander.
Для этого в меню Commands надо выбрать опцию FTP New Connection, в появившемся
окне набрать адрес, например, ftp. ncbi. nlm. nih. gov.
Надо выбрать анонимное соединение, так как пароля не требуется для
общедоступных баз. После соединения будут видны все каталоги и файлы, которые
есть на этом сервере. Можно открыть эти каталоги и посмотреть какие файлы-базы там есть. В каждом каталоге есть файлы readme. txt для описания баз. Для копирования надо перетащить файл мышью на соседнюю панель Windows Commander.
В интернете сотни сайтов, представляющих различную медико-биологическую и генетическую информацию. Не профессионалам, то есть не медикам и биологам,
часто трудно разобраться в этих данных или базах. Поэтому в конце перечня

 
                5
полезных по теме сайтов, я рекомендую посетить лучший из рускоязычных форумов.
Его адрес: http://www. molbiol. ru , на котором любому человеку можно задать вопрос по генетике, молекулярной биологии, биохимии, цитологии,  и так далее,
и получить ответ специалистов и ученых.
 В моей книге я излагаю свои проекты в биоинформатике. Для общего
ознакомления с этой наукой можно рекомендовать книгу по общим вопросам компьютерной биоинформатики [32].
Методы и протоколы в генетической биоинформатике [33, 34, 35].
Я работаю в биоинформатике на компьютере, разрабатывая теоретически свои проекты, но я по образованию лабораторный работник по биохимии или
врач-исследователь широкого профиля. Я несколько лет работал в лаборатории и хорошо знаю всю биохимическую "кухню". Примером одной из моих практических
работ я могу назвать статью в журнале "Лабораторное дело", 1991, 3, 34-36. Статья называется "Метод определения нитритов в слюне". Нитриты в слюне
отражают общее поступление нитратов в организм  с пищей и водой. Контроль нитритов, как одного из главных мутагенов, может иметь значение для
профилактики возникновения рака и токсического, мутагенного влияния на
организм человека. Эту статью можно посмотреть на моем сайте. Если будет финансирование проектов, описанных в этой книге, то практические работы в лаборатории начнутся немедленно.
Буду благодарен за финансовую и другую помощь. Как мне помочь написано на
моем сайте http://neogermetic.narod.ru.

    10 ЛЕТ ГЕНОМА ЧЕЛОВЕКА - ВСЕ ЕЩЕ ТОЛЬКО НАЧИНАЕТСЯ. 29 ФЕВРАЛЯ 2012.

  До настоящего времени находят в геноме человека новые гены или определяют функцию неизвестных генов. То, что есть на момент написания этой статьи, я привожу в виде простого списка генов человека. Этот список, который
представлен на моих сайтах, состоит из латинского названия гена и его расшифровки в виде полного названия и его пояснения. Также для гомологов
указан вид организма, с которым сравнивалась ДНК человека. Список генов
человека находится по адресу:
http://www.neogermetic.narod.ru/a-r.txt
http://www.neogermetic.narod.ru/s-z.txt
Этот список имеет значение для науки, потому что дает общее представление о
том , что есть в геноме человека. Обозначены наиболее полно все гены, включая РНК, а также дан полный список псевдогенов.
Список генов привожу здесь для развития генетики в России. Поэтому развернутое название я привожу на русском языке, сделав авторский перевод. При этом специалисты в своих областях - инженеры, химики, биологи, медики получат
смежную информацию. Впервые многие сотни белков написаны по-русски. Это даст
в будущем удобство при работе с рускоязычными научными статьями.
Список был получен путем обработки и перевода файлов баз, находящихся
на сервере NCBI USA, в свободном доступе по указанным ниже интернет адресам. Даты исходных файлов имеют обновления на ноябрь-декабрь 2011 г.
Полное название генов на английском языке и подробное описание находится в файлах генома человека по адресу :
ftp://ftp.ncbi.nlm.nih.gov/genomes/homo sapiens/
ftp://ftp.ncbi.nlm.nih.gov/
ftp://ftp.ncbi.nlm.nih.gov/genes.
Там же надо искать полную информацию и литературу по каждому гену. Либо,
зайти на сайт http://www. ncbi. nlm. nih. gov , и в поисковике выбрать
опцию - Genes,  и набрать латинское название гена, при этом указать вид - Homo
sapiens. Например, набрать ADCY1 Homo sapiens, для получения информации по аденилатциклазе 1 мозга.
Чтобы не делать нелепого перевода, я оставил жаргонные научные слова или
термины из генетики гомологов генов разных видов на английском языке или как слышится по-русски.
Перевод полного названия генов с помощью программ-переводчиков приводит к нелепому или ошибочному переводу. Поэтому каждую строчка списка просматривалась вручную. Конечно, возможны ошибки, опечатки при переводе.

                6
Я произвел анализ общего списка генов человека.
Список содержит 46005 строк записи, список генов включает в себя
гены белков, псевдогены и РНК.
Количество псевдогенов составляет 11065 записей. Сегодня известно, что часть
их может регулировать активность настоящих генов, то есть нельзя полностью их считать балластом генома. Такое большое число псевдогенов найдено  в геноме,
но какое они оказывают влияние на биологию извесно только для единиц
псевдогенов.
То есть псевдогены в основном вообще не изучены.
В ранних сообщениях на своем сайте Neogermetic.narod.ru , я предложил  такую  операцию на  генах и геноме как его ДЕФРАГМЕНТАЦИЮ для удаления некоторых или всех интронов в генах для очистки генома от транспозонов для избавления
человека от болезней и старения. Частично  такая  операция   проведена  самой природой для многих псевдогенов ретрокопированием. Значит возможно очистить
и рабочий ген.В будующем будут возможны более глобальные для генома человека операции. Тут я думаю, что от многих псевдогенов надо избавиться как от груза ненужных мутаций. И этот процесс резки и сшивания ДНК, который в будущем
будет легко осуществим прямо на ходу,  на компьютере, я назову ОПТИМИЗАЦИЕЙ генома.
Таким образом ДЕФРАГМЕНТАЦИЯ и ОПТИМИЗАЦИЯ генома человека в ближайшем
будущем приведет к созданию нового вида человека с большой длительностью
жизни, без болезней, чрезвычайно устойчивого к среде и годного для полета в дальний космос. В общем решение проблемы псевдогенов только начинается.
Из РНК : транспортной РНК - 688, малой ядрышковой РНК - 407, микроРНК - 1425 генов, длинная межгенная не-белок кодирующая РНК 154 гена (хотя последний
член списка имеет номер LINC00488, то есть возможно, что не все указаны в оригинале).
Большая группа генов рецепторов - 2868 гена, из них обращает на себя внимание рецепторы запаха - их 1097, остальные – это рецепторы мембран,
внутриклеточные и смешанная группа для различных лиганд-рецепторных взаимодействий.
Рецепторов вкусовых всего 49 генов.
Очень много неизученных или малоизученных генов, так слово "гипотетический" встречается в списке 6771 раз, также много генов даже не имеющих оригинального названия - это гены, обозначаемые LOC (локус) с указанием его номера.
Таких LOC в списке 13313 генов.
Много генов ORF (open ready frame) - открытая рамка чтения. С помощью
программы определяется , что для данного места будет возможна транскрипция и трансляция, но функция этих генов мало изучена.
Генов ORF - 1247 в списке.
Много генов гомологов разных организмов, особенно гомологов дрозофилы ,
мышей и других. Хотя клетки у всего живого имеют близкое строение и функцию,
но у человека эти гены могут иметь особую функцию, чем у мух. То есть реально, что делают гены-гомологи у человека мало изучено, да они также мало изучены
и у насекомых, геномы,  у которых определяли позднее человека. Так  что 
ссылка  с  одного неизвестного гена на неизвестный ген другого организма мало что дает. Генов  гомологов в списке 1893.
Большое семейство генов с общим названием "цинк-фингер протеин", или
"цинковый палец белок", это жаргонное имя "палец" связано с тем, что молекула, связывающая цинк, похожа на него. Эти белки связываются с ДНК, РНК, другими молекулами, многие имееют функцию регуляции транскрипции. Отнесены в одну
группу только по схожему цинк-связывающему домену, и точная их функция мало
известна для большинства. Генов цинк-фингеров в списке 1452.
Генов, относящихся к работе рибосом в списке 2479 (может быть
больше).
Много генов, подобных другим генам, то есть им присваивается схожее название
на основании похожести структур или функции. Но все равно эти гены не на 100 процентов идентичны, и если отличия наследуются, значит они для чего-то нужны.
Генов подобных (like) другим генам в списке 4809.
Генов ферментов в списке 4681 (может быть больше).
Можно из этого списка получить и другую статистику по различным генам, но цель этой статьи показать, что изучение биологии человека спустя 10 лет после

                7
определения его генома, только начинается.
Хотя сделано учеными очень много за это время, но еще очень много неясного,
не до конца изученного, очень много генов не подключены к генным сетям, то
есть об их взаимодействии информации нет. В генотерапии или других влияниях
на гены больше эмпиричности, чем точного знания. Предполагаемые последствия
не известны, так же как не известна функция многих генов.

           Тексты ДНК. Медицина и биология будущего.2013.

 В недалеком будущем синтез ДНК на специальных машинах по данной последовательности, а также секвенирование генома или какого-то участка ДНК, значительно ускорятся и станут дешевыми. Это приведет к тому, что работа с генами будет обыкновенной работой для лабораторий больниц или для работы с растениями и животными. Геномодификация их будет общедоступна.
Люди поймут, что геномодифицированные организмы создаются для их пользы. Для людей, далеких от генетики, я могу рекомендовать книгу про
геномодифицированные организмы и пользу, которую они дают. Литература [30].
Генотерапия для лечения рака, старения, инфекций или коррекции каких-то
свойств организма будет повседневной практикой. При этом для вводимых генов будет применяться текстовое пояснение. Вместе с целевым участком ДНК, будет вводится пришитый к нему участок ДНК с текстом. В нем будут записаны
основные данные о гене, месте введения, клетках, и другая медико-биологическая информация.
Эти тексты можно будет извлечь из биопроб и прочитать текст за несколько
минут с помощью специальных сканеров в будущем. Организм можно будет много
раз лечить с помощью различных геномодифицированных клеток.
Будут использованы либо клетки хозяина, которые превращаются
в недифференцированные стволовые клетки, либо универсальные клетки, годные
для любого человека.
Перед введением в конкретного человека, в эти клетки будет введена текстовая информация в ДНК. Это позволит и через много лет для конкретного человека узнать, какие генные модификации с ним были проведены. Для стандартизации
записи и чтения с ДНК будет нужен специальный ПЦР маркер текста. Размер  вводимого текста может быть несколько тысяч или десятков тысяч байт.
Все генетические процедуры будут упрощены и доступны. Я думаю, что эти
времена наступят в ближайшие 10-50 лет. Большой срок нужен скорее для
проверки отдаленных последствий, но,  если речь идет о жизни и смерти при
лечении рака или инфекций, то для таких людей личные последствия генотерапии
не имеют значения, так как позволяют им выжить сегодня. Без записи текстов в
ДНК любая генотерапия будет не контролируемая и не регулируемая через много
лет для конкретного человека. Процедура записи и чтения текстов  будет стандартизована.
Будет полный и несложный контроль за любой генотерапией или генокоррекцией.
Таковы, я думаю, будут перспективы будущего для генетики.
С другой стороны, что будет в будущем, то уже было в прошлом. Если человек подвергался генотерапии или генокоррекции много тысяч лет назад, то эти текстовые или технологические участки ДНК можно пытаться найти в геноме человека.
При этом речь идет не о послании из прошлого, а о текстах, которые являются пояснением к какой-то операции на генах. Это моя гипотеза, которую я буду проверять.


          МУЗЫКА ГЕНОВ ЧЕЛОВЕКА.  Сообщение 1. 29 мая 2006 г. 

 Статьи для книги взяты из интернет-публикаций с некоторыми изменениями, написанных мной с 2006 по 2012 г, и расположенными на моих сайтах
www.neogerm.narod.ru и www.neogermetic.narod.ru , Рядом указана дата
публикации для соотношения с постоянно меняющейся мировой научной информацией.


                8
 Гены человека состоят из ДНК - основной молекулы жизни. Все ферменты, 
структурные белки и другие молекулы закодированы в ДНК в виде
последовательности четырех нуклеотидов. Значение ДНК - это прежде всего
хранение информации, подобно жесткому диску компьютера.   Возраст этой информации огромен. Жизнь была всегда во вселенной, переходя из галактики в галактику. И если молекула ДНК создана природой, то информация на ней записана далеким творцом и была ранее, чем возникла звезда по имени Солнце. Возраст разных генов человека оценивается от десятков миллионов лет до миллиардов лет. Есть у человека и других организмов настолько консервативные по информации
гены, что предполагается , что они были всегда. Это прежде всего гены ,
которые поддерживают информационную целостность ДНК. Поскольку даже единичные мутации в них, например,  замена даже одного нуклеотида на другой, делают продукт этих генов летальным для клетки, и такие клетки сразу же
отбраковываются эволюцией. Для примера - ген белка гистона - H4 человека имеет
такую же последовательность нуклеотидов , что и у растений, а разница в
возрасте генов у них более миллиарда лет.
 В начале 3 тысячелетия н. э.  первичная структура ДНК человека, наконец, 
была полностью определена. Более 25000 генов закодировано в геноме человека.
На 2013 год число генов у человека было уточнено и составило 22389.
 Очень большой массив информации, заложенной в ДНК человека начали изучать ученые всего мира. Почти все задают себе вопрос, что еще кроме структуры
белка, РНК, и некодирующих участков - повторов, может содержать в себе главная молекула жизни? Может быть слова создателя всего живого, послание через миллиарды лет для тех, кто достиг сегодняшнего уровня научно-технического развития, достаточного, чтобы прочитать ДНК? Пока ответа нет. Это неизвестно. 
 Я решил, что одну информационную последовательность можно всегда
преобразовать в другую. Музыка является тоже информацией и мне пришла простая идея - переложить последовательность нуклеотидов в ДНК в последовательность
нот.
 Я разработал алгоритм этого перевода, так чтобы музыка полностью
отражала химическое строение генных продуктов. И вот первый исходник
музыкальной программы написан, я ее запускаю, и я потрясен - оказывает
ДНК - это музыкальное произведение, гены - как мелодии! А этим мелодиям
миллиард лет. Музыка звучит несколько непривычно и оригинально, но чем чаще я прослушивал какую-то мелодию, тем больше она мне нравилась, видимо
запоминались отдельные сочетания нот в мелодии. 
 Хотя в основе этой музыки мой авторский алгоритм, но то, что я для перевода
в ноты использовал именно химическую структуру,  позволяет мне это утверждать, что гармония музыки и гармония макромолекул объединились.
 Возможны, конечно, другие алгоритмы перевода информациии из ДНК, но я взял наиболее простой и универсальный химический принцип,  который является
свойством молекул во всей вселенной. 
 Данный алгоритм и простое программное оснащение для перевода
последовательности нуклеотидов ДНК в музыку будут опубликованы ниже. 
 Возможно,  возникнет новая наука - генетическая музыкотерапия.
Для исследований по этой музыкальной терапии каждый может написать
мелодию на любой ген или группу генов, имеющих значение для какого-то заболевания или музыка-терапии или музыка-влияния на какие-то биохимические реакции или физиологические процессы. 

          ВОПРОСЫ ПО МУЗЫКЕ ГЕНОВ. Сообщение 2. 27 сентября 2006. 

 1. Может ли эта музыка прямо влиять на макромолекулы в организме ?
Нет. Специфическое прямое влияние на нуклеиновые кислоты и белки невозможно.
То есть раскачать в организме в резонансе какой-то конкретный белок или ген с целью изменения его активности, написанной для него музыкой, невозможно.
 Нет физической связи между искусственно созданными звуками и молекулами. При любом алгоритме генной музыки.  Хотя наука полна неочевидными явлениями и парадоксами. Может быть это явление не известно.  Неспецифическое, то есть опосредованное корой и лимбической системой мозга , регуляцией уровня стресса, уровня гормонов в организме,  как и другая музыка-терапия, действие генной


                9
музыки возможно. 
Речь идет именно о музыке, то есть звуках, поступающих через уши в слуховой анализатор мозга. То есть музыка может нравиться, вызывать положительные
эмоции, успокаивать или бодрить и через это влиять на общее состояние
организма.   Я слушаю эту музыку уже не менее полугода, каких-то изменений в
организме не отмечено. Хотя если слушать длинную мелодию, то это способствует засыпанию , мелодия как бы слегка усыпляет и все. 
 Поэтому активировать какие-то нежелательные гены , например апоптоза, 
онкогены, эндогенные вирусы, и другие,  музыкой написанной с этих генов,  не получится. 
 2. Какой алгоритм музыки генов человека?
 Он будет описан ниже.  Надо заметить, что алгоритмов преобразования последовательности нуклеотидов в последовательность звуков может быть много.
Сколько авторов - столько и вариантов музыки какого-то гена. 
Лишь бы полученная музыка была приятной. 
Если набрать в каком-то интернет-поисковике, например в Яндексе, слова
"музыка генов", то будет несколько интересных ссылок. 
 В одной их них известный ученый Гаряев Петр Петрович, автор книг о волновом геноме, предлагает свой вариант генной музыки, но его алгоритм мне неизвестен. 
 В инернет-ссылках описан алгоритм только у авторов из Испании. Это
А. С. Соуза и Р. Крулл. Их музыка состоит,  как я понял,  из 4 нот , 
соответствующих 4 нуклеотидам ДНК. 
 В моем алгоритме моей музыки генов, скажу пока только, звучат почти
все ноты из трех октав. 
 Так как диск этих исследователей-музыкантов из Испании купить где-то
невозможно, попробуйте-ка найдите, я сам закачал этот ген, о котором они
говорят - connexin 26. затем переложил его на музыку по-своему и по-ихнему.
Хотя я и не профессионал-музыкант, но музыка по-моему алгоритму гораздо приятнее. Музыка сочнее, четкие запоминающиеся участки мелодии, сама мелодия гораздо короче, что важно. 
 Гены могут быть очень большие, и слушать 10-20 минут переливы нот надоедает. 
 В моей музыке убраны все интроны из генов и отражающие их ноты.
 Так как слушать то, что сама природа выщепляет из генов и разрушает
при движении информации от ДНК к белкам, пока считаю не нужным.
 Но потом дойдет дело и до музыки интронов , музыки транспозонов, музыки повторов, и даже мусорную ДНК можно переделать на музыку, ведь она зачем-то
есть в геноме.
 3. Для чего можно использовать музыку генов?
 Прежде всего,  просто слушать и размышлять о природе и вечности. 
Информации , записанной в генах человека, миллионы и миллиарды лет. 
А музыка генов отражает эту информацию.   Можно попробывать применить
отдельные мелодии для музыкотерапии,  но для этого нужны исследования.
Возможно в будущем окажется, что какие-то классические мелодии или музыкальные хиты отражают последовательность нуклеотидов в каких-то генах композиторов. 
И они возникли не случайно и их влияние на эмоции, самочувствие людей тоже не случайно.
 Поскольку мелодии уже написаны природой, нужно только перевести их в форму
для приятного восприятия, добавить аранжировки и готово.  Цена в деньгах
мелодий будет невелика. поэтому их можно , я думаю,  с успехом применить для озвучивания компьютерных игр, мультфильмов, кино. 
 4. Какое качество звука?
 Файлы музыки генов записаны в формате pcm, файлы типа riff с
расширением wav. атрибуты файла - 44100 герц, 16 бит, стерео.

         МУЗЫКА ГЕНОВ ДРОЖЖЕЙ.  Сообщение 3. 10 января 2007 г. 

 Продолжаю развивать данный проект в виду его научной важности. Несколько лет назад в интернете прошла новость, что японский ученый Нобуо Мунатака перевел геном человека на музыку полностью.
Ссылка - WWW. Mosors. narod. ru/genom_muz. html.

                10
Да, очень большая работа. Алгоритм японцев мне не известен.   Я, для начала, создал около 40 музыкальных файлов, это музыка генов, основных для сохранения информации в ДНК - полимеразы, лигазы, топоизомеразы, а также генов, важных
для работы нервной системы - миелина, факторов роста нервов, липотропина (пептид, включает в себя эндогенный обезболиватель) и другие.
 В 2007 г.  я сделал то, что еще не было - полностью перевел на музыку
геном дрожжей. Эти Saccharomyces удивительные организмы.
 Генов у них очень много - 6000, причем много уникальных , таких которые
человек в эволюции утратил.  Это эукариоты, а не какие-то микробы. У них есть ядро, митохондрии и даже уникальный способ полового размножения. У дрожжей
много генов,  последовательности нуклеотидов в которых близки к человеку. 
 При просмотре последовательностей генов сразу видно какие гены будут
хорошо звучать благодаря наличию в них всяких повторов,что создает уникальный ритм.   Потребовалось около 2 месяцев, чтобы с помощью программ в полуавтоматическом режиме перевести геном дрожжей на музыку в программную
форму на BASIC. Теперь необходимые гены можно быстро переводить из этой формы
в WAV или MP3 файлы.
 Музыка генов в форме программ позволяет легко изменить параметры музыки
нужного гена - частоту, темп и т. д. 
 Для примера приведу ген дрожжей PAU7 хромосомы 1.
Белок имеет размер 55 аминокислот, функция неизвестна. Привожу музыкальный
файл в формате QBASIC.Сделал Курносов М. 10 января 2007.
Причем я сделал хвост белка из 11 аминокислот повторяющимся 10 раз
искусственно. Аналогично можно поступать с другими генами, как бы увеличивая количество какого-то домена в белке.

PRINT "pau7 - MVKLTSIAAGVAAIAAGASAAATTTLSQSDERVNLVELGVYVSD"
PRINT "IRAHLAEYYSF"
PLAY "L8"
PLAY "O1GO3CO1BO2FO2BO3EO2GO3AO3AO4DO3C"
PLAY "O3AO3AO2GO3AO3AO4DO3AO3EO3AO3AO3A"
PLAY "O2BO2BO2BO2FO3EO2CO3EO2DO1AO1DO3C"
PLAY "O2EO2FO3CO1AO2FO4DO3CO1CO3CO3EO2D"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"
PLAY "O2GO1DO3AO1FO2FO3AO1AO1CO1CO3EO1E"

 АЛГОРИТМ МУЗЫКИ ГЕНОВ. БЕЛКОВЫЕ ДОМЕНЫ. Сообщение 4. 24 ИЮЛЯ 2008.

 По просьбе людей, которые проявили интерес к музыке генов, я раскрываю идею
для алгоритма, который использовал для ее создания.  Идея в следующем:
триплет нуклеотидов – универсальный генетический код - одна аминокислота –
одна нота октавы.
Для распределения всех 20 аминокислот по нотам я разделил их по молекулярной массе, чем больше вес - тем ниже частота звука. Таблица перевода аминокислот
в ноты дана ниже.
 Каждая аминокислота соответствует одной ноте, а все они охватывают 3 октавы. Хотя музыка полностью отражает химическую структуру гена и его продукта,
но все-таки распределение это принято мной искусственно и этот перевод
последовательности нуклеотидов ДНК в последовательность звуков или нот
выполнен без связи с каким-то биологическим или физико-химическим процессом,
поэтому моя музыка генов не может оказать какого-то иного влияния на организм, чем обычная музыка.
 К тому же музыкальный файл охватывает весь ген или белок, а они по своей
длине имеют разное значение. Есть структурные, есть регуляторные участки,есть

                11
разные повторы. В ДНК информация белка закодирована, на ДНК участки гена
могут мало отличаться друг от друга, а в кодируемом им белке будут очень
разные структуры. Белки состоят из различных регионов, доменов, сайтов или
точек имеющих функциональное значение.
 Поэтому следующим моим шагом было,  конечно,  создание музыки генов для отдельных белковых доменов. Для примера - белок спондин.
Ген расположен в 7 хромосоме - SSPO. Спондин нужен для нейрональной
агрегации в развитии нервной системы. Белок-предшественник очень большой - молекулярная масса 547504 Д. Аминокислот - 5147.
Если перевести такое количество аминокислот в ноты, то файл будет звучать
около 10 минут. Хорошая же генная мелодия - короткая, но оригинального
звучания. В спондине много доменов и я их привожу ниже, цитируя данные из белковой базы по адресу http://expasy.org.

   SIGNAL        1     17       Potential.
   CHAIN        18   5147       SCO-spondin.
   DOMAIN       18    102       EMI.
   DOMAIN      194    408       VWFD 1.
   DOMAIN      469    524       TIL 1.
   DOMAIN      563    773       VWFD 2.
   DOMAIN      827    879       TIL 2.
   DOMAIN      880    939       VWFC 1.
   DOMAIN     1013   1219       VWFD 3.
   DOMAIN     1275   1331       TIL 3.
   DOMAIN     1375   1412       LDL-receptor class A 1.
   DOMAIN     1415   1450       LDL-receptor class A 2.
   DOMAIN     1451   1487       LDL-receptor class A 3.
   DOMAIN     1491   1529       LDL-receptor class A 4.
   DOMAIN     1564   1600       LDL-receptor class A 5.
   DOMAIN     1602   1641       LDL-receptor class A 6.
   DOMAIN     1655   1693       LDL-receptor class A 7.
   DOMAIN     1694   1748       TSP type-1 1.
   DOMAIN     1750   1808       TSP type-1 2.
   DOMAIN     1824   1863       EGF-like 1.
   DOMAIN     1864   1901       EGF-like 2.
   DOMAIN     1909   1965       TSP type-1 3.
   DOMAIN     1965   2025       VWFC 2.
   DOMAIN     2065   2224       F5/8 type C.
   DOMAIN     2233   2269       LDL-receptor class A 8.
   DOMAIN     2390   2426       LDL-receptor class A 9.
   DOMAIN     2463   2499       LDL-receptor class A 10.
   DOMAIN     2500   2553       TSP type-1 4.
   DOMAIN     2555   2610       TSP type-1 5.
   DOMAIN     2633   2675       TIL 4.
   DOMAIN     2715   2769       TSP type-1 6.
   DOMAIN     2772   2828       TSP type-1 7.
   DOMAIN     2830   2883       TSP type-1 8.
   DOMAIN     2985   3040       TSP type-1 9.
   DOMAIN     3041   3083       TSP type-1 10.
   DOMAIN     3183   3250       TSP type-1 11.
   DOMAIN     3252   3307       TSP type-1 12.
   DOMAIN     3311   3365       TIL 5.
   DOMAIN     3408   3470       TSP type-1 13.
   DOMAIN     3472   3527       TSP type-1 14.
   DOMAIN     3645   3693       TSP type-1 15.
   DOMAIN     3811   3932       TSP type-1 16.
   DOMAIN     3946   4002       TSP type-1 17.
   DOMAIN     4004   4059       TSP type-1 18.
   DOMAIN     4159   4212       TSP type-1 19.
   DOMAIN     4253   4305       TSP type-1 20.
   DOMAIN     4307   4363       TSP type-1 21.
   DOMAIN     4365   4419       TSP type-1 22.

                12
   DOMAIN     4615   4665       TSP type-1 23.
   DOMAIN     4667   4723       TIL 6.
   DOMAIN     4763   4816       TSP type-1 24.
   DOMAIN     4984   5042       VWFC 3.
   DOMAIN     5041   5140       CTCK.

 Для примера домен 1864-1901 это участок белка,  подобный эпидермальному
фактору роста - EGF-like 2, и для таких коротких, но функционально-значимых
мест есть решение создать звуковой файл. Не обязательно звук, любой волновой паттерн.
 Фармакология белковых доменов - это фармакология не далекого будущего, эта область биотехнологии очень интенсивно развивается. На основе 2 и 3 структур белковых доменов подбираются молекулы для избирательной модификации активных участков белка. Уникальность, консервативность и специфичность некоторых
доменов очень велика, например,  активный центр фермента связывает и изменяет
только один тип молекул из десятков тысяч других и почти одинаковы у человека
и мыши.

        ДОПОЛНЕНИЕ ПО МУЗЫКЕ ГЕНОВ. Сообщение 5. 13 августа 2008 г.

 Расхваливать зарубежных ученых модно, своих потому-что почти не осталось. 
Поэтому, прочитав ссылку http://www. compnews. ru/news/news/23059. html, 
решил высказать свое мнение. 
 Алгоритм ученых из Америки проекта Gene2Music — выполненного Ри Такахаси
(Rie Takahashi),  профессором Джеффри Миллером (Jeffrey Miller), и Фрэнком Петитом (Frank Pettit) из университета Калифорнии в Лос-Анджелесе основан на разделении всех аминокислот по гидрофобности-гидрофильности и по частоте триплетов для кодирования данной аминокислоты - получится звуковой ряд , где каждой аминокислоте будет дана своя нота. 
 Как и раньше было мной написано, я говорю, что алгоритмов перевода
последовательности нуклеотидов в ДНК в звуковые файлы может быть много, все зависит от целей - для чего эти файлы нужны. Сам я могу составить их штук 20, варьируя разные свойства нуклеотидов или аминокислот. 
 Чисто из-за музыки ничего не делается, а делается под конкретные проекты попыток влияния на геномы или протеомы.  И здесь главное - попытаться
связать свойства молекул с волновыми характеристиками файлов. Это не
обязательно музыка, возможны любые волны, если предполагается их специфическое влияние, например чередование импульсов разной длины волны лазеров.
 Музыка коллег из Америки мне понравилась, музыка медленного темпа, хорошего качества и оригинальности. Но на биологические объекты она влиять не сможет иначе, чем обычная музыка. Если разделение по гидрофобности в звуковой ряд
еще имеет какой-то биологический смысл, это влияние гидрофобности аминокислот
на 2 и 3 структуру белка и тропность гидрофобного домена к мембране, то использование вырожденности кода разбивает звуковой ряд искусственно. 
 Моя генная музыка имеет высокий темп и оригинальные мелодии. Приведу образец своей генной музыки, это субъединица АТФ-синтазного комплекса из митохондрий человека - ATP-SYNTASE-8, небольшой белок, кодируемый митохондриальным
геномом.   Вот он -



PRINT "ATP-SYNTASA 8 MITOCHONDRIA HOMO SAPIENS"
REM COPYRIGHT KURNOSOV M. N. 12 apr 2006.
REM NAME - "POWER AND GOLD".
PLAY "L10"
PLAY "O1GO3DO2CO2FO2EO2BO2BO3CO0BO3DO2BO1G"
PLAY "O2GO2BO3DO1GO2FO2FO2BO2FO3EO2FO2GO2B"
PLAY "O2CO2FO1BO1GO2FO2EO2BO2EO1CO1FO2FO3D"
PLAY "O3DO3EO3DO1BO3DO1GO1BO1G"
PLAY "O1BO2EO1CO2EO1BO3DO0BO1AO3DO1BO0BO2B"
PLAY "O1BO2GO2AO3EO2FO1FO3EO2FO3DO3DO2CO3E"
PLAY "O1GO3DO2CO2FO2EO2BO2BO3CO0BO3DO2BO1G"

                13
PLAY "O2GO2BO3DO1GO2FO2FO2BO2FO3EO2FO2GO2B"
PLAY "O2CO2FO1BO1GO2FO2EO2BO2EO1CO1FO2FO3D"
PLAY "O3DO3EO3DO1BO3DO1GO1BO1G"
PLAY "O1BO2EO1CO2EO1BO3DO0BO1AO3DO1BO0BO2B"
PLAY "O1BO2GO2AO3EO2FO1FO3EO2FO3DO3DO2CO3E"
PLAY "O1GO3DO2CO2FO2EO2BO2BO3CO0BO3DO2BO1G"
PLAY "O2GO2BO3DO1GO2FO2FO2BO2FO3EO2FO2GO2B"
PLAY "O2CO2FO1BO1GO2FO2EO2BO2EO1CO1FO2FO3D"
PLAY "O3DO3EO3DO1BO3DO1GO1BO1G"
PLAY "O1BO2EO1CO2EO1BO3DO0BO1AO3DO1BO0BO2B"
PLAY "O1BO2GO2AO3EO2FO1FO3EO2FO3DO3DO2CO3E"
 В этом файле белок повторен 3 раза.

 На эту дату изготовлено более 100 мелодий разных генов человека, формат WAV
или MP3, если кого-то заинтересует моя генная музыка, то сделаю любой ген, любого организма очень быстро с помощью моей простой программы перевода последовательности нуклеотидов в последовательность нот. Или могу сделать
музыку отдельных белковых доменов. В наличии пока есть музыка всех 6000 генов дрожжей S. cerevis. , которые я целый месяц набирал в виде программ на своем
любимом 386 компьютере, ведь для создания и воспроизведения генной музыки достаточно любого древнего ПК. 

    МУЗЫКА ГЕНОВ ВИРУСА ГЕРПЕСА ТИПА 2. Сообщение 6. 10 января 2011 г.

 Я создал музыку генов герпес-вируса типа 2 по алгоритму,  сообщенному мной ранее на моем сайте WWW.NEOGERMETIC.NAROD.RU.  Прежде всего хочу сказать, что последовательность нуклеотидов ДНК геномов или генов разных организмов от человека до самых простых вирусов можно преобразовать в любую другую информационную последовательность. Это может быть текст из букв какого-то
языка, это может быть последовательность разных звуков , как в музыке генов, последовательность световых, цветовых сигналов, различных полевых импульсов - СВЧ-излучения, модуляции электростатического поля, разное лазерное когерентное излучение и другое.
 То есть последовательность нуклеотидов ДНК, РНК или белка можно
преобразовать в любую другую информацию, носителем которой может быть любая другая материя.
 Но обратный процесс, а именно влияние этих физических материй, созданных на основе кода молекулы ДНК,  РНК или белков , на сами молекулы вряд ли возможно
в смысле специфичности воздействия. Иначе говоря вряд ли музыка генов окажет
какое-то влияние в нужном направлении на гены или белки.
 Пока мне про это ничего не известно.Возможно достичь какое-то
неспецифическое действие, например повышение температуры раствора, но для
этого не надо заниматься преобразованиями одного информационного кода или сообщения в другое.
 Эта музыка генов вируса герпеса просто демонстрация возможности
преобразования одной информационной последовательности в другую. Для примера привожу музыкальный файл гена VP26 вируса, белок длиной 112 аминокислот. Это малый капсидный белок вируса по функции. Последние 24 аминокислоты я повторил
3 раза искусственно.

PRINT "HERPES VIRUS 2 VP26,AVTOR KURNOSOV M.N."
PLAY "L10"
PLAY PLAY PLAY "O2DO2EO3EO1CO3DO1FO3DO1F"
PLAY PLAY PLAY "O4DO2DO3AO3AO3AO1AO0BO2F"
PLAY PLAY "O1BO2BO3DO3EO2BO3D"
PLAY PLAY "O1BO2BO3DO3EO2BO3D"

                14
PLAY PLAY "O1BO2BO3DO3EO2BO3D"

 Предлагаю всем желающим студентам, биологам , медикам для научного изучения этой музыки генов  получить какие-то экспериментальные результаты по ее воздействию на биологические объекты. А именно вирусы, бактерии, клетки, многоклеточные организмы.  Всего у вируса герпеса типа 2 есть 77 белков, из
них 8 с неизвестной функцией. В этой книге приведен для примера один белок и
его музыкальный файл, остальные опубликованы мной на сайте.

                МЕТОДИКА РАБОТЫ.

 Все это делается на самой простой машине - процессор 386sx33, на выход системного динамика с сопротивлением 8 ом и мощностью 0, 5 ватта подключается более мощный динамик. Испытано хорошо динамик 2ГДШ3 с сопротивлением 8 ом.
Звук более громкий и приятный, чем от маленького динамика. Для создания и проигрывания музыки генов используется программа QBASIC. EXE версия 1. 1 , входящая в состав MSDOS 6. 22 , также используется программа EDIT. COM,
входящая в эту же  DOS. Эти программы будут работать и на операционной
системе WINDOWS XP. Этот звук можно вывести на дистанционный динамик для
влияния на биообъекты. В окне QBASIC надо открыть программный файл,
например 75. BAS и нажать клавишу F5 - RUN. Программисты-профессионалы могут, конечно, сделать какой-то шедевр для этих целей для WINDOWS, но мне
достаточно и QBASIC.
 Чтобы изучить любой ген, надо загрузить его последовательность из хранилища  NCBI по адресу WWW. NCBI. NLM. NIH. GOV или с любого зеркала.
 Частоты звуков, кодируемые QBASIC следующие.

   НОТА  ДО  РЕ  МИ ФА  СОЛЬ  ЛЯ  СИ
  БУКВА   C   D   E  F     G   A   B

 5 ОКТАВ      О1        О2        О3            О4          О5         

 ЧАСТОТЫ 130-247   261-494   523-988     1047-1975   2092-3950
 ГЕРЦ

 Например, значение O1B - нота  СИ малой октавы , ее частота - 247 Герц.
Перед каждой мелодией стоит PLAY "L12" - это темп или скорость мелодии.
 Я принял следующие значения параметров для своей музыки.Алгоритм автора
- Курносова М.Н. для связи аминокислот и звука.
 Аминокислота   Масса-Д  Частота-Гц  Значение для PLAY

 W              204      247         O2B
 Y              181      262         O2C
 R              174      294         O2D
 F              165      330         O2E
 H              155      349         O2F
 M              149      392         O2G
 E              147      440         O2A
 K              146      494         O2B
 Q              146      523         O3C
 D              133      587         O3D
 N              132      659         O3E
 L              131      699         O3F
 I              131      784         O3G
 C              121      880         O3A
 T              119      988         O3B
 V              117     1047         O4C
 P              115     1175         O4D
 S              105     1319         O4E
 A               89     1760         O4A
 G               75     2350         O5D

                15
 Замена последовательности аминокислот или нуклеотидов на последовательность
нот производится специальной программой, но это можно сделать и вручную, используя в различных редакторах текста опции "заменить на" и "заменить все". Далее вручную набить кавычки и PLAY по образцам, приведенным в статье.
 Более точные значения для оператора SOUND и PLAY надо читать руководство по программированию в среде QBASIC. Так все белки вируса герпеса я превратил в музыкальные файлы примерно за час работы. Файлы под QBASIC удобны тем, что параметры звука можно варьировать очень быстро, просто изменяя их в окне редактора QBASIC.
 Для прослушивания надо текст стандартными приемами WINDOWS перенести в окно QBASIC. Файл должен иметь обязательно расширение . BAS , например,  75. BAS.
Лучше файл сохранить в одной папке рядом с программой QBASIC, чтоб ее было
легче найти и открыть. Звук системного динамика запускается кнопкой F5 - RUN.
Далее зыук, выводимый системным динамиком компьютера, переводится в звук, с расширением WAV , MP3 или другое для удобства дальнейшего прослушивания. Для этого применяются разные редакторы звука, например SOUNDFORGE, GOLDWAVE или другой. Захваченный программой звук сохраняется в другом нужном формате с коррекцией качества звука.

           МУЗЫКА БЕЛКОВЫХ КОМПЛЕКСОВ. СООБЩЕНИЕ 7. 4 ИЮНЯ 2011. 
 
 Музыка отдельных генов или отдельных белков - это уже пройденный этап. 
В живой клетке большинство белков объединены в различные макромолекулярные комплексы.
Почти все белки обладают большим специфичным сродством к другим белкам.
Белки в клетке находят из тысяч других те, с которыми надо объединиться в комплексы.  Binding protein - это свойство есть почти у каждого пятого белка,
 а на самом деле еще больше. Например,  праймазы PRIM1 и PRIM2 образуют гетеродимер. А полимераза дельта состоит из 4 субъединиц, кодируемые разными генами, они объединяются в тетрамер.
То есть из белков генов POLD1,  POLD2,  POLD3,  POLD4 образуется
единый комплекс - рабочая полимераза или биохимическая наномашина, к ней прицепляются еще несколько регуляторных устройств или добавочных белков. 
 Binding или связь происходит по строго определенным участкам белка,
как правило,  это специальные домены для этой функции связи. Домены - это небольшие участки белка, иногда цепь в несколько аминокислот или пространственная структура, подходящие друг к другу как ключ к замку. 
Моя идея состоит в том, чтобы наложить мелодии этих белков друг на друга. 
 Получиться ансамбль генов. Или ансамбль комплекса белков наномашины или наноструктуры. 
 Подобное наложение легко осуществить с помощью программы - звукового
редактора GOLDWAVE 5. 04 2003 года, или другой версии.  Демо версия этой программы есть на диске "Компьютер пресс"8-2004. 
Демо версии вполне достаточно для импульсных научных работ. 
Адрес программы - GoldWave Shareware Version http://www. goldwave. com . 
 Для этого музыку одного гена отправляю в буфер обмена, и кнопкой MIX
произвожу наложение на музыку другого гена. Можно очень точно сделать
смещение одного музыкального файла относительно другого, с точностью
до одной ноты или одной аминокислоты. 
 Я не думаю, что этой микст-музыкой можно как-то прямо влиять на эти
наномашины. 
 Любые новые взаимодействия генов , даже на виртуальном или нереальном, 
как в случае генной музыки уровне,  просто расширяют наши возможности
оперирования генетическим аппаратом, возможно через много лет. 
При генном программировании и на информационном уровне, а не на уровне
реальных молекул. 
 На своем сайте я привожу пример моей музыки генов - файлы музыки генов
праймаз PRIM1,  PRIM2 , белки участвуют в репликации ДНК. Можно для примера наложить музыку одного белка на другой с любым смещением нот.
Так без учета доменов реально взаимодействующих в димере произведено
наложение от первой аминокислоты и так далее. 


                16
 Белки POLD1,  POLD2,  POLD3,  POLD4 комплекса дельта полимеразы. 
На основную субъединицу полимеразы я наложил звуки не целых белков других субъединиц, а только домены - части молекул. Этот файл ансамбля наномашин.
 Гистоновый октет - состоит из 8 белков гистонов по две молекулы белков генов H2a, H2b, H3, H4. Они являются наноструктурами для упаковки ДНК в нуклеосому размером около 10 нм. Структура гистонов H4 очень консервативна и осталось
без изменения около 2 миллиардов лет.Я создал музыкальные файлы этих
гистонов и также наложения двух соседних гистонов. Наложение гистона H4 на гистон H3 без сдвига и гистона H4 на гистон H4 со сдвигом на одну ноту так
как делеция в 24 аминокислоте. 
 Также произведено мной наложение на музыку белка SSBP1 такого же белка, 
только с мутацией, а именно делеция 22 аминокислоты, что приводит к
сдвигу всех нот после нее на единицу. Белок SSBP1 - митохондриальный
белок, связывающий одноцепочную ДНК при ее репликации, белок гомотетрамер, то есть состоит из 4 одинаковых единиц. 
 Это только начальные примеры генной или белковой музыки комплексов
молекул. 
 При накладывании интактных белков друг на друга музыка гена не изменяется.
Но при накладывании мутантного белка музыка комплекса совсем другая. Может
она звучит лучше или нет, но для молекул восприятие музыки человеком не имеет значения. 
Если наложение сделано неточно, то мелодия звучит плохо,  и в редакторе звука исчезают пробелы между нотами. 
Это все искусственные звуковые мелодии, напрямую с генами и белками никак не связаны. Есть только косвенная информационная или виртуальная связь.
 В заключении по музыке генов я хочу сказать, что любые работы с текстами ДНК, даже на виртуальном уровне, далеком от живых организмов, расширяют наши
знания и обязательно пригодятся в будущем.
 Для знакомства с работами по музыке генов на Западе, я даю интернет-ссылку,
где M. A. Klark рассказывает о разных направлениях в музыке генов в настоящее время.
http://whozoo. org/mac/Music/index. htm.
http://whozoo. org/mac/Music/Sources. htm.
 На этом же сайте есть примеры генной музыки.
 Я, в отличии от других авторов, делаю упор в своей музыке именно на
первичную структуру молекул и не применяю аранжировки для того, чтобы
приятнее было слушать. Моя музыка генов генов – это полное отражение
нуклеотидов или аминокислот без посторонних звуков. Я надеюсь, что моя
методика, которую я напечатал выше поможет новым ученым для изучения живого.

          ГЕНОМ ЧЕЛОВЕКА И МИТОХОНДРИЯ. ЧАСТЬ 1. 21 АПРЕЛЯ 2008.

 Данная статья написана с целью ускорения эволюции человка, перехода его на более высокий биологический уровень, чем Homo sapiens. Для работы митохондрий необходимо около 810 генов, продукты которых являются структурными
компонентами митохондрий и различными ферментами энергетического обмена и белками обслуживающими геном митохондрий и синтез белков на рибосомах.
Когда-то геном митохондрий содержал значительно больше генов, а сегодня геном митохондрии человека содержит всего 37 гена, а из них только 13 необходимых
для энергетики.
Все остальные гены в течение эволюции переместились в хромосомы ядра.
Этот рудиментарный геном для митохондрии и для клетки в целом только вреден,
так как его повреждаемость кислородными радикалами и другими генотоксическими веществами во много раз выше , чем для генов ядра.
Высокая повреждаемость генома митохондрий значительно сокращает время жизни человека и способность к работе с возрастом. Сами клетки из-за митохондрий
более уязвимы к различным повреждениям, так как часто через митохондрии активируется клеточный апоптоз
и смерть.
Факторов апоптоза, связанных с митохондриями , более 28, и они могут
запускаться при критическом уровне повреждений в  митохондрии.

                17
Почти 99 белков, которые обеспечивают работу рибосом митохондрий, должны образоваться в цитоплазме и затем переместиться в матрикс митохондриии.
Только для того, чтобы транслировать 13 генов генома митохондрии. Вывод напрашивается сам собой и я не первый,  скорее всего, кто обратил на это внимание.
Надо перенести эти 13 нужных генов энергетики в хромосомы ядра, а геном митохондрии разрушить.
Еще в 70-х годах 20 века изучалось движение белков в митохондрию и многие
ученые думали о переносе генома митохондрии в ядро.
О транспорте белков в митохондрию литература [2, 3].
Я здесь попытался осмыслить этот возможный перенос генов в связи с
данными генома человека в новых условиях развития информатики ДНК.
Это должно по расчетам привести к появлению нового вида человека. Я назвал
его Homo neosapiens. Это будет скачок в эволюции человека, так, как он приобретет совершенно новые свойства.
Это очень высокая энергетика, высокая устойчивость к повреждающим факторам среды, скачок в продолжительности жизни, устойчивость ко многим болезням.
Простой перенос в хромосомы в виде вектора выделенных геномов митохондрий
вряд ли приведет к ненужности митохондриального генома, даже если произойдет удачная интеграция. Для сборки митохондрии надо, чтобы белки ферментных комплексов сначала проникли в саму митохондрию. Для этого
белки-предшественники должны иметь лидерный конец, с помощью которого они проходят через пору митохондрии, а также должны иметь сайт атаки
эндопептидазы для отщепления лидерного конца.
Белки,  синтезирующихся внутри митохондрии,  не имеют таких участков
из-за ненадобности. Поэтому перед созданием вектора, содержащего гены митохондриального генома, надо перед каждым геном расположить обычный
промотор хромосомного гена, затем последовательность, кодирующую лидер и сайт
для эндопептидазы.
Здесь лучше всего пойти по аналогии с генами , являющимися компонентами митохондрий и лежащими в хромосомах и создать участок вектора по подобию.
Для этого я прошелся по геному человека и составил самый полный на сегодня список генов домашнего хозяйства митохондрии. Возможно в нем не хватает нескольких генов, так как генов с неизвестными функциями очень много.
Список дан в приложении 1 и 2. В будущем при изучении генома список незначительно изменится. Получилось, что гены домашнего хозяйства митохондрии, составляют около 3 процентов всех генов человека.
Они разбросаны по всем хромосомам почти равномерно, что говорит о том, что митохондрия теряла гены постепенно, и что переход каждого гена в хромосомы
был выгоден с эволюционной точки зрения для клетки и организма.
Использование этого списка облегчает изучение биологии митохондрии, так как
гены легко найти и сгруппировать на несколько крупных семейств.
Это семейство генов белков рибосом L и S субъединиц, семейство переносчиков низкомолекулярных субстратов SLC25A,  семейства транслоказ белков через
наружную и внутреннюю мембраны митохондрий TOMM и TIMM, семейства
NADH-дегидрогеназ NDUFA и NDUFS и другие.
При разработке новых генов хромосом гены из этого списка можно использовать
для образца, так как их белки имееют нужный сигнальный конец и все удачно проникают внутрь митохондрии.


          МИТОХОНДРИЯ И ГЕНОМ ЧЕЛОВЕКА. ЧАСТЬ 2. 01 МАРТА 2009.
          ДОПОЛНЕНИЕ 01 ЯНВАРЯ 2012.

 После обсуждения возможности переноса генома митохондрии в ядерный
геном со специалистами были сделаны дополнительные выводы, которые
изложены ниже.
1.  По поводу митохондриальной патологии и старения.
Старение неразрывно связано с всеобщим энергодефицитом
в организме человека. Страдают все звенья энергетического обмена.
Многие возрастные болезни прямо связаны с недостатком энергии в
клетках.

                18
Про это много написано в прошлых исследованиях по геронтологии. Старение и патология митохондрий неразрывны. Например, активность цитохромоксидазы значительно падает.
Обзорная информация по энергетике при старении в литературе [4].
Современные данные - литература для примера [5-13].
Мое мнение, что для старения важны как гены митохондрии, так и более 800
генов ядра домашнего хозяйства митохондрий. Но в митохондрии гены более подвержены повреждениям. Можно пробовать спасать или защищать геном ее антиоксидантами, но опыт говорит, что это недостаточно, к тому же много
других, кроме кислорода, вредоносных генотоксических агентов.
Радикальная защита митохондрии - это удаление генома из митохондрии и перенос генов в ядро.
Есть еще один аспект этого переноса. В ядре работают 99 генов для обеспечения работы генома и рибосом митохондрии. Если перенос успешен, то эти гены станут
не нужны. Причем эти гены интенсивного функционирования и их ненадобность
значительно облегчит работу ядра клетки, а их повреждаемость с возрастом не будет влиять на состояние клетки.
Предположительно, ненадобность этих 99 генов значительно повысит
устойчивость клетки к повреждениям и продолжительность жизни.
Последние исследования доказывают роль генома митохондрий в старении.
Так,  при создании мышей с ДНК-полимеразой (ген POLGA), которая при
копировании генома митохондрии, вызывает повышение мутаций в нем, обнаружено, что эти мыши имееют ускоренное старение, сокращение жизни, ранний старческий фенотип. Начало старения, средняя продолжительность и максимальная
продолжительность жизни составила соответственно 25, 48, 61 недели.
Причем уровень кислородных радикалов был не высоким. Литература [5-12].
2. В геноме митохондрии 4 кодона отличаются от ядерного генома, то есть в митохондрии они транслируют разные аминокислоты или терминаторы.
То есть, если гены митохондрии просто встроить в хромосому, то их трансляция будет ошибочна. Сегодня различия генного кода  легко обходимы,
не надо пытаться заниматься точковым мутагенезом с помощью олигонуклеотидов
или иначе. Есть фирмы, которые рекламирует быстрый синтез гена из нуклеотидов
напрямую, для митохондриальных генов это лучший способ, так как они
небольшие, можно добавить и лидерный участок и промотор. При этом кодоны
будут исправлены.
Нет необходимости переносить весь геном митохондрии в хромосомы, так как в
нем будут содержаться ненужные гены - тРНК, рРНК. Надо перенести только
важные 13 генов, причем для начала можно перенести часть или один ген и посмотреть, что будет.
У меня в наличии есть программа для того, чтобы быстро исправить нужные
кодоны в геноме митохондрии, так, чтобы они были приспособлены для трансляции
в цитоплазме. Приведу пример гена ATP6 с кодонами для трансляции в
митохондрии и созданный мной ген для трансляции в цитоплазме. Это хороший
пример биоинформатики ДНК, когда создается новый ген на основе теоретических знаний.
Ген для трансляции в митохондрии - 681 нуклеотид.
Цитировано с http://ncbi. nlm. nih. gov.

tacctgcacgacaacacataa



                19
Ген для трансляции в цитоплазме - 681 нуклеотид,
создал Курносов М. Н.  Ген искусственный, только кодирующая
часть.
tacctgcacgacaacacataa

3. Еще одно возможное препятствие для осуществления этого проекта - это
сильно неполярный гидрофобный характер белков, синтезируемых с
митохондриального генома. Возможно будет затруднена их трансляция в
цитоплазме. Действительно , белки митохондрии генома довольно сильно
неполярны, что может препятствовать их трансляции и транспорту внутрь митохондрии.
Субъединицы многих белков митохондрий имеют неполярные, трансмембранные
домены, но тем не менее они с помощью лидерной последовательности проникают сначала в матрикс, а затем встраиваются в мембрану. Поэтому я думаю, что подобрав нужный лидерный участок этих белков, сильно заряженный и
гидрофильный можно это будет преодолеть.
После транспорта внуть митохондрии какой бы лидер не был, он будет отрезан протеазой.
Для примера приведу - ген COX6A ядра, у которого я пометил неполярный домен - ffvalpgvav, а также указал сигнальный пептид  - лидер.
Этот пептид отрезается и нужен только для проникновения белка  в митохондрию.

mavvgvssvsrllgrsrpqlgrpm - лидер
-*****--*--***---*-**-*-
ssgahgeegsarmwktltFFVALPGVAVsmlnvylk
--**-*--*-*-----*-**********--*-*-*-
shhgeherpefiayphlrirtkpfpwgdgnhtlfhn
---*----*-***-*-*-*---***-*-*---**--
phvnplptgyede
*-*-***-*----


Ген ATP8 генома митохондрии, неполярных участков мало. Без предполагаемого лидера.
MPQLNTTVWPTMITPMLLTLFLITQLKMLN
-*-*---*-*--*-*-**-****--*--*-
TNYHLPPSPKPMKMKNYNKPWEPKWTKICS
----***-*-*--------*--*----*--
LHSLPPQS
*--***--

Я отметил (*) неполярные аминокислоты. Их может быть много в белках,
кодируемых ядром и в белках, кодируемых геномом митохондрии.
4. Белки, образуемые в цитоплазме, подвергаются созреванию, то есть частичной модификации аминокислот.
5. Чтобы белки работали, они должны соединиться в макромолекулярный комплекс. Напимер, образовать АТФ-синтазу из нескольких субъединиц. Все это может усложнить проект. В конечном счете опыт - критерий истины.
Таким образом, необходимы прямые эксперименты для проверки синтеза и
транспорта белков, кодируемых генами митохондрии из цитоплазмы в митохондрию.


                20
Показано , что процесс встраивания части митохондриального генома в хромосомы
происходит спонтанно у некоторых видов. То есть этот процесс происходит в природе, но он не управляемый и толку от него нет.
В настоящее время проводятся эксперименты по таргетингу (то есть управляемому транспорту белков внутрь митохондрии). Речь идет именно о белках, которые
сами не могут в нее попасть. К ним надо пришить сигнальный пептид
определенного состава, который и осуществит проникновение белка в
митохондрию. Теоретическое обоснование пользы от этого переноса и возможности это осуществить вполне достаточны, то есть нет каких-то явных непреодолимых препятствий. О возможности переноса генома митохондрии в ядро ученые думали
давно - с 70-годов прошлого века. Наконец весь мир из книги Обри де Грея
узнал, что он взялся решить эту проблему. Литература (14).
И вот прошло уже 5 лет с момента его декларации об этом намерении, а каких-то серьезных результатов пока не напечатано.  Можно пожелать ему успеха в его работе. Но может быть так, что результатов никто не дождется. Поэтому я
считаю, что такие проекты надо одновременно делать в нескольких независимых лабораториях.
В этой статье я теоретически обдумал подходы к началу таких экспериментов. Информатика ДНК позволяет это сделать, сидя за компьютером.
Будет создан новый вид человека, который не будет скрещиваться с Homo
sapiens, так как будут созданы митохондрии без генома. Надо будет создать
особи женского рода с новыми митохондриями и особи мужского рода с
хромосомами, содержащими модифицированный геном митохондрий для обоих полов.
Тут без клонирования человека не обойтись, так как митохондрии наследуются
через яйцеклетки. Промежуточный этап - это получение стволовых клеток,
в ядре которых будет такой геном митохондрий. Для начала надо получить устойчивую экспрессию отдельных модифицированных генов митохондрии и
транспорт этого белка внутрь ее.
Еще раз обращаю внимание, что в одной лаборатории это все сделать сложно по многим причинам, и поэтому какие бы не были получены результаты ранее,  надо просто подключиться или начать с нуля этот проект. Может быть так, что
удачные результаты никогда не будут опубликованы, а новые клетки содержащие геном митохондрии в ядре невозможно будет где-то получить или приобрести.
Этот проект переноса генов из митохондрии в ядро я представил в этой книге
для демонстрации теоретической биоинформатики, работа с которой должна предшествовать экспериментам с молекулами и клетками.

              УПРАВЛЯЕМЫЕ НАНОМАШИНЫ - ОСНОВА ТЕРАПИИ БУДУЩЕГО.2008.

После того, как геном  человека или другого организма был полностью
расшифрован,я решил,что  появилась возможность НАПРАВЛЯТЬ ЭТУ ИНФОРМАЦИЮ
ОБРАТНО К ГЕНАМ с помощью физических факторов - звука, света, других волн.
Мной без спешки, пока гипотетически,  разрабатываются комбинированные
наномашины на основе фермента полимеразы. К ферменту ожидается пришить чувствительный к внешним воздействиям белок или хромофор. При приеме им
квантов звука или света предполагается, что будет изменяется конформация активных центров полимеразы или коррегирующей нуклеазы. Это все делается для управляемого мутагенеза при синтезе ДНК.
Управляемый мутагенез позволит создавать или устранять точковые мутации в
ДНК. А внешний сигнал служит для инструкции наномашины. То есть какой
нуклеотид должен быть встроен задается извне звуком и светом на основаии
известной последовательности для нужного гена.
Звук скорее должен быть не слышимым, а микроволновым. И должен действовать не прямо на молекулы, а на промежуточные микромашины. Эти микромашины, я думаю, будут использоваться уже для передачи информационного сигнала на наномашины, а
они будут влиять на макромолекулы.
Я назвал этот возможный в будущкм синтез нуклеиновых полимеров –
ИНСТРУКТИВНЫМ СИНТЕЗОМ ДНК ИЛИ РНК.
Все это может привести к революционным изменениям в биологии человека!!!
Любые гены можно подвергнуть быстрой модификации, что изменит их белки и
фенотип человека. Лечение всех болезней - рака , старения, нервных болезней,

                21
инфекций и так далее будет проволится на совершенно другом уровне
генотерапии. Без применения вирусов, плазмид, векторов. Это все может быть возможно в будущем. Пока создаются только отдаленые подходы к решению этой проблемы. Основные сложности - это отсутствие обратной связи с наномашиной и определение момента ее включения. Инструктивный синтез ДНК отличается от матричного тем, что при работе полимеразы в новую цепь вносятся специальные
ошибки. Если для матричного синтеза эволюцией создан высокоточный механизм копирования с коррекцией ошибок неправильно комплементированных нуклеотидов ,
то для инструктивного синтеза именно ошибки синтеза второй цепи ДНК и
являются целью.
Внешняя инструкция для полимеразы управляет ей и определяет места управляемой замены нуклеотидов, которые уже не являются комплементарными для материнской цепи. При этом ген либо исправляет точковые мутации, полученные по наследству, либо ген нокаутируется и становится непригодным для синтеза белка. Пока что
это одни идеи, но как бы было интересно внешним влиянием на наномашины
изменять быстро генетическую информацию. Даже если будет создана модифицированная полимераза, самый сложный вопрос - точка начала изменения
ДНК и точка остановки. Пока идея мной высказана, а решения, может быть очень необычные, появятся позднее. Итак, информация о генах и других участках ДНК определена в виде последовательности нуклеотидов. Теперь эту информацию надо провести до ядра клетки обратно в виде информационной инструкции и изменить
ДНК в клетке с помощью наномашин. Движется эта наномашина вдоль гена
и синтезирует вторую цепь уже с внесенными точковыми изменениями. Дочерние клетки унаследуют эти изменения.
 В настоящее время проводятся эксперименты по влиянию квантов света  на белки, связанные со светочувствительными хромофорами. Пример этих работ - это работа
о влиянии света на ионотропный глутаматный рецептор нервной клетки.
К белку был пришит хромофор, имеющий избирательное поглощение света. Импульс света 380 нм вызывал активирование канала рецептора, а импульс света в 500 нм выключал рецептор. Для дистанционного управления каналом рецептора к белку
была пришита молекула деривата азобензена в качестве фотоприемника. При поглощении света изменялась конформация белка, что меняло его функцию. Предполагается использовать эти наномашины в виде глутамат-рецептора с
пришитыми поглотителями света для управления нейронами на расстоянии.
Литература [1].
Успехи этих работ дают мне возможность предположить, что и моя идея об управлении наномашиной в виде модифицированной полимеразы тоже будут успешны.
 В настоящее время я могу только гипотетически разрабатывать эту машину.
Моя идея в следующем. Для посадки этой наномашины на нужный ген или в нужное место генома клеток надо сначала отсеквенировать организм или клеточную культуру. Теперь будет возможность выбрать точно праймер для посадки
полимеразы в нужном месте. Праймер пришивается к инициирующему белку,
входящему в наномашину. Один импульс света отсоединяет его от машины,
а другой импульс света вызывает ошибку синтеза в нужном месте ДНК при ее
движении. Таким образом все генетические свойства организма или клеток, любой фенотип можно менять на лету, преобразовывать одни клетки в другие по
качеству. Исправлять любые генетические повреждения быстро и просто. Клетки будут бессмертны. Вот для этого мной и разрабатывается ультразвуковая музыка генов.

      ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 1. 20 ноября 2008 г.

 Продолжая развивать свой проект "ДНК говорит", я искал какие гены могут выполнять функцию оболочки или носителя для внешних, специально введенных в
гены информационных, текстовых посланий. Для этого я решил, что главным критерием для отбора таких генов будет их размер, чем он больше, тем больше информации может содержать ген.
 При анализе генома человека было я просмотрел вручную 29216 генов из реферативной базы генома NCBI. Официальное количество генов в геноме
человека, взятое из карт хромосом, равно 26806 генов. Для анализа учитывались гены размером более 60 тпн, и интроны - размером более 40 тпн. Общее

                22
количество таких генов, сумма по всем 24 хромосомам приведена в таблице.
ТПН - тысячи пар нуклеотидов.

 РАЗМЕР ГЕНОВ (ТПН)  СУММА ГЕНОВ

    60 - 100         1943
   100 - 200         1639
   200 - 300          509
   300 - 400          271
   400 - 500          130
   500 - 600          87
   600 - 700          46
   700 - 800          29
   800 - 900          19
   900 - 1000         16
   БОЛЕЕ 1000         39
   СУММА            4718

 Это составит 16, 3 процента от общего количества просмотренных генов.
Наиболее демонстративны особые размеры генов более 400 тпн , их количество
- 324 (1,09 процента от общей суммы генов), и я полностью вывел
в таблицу их обозначение, размер гена в тпн , размер самого большого
интрона в гене в тпн. Они записаны в  приложении 3.
Таким образом , были обнаружены в геноме человека гены-гиганты, размер
которых в 10-100 раз больше обычных генов.
Рекордный размер имееют следующие гены : CNTNAP2 - 2305, DMD - 2220,
CSND1 - 2057, LRP1B - 1901 тпн.
Конечно, я не первый их открыл, ученые, которые секвенировали геном, также
обратили на них внимание, только обзора с системным анализом этой генной
аномалии я не нашел. Поэтому неплохо обратить внимание ученых на них еще
раз. Важно, что размер этих генов обусловлен в основном размерами интронов,
которые в них находятся. Также я вывел в таблицу интроны, максимальных
размеров. 
Самые крупные интроны в геноме человека находятся в следующих
генах и имеют размер в гене GPC5 - 722, SGCZ - 683,  CNTNAP2 - 657, 
OPCML - 589 , PCDH9 - 580 тпн .
 С точки зрения моего проекта "ДНК говорит" , эти гены и интроны могут
быть оболочкой или носителем какой-то важной информации, введенной
вместо интрона в ген, в одном гене можно разместить почти 700 килобайт
информации.
 С точки зрения физиологии клетки, если есть гены и интроны такой
большой длины , значит это необходимо для природы и эти образования
могут играть важную роль в клетке.
 Среднее количество интронов в генах человека равно 7, 4  на ген. При
колебании от 0 до 35 интрона на ген. 
Однако в геноме человека встречаются в небольшом количестве гены , имеющие
количество интронов в гене значительно выше среднего. Эти гены я вывел в виде таблицы. И эта аномалия интересна для науки,  как и все необычное.

 Хромосома  Ген      Размер гена    Количество интронов в гене
  1         CSMD2    650            74
            HMCN1    456           100
            USH2A    800            71
            HSPG2    115            96
            ZUBR1    139           105
            LOC728841 77            91
            OBSCN    157            81
            RYR2     791           104
            COL16A    53            70
            MACF1    405            94
            USP24    149            64

                23
            COL24A1  428            59
            COL11A1  231            65
            FRAP1    156            57
            VPS13D   284            69
  2         LRP1B    1901           90
            BIRC6    263            73
            USP34    217            77
            NEB      249           149
            DNAH7    331            67
            NAG      394            51
  3         COL7A1   31            117
            DNAH1    84             76
  4         HD       169            66
            FRAS1    487            73
            WDEY3    297            67
            KIAA1109 193            83
  5         DNAH5    252            78
            GPR90    606            89
            FBN2     280            64
  6         DNAH8    307            90
            DST      385            93
            MDN1     176           101
            UTRN     559            73
            SYNE1    515           145
  7         TRRAP    135            70
            DNAH11   359            81
  8         PKHD1L1  168            77
            PRKDC    187            85
  9         VPS13A   240            70
 10         CDH23    419            69
            CUBN     305            66
 11         DYNC2H1  371            89
            ATM      147            62
 12         SEP290   94             53
            UTP20    106            61
            STAB2    179            68
            LRP1     85             88
 13         FRY      265            60
            MYCBP2   287            83
 14         SYNE2    373           120
            DYNC1H1  86             77
 15         RYR3     555           103
            VPS13C   208            85
            HERC2    211            92
 16         SMG1     121            62
            DNAH3    226            59

                24
 17         DNAHD3   114            64
            DNAH9    371            68
            MYO15A   71             65
 18         LAMA3    266            74
 19         RYR1     154           105
  X         DMD     2220            78
            COL4A    258            52
            HUWE1    122            80
  Y         ------
 20         LAMA5     58            79
 21         ------
 22         ------
 Итого генов с числом интронов на ген более 50 всего 66  на весь геном
человека. Сразу от статистики можно перейти к обсуждению этой аномалии.
Видно, что в таблице есть семейства генов - COL, DNAH, LAMA, RYR, SYNE , что говорит о не случайности этого феномена.
Рекорд генома человека - это гены небулин - NEB - 149 , SYNE1 - 145,
SYNE2 - 120 интронов в гене.
Таким образом в первом сообщении о генах-гигантах генома человека были
показаны рекордные величины генов, интронов в них и число интронов в гене.
Все это несомненно имеет какое-то важное значение для клетки.

      ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 2. 12 февраля 2009.

 В генах-гигантах мною были обнаружены следующие закономерности.
 Если рассматривать длину всех интронов в гене, то самые длинные интроны
- это последний или предпоследний интроны, они чаще всего и определяют
общую длину гена. Для примера, для генов размером более 60 и более 400 т. п.
нуклеотидов приводится общее количество генов с максимальными конечными
интронами.
При общем числе интронов в среднем 20-30, только конечные 1-2 интрона
могут определять длину гена.

 Хромосома Гены размером более  60 тпн  Гены с наибольшими конечными
                интронами
  5        249                51
  6        271                64
  7        241                47
  8        194                50
  9        213                27
 Сумма    1170                239

 Хромосома Гены размером более 400 тпн  Гены с наибольшими конечными
                интронами
  5        23                12
  6        25                11
  7        31                7
  8        16                6
  9        7                2
 Сумма     102                38

Это составляет 20 и 37 процентов соответственно, что,  несомненно,
представляет собой какую-то важную закономерность , имеющую значение
для работы этих генов в клетке.


                25
Для примера приведу несколько конкретных генов. Интроны учитывались с
длиной более 40 т. п.

 Ген    Размер  Размеры интронов тпн.

CDH12   1103    i9 -113   i12-193
                i10-103   i13-100
                i11-134   i14-347 - последний.
PARK2   1379    i3 -162   i5 -217
                i6 -187   i7 -470   i8 -285 - последний.
MAGI2   1437    i1 -59    i2 -47    i12-55
                i13-87    i16-121   i19-105
                i20-380   i21-446 - последний.
CSMD1   2057    i42 -54   i58 -59   i60 -81
                i64 -92   i65 -45   i66-244
                i68-387   i69-218   i70-357 - последний.

У части больших генов, наоборот,  первый интрон
является максимальным по длине. Таких генов 18 процентов среди
больших генов размером более 400 тпн.
Приведу примеры таких генов.

CNTNAP2 2305    i1 -657    i2 -65   i3-204
                i4 -64     i8 -168  i9 -95
                i10-91     i11-76   i12-77
                i13-258    i14-74   i15-140
                i18-45     i21-116
KCND2    476    i1 -457
SDK1     964    i1 -317    i4-180   i5-129
GRIK2    670    i1 -223    i3 -50   i6-113     i13-107

Все средние интроны, как правило,  не выделяются особым размером
относительно длины гена и имеют размер близкий к среднему для этого гена.
Механизм возникновения таких аномальных по длине интронов,  как конечные
или начальные будет рассмотрен в следующем сообщении. Несомненно, что для возникновения, функционирования и сохранения таких гиганских интронов,  необходим специальный механизм, особые гены, белки и РНК. Поскольку геном человека уже известен, привожу полный список генов, участвующих в сплайсинге.
Эта база генов сплайсинга составлена мною при поиске по реферативной базе
генома человека NCBI. Они записаны в приложении 4. Возможно, что гены сплайсинга, имеющие отношение к генам-гигантам, находятся в этом списке.
Все гены сплайсинга - это обычные мозаичные гены. Например, ген SF3B1
во 2 хромосоме имеет размер 43 тпн,  и имеет 24 интрона размером от 200 пн до 7000 пн округленно. Эта база генов  сплайсинга показывает еще один феномен клетки , когда гены или их продукты обслуживают самих себя. Чтобы факторы сплайсинга были рабочими , необходимо чтобы они обработали собственные РНК.

Можно привести примеры таких феноменов.

1. ДНК-полимераза копирует себя при репликации.
2. РНК-полимераза транскрибирует свой ген.
3. Факторы рибосом участвуют в трансляции своей РНК.
4. Факторы сплайсинга выщепляют интроны из своей РНК.

Без этого они сами не функционируют.
Что первично - курица или яйцо? Вопрос древних философов. Поэтому
гены сплайсинга еще раз показывают скачкообразность эволюции живого,
и даже возможность влияния высших цивилизаций на гены при образовании
и эволюции живого.


                26
        ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 3.  ИНТРОГЕНЫ.
        февраль-апрель 2009.

 В генах-гигантах есть еще один феномен - это расположение внутри гигантских интронов одного или нескольких мелких генов. Эти гены, расположенные внутри других генов, я называю интрогены. Статистика интрогенов следующая.
В хромосомах 5, 6, 7 для примера в 761 гене, размером более 60 тысяч пн, обнаружено 81 интроген, которые расположены по 1-2 , как правило,  в самом большом интроне. В генах-гигантах встречаемость интрогенов составляет около
11 процентов. Для примера,  ген кадхерин 12 - CDH12 размером 1103 тпн в 9 интроне размером 120 тпн содержит интроген LOC643300 - белок теплового шока,
а в интроне 11 размером 134 тпн интроген PMCHL1 – промеланин концентрирующий гормон подобный 1.
Ген  IMP2-пептидаза внутренней мембраны  подобный - IMMP2L, размером 899 тпн,
в 3 интроне размером 523 тпн содержит интроген LRRN3 - лейцином богатый
повтор ген нейрональный 3. Ген микроцефалии, ингибитор TERT экспрессии,
MCPH1, размером 213 тпн, в 9 интроне размером 129 тпн содержит интроген
ANGPT2 - ангиопоэтин 2.
Многие из интрогенов являются псевдогенами, а другие обычными мелкими
генами.
В принципе этот природный феномен подходит мне для проекта "ДНК говорит".
Так как я собираюсь использовать эти интрогены для мечения полезной
информации или придания организму особых преимуществ в эволюции для того,
чтобы информация введенная в ДНК сохранилась и через миллионы лет.
Возможно, что человек Homo sapiens,  как вид,  не является наилучшим
контейнером для информационных посылок. Во-первых, это вид молодой
в эволюции - несколько миллионов лет по сравнению с организмами, которые
дошли до сегодняшнего времени через десятки миллионов лет.
Во-вторых,  человек имеет низкую устойчивость к экологическим факторам.
В прессе уже было сообщение о том, что в прошлом человек чуть не вымер,
как вид. Разум человека помогает ему выжить, но его не всегда достаточно.
Для примера приведу устойчивость азиатской черепахи Testudo horsfieldi (УСБ 1991, том 111, выпуск 2, стр 305) к ионизирующему излучению - это 730 Гр, при устойчивости человека 3-5 Гр. Вообще рептилии выдерживают от 15 до 500 Гр, амфибии - 7-30 Гр, а некоторые лишайники до 10000 Гр, насекомые 580-2000 Грей
(при смертности 50 процентов особей). Эти цифры просто фантастика по
сравнению с человеком, а все это определяется особенностями генов генома.
Примеры приведены из Кузин А. М. Структурно-метаболическая теория в
радиобиологии. 1986, с. 120.
Эта устойчивость некоторых организмов позволяет транспортировать их геномы и информацию через космос.
В настоящее время по данным WWW. NCBI. NLM. NIH. GOV в прогрессе секвенса
есть около 50 видов  и на сборке полного генома около 50 видов высших
организмов. Данные на 2008 г. К 2013 г.  секвенирование геномов резко удешевилось и поэтому можно ожидать определение геномов десятков новых видов.
На планете Земля видов может быть десятки-сотни тысяч с оригинальными
геномами или генами.
Поэтому можно надеятся, что моя гипотеза о информационных посылках в ДНК из прошлого найдет применение. Перспективно, я думаю, для этих целей
секвенировать организмы феноменально-устойчивые к факторам внешней среды.

                ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 4.
                ТРАНСПОЗОНЫ. Апрель-май 2009.

Я произвел поиск повторов в интронах генов-гигантов. Последовательность нуклеотидов интронов выделялась из реферативной базы генома человека NCBI.
После этого сканировалась программой для поиска повторов несколько раз с подключением каждый раз новой партии консенсусных повторов.
Для примера в этой работе приведены расположение и вид повторов :
1. Ген NEGR1, интрон 6 в гене размером 347 тпн. NEGR1 - нейрональный
роста регулятор 1, функция - адгезия клеток, хромосома 1.

                27
Размер белка 354 аминокислоты, что дает 1062 пн. Размер же гена со
всеми интронами составляет 880 тпн.
2. Ген DISC1 размером 415 тпн,  интрон 9 размером 140 тпн. Поврежденный
при шизофрении 1, хромосома 1. Размер белка 832 аминокислот, что
дает 2496 пн. Функция точно не известна.
3. Ген NRXN1 - неурексин, размером 1108 тпн, интрон 17 размером 299
тпн. Размер белка 1477 аминокислот, что дает 4431 пн. Функция - аксон
информатор и адгезия. Хромосома 2.
4. Ген ROBO2 размером 607 тпн, интрон 2 размером 379 тпн, хромосома 3.
Функция белка - обходной путь роста аксона, аксон-информатора
рецептор 2. Мозга развитие. Размер белка 1378 аминокислот, что дает
4134 пн.
5. Ген DOCK3 размером 709 тпн, интрон 5 размером 130 тпн. Хромосома 3.
Предназначен цитокинезу 3. Размер белка 2030 аминокислот, что дает
6090 пн.
Всего консенсусных повторов было использовано для поиска 170, простые
повторы не искали.
Также не уточнял разновидности повторов. Подключены были не все имеющиеся повторы. Подробно расположение повторов в гене дано в приложении 6. Это приложение дано только для демонстрации повторов в интронах-гигантах, использование другого генома или баз может дать несколько другую картину.
Мной использовалась программа REPFIND -  Dr. G. B. Hutchinson,
(Canada), базы повторов - REPBASE -  J. Jurka,  (USA), находящихся
в свободном доступе.
В изученных интронах было я обнаружил общее число повторов:
в i6 NEGR1 - 175,  в i9 DISC1 - 110, в i17 NRXN1 - 135, в i2 ROBO2 - 223,
в i5 DOCK3 - 117 единиц.
Повторы имеют разную длину , есть полные повторы, соответствующие
консенсусным по длине и укороченные или части , куски от полного размера повтора. Это происходит потому, что транспозоны захватывают части цепи ДНК
при мобилизации или встраиваются посередине целого повтора. Участки между найденными повторами составляют от единиц до нескольких тысяч нуклеотидов. Назначение их неизвестно.

Обнаружены следующие повторы.
Повтор     Название     Обычная или полная длина, пн
ALU    -   повтор                290
BSR    -   бета- сателлит                68
CHARLIE-   повтор
ERV1   -   эндогенный ретровирус
FRAM   -   повтор
HSAT1  -   сателлит 1 человека               631
MADE1  -   вторичный от MARINER1              80
MIR    -   млекопитающих  повтор             265
MIR2   -   -------------------------         150
L1     -   повтор транспозон                6140
L2     -   -----------------
THE1b  -   транспозон like элемент с LTR     364
TIGGER1-   автономный ДНК транспозон        2418
TIGGER2-   -------------------------
MLT1a  -   транспозон подобный с LTR         374
MLT1b  -   -------------------------         390
MSTA   -   -------------------------         426
MSTC   -   транспозон подобный LTR           405
LTR1   -   LTR из человеческого эндогенного
           ретровируса подобного HUERS- P2   842
LTR2-LTR6
LTR7   -   LTR из эндогенного ретровируса
           RTVL-H2                450
LTR8-LTR13
LTR12  -   LTR ERV9                877
MER1A-MER46 неавтономные транспозоны     189-693

                28
MER21  -   средней повторяемости
           последовательность                933
MER34  -   средней повторяемости
           последовательность                581
PAB    -   псевдоаутосомальная погранично-
           подобная последовательность       703
PTR5   -   ---------------------------      2438
PTR5-1 -   транскрипт человеческого вируса
           эндогенного ERV9
PTR5-2
RETROVIRAL эндогенный ретровирус
SAR    -   сателлитный повтор                42
SVA    -   композитный ретропозон
           неретровирусный                1640
R66    -   тандемный повтор                66

Многие из этих повторов являются транспозонами, практически обнаружены почти
все типы этих элементов. Это ДНК-транспозоны, ретротранспозоны LTR и без LTR.
Главный вывод из этого поиска - гиганский размер интронов генов-гигантов определяется очень большим количеством повторов и транспозонов, расположенных внутри интрона.
Следующий важный вывод - происходит накопление в больших интронах повторов и транспозонов, это происходит в линиях половых клеток, но потом это
проявляется  в соматических клетках нового организма.
В соматических клетках в течение жизни происходят многочисленные атаки транспозонов на их гены. Эта нестабильность их генома - одна из причин
болезней и старения. По-моему , причина такого большого количества повторов в интронах связана с тем, что вставка мобильного элемента в ДНК облегчается в
этих участках, или проходит с большей вероятностью, так как идет вставка в участки со схожей структурой, почти комплементарной. В приложении, где стоит слово COMPLEMENT , означает, что повтор вставился на новое место с поворотом
на 180 градусов. Большое количество таких блоков говорит о том, что инсерции происходили в течение времени многократно во многих поколениях в линиях гамет.
Гиганские интроны, поэтому, будут и далее увеличиваться - это приведет
через какое-то большое время и много поколений к дегенерации вида или
значительного возрастания числа больных особей.
Человечеству от этого никуда не деться и рано или поздно будет поставлен
вопрос о полном избавлении генома человека от транспозонов.
Я назову этот грандиозный шаг, который предстоит сделать человечеству
ДЕФРАГМЕНТАЦИЕЙ ГЕНОМА или для начала дефрагментацией отдельных генов.
Сегодня известно, что транспозоны играют важную роль в старении.
Активация транспозонов и их вставка в какие-то гены приводит к нарушению сплайсинга, остановке транскрипции и другим повреждениям клеточных генов, в результате ген с новым транспозоном может отключиться в смысле , что его
продукт - белок будет невозможен либо дефектен.
Клетка при этом умирает, если ген важен или перестает выполнять свою функцию
в виде синтеза белка. Все это приводит в снижению резервов организма, что на уровне организма проявляется как старение.
Гены-гиганты имеют к этоиу , по-моему, самое главное отношение.
Если в соматической клетке,  нейроне или стволовой клетке, произойдет
активация транспозонов, то это коснется в первую очередь генов-гигантов.
Так как будут атакованы интроны-гиганты и произойдет встраивание в них транспозонов. Это приведет к возможному отключению гена, и чем чаще атаки транспозонов, тем больше вероятность возрастной отключки гена.
Поэтому гены-гиганты - это одно из главных направление генотерапии старения.
Одна из основных функций транспозонов - это ускорение эволюции вида.
Но человек в настоящее время вышел на уровень развития науки, когда он сам
может управлять своей биологией, изменяя и улучшая вид без эволюции.
Современному человеку процесс эволюции не нужен и просто вреден, а поэтому борьба с транспозонами - одно из главных направлений генотерапии старения и борьбы с основными болезнями. Примером влияния миграции транспозонов может


                29
быть модификация гена DISC1 в нейронах типа альтернативного сплайсинга,
приводящего к шизофрении, как основной психической болезни. Так же основные соматические болезни , возможно, имеют транспозонный механизм на генном
уровне, попадение транспозона под промотор гена или внесение нового промотора может привести к раку, а возможные повреждения соматических клеток разных
тканей приводят к их недостаточности или гибели, снижению резервов нервной и эндокринной системы и кровообращения, что проявляется как старение.
Самый радикальный процесс исключить ген из под влияния транспозонов - это произвести его ДЕФРАГМЕНТАЦИЮ, то есть вырезать из гена-гиганта все интроны.
Это что-то подобное компьютерному процессу дефрагментации жесткого диска.
Хотя движение транспозонов при этом может быть, но не фатально для этого
гена, при промежуточном состоянии мишенями для транспозонов и других
мутагенов будет межгенное пространство.
Размер гена при этом уменьшится в 100-1000 раз, как видно из приведенных выше примеров, если рассчитать размер через размер бепка, 1 аминокислота - 3 нуклеотида.
Во столько же уменьшится  мишень для повреждения. Во столько же раз возрастет экономичность энергетики транскрипции.Скорость ответа гена возрастет во много раз. Все это не только защитит ген, но повысит энергетику клетки и скорость реакций, что во много раз улучшит адаптируемость организма, как противоположность старению.
В проекте "ДНК говорит" предполагается в будущем на месте повторов или транспозонов разместить информационные модули, содержащие либо тексты, либо модули-инструкторы для наномашин в виде нуклеиново-белковых комплексов.
Я не утверждаю, что здесь все просто. Проблем может быть много, это
измененная регуляция гена, измененное положение нового дефрагментированного гена, возможно влияние гена на высшие нервные функции - интеллект, память или
на развитие организма. Это все требует тщательного изучения. Но для
генотерапии старения можно оставить старый ген без изменения, а ввести в
клетки дефрагментированный ген , который , будет функционировать значительно дольше и защитит организм от преждевременной гибели.

               ГЕНЫ-ГИГАНТЫ В ГЕНОМЕ ЧЕЛОВЕКА. СООБЩЕНИЕ 5.
          ДЕФРАГМЕНТАЦИЯ ГЕНОВ - ПРИРОДНЫЙ ФЕНОМЕН. 26 НОЯБРЯ 2012 Г.

Ранее мной была предложена новая генетическая операция для борьбы со
старением и создания новой разновидности человека, более устойчивого к
болезням и патогенным факторам внешней среды. Это - ДЕФРАГМЕНТАЦИЯ генома
или , для начала, наиболее важных генов в геноме человека.
Дефрагментация гена - это вырезание всех интронов из гена.
Это не фантастика , так как сама природа использует этот процесс.
Дело в том, что типичные гены для высших организмов - это мозаичные гены.
Но в высших организмах, и у человека, многие гены вообще не содержат в себе интронов.
Это дефрагментированные природные гены.
Механизм их образования изучен не полностью. С одной стороны - это
мутировавшие псевдогены, которые получили промотор и другие регулирующие
области генома. Известно, что псевдогены, полученые обратной транскрипцией из РНК не содержат интронов. Но они не функционируют до какого-то времени, пока
не попадут под промотор.
С другой стороны природные гены без интронов наводят на мысль об их искусственном происхождении путем генных опрераций над геномом человека в недалеком прошлом. В них еще не успели появиться хотя бы один или два
небольших интрона.
Если предположить, что надо было бы внедрить какой-то ген в геном человека,
то понятно, что вектор с этим геном не должен содержать интронов как
ненужного балласта. Поэтому я думаю, что природные дефрагментированные гены, хотя бы единицы их могут иметь искусственное происхождение.
Третий вариант - это утрата генами интронов в результате каких-то
естественных процессов. Происходит какая-то ферментативная делеция только


                30
интрона. Процесс этот я предлагаю в качестве гипотезы. Полное отсутствие
какой-либо информации.
Мной был произведен поиск генов без интронов (дефрагментированных), генов с одним интроном и с двумя интронами на хромосоме 1 человека по базе
s_ref_GRCh37. p5 , дата базы - 20 октября 2011 г.
Всего генов в хромосоме 1, включая разные РНК и псевдогены, просмотрено 3429.
Из них учитывались только функциональные гены, имеющие трансляцию.
Генов без интронов оказалось 143, с одним интроном - 123, с двумя
интронами - 126.
Что  составляет соответственно 4, 2 процента,  3, 6 процента и 3, 7
процента от всех генов в хромосоме 1.
Особенно обращает на себя внимание большое количество генов без интронов в семействе ольфакторных рецепторов и семействе гистонов на хромосоме 1.
Примеры нескольких генов без интронов на хромосоме 1 приведены ниже. Как
видно, это совершенно различные по функциям в клетке гены, но их почему-то объединяет одно общее свойство - это отсутствие интронов и поэтому
независимость их от громоздкой для клетки системы сплайсинга.

   OR4F5    обонятельный рецептор, семейство 4, субсемейство F, член 5
   ACTRT2   актин-связанный белок T2
   RNF186   ринг фингер белок 186
   HTR1D    серотонина рецептор 1D
   SFN      стратифин
   POU3F1   POU класс 3 гомеобокс 1
   HPDL     4-гидроксифенилпируват диоксигеназа-подобный
   FOXE3    развилки бокс E3
   PRMT6    белок-аргинин метилтрансфераза 6
   UBL4B    убиквитин-подобный 4B
   ADAM30   ADAM металлопептидазы домен 30
   HIST2H3D гистона кластер 2,  H3d
   C1orf68  хромосомы 1 открытая рамка чтения 68
   RXFP4    релаксин и инсулин-подобных семейств пептидов рецептор 4
   ZNF645   цинк фингер протеин 645
   HSPA6    теплового шока 70kDa белок 6
   IER5     немедленный ранний ответ 5
   TEDDM1   трансмембранный эпидидимальный белок 1
   OCLM     окуломедин
   SPHAR    S-фазы ответ
   EXOC8    экзоцисты комплекс компонент 8
Это природные дефрагментированные гены в геноме человека.
Таким образом, здесь показаны предпосылки для начала экспериментальных работ
по искусственной дефрагментации наиболее важных и уязвимых для повреждений
генов человека. Риск для этих генетических операций или генотерапии для вида человека скорее всего низкий , так как процесс этот является природным, а влияние на него может принести большую пользу для вида человека.

                ДОПОЛНЕНИЕ ПО ГЕНАМ-ГИГАНТАМ ОТ 20 апреля 2013.

 Поиск повторов был произведен в 2006 году с использованием первых обновлений баз повторов и программы, работающей под DOS. В настоящее время существует онлайновый сервис для поиска повторов в исследуемой ДНК.
Адрес www. repeatmasker. org , на нем в окно для анализа последовательности
ДНК надо вставить изучаемую последовательность.
В течение нескольких минут придет обратно результат, в котором все известные повторы будут помечены и описаны. Повторы в анализируемой ДНК сравниваются с постоянно обновляемыми базами повторов, которые находятся по адресу
www. girinst. org и можно свободно закачать у них программу Repeatmasker для
самостоятельного поиска повторов в ДНК.
 В настоящее время после повторного поиска с новыми базами в интроне гена-гиганта в основном мало что изменилось. То есть обнаружены,  как и ранее,


                31
в этих интронах целые или куски интактных или мутировавших разных повторов -
перемежающиеся длинные повторы, разные транспозоны, эндогенные ретровирусы, простые,  тандемы и другие.
То есть общий вывод, что гигантские интроны генов-гигантов состоят из
большого количества разных повторов и межповторной ДНК,остался без изменения.
Количественно для интрона 6 гена NEGR1 размером в 358883 нуклеотидов
количество нуклеотидов, входящих в повторы составило 27 процентов. ДНК
интрона, которая не входит в повторы 73 процента. Эта ДНК , возможно, несет какую-то особую функцию в клетке, пока не известную. Но эта ДНК может быть просто захвачена и перенесена при миграции транспозона или при рекомбинации гена. Межповторная ДНК, как и все остальное должна быть изучена, это какой-то феномен, который я здесь обнаружил и обратил на себя внимание. Таким образом,
интроны генов-гигантов представляют собой чередование разных повторов и межповторной ДНК с неизвестной функцией.
Генов в межповторной ДНК не отмечено, хотя гены могут часто быть
в гиганских интронах.

               ГДЕ НАХОДИТСЯ ПАМЯТЬ У ЧЕЛОВЕКА. 23 апреля 2013.

Как генетика вопрос о молекулярных механизмах памяти интересовал меня давно.
Мне уже 54 года и я решил вспомнить что было в моем счастливом детстве. Для этого я нашел журнал "Пионер" за 1967 год. С того времени,  как мать выписала мне этот журнал, прошло почти 46 лет. С тех времен ни разу этот журнал не просматривал снова. Первое хорошее впечатлние от просмотра журнала детства,
что многие картинки сразу узнавались, как будто я их видел вчера.
Просмотрев 10 номеров журнала за 1967 год, я насчитал 843 картинки или фото.
 Из них 96 были определены как знакомые. То есть около 12 процентов
изображений моя память пронесла через всю жизнь. Интересный эксперимент сопровождался приятными воспоминаниями из детства, то есть просмотр старых журналов с картинками из времен счастливой жизни улучшает настроение и , я думаю, и состояние здоровья.
В главном же долговременная память хранит где-то эту информацию. В настоящее время при всех успехах в молекулярной биологии точно неизвестно где и как хранится память у человека. Я, как генетик, думаю, что долговременная память все-таки связана с ДНК,  и хранится в ней. Каким образом эта информация в ДНК
превращается в последовательность электрических импульсов еще неизвестно. Все остальные молекулы , а именно белки, липиды, РНК,  а также их комплексы в
виде рецепторов, синапсов и других структур клетки изменяются в течение
секунд, часов или дней и вряд ли смогут быть неизменными в течение 50 лет. Только ДНК отдельного нейрона после записи информации в спираль может хранить
ее всю жизнь в виде последовательности нуклеотидов. Каким образом происходит запись и извлечение в ДНК клетки нейрона неизвестно.
В этой статье я выскажу лишь свою гипотезу этого процесса.
               
                Скорость извлечения памяти.

Чтобы после стимула снять информацию из ДНК заново надо минуты и часы, затрачиваемые на процессы транскрипции и трансляции и наработку продуктов белковых ферментов - медиаторов. Но память реагирует на стимулы мгновенно, в течение нескольких секунд. Поэтому можно предположить, что какой-то нейрон, записав в ДНК информацию,  все время держит ее в рабочем состоянии. И при появлении нужного стимула этот один нейрон мгновенно выдаст именно ту информацию, которая в нем записана,  в виде спайков импульсов. Если такой же нейрон запомнит другую информацию, то наверное, характер импульсной
активности будет другой. Таким образом , при запоминании отличается
информация, записанная в ДНК и характер импульсной активности ее отражающий.
Если взять два или более отдельных нейрона, то, предположив, что в них есть участки, где записана информация в ДНК, можно подтвердить это, сравнив секвенированные геномы отдельных нейронов. Рано,  или поздно,  этот проект
кто-то осуществит, чтобы показать разницу в геномах отдельных нервных клеток, взятых из мозга одного человека.

                32
Сегодня можно только предположить, что участки записи памяти в ДНК нейрона
лежат в некодирующих участках. То есть сами гены не изменяются при
кодировании памяти. Только один механизм может записываться в геном клетки и
извлекаться из генома - это генетические транспозоны. Это моя гипотеза долговременной памяти – транспозонная гипотеза. Она заключается в том, что мобилизованные транспозоны модифицируются в клетке каким-то механизмом,
связанным с генерацией импульсной активности нейрона. Затем такой транспозон встраивается в геном и уже хранит информацию - долговременную память. При последующих мобилизациях или транскрипции транспозона память извлекается. Фоновая транскрипция транспозонов обеспечивает почти мгновенный ответ памяти
на стимул нейрона, то есть один раз записавшись в ДНК или  в РНК,
долговременная память может мгновенно извлекаться даже через годы ее
хранения. В нейроне постоянно работают гены домашнего хозяйства, связанные с обеспечением жизни нейрона и его работы. Это синтез белков рецепторов, медиаторов и других.
В клетке есть динамический пул РНК. Это РНК, готовая для трансляции и пул интронов, вырезанных из транскрипта. Этот постоянно находящийся в клетке пул интронов, я предполагая может быть связан с хранением и извлечением памяти.
При этом молекулы РНК находятся в постоянно готовом состоянии для работы нейрона, для мгновенного ответа его на стимулы.
Кратко, что можно сказать о памяти. Консолидация памяти и ее извлечение,
нейроны холинэргические и адренэргические, нейроны афферентные, нейроны вставочные или ядер, нейроны эфферентные. Спонтанная импульсная активность и вызванные потенциалы, часть нейронов - хранители, другая часть для введения
информации и часть для вывода информации - нейроные сети. Разные сигнальные
пути записи в ДНК и извлечения из ДНК, Синтез и распад РНК, обмен макроэргов.
 А где хранится память на всю жизнь?
Я за свою жизнь прочитал много литературы по нервным тканям, создание этой гипотезы основано на интуитивной генерации связей. Гипотеза на основе
интуиции, поэтому каждый пункт нуждается в проверке.
Пока сам механизм синтеза ДНК в связи с импульсной активностью нейрона и обратный процесс преобразования последовательности ДНК в последовательность импульсов нейрона не известен.
Я только гипотетически могу предположить возможный механизм этого.
Статистика генов-гигантов показала, что мозгоспецифические гены из них составляют около 49, 4 процентов. Остальные гены-гиганты - это гены,
работающие в других органах. Приложение 3.
Из этой статистики функций белков для генов-гигантов можно сделать главный вывод, что только прямые эксперименты с их дефрагментацией ответят на вопрос
об их настоящем значении. Речь идет не о белке, кодируемым этими генами, а о роли интронов-гигантов в физиологии не только гена, где он есть , но и о значении транскрипта этого интрона, как самостоятельной функции. Можно только предположить, что сами интроны-гиганты вместе с генами, где они находятся
могут влиять на поведение, память, включение и выключение генов,
генорегуляция и так  далее.
В ряду поколений интроны-гиганты не исчезают,  как не нужные, хотя
наследование идет через половые клетки. Предположение о том, что эта ДНК
просто паразитическая, как все повторы, может быть неверным. И эта интронная
ДНК гигантского размера, может иметь особое значение для работы некоторых органов, например, мозга.
Если гены-гиганты и их интроны,  предположим, нужны для работы мозга,то можно предположить, что с ними связаны основные функции мозга, а именно развитие мозга, хранение памяти, мышление, а также разные заболеванеия, связанные с генами-гигантами.
Не случайно среди этих 324 генов-гигантов 7 генов-гигантов имеют отношение к основной психической болезни мозга- шизофрении, это 2, 16 процента. А гены, связанные с развитием эмбриона и его мозга составляют 31, что дает 9, 57 процента. Это показывает важную роль генов-гигантов в нормальном развитии человека, и особенно его мозга, а также в нормальном функционировании мозга.
Хотя большие интроны интересный феномен, не надо забывать об обычных
небольших интронах, которые создают пул РНК-интронов в клетке. Может быть


                33
интроны и сплайсинг есть в генах для каких-то особых, важных функций.
Предположим,  для обеспечения работы памяти или других важных процессов в клетке. Пока рано считать интроны просто мусором в клетке или паразитической ДНК.
Итак, биоинформатика ДНК открыла много нового в генетике. Появились новые
данные об интронах и новые гипотезы о памяти. Но, критерий истины, как
известно, это опыт.
Итак, необходим прямой эксперимент для выяснения функций интронов-гигантов и особых функций генов-гигантов, не связанных с белком, ими кодируемыми. Теоретически тут уже ничего не поделать. Нужно синтезировать химически ген
без интронов, или хотя бы без гигантских интронов и вставить его в хромосому. Хозяйский ген при этом блокировать или нокаутировать. После чего наблюдать
биологические функции клетки или организма. Впереди будут эксперименты по дефрагментации генов и генома.

           МИКОПЛАЗМА, ТРАНСПОЗОНЫ, ЭВОЛЮЦИЯ И ЗДОРОВЬЕ ЧЕЛОВЕКА.
           ЧАСТЬ 1. 25 ИЮЛЯ - 25 АВГУСТА 2009.

 На примере генома микоплазмы я продемонстрирую, как производится поиск и сравнение геномов или последовательностей ДНК.
В процессе разных биоинформационных разработок ученые постоянно проводят
поиск и сравнение каких-то участков ДНК. ДНК подвергается постоянному мутированию - это ее основное свойство. Можно сказать, что человек на
столько-то процентов сходен с шимпанзе, мышью и даже с растениями, микробами
и вирусами. С ними в человеческой ДНК есть много совпадений. Чтобы оценить
эти мутации у разных участков или разных организмов, проводится сравнение
разных последовательностей друг с другом. Операция называется иначе
алигментом. Для целей сравнения и выравнивания двух или многих участков есть много разных программ. Я приведу , для примера, самые простые из них, и самые передовые.
Для примера, я приведу программу Repfind, находящуюся по адресу
ftp://ftp. ebi. ac. uk/pub/software/dos/repfind/.
Программа G. Hutchinson, 1995 года, предназначена для работы в
DOS или Windows в командном режиме. В ней использована база
повторов J. Jurka. Программа простая и позволяет искать не только повторы в
ДНК , но и любые участки. У нее есть ограничения на размер участка, который
надо будет найти - около 2500 байт. Для подключения к программе нового
повтора надо дать команду repfind -e <имя файла нового повтора>. ref, далее вписать этот файл строкой в файл repfind. cfg. Для поиска дать команду
repfind -d <имя тест-файла>. Будут выведены наглядно сравниваемые места в
двух файлах со статистикой.
Также простая программа - это Clustalw и Clustalx, можно взять по адресу ftp://ftp. ebi. ac. uk/pub/software/clustalw2.
Она позволяет вести сравнение сразу нескольких участков. Эти программы сравнивают или ведут поиск участков ДНК даже если в них есть пробелы или
gaps, или вставки. Это распространенные мутации ДНК - вставки (инсерции)
одного или нескольких нуклеотидов или делеции (пробелы). Для поиска в ДНК небольших участков, я применяю обычные текстовые поисковики. Для этого
открываю участок ДНК программой "Блокнот", или подобной, беру опцию "Правка",
далее "Найти", и в окно  вставляю искомый участок. Далее нажать кнопку "Найти далее". При таком поиске, если хотя бы один знак будет отличен, то участок не будет найден. Также в текстах есть невидимый знак переноса строки. Если он
будет внутри участка, то он не будет найден. Это такие ограничения простых поисковиков. Одной из самых передовых поисковиков является программа BLAST.
Она находится по адресу http://www. ncbi. nlm. nih. gov/
BLAST. Она распространяется свободно в виде файла, например
ncbi-blast-2. 2. 26. +-win32. exe , или используется в онлайновом сервисе.
Для этого надо открыть страницу BLAST, выбрать раздел анализа последовательности, выбрать сравнение. Будет открыто окно "Align Sequences Nucleotide BLAST". В форму вставить два участка ДНК, выбрать опции сравнения,
и нажать кнопку "BLAST". Будет выведен полный отчет о поиске, сравнении двух

                34
участков ДНК. Для изучения BLAST написаны целые книги, так как эта программа
довольно сложна и требует введения многих опций или ключей в коммандном
режиме. Литература по BLAST [16]. Можно также использовать Help-файлы со
страниц о BLAST. Пример использования этой программы будет дан в части 2
раздела о микоплазме.
Микоплазма - микроб небольшой, и поэтому алигмент ее генома с другими организмами не сложен по количеству сравниваемой информации.
Что вообще сегодня известно о микоплазме?
Микоплазма - внутриклеточный или расположенный на поверхности микроб, она
может бессимптомно сопровождать человека всю его жизнь или вызывать
заболевание тяжелое, вплоть до смерти. Существует много видов микоплазм
человека и животных. Из микоплазм человека значение,  как патогены или сапрофиты,  имеют Mycoplasma pneumoniae, M. hominis и другие. Из них самый маленький геном у M. genitalium.
Mycoplasma genitalium имеет 517 генов, из них у 100 функция пока не известна,
а 93 гена повреждены по [19]. У этого микроба наименьшее количество генов, с которыми еще возможна жизнь свободно живущего организма клетки-прокариота.
Живет в половых путях человека, что особо важно, так как она прилипает к сперматозоидам и , возможно, к яйцеклетке. Таким образом, при предполагаемом проникновении ее генома внутрь зиготы или в клетки бластулы или эмбриона,  возможно  влияние на геном зародыша человека на ранних этапах эмбриогенеза, и поэтому предполагается появление иммунной толерантности к этому микробу.
Если микроб повреждает ключевые системы плода, то происходит смерть эмбриона
 - бесплодие или самопроизвольный аборт мертвым плодом или при частичном повреждении и внутриутробной персистенции, носительстве микроба - рождение
живого плода со сниженной массой тела. Литература [17, 18, 21].
Микоплазма может влиять на работу генов клетки-хозяина после инфицирования,
по литературе [20, 22, 23] может изменять работу генов клетки так, что через несколько стадий деления работа генов изменяется необратимо, приводя клетку к
раковой трансформации. В культуре клеток для полной трансформации надо около
18 недель. Этот пример показан для заражения  Mycoplasma fermentans. Клетки проходят стадию обратимого изменения, при котором обработка антибиотиком,
освобождая клетки от микоплазмы, возвращает нормальный фенотип клетке.
Этот пример я привел для того, чтобы показать, что геномы клетки и паразита активно взаимодействуют. Аберрации регуляции генов , вероятно,  проходят
стадию нестабильности генома, при котором активация транспозонов обычное явление, а возможное внедрение транспозонов под промоторы онкогенов
приводит к стойкой раковой трансформации. Поверхностное расположение
микоплазм также может приводить к обмену генетическим материалом, но по
другому механизму без внутриклеточного расположения микроба. Хотя, как для
M. penetrans так и для M. genitalium показаныо их внутриклеточное положение
для части микробов. Я приведу здесь мою гипотезу о роли микоплазмы в биологии
и эволюции человека. Это микроб , который на протяжении всей истории человечества имеет прямой контакт с половыми и зародышевыми клетками и , поэтому, возможно, причастен к жесткой эволюции человека путем обмена генами
при попадании микроба в эмбрион при его заражении. Если в настоящей генетике проводят эксперименты по введению генетического материала в яйцеклетку с
помощью микрошприца,  протыкая оболочку зиготы, то микоплазма - это природный переносчик генов. К тому же,  как половая инфекция,  микоплазма , возможно,
транспортирует гены между индивидумами. Я предполагаю , что это делает микоплазму носителем или "троянским конем" для введения в клетки
человека иной генетической информации.
Это пока что моя гипотеза, а косвенное ее подтверждение - это обнаруживание
мной в геноме микоплазмы участков ДНК похожих на транспозоны человека.
 Я произвел поиск повторов и транспозонов, характерных для человека в
Mycoplasma genitalium G37. Я обнаружил сильно мутировавшие повторы подобные
транспозону L2, CHARLIE2 и эндогенного ретровируса человека.
Примеры этих участков приведены в приложении 8.
Попал вирус или транспозон в микоплазму от человека или другого организма или наоборот. Покажет дальнейшее изучение. Скорее всего обмен ими был


                35
многократным  в истории человечества и при этом были перестройки генома
в зародышевых клетках.
Это говорит о том, что в далеком прошлом произошла с человеком генетическая катастрофа, изменившая биологию человека. Произошло резкое изменение генома человека, которое и привело к современному Homo sapiens со всеми его
болезнями и низкой продолжительностью жизни. Возможно это связано с какими-то глобальными геологическими или экологическими процессами на планете Земля.
Именно в такие времена выживания человеческого рода происходит снижение иммунитета и распространение различных инфекций. Можно даже вспомнить
библейскую легенду о всемирном потопе и о том что люди до потопа жили до 1000 лет, а после Мафусаила через несколько поколений продолжительность жизни
упала до 40-70 лет в разных эпохах. Такое резкое падение длительности жизни - косвенный признак заражения человека каким-то вирусом. Или , как я думаю, это микоплазма плюс вирус или транспозон.
Микоплазма была всегда с гоминидами и является поэтому свидетелем этой генетической катастрофы. С тех пор как произошел обмен генами с микоплазмой прошло много времени. Хотя количество измененных нуклеотидов в похожих
последовательностях известно, но точно назвать дату трудно. Если геном
человека во много раз стабильнее микоплазмы, то все-таки судить о скорости мутирования микоплазмы трудно, так как влияет на это много факторов. И даже в одном гене у микоплазмы mgpC есть вариабельный и консервативный участки.
Использование для определения скорости мутирования микоплазмы культуры зараженных клеток также может дать большую ошибку, так как в реальном
человеке на них влияет иммунитет и метаболический фон.
Чтобы точно рассчитать это время я предлагаю ученым провести для прямого
замера следующий эксперимент - если будет найден замороженный умерший
человека где то в широтах вечной мерзлоты или высокогорья, что более реально,
то выделить у него микоплазму, которая была заморожена вместе с человеком
на протяжении 300-500 лет со знанием точной даты смерти человека и определить
в ней количество мутаций и сравнить с современной микоплазмой с учетом этноса
и географии. При этом скорость мутации в микоплазме будет определена
более точно in vivo.Если будет возможность,то вместо SNP в отдельных локусах лучше полностью отсеквенировать весь геном у микоплазм, выделенных у такого человека, жившего несколько сотен лет назад. После этого можно будет сравнить
эти участки повторов похожие не человеческие и экстраполировать назад в
историю вида человека.
В настоящее время мне удалось найти одну статью, где in vivo продольные исследования проводились только за 10-35 дней. При этом , конечно, никаких
новых мутаций не обнаружили у микоплазмы из зараженного человека в генах
микоплазмы rRNA и MG309. В другом исследовании  проводилось продольное
изучение гена mgpC у инфицированных женщин на протяжении 19 месяцев. Проксимальный его участок содержит гипервариабельный участок, скорость
мутаций в котором очень велика. На участке в 70 аминокислот произошло около
20 различий за это время. Таким образом, у микоплазмы есть консервативные участки, необходимые для стабильности важных генов и сохранения вида и
гипервариабельные участки , необходимые для паразитирования. В частности для ускользания от иммунного надзора. Поэтому только прямое определение в виде секвенса может дать ответ на этот интересный вопрос – когда у человека и микоплазмы произошли обмены генетической информацией и как это могло повлиять
на эволюцию человека?Возможно, за счет обмена между человеком и микоплазмой
даже небольшими участками ДНК, особенно транспозонами или эндогенными ретровирусами, произошло резкое повышение нестабильности генома предков человека, что способствовало его эволюции и приспособлению к среде. Что в конечном счете привело к современному виду человека.
Еще раз отмечу, что это лишь моя гипотеза. Как обычно,данные,  полученные с помощью биоинформатики,  надо проверять экспериментально.
Меня интересует этот микроб с точки зрения моей программы борьбы с мобильными генетическими элементами - транспозонами. Транспозоны могут быть одними из главных факторов повреждения клеток и снижения уровня здоровья, расходования резервов организма, развития рака и старения.


                36
Могут ли как-то взаимодействовать  транспозоны человека с их мутировавшими похожими последовательностями из микоплазмы пока не известно.
Косвенный факт этого - возникновение артритов у инфицированных микоплазмой людей. С другой стороны,  было показано, что активация некоторых транспозонов
у человека, например LINE, приводит к развитию ревматоидного артрита.
Необходимо радикальное освобождение человечества от этого микроорганизма. Использование антибиотиков и вакцинация по литературе [17] дает временный
эффект для отдельных индивидуумов. Человек может заражаться микоплазмой много
раз в течение жизни. И,  если человечество намерено освободиться от основных
микробных патогенов, то микоплазма хороший кандидат для этого. Например, человечество победило натуральную оспу в 70-80 годах прошлого века и всем от этого хорошо.  Также надо последовательно избавляться и от других патогенов ,
путем проведения генетических влияний на эти микробы. Для этого надо либо модифицировать геном человека, чтоб он был не совместим с микоплазмой на генетическом уровне, либо применить лекарство , изменяющее геном микроба,
когда он в клетке или снаружи.
Микоплазму легко контролировать микробиологически и генетически, потому что у нее очень маленький геном и достаточно 1-2 генов человека для противостояния
ей, и, если микроб проникнет внутрь клетки, то программу его размножения
легко заблокировать, сделав геномы человека и микроба несовместимыми.
Если же влиять на геном микоплазмы, то из небольшого числа эссенциальных
генов можно in vivo заблокировать тоже 1-2, чтобы  сделать микроб нежизнеспособным. Таким образом , я думаю, в недалеком будущем будет переход
от антибиотиков и вакцинации в борьбе с микробами к влиянию на генетическое
взаимодействие микроба и хозяина.

           МИКОПЛАЗМА, ТРАНСПОЗОНЫ, ЭВОЛЮЦИЯ И ЗДОРОВЬЕ ЧЕЛОВЕКА.
                ЧАСТЬ 2.

 Я произвел сравнение генома Mycoplasma genitalium c HERVK и LINE 1 транспозонами. Использовался онлайн сервис - программа BLAST сервиса NCBI. Полученные данные в виде нескольких примеров представлены в приложении 9.
Видно, что есть очень много участков с идентичностью для некоторых до 100 процентов. Данные транспозоны – эндогенный ретровирус человека К и перемежающийся большой повтор 1 характерны для человека. Их ДНК получена из
базы повторов человека с сайта www. girinst. org . Таким образом, я показал,
что в таких разных организмах, как человек и прокариот микроб микоплазма
имеются почти одинаковые участки ДНК. Особенно наглядно соответствие геномов можно видеть, если при алигменте загрузить дот матрикс. Он находится на той
же странице алигмента, что и графический результат алигмента ДНК. На нем
видно, что есть много участков соответствия, но они разбросаны по дот
матриксу и оторваны друг от друга. Также было наблюдение того, что многие алигменты имеют плюс и минус цепи ДНК, то есть повернуты на 180 градусов.
На основании этого я сделал вывод, что участки человеческой ДНК встраиваются
в геном микоплазмы. Эти события встраивания облегчаются тем, что в половых
путях повышено количество ДНК человека из разрушенных сперматозоидов, а транспозоны составляют значительный процент всего генома. Вероятно,
микоплазма постоянно встраивает в свой геном внешнюю ДНК, которая затем подвергается мутированию в течение времени. Возможно влияние ДНК микоплазмы
на человека, но это требует дополнительного изучения. В этой же книге
основной упор я делаю на демонстрацию роли ДНК биоинформатики для подготовки дальнейшиего экспериментального изучения роли микоплазмы на здоровье
человека.
С точки зрения здоровья человека и геронтологии,  имеет большое значение наблюдение того, что у животных при эксперименте длительность жизни сильно зависит от условий в которых находятся половые клетки до оплодотворения. При полной зашите половых клеток от окислительной деструкции у мышей
предполагается увеличение в 2 раза предстоящей длительности жизни.
Как пишут эти авторы, это может быть сверхпервичной профилактикой старения и болезней у будущего поколения. Литература [24].


                37
Микоплазма может нанести прямой вред половым клеткам за счет токсинов и за
счет кислородных радикалов. Резкое возрастание кислородных радикалов в среде
также происходит за счет "кислородного взрыва", который производят активированные микробами нейтрофилы, находящиеся в половых путях.
В настоящее время распространенность микоплазмы на примере близкого вида M. hominis и U. urealyticum дают 40 процентов всех воспалительных заболеваний мочеполовых органов. Бессимптомное носительство составляет от 8 до 26
процентов всех людей. Литература [25]. Таким образом, проблема микоплазм довольно большая для человечества, и вызывает интерес у разных специалистов,
от практической медицины до генетики.

        ПОЛЕЗНЫЕ ГЕНЫ ЖИВОТНЫХ, РАСТЕНИЙ И МИКРОБОВ В ГЕНОМ ЧЕЛОВЕКА.
                ДЕКАБРЬ 2010.

Полезных генов очень много в природе. В связи с современным развитием
геномики появляется новая возможность для улучшения человека, как вида.
Можно использовать гены животных, растений и бактерий для создания
суперчеловека будущего.
Почему-то эта возможность , которую дает современная наука мало обсуждается.
Вероятно, многие люди и даже ученые считают человека чем-то постоянным,
незыблемым, и что как бы нельзя вмешиваться в биологию человека.Надо
отбросить эти догмы, развитие науки не остановить.
Я же утверждаю, что человек будущего - это сильный продукт науки будущего. Человек станет генетическим рекомбинантом, человек станет полукиборгом,
человек будет иметь компьютер внутри, превышающего возможности мозга и так далее.
Никто не сможет остановить  развитие всего, что улучшает качество жизни человека, его возможности.
Список этих генов может быть большим, для начала я предлагаю встроить в
геном человека следующие гены.
 1. Гены синтеза витаминов.
Аскорбат-синтетаза, для эндогенного синтеза витамина С в организме человека. Сегодня потребность в этом витамине полностью зависит от качества пищи.
Витамин К синтетаза - потребность восполняется только за счет кишечной микрофлоры.
Человек полность зависим от растительной и животной пищи почти для всех
витаминов. Хотя многие витамины как коферменты ферментов организма можно
образовывать в самих клетках.
 2. Целлюлаза бактерий для того, чтобы человек смог усваивать глюкозу из
целлюлозы растений. Человек будет использовать очищенную древесину как
энергетический субстрат. При этом проблема будущего голода на планете Земля будет полностью решена.
 3. Гены для образования естественных молекул запахов, которые будут
выделяться через потовые железы или через выдыхаемый воздух. Самим человеком
эти запахи восприниматься не будут. Но можно сделать так, чтобы этот запах
был непереносим для гнуса, комаров или клещей. В будущем нехватка свободной земли на планете подвигнет людей к освоению мест, где эта проблема
кровососущих насекомых и клещей особенно актуальна, особенно из-за
переносимой ими инфекции. 
 4. Эндогенный антибиотик широкого спектра действия, обладающий полной
устойчивостью к защите микробов, так чтоб чувствительность микробов к нему никогда не снизилась. Это даст образование человека-гнотобионта. Полностью
будет разрушен симбиоз человека и кишечной микрофлоры и человек полностью освободится от паразитирующих на нем микробов и станет абсолютно стерильным
от микробов. Это снимет все проблемы в медицине, связанные с борьбой
организма человека с агрессивной внешней микробной средой.
 5. Гены синтеза незаменимых аминокислот для человека. А также ферменты
микробов превращающих нитраты в нитриты, а нитриты в аммиак. Больше не будет
проблем с белковым голодом на планете Земля. Человеку будет достаточно
небольшого количества аммиака или нитратов чтобы не было  белкового голода.

                38
Для роста , развития и восполнения катаболизма белков тканей. Это ферменты - нитрат и нитрит редуктазы. Можно пойти по примеру растений и приспособить ферментный комплекс для фиксации атмосферного азота, как у клубеньковых бактерий. Использование атмосферного азота для синтеза белка сделает человека независимым от пищевых природных цепей. Человек сможет превращать
неорганическое сырье в виде газов и солей в энергию и белки.
Конечно, для человека прием пищи - это больше , чем просто употребление
углеводов , белков и так далее. Так радоваться поеданию чего-то вкусненького никто и не отменяет. Можно сколько угодно есть обычную пищу или вообще ничего
не есть, кроме солей.
Такое автономное существование человека без обычной пищи может иметь значение для космических полетов. Перестанет быть угрозой для жизни то, что обычная
пища закончилась.
 6. Гены повышенной устойчивости к неблагоприятной внешней среде.  Примером
этих генов могут быть гены репараз ДНК, восстанавливающие ее повреждения от мутагенов среды.
 Для этих групп генов можно изготовить несколько универсальных
векторов.
Далее эти векторы вводятся в стволовые клетки, выделенные у какого-то
человека - фибробласты или лимфоидные клетки или другие. После
успешного переноса генов, клетки вводятся обратно. Полностью изменить
организм можно только введя векторы в яйцеклетку , из которой вырастет
организм с новыми свойствами.

    РАСТЕНИЯ - ГЕННЫЕ КОНТЕЙНЕРЫ И  ХИМИЧЕСКИЕ ЛАБОРАТОРИИ. 29 мая 2009.

Рассмотрим планету Земля сквозь время. Миллиарды лет. Предположим, что нашу планету посещали или населяли когда-то высокоразвитые цивилизации. Если наша человеческая цивилизация прошла путь от первобытнонго общества до современной цивилизации за 4-5 тысячи лет, то можно предположить, что Землю населяли
такие же цивилизации несколько раз за миллиарды лет, что существует Земля.
Они могли доходить до  совершенства в генетических манипуляциях с организмами значительно выше , чем сейчас.
Какими бы не были цивилизации прошлого для разумной расы существ всегда
будут одинаковы ценности для любой разумной жизни. Это прежде всего
существование без болезней и во времени значительно продлить свою жизнь,
также расширение своих физических и умственных способностей.
Меня, как генетика и геронтолога, интересует прежде всего как генетические ученые и мастера других цивилизаций решали проблему увеличения своей жизни.
Идея в том , чтоб создать такое лекарство, которые никогда не исчезло и было доступно всегда.
Это - растения,  как основа пищи и лечения всех высших форм жизни.
Их легко размножить и иметь лекарства в виде консервов - семян при межгалактических полетах. Растения могут с помощью генетичеких программ синтезировать такие химические вещества, которые современная химия не может сделать в пробирке.
Какими же свойствами должны обладать растения несущие генетические программы создания лекарств продления жизни?
Я думаю и предлагаю свою гипотезу о том , что эти растения растущие на Земле
- это сорняки. Это не бесполезные и не пустые создания природы.
Если бы цивилизации создали для себя постоянный источник лекарств для
продления жизни, то они создали бы растения , обладающие следующими
свойствами.
1. Неприхотливость к экологическим факторам.
2. Несколько способов размножения.
3. Сильная экспансия растения, то есть за короткое время оно заполняет
все свободное пространство, растение вне конкуренции.
4. Яркий фенотип, сразу бросающийся в глаза и отражающий наличие нужного
лекарства. Весь внешний вид растения , его цвет, запах, вкус показывает, что
это непростое растение. Сами-то растения не знают, что они выглядят как-то


                39
странно или красиво. Это оценка их создателя.
5. Стабильный генотип, неизменность основной химии растения в течение многих миллионов лет.
6. Растения целевые снабжены системой защиты от поедания животными
и устойчивости к микроорганизмам и другой флоре.
7. В геномах сорняков возможно есть метки, послания высших цивилизаций.
Хорошо бы если был произведен секвенс нескольких обычных сорняков. Даже если
не повезет и не будет никаких информационных посланий, то генетика сорняков может иметь большое значение для увеличения урожая пищевых культур.
На Земле биомасса сорняков во много раз превосходит биомассу полезных видов.
 И возможно присобление сорняков для биосинтеза нужных химических веществ.
Растения могут синтезировать очень сложные химические соединения.
Синтезировать такие в пробирке очень сложно даже из близких по формуле соединений. Возможно потребуется десятки реакций для воспроизведения
какого-то , к примеру , алкалоида. У растений же в его синтезе участвует
такое же количество генов, каждый фермент модифицирует , режет или
присоединяет какой-то химический радикал. И все работает согласованно.
Возникает вопрос - это продукты эволюции или чья-то генноинженерная мысль.
Если токсический эффект для защиты определяется у растения конечным
соединением, то как же оно защищалось до этого. Приобретало и накапливало
цепи ферментов без защиты, то где же эволюция. Возможны , конечно,  разные способы.
А может быть в каком-нибудь обыкновенном одуванчике,  иван-чае или
мать-и-мачехе может быть что-то невероятное?
Итак,  еще раз выскажу кратко свою гипотезу. Сорняки - это химические лаборатории  для синтеза различных лекарств в том числе и для продления
жизни. Причем это могут быть не обязательно низкомолекулярные соединения, а
сам набор генов  или какие-то последовательности ДНК, которые могут
поглощаться геномом организма с изменением качества генома для выздоровления
или омомложения организма.

         ЧТО ЖЕ ТАКОЕ - РАЗУМНОЕ ПОСЛАНИЕ В ГЕНОМАХ? МОИ РАЗМЫШЛЕНИЯ.2013.

Я предполагаю найти в ДНК именно РАЗУМНОЕ послание в виде текста. В
начальном появлении человека пока точно не ясно, как он произошел,  как новый вид. Возможно это простая мутация плюс влияние среды. Тем не менее,  человек резко вырос в своем развитии по сравнении с другими приматами. Не случайно, поэтому, некоторые ученые, изучающие появление человека, предполагают, что
он продукт генных операций какой-то более высокой цивилизации. Иногда даже точковые мутации могут резко менять фенотип и приводить к появлению нового
вида. Многие гены человека схожи с высшими приматами, но могут ли быть эти точковые мутации или транслокации продуктом генных операций. Почему бы нет?
Все можно предположить. Если это так, то должны остаться разные участки ДНК, которые несут технологическую информацию, например, метки для ПЦР,
аномальные повторы, возможные дубликаты и копии генов или транспортных систем, какие-то гены или регуляторы для преимущественной эволюции нового вида и так далее. Все технологические метки и остатки ДНК, необходимые для создания и продвижения нового вида ничем особо не отличаются от остального массива ДНК.
И хотя они продукт работы высшей цивилизации, они не являются разумными
посланиями для будущих цивилизаций. Разумное послание - это текст, который высшая цивилизация хочет передать последующей цивилизации, сохранив его
через много поколений и многие тысячелетия. В этом и есть смысл жизни - сохранение и распространение информации, заложенной в ДНК.
При этом предполагается, что последующая цивилизация достигнет уровня науки,
при котором возможна работа с генами и ДНК. Самое главное в разумности
послания - это обращение внимания ученого на необычность участков ДНК и
легкий алгоритм шифрования текста. Предполагается, что текст будет введен
именно в разумный вид, то есть в человека. Хотя им может быть любой из других миллионов видов.
Итак,  необычность участков ДНК  в виде каких-то искусственных построений

                40
последовательности ДНК. Можно подобрать такую последовательность из 15-20 нуклеотидов, что она будет в полном виде встречаться в одном экземпляре на
весь геном, то есть оригинальных участков очень много, но это не будут
признаком метки текста, поскольку никак не обратит на себя внимание. Метка разумного текста должне его сразу выделить из массива ДНК. Для подтверждения этого можно рассчитать вероятность появления этого необычного участка.
Но, скорее всего теорию информации применять будет не нужно,так как вид метки
будет настолько необычен, что случайными событиями объяснить его образование
не возможно. Также он не должен быть естественного происхождения, то есть не должно быть биологического процесса, который формирует, использует или
сохраняет какие-то структуры ДНК, которые решено сделать меткой разумного текста. Я делаю одновременно две вещи - это разрабатываю способ вложения послания в ДНК и способ поиска такого послания. Конечно, логику работы высшей цивилизации предположить трудно и поэтому могут быть сложности с нахождением
меток текста и большая случайность этого события.
Далее будут показаны некоторые метки текста, которые я бы применил при разработке послания от нашей цивилизации той, что придет после нас. 

           Кодоны в ДНК и разумность последовательности. 2013.

 В ДНК, как известно, имеется 64 кодона по 3 нуклеотида. То есть,  можно закодировать каких-то 64 знака, присвоив каждому кодону букву или знак. Количество возможных кодонов слишком избыточно для кодирования какого-то
языка. Приведу короткий пример о количество слов в простом языке.
Я принимаю  следующие условия.
1. Чередование согласных и гласных.
2. Букв в алфавите 21.
3. Согласных 14 , гласных 7.
Пусть слова в языке будут только  по 5 букв с чередованием:
сгсгс, что составит 14*7*14*7*14=134456, гсгсг, что составит
7*14*7*14*7=67228.
Итого 201684 слов в этом условном языке.
Таким образом, только для этих условий,  словарь языка огромен. Поэтому, если каждой букве языка присвоить один кодон, то хватит около 20 кодонов или
меньше. Если перейти на биологический принцип подобия, то,  конечно,  лучше
всего количество букв в языке принять равным числу аминокислот в белках.
То есть , по принципу вырожденности кода, один знак может иметь несколько кодонов. Если транслировать такую ДНК, то полученный текст ни чем не будет отличаться от других белковых транслятов и определить, что здесь написан
какой-то текст-послание будет не возможно.
Поэтому главным признаком разумности последовательности ДНК, я думаю, будет наличие в ней сниженного количества использованных кодонов. То есть,  будет использовано 20 кодонов из 64. Этот принцип разумности я предлагаю
использовать для записи в ДНК каких-то текстов или для поиска посланий.
Известна общая статистика числа разных кодонов для человека и других
организмов. Конечно, на каких-то участках ДНК, особенно небольших, процент кодонов может отличаться от среднего. Но не настолько, чтобы отсутствовали совсем десятки кодонов. Для анализа числа разных кодонов можно использовать
следующие программы. Программа CODONS14, расположена по адресу:
ftp://ftp ebi. ac. uk/pub/software/dos/.

Особенностью этой программы, что она выдает результат в виде листа всей последовательности ДНК, кодоны которой разделены пробелами. Пример показан в приложении 10. Для примера дана только верхушка гена PUSHKIN, в котором
зашифровано стихотворение Пушкина "Осень". Такое разделение кодонов позволяет проводить удаление или замены ВСЕХ одинаковых кодонов, не затрагивая
остальных. То есть разбивка последовательности на кодоны очень нужное
свойство этой программы. Програма выводит абсолютное число разных кодонов в
участке ДНК. Количество кодонов в гене PUSHKIN, который я создал,
представлено в приложении 10. Видно, что при кодировании стиха "Осень" в этом гене я использовал только 35 кодонов, приспособив кодоны для русского

                41
алфавита. Остальные кодоны не использованы. Таким образом, если кто-то через много лет найдет в ДНК этот ген и определит в нем число разных кодонов, то
сразу будет ясно, что это не природное, а искусственное образование. Еще один признак разумности текста – это большое количество разделителей слов в языке.
 В этом примере это кодон разделитель AAA, которого содержится больше, чем
всех остальных знаков. Ген PUSHKIN я создал для примера. Количество использованных кодонов легко можно было уменьшить до 20. При этом текст стиха "Осень" также можно было понять.
Также можно использовать форму для поиска редких кодонов,  по адресу: http://molbiol. ru/scripts/01_11. html,
но в ней определяются только промилле разных кодонов, а лучше сразу иметь их абсолютное число.
Можно использовать форму с сайта:
http://www. kazusa. or. jp/codon/countcodon. html. Программа COUNTCODON.
В окно формы надо вставить последовательность ДНК и отослать. Через несколько минут всплывет окно с результатом. В таблице будут указаны промилле и
абсолютное число кодонов в участке ДНК.
Для кодировки текста в геном можно использовать два основных способа - кодирование непосредственно в цепь ДНК и кодирование через трансляцию,
подобно рибосоме.
Конечно, возможны и другие кодировки, все зависит от создателя. Для примера,
я мог бы привести кодирование с четырехбуквенным кодом, когда каждой букве текста будет соответствовать четыре рядом расположенных нуклеотида цепи ДНК.
Но этот код никак не связан с биологией клетки и годен скорее для шифрования
в ДНК текстов, которые никто не должен прочитать, чем для легко читаемого послания. То есть мало вероятности, что 4-буквенный код кто-то вообще будет искать и расшифрует.
Первый способ кодирования я осуществил через понятие "единицы", оно описано далее в разделе "ДНК говорит". При втором способе кодирование сложнее, но оно как-то связано с нормальной биологией клетки, что может быть важно для
сохранения неизменной информации. Если тот человек,  который кодирует в ДНК
для последующей трансляции ее, как белок, будет и извлекать эту информацию,
то каждому кодону ДНК можно присвоить любую букву. Если же предполагается сделать послание на длительное время или для поиска посланий из прошлого, 
надо процесс кодирования сильно упростить для последующей расшифровки.
Для этого надо сократить количество букв в алфавите хотя бы до 20 и сократить количество используемых кодонов. Некоторые кодоны не надо использовать,
если их промилле мало. Надо использовать для одной буквы тот кодон, которого
по статистике больше,а остальные кодоны при вырожденном коде не использовать.
 Из 64 кодонов понадобятся всего 20, столько же,  сколько и аминокислот,  или немного больше. Надо для кодирования не использовать кодоны терминаторы,
иначе невозможно будет распознать разумный текст. Транслят при большом количестве терминаторов будет выглядеть,  как некодирующий участок. При их многочисленности он не обратит на себя никакого внимания.
Надо для разбивки текста белка использовать знак пробела между словами. Примерная статистика такова, что из 300 знаков в обычном тексте 50 знаков пробелы. Это составит 167 промилле, что почти в 10 раз выше, чем для встречаемости разных аминокислот в белке.
Для пробела можно взять кодон TTT в ДНК, это фенилаланин, и AAA - это лизин,
а другие их кодоны не привязывать ни к какому знаку.
При расшифровке текста якобы белка, который получится после трансляции,  как
на рибосоме, сначала разбить текст на слова с помощью амнокислоты, соответствующей пробелу. Затем расшифровывать слова. При создании гена
PUSHKIN, конечно, надо было лизину выделить только кодон AAA, а кодон AAG
не присваивать ни какому знаку. В любом случае, пример правильного и не очень правильного присвоения кодонам значения букв,  также имеет показательное значение.
При этом этот большой белок разбить на отдельные слова по лизину правильно не получится. Пример трансляции в приложении 11. Чтобы закодированный текст правильно выглядел надо присваивать значения букв с учетов вырожденности
кода. Если аминокислота кодируется несколькими кодонами, то брать только один


                42
кодон, а остальные не исползовать. Также не использовать кодоны-терминаторы.
При этом закодированный текст будет выглядеть,как очень большой белок и сразу обратит на себя внимание. Надо, чтобы сам этот текст содержал в этих словах
направление для облегчения расшифровки. При этом можно также,  как для кода
ДНК, то есть первого способа кодирования провести ввод чисел, химических
элементов, констант физики , понятий времени, массы, размеров, и так далее. И обязательно словаря. В этом случае этот текст-послание кто-то расшифрует.
Конечно,  бесполезно сразу зашифровать в ДНК какие-то тексты вроде
стихотворения Пушкина, расшифровать их без ввода в послание невозможно.
Транслят текста ничем не отличается от какого-то белка, а их десятки тысяч.
Конечно, можно еще сопоставить саму ДНК и транслят. Если выполнять правило об сокращении количества используемых кодонов до 20, или до 25 (точная цифра зависит от целей), то ДНК со сниженным количеством различных используемых
кодонов - это признак разумности текста или его искусственности. ДНК надо транслировать по белковому коду и в этой же ДНК в экзонах определить процент разных кодонов, начиная от кодона инициации - метионина. Если окажется, что какие-то кодоны не встречаются в этом участке ДНК, а какие-то выше среднего
для данной аминокислоты, то можно предположить, что этот участок
искусственного происхождения. Частоты кодонов в ДНК для человека,
цитировано с сайта:
http://www. kazusa. or. jp/codon
Значения в промилле, то есть на 1000 кодонов. Среднее значение без
терминаторов должно быть равно 996, 66 : 61 = 16, 34.Данные о количестве
кодонов приведены в приложении 12.
Если же в кодирующих участках промилле кодонов будет сильно отличаться или,
что еще лучше, более половины кодонов будет отсутствовать, то это важный
признак разумности текста - его отличие от средней статистики. Также, если какая-то одна аминокислота будет превышать средний уровень в несколько раз,то это возможный знак логического раздела слов в тексте, что также признак
разумности текста.
Если после перевода текста в последовательность нуклеотидов, эту последовательность транслировать по обычному коду аминокислот, то возможны 6 последовательностей с разными сдвигами рамки для прямой и обратной цепи.
Буквы обозначения аминокислот и буквы алфавита, слова на котором записаны в
ДНК,  не совпадают. При трансляции по биологическому коду получается как бы белок, но прочитать его как слова не возможно. Поэтому при переводе текста,
например стиха Пушкина в ДНК, не надо использовать кодоны терминаторов. Иначе признак разумности текста при его просмотре будет утрачен. Если кодоны терминаторы не использовать, то разумный текст выглядит как очень большой
белок. Иначе говоря, большой белок с непонятной функцией - это и есть
разумный текст. Чтобы его было легче расшифровать как текст,  надо буквы алфавита по возможности кодировать с учетом вырожденности кода, то есть несколько кодонов на одну букву. Далее при расшифровке вначале надо найти
знак раздела, В моем примере - это знак f - фенилаланин, кодон пробела - AAA,
при трансляции в обратном направлении. и далее работать со словами,
различными участками белка размером от 1 до 20 аминокислот. Длиннее 20 букв слова в языке человека очень редки.
В приложении приводится пример стиха "Осень" после биологической трансляции
на рибосоме по обратной последовательности со сдвигом -1, отражая код в ДНК,
то есть текст стиха выглядит как большой белок, которые можно
перетранслировать снова в текст стиха. При остальных 5 вариантах трансляции текст из аминокислот имеет очень много терминаторов, и поэтому не производит признака разумности. Хотя, именно в рамке +1, трансляции вперед, и
закодирован текст стиха. В этом случае - это демонстрация ошибки при выборе кодонов.
Данные тексты лишь пример, ничто не может быть однозначно принято, как
какой-то вселенский принцип. Возможны любые изменения, возможны любые
кодировки. Все зависит от автора и конкретной цели. Моя задача лишь обратить внимание читателя на возможные проблемы и их решения.



                43
              ГЕННОЕ ПРОГРАММИРОВАНИЕ И ДНК ГОВОРИТ. 22 мая 2007.

Наступает новая эпоха в генетике. Наступает время , когда живые организмы
будут использоваться для хранения информации. Футурологи прогнозируют начало этого через 20 лет по статье Деймоса Стренталла "Генное программирование" на сайте XAKEP. RU . Другой исследователь - Джарон Ланье предлагает переписать архивы NEW YORK TIMES или библиотек в интроны тараканов и выпустить их. Предполагается , что тараканы как очень устойчивые насекомые, которым
несколько сотен миллионов лет , сохранят информацию о человечестве в случае глобальных катастроф. Филипп Кео , директор ЮНЕСКО в Москве в статье "Электронный кит, электронный кролик и электронный таракан" развивает эти
идеи и предлагает сохранить шедевры искусства в насекомых.
Итак, фантасты, футурологи, изобретатели,  как всегда,  опережают реальную
науку на много лет. 
Мне же интересен больше другой аспект этой проблемы. Если станет возможно
закинуть в будущее информацию в живых организмах на миллионы лет, то
предположив,что предшествующие цивилизации могли это сделать для людей Земли, надо поискать в современных организмах информацию из далекого прошлого. Этому
и посвящен проект "ДНК говорит". 
В геномах организмов много "свободного" места в виде неиспользуемых явно последовательностей нуклеотидов. Это интроны, интергены, повторы,псевдо-гены
или нуль-аллели,  множественные молчащие гены, гены изо-ферментов,  остатки ретровирусов и другие явно не нужные гены и негенные участки. Информационная емкость неиспользуемых и годных для введения информации в геном довольно
велика и может составить 10-20 процентов генома. Это для человека составит
около 100-200 мегабайт возможного пространства. 
Скорее всего на них можно будет записать информацию жизненно важную для конкретного человека. Это типирование его биометрических, генных,  личных и других характеристик,  необходимых для его здоровья и безопасности. Или же общечеловеческие ценности для избранных организмов. 
Забрасывание в будущее информации возможно на время от тысяч лет до сотен миллионов лет. Неизвестны другие носители информации, которые могли бы сохраниться неизменными за это время.Только живое вещество для ДНК - белковой жизни может сохранить информацию навсегда. 
Пока создаются только подходы к этой проблеме. Есть несколько сложностей для
ее осуществления. О них будет сказано в другой статье. 
Итак,  для того , чтобы найти способ расшифровать возможную информацию в ДНК, надо разработать или знать способ, как ее туда эффективно записать. 
Я разработал несколько принципов записи для длительного хранения информации в геноме. 
Текст по выбранному алгоритму превращается в последовательность
нуклеотидов ДНК. Это не сложно. Для примера приведу стихотворение А. С. 
Пушкина "Осень" в виде текста и транслированное мной в вид гена.  При способе кодированиия 1 буква - триплет нуклеотидов возможно закодировать 64 знака,что достаточно для любых текстов.Это биологически совместимый способ кодирования. 
Если для кодирования использовать по 4 нуклеотида , то возможно закодировать
256 знаков, что достаточно для кодирования всех знаков таблицы ASCII. Этот способ позволит записать любые компьютерные программы и графику на низкоуровневом компьютерном языке, но этот способ не присущ живым организмам. 
Можно конечно изобрести различные способы шифрации на ДНК, но это не нужно
для нашей темы.  Принципы кодирования.
1. Принцип - это принцип облегченного расшифрования ДНК текста.
То есть информационные посылки создаются именно для того, чтобы их легко мог расшифровать любой лингвист. 
2. Принцип ДНК метки. Участки ДНК, несущие текстовую информацию, должны быть выделены из общей ДНК генома специальной меткой, в виде аномальной последовательности, вероятность образования которой случайным или
ферментативным способом близка к нулю. Эта последовательность названа мной INFOINDICATOR. Именно аномальной последовательностью,сразу попадающей в глаза после секвенирования, а не участок для праймера. Эта последовательность нужна для быстрого выделения нужного участка ДНК для анализа или чтения заложенной информации.  С этой же целью применяется фланкирование ДНК текста участками,

                44
показывающими начало и конец чтения. Пусть это будут просто поли-A блоки
размером 30-100 нуклеотидов. Они названы мной, как STARTINDICATOR и
ENDINDICATOR. 
3. Принцип биохимической метки. В текст ДНК надо вставить один или несколько небольших генов - маркеров. Они необходимы для типирования и отбора стволовых клеток в культуре или эмбрионов на ранних стадиях развития. Если интеграция в хромосому прошла удачно, то обнаружив продукт генов - маркеров можно быть уверенными, что и информация на месте для хранения. Биохимические маркеры
можно дополнить оригинальными участками ДНК для ПЦР, но если особый
метаболизм быстро выявляется, то участки для праймеров надо знать точно, а
это , скорее всего,  через много лет будет невозможно.
4. Принцип эволюционого превосходства. Организмы, которые предполагается использовать для посылки информации на миллионы лет, должны иметь особое эволюционное превосходство перед другими особями этого вида. Без этого метка будет разбавлена обычными геномами или вообще самоудалится в популяции. 
Это касается идеи фантастов вставить информацию в насекомых, а затем их выпустить. Информация будет утеряна. 
Эволюционного превосходства можно достичь какими-то генами , дающими новые источники пищи (например, ген целлюлазы для превращения клетчатки древесины
до глюкозы или ген фиксации атмосферного азота для исключения белкового
голода), новые ареалы расселения - устойчивость к экстремальным факторам
среды, новых способов защиты от инфекции , усиление способности к размножению
и так далее. 
5. Принцип метки для изменения фенотипа организма.  Сам внешний вид взрослого организма должен говорить, что он носитель метки. То есть его внешний вид
должен показывать, что он отличен генетически от себе пободных организмов.
Метки организма - носителя информации желательно интегрировать в
информационный участок. 
6. Принцип генетической стабильности информационного участка. Спонтанные
мутации за много лет могут сильно исказить информационную последовательность. Для генетической стабильности применяется комплексный подход.  Он будет
изложет в последующих статьях. 
7. Могут быть дополнительные условия, которые возникнут во время
непосредственной работы. 
Пример записи текстовой информации в ДНК. Я транслировал текст на русском
языке поэта Пушкина - "Осень" в последовательность нуклеотидов в ДНК. Каждая буква или знак - триплет нуклеотидов. Программа для транслирования очень
простая и ее может изготовить любой программист на Java, Basic или другом
языке. Перекодировки буква - триплет любые по желанию.
Я принял для себя, например, такие:

catagggagcagcgaatcggcgagaaccataaa
  о  с  е  н  ь  .   ч  е  г  о   
aataaacaacatataaaagaaagagagcaataccgttggtagataaaaagtcataacgaa
  в     м  о  й     д  р  е  м  л  ю  щ  и  й     т  о  г  д
acaaaacaggagaaaaatgggcatgaatagagtaaaagccaaatcaaaaaaaaaaaaaaa
  а     н  е     в  х  о  д  и  т     у  м  ?

Где AAA - пробел между словами, ACA - а, AAT - в, GAA - д, и так
далее.    А. С. Пушкин - "Осень".

gtaagtgtcccaagctcacatagaacctcacatggtaacaggggcacatgtagtcttcct
tgtctcttgagatctctgcttatgggcatggtattgtgtctggcacttctttgtttatag
tttagaatgtatttttgtggttgtttggtactgtctccactcatagactatgagctccac
atacttgctactgtaaccacatgcctgcttcatagttgatactcactgaatactgaggga
agagagggaaggcaaaagaaagggtaaagtgaagatttcaggtgccgttacagtcaccga
gtttacattgttatagctttaattagtgtacctccatttataaggagattgatgctatct
tgattattggttcatcttgtctctgtcgctgaaggtattttcatgtcaaatgagaaaaca
tggctttttaacatgaaatttttaatttttaatattcaattcattgtgagaatcctactc
tataappppppp......promotor..............pppppppppppppppppppp
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnn......gene1.................nnnnnnnnnnnnnnnnnnnn

                45
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxx......infoindicator.........xxxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaa......startindicator........aaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaacatagggagcagcgaatcggcgagaaccataaa
aataaacaacatataaaagaaagagagcaataccgttggtagataaaaagtcataacgaa
acaaaacaggagaaaaatgggcatgaatagagtaaaagccaaatcaaaaaaaaaaaaaaa
aaaaaaaaaaaagaagagagagacacaaattagcagatccattatagtggcaagagacga
aaaagcgacaaacagacaaggagtagccactagtacaaaactaaaagcgacaaaagacat
tggacaaaacatagtagaggcgggacagagagtcaccataggtacgaggaacagtaggag
aaatactagaggagttgcaaaaggaaacagacaaactaggggaaaaggaatcattagggg
aaaaatgagagtaatgagataatcgaacatgggcagagctacaaacatagggagcagcag
tagataaaagggtacacagaaaaaactaaagaacatagacataacacaaaacacagacat
caagagagataaacagagagtatcgacagcagaggcacaaaagagtgggagaaaaaggag
gactagagtaaataaacaaaacaagagtaccgacagtagggtagcaaaagaagcggcgag
ataattcagcataaacacagaagcgaaaaaagcgacgagaaataaacaaggagttgctac
attaaaaggcatagggaggaaaaacaacatataaaacaccataggcacgagtgaacagag
agtaataaacatagttgtgagtaagactaggagaaacaccattacggcaaaaggaaacat
gggcatagtcatcgtaaaaggaatcatgagataatttagaaaaggagtagaacagacgaa
agcagtaaacattaatagcaatagaaacatagtaaaaaggagtgagagcagcatataaaa
taaacaaagacaaattgcatttagaaaaagagcgaatagagtaaatacacaataaaaagg
cataagacatataaaagcaggcagagcaattgataggagaaagaaagcaagagaacaaat
tgcatcagtgagcacgagagacgaaaacaacatggcaaacaccatagaacaattaaaggc
aaacaggagaaataccgtaagtaccgtaaaaatgagaggcagtgcattaggtatagcggc
cagacaaaacaacaggagaaacatagtagtgagcacgagtaccgaattaaaaatcatcag
cgaattaaaaacagaggctaacgaaaaactaaaaatgagaggcagcatataaaaggcaaa
aagcattacgagcagatttatagacataatcgaaaaaagagacatgaatagagtattaaa
ggcagcaataggagtaatacaattaaaagccaaaaaagtcataggtatcatcgtaaaagg
agtgagaggcaggagcagtgcatcaggagcagacataatcatcgtaaataatagcaacat
ataaaaggcaaaaagcattacgaggagaaagaacataatcattacgagcagatttaccgt
aagtaccgtaaagaggagaaaaggcaggagaacacaattaaaaataaacacagatagagg
agcagtaggagtaattagtagaaatacagccagtgctatacatataaatacgagaactat
tagataaaaaaggagaacaaaaggacacaggagataaaaaggaaacaccatgaaagaagc
aaccatataaaaaagtgcaggagtagaaaatagaaaaatcattacgagcagatttatcat
aacgaaacaaaacaccatgaaaaaaggcataagcattacgagcaaattaaaaggcataac
agagagagtacaaaatagaaaaggaatgaggacacaattcatcagacaaaaaatacacaa
aaaagaagctatagcaaagaccaagagagtattaaacactgctacacaggcaaatagaaa
gaaagacatgacacaatctatacatataaaaatgagagggagtaccatattaaacataag
agcaataaagacgagtacgagtaacatcaaaaacataggagtagatgccaaaaacagcat
aactagattaggtatcattaccgataatagagtcgaaaacaccataaataagagagatat
acatacagcaaaaggagtcatggcggctaggggattaaaagacataatcagtgcgggaaa
agagagtatatcacaaaataatagcaacagtaggggaaacacagaacataagaacagtag
tatcataataaaaagtacgagaggagtggctggtaggagaaaagtagagagaatcataac
tagatcatcatcatccagcataaacagacagaacataaataacagacaagtcgaaaatag
aaaggcgagaggagtcgaatcaaacaccattacaaccatgaaacaaaaaggcaggagaac
aaagaaacaaaaaggcaggagaacattaatgaggaacgaaaacggagtcataaacagaca
tatcatcaggagggtaaatagaaagactagagtgagtaccgtaaaaaggagagataccat
aactagatccaagaggaaaatgaggaacgtaaacagacagaacatgagaggagtatcaaa
caggagtaccgataaggcaaagacgagaaaggtgagtactgcataaaaaatgagtattat
acaagtacaagtcgaaggggcaaacagacacaaaaaaataaaaggacacagggcgggaaa
aggaaaacaagacaataggaaacacaatagaaacaatacacagaatgccaatagatctag
taccgaaaatattagaggcagagcagtcgaaaaagcaaacacgagggcgagataaaataa
acaaaaaggagtgagtattacacacaatagaaagaaaatcatatacagtgccaatagatc
catgggatcaaatacgagagtcataaatatagaacaaggcagcatgagatcaaataccgt
aagtagtacaaaaagtgcaaaggcaaaagtgagaagggcatttatcataacgaaacaaaa
aagaaacaggagaaataacagcatataattaaagaaacaaaacactgctaccgaattaaa
gaaacaaaatatcatcaaacaagatgcattaaagaaacaaaacaaagcgggtagatcagt
tgcattaaaaatagggagaaagaaagctgagagaatcagtgcgagaaaaggcaccatagg
cataagcagcataggagttagaaaaacagcaagggcattcagacaaggaaacaaagcggc
tagtgacgaattaaatatacatataaacaccattacggcattaaacaatgcaaaaggagt

                46
agaacagacgaagagcaaaaacatagtaaataaacaaggagcgggtagatttactagtga
cgaaaatatacatataaaaagtgcaaacagacacaccattagagtcgaattaaagaaaca
aaacataggaatgaggactagagtcgaaaaagggagaagggcaaaacttagcagcatata
aaaaataaacagacaaggaaacaatgcaggtactagaaacaggagagtattaaatagaaa
gacacataccgaaaataatagcaatgcaaaaggagtacaagaagcgggtagatttagatt
aaacacagacataatcatgaatagaataaagaggagaaaaagtactagcagacacaatag
aaatagaaaaattagcagcatcaaattcaccatcaatagcagtattagaaagagataaaa
agtaatcatagatagcaaaaacaacatagacatgacgagcagtgccaaaaatagaaatac
cgagaacatcaaatcgaacagtagaaacaccattaagaacaggagataaaacatagggag
cagtagaaaaagagaacacagggcagtaaacataagtgctatcagcataatgagcagcag
catattcagcataaacaacaggagaaacatcagacaaaacaatagtacacaattaaaggc
tagagtacaagtgagtaccgaaaagaacatagacataaccatataatttatagaacaagg
catcgtaaaagttaggggcatcgtattaaaaagtactagaggagtacacgttgggagata
aaaaggcaatagagagagcagcagcatatcagtacatataaacaggagtaccgtaagtag
caacatgagaaagaatagagtggcaaaaataaaagggagcaacgagagaaaagacatgaa
cagcatatatataaaagggagaaggagaaacaagagcagggcaaaaattacgagggcgag
agtatcaaaaggtatacataaacaagtcgaaaaaatacacaaaaacatagttatagacat
aatgagcagcagcatatttagtaaaaaaaccatgaacataattgcgggaaaaatagagag
caagagcagaaaggcaaaagaacagaaaaatactagtgacgaaaagagataaaacatgaa
cagcatataattaataaacaggagataaaacaacagcataaccataaagaacataagaga
cataaccatattaaataccgtaagcataatcagtagtataaacaggagaaaagttgggag
aggtacacaaatcagtgcataattggcaaacaggagggcagtcataaaaataaacaggag
ataaaacagacatgagagtacaaacaagagggcagtcatcgtaaaaggaatcatgagcag
agaacaaatcagcatataatctatacatataaacggagtcataaacataagtgtggcagg
cagtagagtcgaatcaaacaacaggagaaacagagaacaaattagagtaggggcaaacat
cagacaatttatacatatattaaaaatgagagacatggcagtcagcatattaaaaataca
caaaaaggcacagggcatagtcatggccagacaggcaaagaagagaatacacaccataga
catcgtaaacagagaacaaattagagtaggggcatcaaacagacaaaaaggcaagagaga
agtcgaaaacataggagcgacgaagagcagacaattaaggaggaacagggcgactataca
aaatattaccatcagtagagtaggggcaaaaaggagtaaaaaagacatcaccatagtaca
attaaaaaggagtaaaaaaaccaggagaatacaatcagctactgcaagtatacaaaacag
acaaaaagcaggagtacagggaaaagcaatggccagagcaattgataggggaaaaattag
gaacagacaattcaacataactagtaccgacagcatataaaacacagacatcacacaagg
agttagaaacatcagacaaaacaggagaaaaggtactgctgatagagtaaataagagaat
acaatttagaacagaacagagagtaaacagacaaaatactagggtgagaaagagtgggag
aaaaagacaaacagacataattgcataaaaggtaatgagagtatccatcagacaaaagac
tagaatacaaaagagtgggagaaaagggagaaccatgaacagggcattaaataaacaaat
agtagaacaaaacaggagagtatcagccagtgctacacaggcaaacaccatagaacaatc
aaacatggcgagataaaacatggcacaagacataatacacagcgagagatccacagatag
ggcagtcagacaaaacaacaggagaaaagtaatcatggcaaacacagacattggacatac
cgacagacaggcaaatatagaacaaggacaaaaacttaccgtaagtaccgtaaaggcaaa
cactgctgacagcatgagaaacacagatagagacatgaatgcaaaagcaatggcgaaaca
cagcgagagattaataaaaagacaaacagagagggtaaatagaaaaataaataacattac
catagtcataaacatgaagagagttgcgagaaatacgagaggacaattaataaatagggg
aaaagggagcagggcgggaaaaatgagagtagaacaaaatgaagccaaaaatagaaaagg
aatgaggacgaggagaaagaatgcgggacacagcgagagatttagaaacaaaactaccat
ataaaaaatcattaccagtagaggagtcatcgtaaacaccattatagatgcagttgcaaa
caggagaaggagaggacaatttagaaaagagaggaatattagataaaaaggcattaccag
ggtacaaaatacagcggcattaaatagaaacacgagagaaattgcgagaaacaacataga
cattaatgcatttagaaacatagtgaaacatacgagcagcagtgcgagaaaagggaggaa
catataaaataatagcaatgcaaaagcaacagacattaatgcatctagaaaaggaaatat
acagacgaacatataaaacatagggagcagcgacgtaaaggcaaaagaacaaggggtaat
gagagtacacgtaaaaatcagcataatcgaatttaagaacatagacataatcgacgtaaa
caacatgagcaaagcaaacaccattacgagtaagagcagaaaagaagcaggaggtatcat
ataaaagggcattaccatgaaatttataaacacagatagaattgcggctatacacaaaaa
aagtgcagttagggcaaaaatcagcataatcgaaaaggcagcaataggagtaatagccgt
aaataccgtaagcataatcgaattggcagagaggaacatataaaaaggtacgagagtaca
gagagtaaaaggcatcagattaaaggcagagaggaacatataaaacagacagggcatgaa
tagagtaaaaaccattaccatgaaatttacgagaactatcataaatagaaaagaacagaa
cataggagtcagcataaatagaacagaacagagagtaaaaataaaagggagagagaaggt
gagaaatatagacataatcgaattgacgagtacacacagtagggcaaatattagcacggc
agtaaaactaaaggcaaaaggcagcataatacaaaaaggggcacaaggagttactagaat

                47
attaaacaacattaccatgaaattggcaaaaggcagcataatacaaaagactagtaacag
tagaaacaccattaccagaaaactaaaagtacatatcataataaacaacatataaaacat
agaaacacacagtagtaacaaatttagtaaaatcattaccgaagtgagaaacaacaggag
aaacacagacataggagttagagtcgaaaacaggagcagagcgaccagtgcataaaacac
agacattaaacatagtaacaaattatcaatgaggaaagcagtaaatatcataaacaacag
gagaaatatcatcagggcattaaaaataaaagaacataagaacattactagtagaaacat
agttatagatgcagtcatcaaattcaaacagggacaggcaaaaacagatagaatcatcgt
attaaacatcagaaaaataggacagaacagtagtatacaaaacaggagagggagagtatt
tagaaataaaatcatcagtatcataaacaccatgaaaaagagaaccataaaaagtactag
aggagtacacgttggtagcaaaaatatcatcactgcagtcatcaataaaatgagcagtag
agtaaacacagacatcaagagagataatactgcataaaagaacattacattaaatagaaa
agtagagagaggtatacagagagtaggggcaaatacgaggaaatccagcataaaaacaca
aggcaggagagtaaatatagaacaagttattagataaaagaagagcagcgaattaaatag
aaaaataaatatacacaagagtaccgatatgagaaataaacaaagtgcagtcatcaacat
aaccatcagcgaaaacatcacggcagtcgaaaaaaccatagatagagtaaaactaaaagt
cataaaggcagatattagataaaaaggaatgagagtaaatactaggagagtattagtcat
aaaagttacgaggagagtaaacaagaggaatacgagcagcagcataaaactaaaacaaaa
ggcaaacacagagaggaaaaacagtagcaaaaaggctagagtacacgtatttagtaccga
aaagaaagccaatgcaaagaacattacaactaggagaaaaataaagaaagctgagagaaa
caacatgagataaaacactagagtacacgtatctagaaataaacaaagtgcaatacacgt
aaacaatagagaaaaactaaatagaaaaataaaaggtacacagaatatcatataaaaagt
tagtgatagcaggagggcaaaaggtacacagaatatcataaaagcaggtgccactacgag
cagaaacaacattagcaaaaaaatcatcataagagaacagacgagcagcgagagcaaatt
tagaaacacagacataagagcgacgaaacagagagtaggggcaaacaccatcggtaatag
ggcaaaaatcataaacaacaggagattgaaagctgaacaaaaaggagtgagaggcagggc
gagagtaggggcaaatactagagatagggcgagaggtattagcaaaaaaatcattaccag
gagcagcgagagcaaattagtagagagcacgagtgggagagtaaatagaaataaaatagc
ggctagagtattaaatagaaatagtgggagagtattaaatatacatataaaaatcataaa
aggcaggagatttagtaatactagagtcgaaggggcaaacagacatatcatcaggagggt
aaaaggaatcataagcatgaacagtgccaaaaacacagacatggcaattacgagcagcga
gagcaaaaaacttagaaaagtagcagtaaatatcataaacaacaggagaaataggaagag
agtaaacaggagtaaagatagcaatgcataaaaagacatataaaaaaccataggagtgag
ataatttaacagacatatcatcaaggttgcaaagaaacaaatcagtaggagattaaacac
taccatgaatgcaaacaagagggcagttgcaaacaacatgagataatctagaaacaatgc
aggtactagaaaaataaaaaccattaccataatgagaaaaatcattaccagagccgtagt
aggggcaaaaataaacatagtaatacaaacgagatttagaaaagatagggacaatgcaaa
tacgagaactattaggagaaacagacaaataggagtagagagggcagcaaatagcaaaaa
aaggagaacagcagtatttagaaacacacataccgaggttgcaaacacagacataggggc
agtaggggcaaatataaacacgagagaagcattaaacacgagagacataaatataaaaag
agccaaacaaacgagattcaatagcagagcagtacaaaaactaaatagaaaaggagttag
gggtagaaaaggaatcataagcatgaacagcataaacaccatagtgagtatagcagtatc
agtacatataaagaaagagagcaatacgagagtaaacaggaggaaaattaggactagcaa
aaatatcatagaacaaagtaccgaaaaaataaacaggaggaaaattaggaccagcatata
aaaaattacacaaacgagattcagcataaaggcagcatcaaaactaaacaaacaagtaga
cataggtgcaaaaatgaaagaagcaacaaatattaggaaacacgtagtaggggcattaaa
caccattactaaagcagtaataatgagagagggattaaaaatcagtagtaaaaaactaaa
tagaaacacacaagaagcaggacaaaacagacagaaagctactagaggcgaattaaaaat
gagagtagaacaaaacaccattaccagtgcattaacagacatcaaacagaaacaaaagaa
aattagcagagctacacaaggcgaaaatagaaaagaacaaggagggagtatacagagagt
aaaaatcattaccagtgcatccactactgcaatgagagtatcaaatatagcgaaacaaaa
gacaaacagacacaaaaacactactgcagtcgaatcagtagaacacagaggtactagaga
cataatacatacaaatatagcagacagcataggcataataaacaataggggacatagtac
atccaaacaataaaaagggaggaacgacaacataaccataaaaaccatgaaacaatcaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaa........endindicator........aaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
pppppppppppppppp........promotor............pppppppppppppppp
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnn........gene2............nnnnnnnnnnnnnnnnnnn
nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
aagggtaaattaaattggttggcctaaaaatgtttcttttctttaattagtttgtggaaa
caaaatagcataaacatgcattgattgatttcttatgttgttttgaatgaaatatggaag

                48
gtatatttggtttcaggattctcagggacattttggcctgtagaatctgtagacccattg
tttttgcacatattttaaatttctgaatttcgaacatcaagaaaaccatgttgcattttg
tctcagatgctgctactgaattttaaccactgaattagattgcaacctacatgctgttaa
ctactgagccaagatgaaatcgactactgcattgaaatcagggttagctgtgtctgcact
tgaaggagttgtaatggcagtgaacctgttttctttaatgggatttttattccctgattt
tattctcagttttaattgtgactttgattttaagagaatttcttagtacacatttatttg
aggttttcattgtaactttaagagaataataaaaaacatcctatcgaagtaggtgcttcc
aaacccatatgttcagtggcatatttctgtgttgtgttgttgcagttacttgttttattt
ataaagtatctcttgtaaaaagagaagtcatttgtccatgtgcttttgagttcaaatggt
tgtgtgtatgtgcatgaatttaaaataattttttgtgggagttttcttctttggggtatt
tttggaatacttttctgaatttgtttttttcttttacattaatag

Это только пример. А. С. Пушкин - "Осень". 

Чего в мой дремлющий тогда не входит ум?
Державин. 
Октябрь уж наступил - уж роща отряхает
Последние листы с нагих своих ветвей;
Дохнул осенний хлад - дорога промерзает. 
Журча еще бежит за мельницу ручей, 
Но пруд уже застыл; сосед мой поспешает
В отъезжие поля с охотою своей, 
И страждут озими от бешеной забавы, 
И будит лай собак уснувшие дубравы. 
Теперь моя пора: я не люблю весны;
Скучна мне оттепель; вонь,  грязь - весной я болен;
Кровь бродит; чувства,  ум тоскою стеснены. 
Суровою зимой я более доволен, 
Люблю ее снега; в присутствии луны
Как легкий бег саней с подругой быстр и волен, 
Когда под соболем,  согрета и свежа, 
Она вам руку жмет,  пылая и дрожа!
Как весело,  обув железом острым ноги, 
Скользить по зеркалу стоячих,  ровных рек!
А зимних праздников блестящие тревоги?. . . 
Но надо знать и честь; полгода снег да снег, 
Ведь это наконец и жителю берлоги, 
Медведю надоест.  Нельзя же целый век
Кататься нам в санях с Армидами младыми, 
Иль киснуть у печей за стеклами двойными. 
Ох,  лето красное! любил бы я тебя, 
Когда б не зной,  да пыль,  да комары,  да мухи. 
Ты,  все душевные способности губя, 
Нас мучишь; как поля,  мы страждем от засухи;
Лишь как бы напоить,  да освежить себя -
Иной в нас мысли нет,  и жаль зимы старухи, 
И,  проводив ее блинами и вином, 
Поминки ей творим мороженым и льдом. 
Дни поздней осени бранят обыкновенно, 
Но мне она мила,  читатель дорогой, 
Красою тихою,  блистающей смиренно. 
Так нелюбимое дитя в семье родной
К себе меня влечет.  Сказать вам откровенно, 
Из годовых времен я рад лишь ей одной, 
В ней много доброго; любовник не тщеславный, 
Я нечто в ней нашел мечтою своенравной. 
Как это объяснить? Мне нравится она, 
Как,  вероятно,  вам чахоточная дева
Порою нравится.  На смерть осуждена, 
Бедняжка клонится без ропота,  без гнева. 
Улыбка на устах увянувших видна;
Могильной пропасти она не слышит зева;

                49
Играет на лице еще багровый цвет. 
Она жива еще сегодня,  завтра нет. 
Унылая пора! очей очарованье!
Приятна мне твоя прощальная краса -
Люблю я пышное природы увяданье, 
В багрец и в золото одетые леса, 
В их сенях ветра шум и свежее дыханье, 
И мглой волнистою покрыты небеса, 
И редкий солнца луч,  и первые морозы, 
И отдаленные седой зимы угрозы. 
И с каждой осенью я расцветаю вновь;
Здоровью моему полезен русской холод;
К привычкам бытия вновь чувствую любовь:
Чредой слетает сон,  чредой находит голод;
Легко и радостно играет в сердце кровь, 
Желания кипят - я снова счастлив,  молод, 
Я снова жизни полн - таков мой организм
(Извольте мне простить ненужный прозаизм). 
Ведут ко мне коня; в раздолии открытом, 
Махая гривою,  он всадника несет, 
И звонко под его блистающим копытом
Звенит промерзлый дол,  и трескается лед. 
Но гаснет краткий день,  и в камельке забытом
Огонь опять горит - то яркий свет лиет, 
То тлеет медленно - а я пред ним читаю, 
Иль думы долгие в душе моей питаю. 
И забываю мир - и в сладкой тишине
Я сладко усыплен моим воображеньем, 
И пробуждается поэзия во мне:
Душа стесняется лирическим волненьем, 
Трепещет и звучит,  и ищет,  как во сне, 
Излиться наконец свободным проявленьем -
И тут ко мне идет незримый рой гостей, 
Знакомцы давние,  плоды мечты моей. 
И мысли в голове волнуются в отваге, 
И рифмы легкие навстречу им бегут, 
И пальцы просятся к перу,  перо к бумаге, 
Минута - и стихи свободно потекут. 
Так дремлет недвижим корабль в недвижной влаге, 
Но чу! - матросы вдруг кидаются,  ползут
Вверх,  вниз - и паруса надулись,  ветра полны;
Громада двинулась и рассекает волны. 
Плывет.  Куда ж нам плыть?

        Функциональные элементы генома и ДНК информатика. 2013.
 
 Несколько лет назад [2011-2012] был в основном осуществлен проект ENCODE,
что означает энциклопедия ДНК элементов. По этому проекту получается, что 80 процентов всей ДНК генома человека имееют биохимическую функцию. То есть не являются балластом, а участвуют в регуляции. По ENCODE написано много статей, например [27, 28, 29]. Этот проект и его результаты подверглись критике [26],
в основном это касалось связи генома и эволюции. Тем не менее,  был составлен список всех регуляторных элементов в геноме.Базы ЭНКОДЕ, находятся по адресу:
http://encodeproject. org,
http://genome. ucsc. edu/ENCODE/,
ftp://ftp. ebi. ac. uk/pub/database/ensembl/encode/,
http://hgdownload. cse. ucsc. edu/goldenPath/hg19/encodeDCC.

Приведены базы различных регуляторных элементов генома, например,базы раздела протеогеномики wgEncodeUncBsuProt содержат списки пептидов для ядра, митохондрии, цитозоля и мембран, которые образованы после переваривания

                50
трипсином. В базе эти пептиды привязаны к геному, к местам их кодирования.
В файлах wgEncodeBroadHmm для разных модельных клеток показаны расположенные
по длине генома регуляторные элементы, такие как энхансеры, репрессоры, инсуляторы, промоторы, участки начала и конца транскрипции, и другие. Для нахождения ENCODE элементов можно использовать UCSC генный браузер, который находится на приведенном выше сайте. У меня возник вопрос, может ли текст , переведенный в последовательность ДНК,  влиять на этот геном? Слова и буквы в стихе Пушкина "Осень" никакого значения для ДНК не имеют, это случайный набор знаков для генома и биологических процессов.
Скорее всего, если эту ДНК встроить в геном, то она не будет безразлична для него и клетки. Даже,  если участок ДНК случаен, на нем уже есть небольшие участки с измененной структурой ДНК. То есть отличные от обычной ДНК в виде
В-формы. Так, я обнаружил в гене PUSHKIN квадруплекс-формирующие G-богатые участки с помощью программы QGPS, расположенной по адресу: http://bioinformatics. ramapo. edu/QGRS/index. php.

Position  Length  QGRS                G-Score
399   22  GGGGAAAAGGAATCATTAGGGG         13
574   28  GGCACAAAAGAGTGGGAGAAAAAGGAGG   11
710   30  GGAGTTGCTACATTAAAAGGCATAGGGAGG  7
1439  29  GGAGTGAGAGGCAGGAGCAGTGCATCAGG  11
2182  12  GGCGGCTAGGGG                18
2303  15  GGAGTGGCTGGTAGG                20
2450  30  GGCAGGAGAACAAAGAAACAAAAAGGCAGG  5
2744  20  GGACACAGGGCGGGAAAAGG           19
4927  29  GGCACAGGGCATAGTCATGGCCAGACAGG  17
5998  21  GGGAAAAGGGAGCAGGGCGGG          39
6059  28  GGAATGAGGACGAGGAGAAAGAATGCGG   14
7040  29  GGCAGCATAATACAAAAAGGGGCACAAGG   5
7751  30  GGTATACAGAGAGTAGGGGCAAATACGAGG  8
8498  24  GGGGCAAACACCATCGGTAATAGG       10
8564  26  GGAGTGAGAGGCAGGGCGAGAGTAGG     16
8792  27  GGGGCAAACAGACATATCATCAGGAGG     3
9337  30  GGTTGCAAACACAGACATAGGGGCAGTAGG  4
9473  20  GGAGTTAGGGGTAGAAAAGG           14

Поэтому при переводе текста в ДНК,  надо оценивать с помощью разных программ
ее возможное влияние на работу генома, соседних генов, или какие-то функции клетки.
Я обратил внимание на особенность поиска по ДНК, в которой записан текст.
Если в ней искать какую-то произвольную последовательность,то она повторяется, хотя не является каким-то повтором. Она просто отражает повторяющиеся
словесные обороты или одни и те же слова.Например,при использовании программы UGENE, расположенной по адресу: http://ugene. unipro. ru,
нужно при анализе участка ДНК выбрать поиск по Смит-Ватерману. Это поиск по шаблону, используя алгоритм, который ищет в случаях, если есть вставки или делеции, или мутации. Так вот, при поиске случайного участка, программа нашла еще 8 близких по составу участков. Это, по-моему, отражает именно поиск по разумному тексту,  когда закодированные в ДНК буквы, слоги, и слова
повторяются. Этот пример расположен ниже.

     G A G A A C A A A T T A G A G T
     G A G A G C A A A T T A G
     G A G A G C A A A TTT A G A G
       A G A A C A A G T T T T A G A
     G A G A A C A A A T T A G A G T
     G A G A A C A A A T C A G
       A G ACA C A CCA T T A G A G T
     G A G A A C ACA A T T A AA
     G A G A A C A A A T TGCATCA G T


                51
Если поиск велся простым поисковиком, то были бы найдены только первый и четвертый участки. Я перевел последовательность стихотворения Пушкина "Осень"
в последовательность нуклеотидов. Если такую ДНК вставить куда-нибудь в хромосому на хранение, то что может произойти? Как она себя будет проявлять
или будет полностью нейтральна по отношению к геному.
Был произведен поиск участков ДНК,которые могут быть регуляторными элементами, так как имеют аномальную структуру.Использовался онлайновый сервис по адресу
https://www.nonb.abcc.ncifcfr.gov/default.
Я обнаружил, что эта последовательность содержит:
Директ повторы      - 5,зеркальные повторы  - 10,Г-квадруплекс мотиф – 1,
короткие тандемы    - 7.
Не найдены:А-фазы повторы, инвертированные и крестообразные, Z-ДНК.
Хотя другие программы для анализа ДНК могут давать другие значения.
То есть я могу  утверждать, что любой текст, транслированный в ДНК последовательность, не будет нейтрален для генома. Даже, если нет участков транскрипции, эта ДНК будет иметь потенциально регуляторное влияние на геном, либо на соседние участки. Завершая изучение гена PUSHKIN, можно сказать, что получена интересная информация по записи текста в ДНК и по поиску возможного текста в каком-то геноме. Моделирование мной записи в ДНК показало,какие могут
быть ошибки. Изучение такой ДНК показало, что может быть признаком разумности для поиска посланий в ДНК. В следующем разделе "ДНК говорит" будут описаны способы кодирования текста с помощью только нуклеотидов, путем ввода
понятий специального языка.

                Биоинформатика и белки. 2013.

 Ген PUSHKIN, который я сделал, является моделью, для анализа ситуации в
клетке с помощью биоинформатики. Этот ген для записи текста в ДНК не является конечной разработкой, а служит только для проверочных и отладочных действий.
Оказалось, что по цепи ДНК, оппозитной к той, где записан текст, возможна трансляция. Сам транслят показан в приложении 11. Был произведен элементарный состав этого гипотетического белка. Использована форма по адресу:
http://molbiol. ru/scripts/01-18. html.
По ней получены следующие свойства белка:pI=2, 11 ;заряд белка резко отрицательный -44, 349 при pH=7, 4;отсутствуют аминокислоты W, E, Q, H, K, R,
G, преобладают неполярные кислоты A=6,7 в процентах;L=24,4;V=7,8;F=18,0;
I=6,4;M=8,1;P=5,3.
Проверка сигналов или доменов в белке с помощью программы PHOBIUS находящейся
по адресу:http://phobius. binf. ku. dk/index. html, показало, что белок
состоит из чередующихся участков цитоплазматического, трансмембранного и не цитоплазматического. Для примера, приведу начало этого белка:
FT   SIGNAL        1     18      
FT   REGION        1      2       N-REGION.
FT   REGION        3     14       H-REGION.
FT   REGION       15     18       C-REGION.
FT   TOPO_DOM     19     27       NON CYTOPLASMIC.
FT   TRANSMEM     28     46      
FT   TOPO_DOM     47     52       CYTOPLASMIC.
FT   TRANSMEM     53     79      
FT   TOPO_DOM     80     90       NON CYTOPLASMIC.
FT   TRANSMEM     91    114      
FT   TOPO_DOM    115    125       CYTOPLASMIC.
FT   TRANSMEM    126    147      
FT   TOPO_DOM    148    152       NON CYTOPLASMIC.
FT   TRANSMEM    153    178      
FT   TOPO_DOM    179    189       CYTOPLASMIC.
FT   TRANSMEM    190    212      
FT   TOPO_DOM    213    217       NON CYTOPLASMIC.
FT   TRANSMEM    218    237      
FT   TOPO_DOM    238    243       CYTOPLASMIC.
FT   TRANSMEM    244    266      

                52
FT   TOPO_DOM    267    271       NON CYTOPLASMIC.
FT   TRANSMEM    272    298      
FT   TOPO_DOM    299    304       CYTOPLASMIC.

Таким образом, при трансляции со второй цепи ДНК, образуется белок с очень аномальными свойствами. Если он будет возможен, то это будет мембранный белок, скорее всего с якорными свойствами или подобие рецепторного белка. Он может иметь влияние на функции клетки. В этом случае биоинформатика позволяет это предположить. Задача записи текста  в ДНК, наоборот, такая, чтобы
информационный участок не оказывал на клетку никакого влияния.
Таким образом, ген PUSHKIN, выполнил свою модельную задачу, показав ситуацию, когда возможна трансляция текстового участка. Можно применить разные способы запрещения трансляции с текстового участка. Целью этой книги являются не
какие-то конкретные решения, а показ возможности биоинформатики для использования и прогнозирования ситуаций с записью текста в ДНК.

          ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 1. 9 МАЯ 2010 Г.

 Для ввода информации в ДНК для посланий в будущее, а также для попыток найти возможные послания из прошлого, надо учесть, что разные цивилизации имеют
разную логику мышления и как свести эти различные мыслительные особенности к тому, чтобы их можно было легко понять другим  разумным организмам. Это
самый важный вопрос.
Я не лингвист,  а молекулярщик, поэтому взгляд у меня на эти проблемы представляет собственную идею и разработку. И как обычно на стыке разных наук можно найти что-то свежее. В основе моей идеи об нахождении общей логики или общих логических элементов между цивилизациями положена идея об общности
понятия числовой единицы. Любой комплекс предметов, любое множество всегда состоит из отдельных единиц. Через понятие единицы и вводится все остальное –
цифры, логические действия, физические константы, а далее алфавит и словарь,
в котором предметы и их взаимодействие в понятиях одной цивилизации станут понятны другой цивилизации без переводчика, знающего сразу два языка,
разделенных миллионами лет и миллионами километров.
Может быть это можно применить к радиоволнам во Вселенной, но мне ближе предположить, что какие-то информационные послания находятся в биологических молекулах - ДНК,и представлены генетическим кодом,практически 64 комбинации 4 нуклеотидов по три достаточны , чтобы ввести любой язык и описать любое множество предметов и явлений во Вселенной, так же как обычным человеческим языком.
Нужно создать информационный модуль для связи языков разных цивилизаций.
Прежде всего его как-то выделить в геноме, предположим для выделения этого
модуля будет использована длинная последовательность поли-А, или другая
странная или аномальная последовательность. Далее ввести знаки единицы и знак раздела единиц.
Пусть знак "единицы" - TTT, а знак "раздела" между знаками или законченными
уравнениями или словами и предложениями - AAA. Далее вводится простая арифметическая логика - знак "есть" или знак "равно" - CCC. И далее вводятся цифры, предположим для десятичной системы исчисления, хотя цифровая система может быть как двоичной, так и многочисленной, в этом случае наша логика говорит, что чем проще , тем реальнее, что это будет использовано.Вводим арифметические знаки - сложение - CTT, вычитание - CCT, умножение - CGG , деление - CCG. Показана система исчисления - десятичная.
AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

                53
В переводе на человечий язык этот модуль означает:TTT - это единица,  TTT
есть или равно TTT --  введена  единица и знак равно, TTT плюс (и) TTT - есть цифра два - 2 или TTA -- введена цифра 2 и знак "+", далее вводится цифра
три - 3 или TAA, цифра - 4 или TCA, цифра - 5 или TGA, цифра – 6 или TAC,
цифра - 7 или TCC, цифра - 8 или TTC, цифра - 9 или TGC, далее вводится
цифра - 0 или TAT и знак минус - CCT, можно продублировать действия,
например 1-1=0,  5-5=0, далее вводится знак умножения - CGG на примере 2 умножить на 2 = 4, и 4 умножить на 2 = 8, и деления - CCG на примере 9 : 3 =
3 и 8 : 2 = 4. Далее показана система исчисления - десятичная, 
на примере 9 + 1 = 10, 10 умножить на 10 = 100.
Этот информационный модуль вводит единицу, цифры , логические арифметические
действия и систему исчисления. Все настолько просто, что эти странные по виду
последовательность нуклеотидов легко расшифруется при любой логике разумных
существ.

         ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 2. 19 МАЯ 2010 Г.

 Химический модуль.
 Следующий информационный модуль использует кодировки из цифрового модуля.
Производится ввод таблицы Менделеева, химические элементы, их положение в
таблице одинаково для любых цивилизаций. Эта логика основана на том, что
номер химического элемента - это количество протонов в ядре.

TTTAAAAAAAAAAAAAAAAAAAAATTAAAAAAA
TAAAAATCAAAATGAAAATACAAATCCAAATTCAAATGCAAATTTTATAAAAAA
TCCAAATTATTCAAAAAA
TGAAAATCATACAAAAAA
TAAAAATACTCAAAA
TAAAAATCCTCAAAA
TCCTGAAAATCCTACAAATCCTCCAAATCCTGCAAAAAA
TGAAAATGCTACAAA
TGCTCCAAATGCTTCAAATGCTGCAAA
TTTTATTATAAATTTTATTTTAAA

Этот информационный модуль перечисляет номера химических элементов от
1 до 101 элемента с периодичностью, равной общему количеству электронных
слоев в атоме. В местах их повышения стоит двойной раздел - AAAAAA.
Участок поли-A служит для выделения модуля в геноме, он может быть любым,
лишь бы выглядел искусственно. То, что это именно периодическая таблица
элементов говорит двойной раздел между периодами.
При ссылке на этот модуль каждое число логически связано с конкретным
химическим элементом, а арифметические знаки с их взаимодействиями. Например, запись TTC+TTC - означает молекулярный кислород , а запись TTT+TTC+TTT - означает вода.
Полная запись соответственно - AAATTCCTTTTCAAA и AAATTTCTTTTCCTTTTTAAA.

        ДНК ГОВОРИТ, СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 3.  29 МАЯ 2010 Г.

Темпоральный модуль.
Модуль использует данные кодировки из числового и химического модулей.


                54
TACCCCTACAAATACCCCTACAAA
TACTACTACTACTACTACTACTACTACTACTACTACTACTACTACTACAAAGGGAAA
TACTACTACTACTACTACTACTACAAAGGGAAA
TACTACTACTACAAAGGGAAA
TACTACAAAGGGAAA
TACAAAGGGAAA
GGGCCCTTTTTCTATTCCTATTTTTTATTCTATTATTATTATAAAAAAAAA

6=1, 6=2, 6=3, 6=4, 6=5, 6=6, 6=7, 6=8 - перечисляются все изотопы углерода
по порядку массового числа, 6=6, 6=6 - показано, что описывается изотоп 6 углерода по порядку, это C14. Количество шестого изотопа - 16, затем 8, 4, 2,
 1 - показано уменьшение количества изотопа в виде полураспада, разделено
GGG - по логике это время. Этот модуль вводит понятие времени. Для этого используется время полураспада в данном случае изотопа углерода C14, вначале перечисляются все изотопы по массовому числу, у углерода известно 8 изотопов,
показано , что именно шестой по порядку изотоп с массовым числом 14 уменьшает  свое количество в геометрической пропорции, соответствующей полураспаду, то
есть уменьшение количества шестого номера в 2 раза. Промежуток между ними обозначен как GGG, это по логике и есть время. Далее время приведено к одной секунде для человеческой цивилизации. Введено GGG - это одна секунда, эталон времени для данной кодировки и цивилизации. GGG = 180701280000.
Время полураспада,  хотя величина и статистическая, но очень стабильный
отметчик времени. Аналогично можно ввести время через нестабильные изотопы других элементов.
Литература.
1. Широков Ю. М. , Юдин Н. П. Ядерная физика. Наука. 1972.

       ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 4.  12 июня 2010 Г.

 Человек говорит словами, которые и описывает все многообразие окружающего
мира. Написанные слова отражают речь, но , конечно, написанные слова содержат
в себе меньше информации, чем произнесенные речью. Речь несет значительно
больше информации для человека, чем написанные слова. Это  интонация,возраст, пол и другие индивидуальные особенности.
Алфавит современного языка можно сделать и из 50-100 букв, все зависит от
установок и образования, обучения. И все эти буквы слуховой анализатор
человека легко бы различил. Но необходимо ли это? Знать какие особенности
языка могут быть у другой цивилизации вряд ли возможно, поэтому чем проще,тем
лучше. Разработанная здесь кодировка букв слов представляет собой упрощенный
язык. Уменьшено количество букв,схожие буквы по звучанию удалены.В результате
Язык стал более простым, но по звучанию похож на обычный язык человека.
Речь распознается по слогам, словам и частично интуитивно, то есть слуховой анализатор человека может понять сказанное,даже не расслышав часть сказанного.
В языке для ДНК я , напротив,  применил разбивку слов на отдельные элементы-буквы, так как этот язык искусственный. Также этот язык русифицирован, это
тоже искусственно, так как кодонами можно обозначить буквы любого языка.
Можно сделать переход от модуля времени к буквам, то есть сделать их похожими
на речь и ввести как тональный звук какой-то частоты звука. Если с гласными звуками это и можно сделать с упрощением, то согласные звуки ввести через частоту и длительность сложно, так как звуки слагаются из нескольких частот.
Поэтому буквы текста я обозначил кодонами без привязки к реальной речи.
Нужно будет после ввода букв алфавита сделать толковый словарь, в котором начиная с арифметики, затем химии и физики будет переход к биологии и социологии.
Этот словарь, который будет содержать несколько тысяч слов,предполагается
также записать в ДНК. И только после этого можно записать в ДНК уже значимую
для длительного сохранения информацию. Модуль букв.


                55

Что означает GTA есть GTA, подразумевается, что это код буквы, производится
перекодирование с 4-буквенного языка, на 31-буквенный язык. Как звучат эти
буквы неважно для кодирования информации, надо только при этом создать еще толковый словарь, в котором термины или слова вводятся логически.
Далее для русского языка кодоны означают:
ACA - А, AAG - Б, AAT - В, AAC - Г, GAA - Д, GAG - Е, GAT - З, GAC - Ж,
TAG - И, TAT - К, CAA - М, CAG - Н, CAT - О, CAC - П, AGA - Р, AGG - С,
AGT - Т, AGC - У, GGA - Ф, GGC - Ц, GGT - Ч, TGG - Щ, TGT - Ъ, TGC - Ы,
CGA - Ь, CGT - Ю, CGC - Я, ATA - Х, ATG - Ш, ATT - Л, ATC – Э.

Во все модули также надо ввести последовательность - участок для Праймера для быстрого нахождения модуля в геноме организма методом ПСР.
В данном случае взят участок из 26 нуклеотидов - ATATAGCAGACAGCATAGGCATAATA, который при синтезе модуля располагается на некотором расстоянии от информационного участка. Участок этот написан может слишком длинным, но его можно будет зацепить с разных концов или посередине. Вообще можно еще
подумать каким сделать сигнальный участок.
Модуль словаря.
GTGAAAAATCATGAAACAAAACCCAAATTTCTTTTCCTTTTTAAAAAA
GTGAAATATTAGAGGATTCATAGACATGAAAAACCCAAATTCCTTTTCAAAAAA
GTGAAAGAGGAATAGCAGTAGGGCACAAAACCCAAATTTAAAAAA
GTGAAAAGAACAGATGAAGAGATTAAACCCAAAAAAAAAAAA
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Это означает GTG есть GTG, означает слово. Затем вводятся слова, например
слово ВОДА означает TTTCTTTTCCTTTTT, логика этого участка взята из
химического модуля. Слово КИСЛОРОД означает TTCCTTTTC. Слово ЕДИНИЦА означает TTT, взято из числового модуля. Слово РАЗДЕЛ  означает AAA.
Таким образом набирается словарный запас,то есть слово, выраженное в кодонах, его объяснение с помощью математической, физической или химической логики, а затем оперируя для объяснения слова комбинацией уже известных слов.
В модуле словаря применен участок для праймера - ATATCGTCTGTCGTATCCGTATTA.
Осталось еще несколько кодонов без применения, я думаю они будут
использованы при вводе каких-то логических понятий.
Ну вот и все. Основа общения между цивилизациями планеты Земля или других галактик заложена. Дальше надо сделать защиту языка от мутагенеза и
использовать кодоны с наименьшим значением мутагенеза. Также возможна
привязка букв или логических кодонов к какому-то более глубокому смыслу, например количество букв уменьшить до 20 и каждую букву можно связать с
какой-то аминокислотой. Также надо нарабатывать словарь и применять его для сообщения какой-то важной информации. То есть работы впереди еще много.
В данных статьях приведен только упрощенный вариант языка, он не
оптимизирован и кодоны взяты произвольно.
В следующей части будет произведен ввод биологической части словаря.
Как следствие из этой разработки можно использовать повторы или
какие-то странные участки для поиска вложений в ДНК, то есть на

                56
основании этого попробывать найти что-то в геномах разных организмов. Логику создания этого языка можно попробывать использовать для поиска разумных
текстов в ДНК, возможно какая-то древняя цивилизация сообщит нам что-то
важное. Искать для начала надо логические модули ввода в язык, записанный на ДНК.

  Литература.
1. Механизмы деятельности мозга человека. Часть 1. Нейрофизиология человека.
  Ред. Бехтерева Н. П. . Л. Наука. 1988. Глава 9. Психоакустические аспекты
  Изучения речи.
  Руководство по физиологии.
2. Слуховая система. Ред. Альтман Я. А. . Л. Наука. 1990.
  Руководство по физиологии.

                ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ.
                ВВОД БИОЛОГИЧЕСКОГО СЛОВАРЯ. 12 ИЮНЯ 2010.

 Для биологического словаря надо ввести основные понятия живой материи.
Часть слов можно ввести через основную молекулу жизни  - ДНК.

GTGAAA GAACAGTAT AAACCCAAA AGTCAGTCAGTCAGTC AAAAAA

Слово ДНК есть AGTCAGTCAGTCAGTC. Слово ДНК можно обозначить любой особенной последовательностью, что при поиске на геноме даст 1-2 копии на весь геном
или отсутствие в геноме. Если они будут рядом, то сразу обратят внимание, что участок есть важный маркер или ввод какой-то логики.

GTGAAA ACAGAAGAGCAGTAGCAG  AAACCCAAA AAAAAAAAAA AAAAAA.
Слово аденин есть AAAAAAAAAA.
GTGAAA AACAGCACACAGTAGCAG  AAACCCAAA GGGGGGGGGG AAAAAA
Слово гуанин есть GGGGGGGGGG.
GTGAAA GGCTAGAGTCATGATTAGCAG  AAACCCAAA CCCCCCCCCC AAAAAA
Слово цитозин есть CCCCCCCCCC.
GTGAAA AGTTAGCAATAGCAG  AAACCCAAA TTTTTTTTTT AAAAAA
Слово тимин есть TTTTTTTTTT.

GTGAAA TATCATGAA AAACCCAAA TTTCCCTTT AAATCACCCTAAAAA TAACCCTACTCAAAA
TACTCACCCTTATATAAA  AAAAAA
Слово код - это 1 есть 1, 4 есть 3, 3 есть 64, 64 есть 20.
Введен код жизни через единицу, количество нуклеотидов, кодонов и
аминокислот через цифровую логику.
GTGAAA  TATCATGAACATCAG AAACCCAAA TACTCA AAAAAA
Слово кодон равно 64.
GTGAAA ACACAATAGCAGCATTATTAGAGGATTCATAGTACA AAACCCAAA TTATAT AAAAAA
Слово аминокислота равно 20.
GTGAAA AAGGAGATTCATTAT AAACCCAAA ACACAATAGCAGCATTATTAGAGGATTCATAGTACA
AAACTTAAA ACACAATAGCAGCATTATTAGAGGATTCATAGTACA AAAAAA
Слово белок есть аминокислота плюс аминокислота.
GTGAAA GACTAGGATCAGCGA GAACAGTAT AAACTTAAA AAGGAGATTCATTAT AAAAAA
Слово жизнь есть ДНК плюс белок.


И так далее применяются разные численные и химические параметры
молекул жизни для ввода слов  в биологический словарь.





                57
      ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 5.  28 июня 2010 Г.
      Введение графических изображений с помощью ДНК.

 При введении словаря или каких-то понятий можно использовать логические построения, а можно использовать графические конструкции. То есть
последовательность нуклеотидов разложить по горизонтали и по вертикали. Это
идея приходит в голову почти каждому, кто просматривал секвенс участков
генома. При просмотре последовательности нуклеотидов в любом текстовом
редакторе при движении вниз или вверх строчек видны как бы меняющиеся
картинки, которые образуют последовательность нуклеотидов.Особенно интересно, когда видны повторы нуклеотидов. В это случае картинка секвенса выглядит как кино.
Я несколько раз пробовал выводить последовательность нуклеотидов внутренним просмотрщиком Windows Commander - клавиша F3,  с вариациями длины строчки, и затем прокручивать текст по вертикали. Изменить длину строки можно, изменив в настройках этого просмотрщика длину строчки через options/configure/text characters per line. Иногда можно заметить какие-то картинки, но это только
игра воображения, зрительный анализатор человека может видеть картинку, даже если ее нет. Хотя просмотр всего генома имеет очень большие затраты времени,
но он может указать на интересные повторы или другие участки.
В начале надо закачать из генома человека, какой-то файл в формате FASTA,
затем открыть его блокнотом или другим просмотрщиком. После этого удерживать клавишу направления вниз или назад. Надо сесть на расстояние около метра от монитора и расслабить глаза. Теперь понятно, что всякие образы , которые тут возникнут это не какое-то послание,  а просто игра воображения.То есть искать
какое-то разумное послание в этих графических картинках вряд ли имеет смысл. Весь этот поиск графики - это шаманство и колдовство, и к науке мало имеет отношения. Если длина строчки изменится хотя бы на один нуклеотид, то
рисунки сразу изменятся. То есть можно увидеть то , чего нет или не увидеть, если рисунок действительно был. Но реальные повторы генома при этом хорошо
видны и так можно обнаружить повтор, которого нет даже в такой базе, как для REPEAT MASKER. Примеры таких повторов приведены в конце книги.
Использование графики вместо логики для ввода понятий в словарь требует в десятки или сотни раз большего количества нуклеотидов. Попробуем ввести слово квадрат и треугольник,  как геометрический термины. С помощью этой графики
можно легко ввести только линейные структуры. При этом нужно небольшое число пикселей.
Так для квадрата 20 на 20 единиц нужно 70 на 22 нуклеотида или 1540. Для треугольника равностороннего со стороной 16 единиц надо 70 на 18 нуклеотидов
или 1360. Круг , эллипс для хорошей картинки потребуют более чем в 10 раз большего количества нуклеотидов или единиц изображения, или пикселей. Если рассмотреть режим VGA компьютерного монитора 640 на 480 пикселей , при
котором удовлетворительно видна нелинейная графика, то это потребует 307200 нуклеотидов, что очень много для введения какого-то термина или понятия.
Поэтому , я думаю, что использование графики с помощью нуклеотидных цепей
вряд ли будет использоваться в генетических посланиях, или только в редком случае, так как этот способ требует очень длинных цепей для нелинейной
графики. Также если этот участок ДНК специально не помечен, найти его практически невозможно.
Модуль введения графики.


Это выражение означает CTC есть CTC - кодон обозначения графики, CTC -размер графического модуля -  70 на 70 нуклеотидов. Вначале идет участок для
праймера, а в самом модуле расположен квадрат 20 на 20 нуклеотидов.


Это выражение означает CTC есть CTC - кодон обозначения графики, CTC -размер графического модуля -  70 на 70 нуклеотидов. В самом модуле расположена структура 16 + 16 + 16 нуклеотидов, что означает равносторонний треугольник.

                58
Эти повторы оригинальны, что сразу вызовет мысль о графике, и кодон CTC
будет связан с графикой.Эти фасты с псевдографикой набрал на компьютере
автор - Курносов Михаил,это чисто искусственные образования.



                ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 6.
         ВИЗУАЛЬНО-ОСОБЫЕ, МАГИЧЕСКИЕ УЧАСТКИ ГЕНОМА. 12 НОЯБРЯ 2011.

Информация в ДНК должна быть легко обнаружена.Это один из основных принципов. Можно закодировать что угодно так, что вложенный текст не будет выделяться
среди остального массива. Но если это ПоСлАнИе, то зашифрованный текст должен быть помечен текстом, который сразу бросается в глаза из-за своей оригинальности.
Если просто прокручивать секвенированную ДНК на дисплее монитора, то оригинальные куски ДНК очень хорошо видны на общем фоне.
Лучше всего для метки нужного массива закодированных нуклеотидов
использовать короткие повторы, размером модуля от 2  до 10 нуклеотидов
и общим размером этих повторяющихся модулей от нескольких десятков до
нескольких сотен нуклеотидов.
Процесс поиска и пометки участков, годных для предполагаемой дешифровки
может быть довольно длительным, так как неизвестны маркерные участки.

                59
Если на дисплее монитора видно на одной странице текста около 7500
нуклеотидов, а надо просмотреть 1500 мегабайт текста при трате на одну
страницу 2 секунды, то это займет времени около 110 часов. Текст лучше
растянуть по горизонтали монитора выбрав в просмотрщике Windsows Commander
опции ширина дисплея - binary и указать размер строчки , например 180 знаков, текст просматривать в опции - binary.
Для удобства поиска надо сделать замены блоков повторов на хорошо видимые
участки. Искать по сплошному тексту , состоящему из CGTA , неудобно.Например,
с помощью  редактора WORD сделать замену блока CCCATCCCAT на
блок __________ или десять пробелов, выбрав опцию - заменить все.
Также облегчает визуальный поиск обработка текста программой типа
RepeatMasker , которая выделяет повторы буквами нижнего регистра. Но она выделеляет также большие повторы типа LINE или другие, которые вряд ли нужны
для маркировки разумного текста.
Искать возможные метки разумного текста с помощью программного поиска в нем
каких-то особых отличий может быть неудачным, лучше визуально просмотреть
текст нуклеотидов. То есть просмотреть всю хромосому от начала до конца.
У разных организмов количество особых участков значительно различаются.
Я произвел подсчет ярких участков у человека и данио.
При визуальном просмотре хромосомы 1 человека с начала хромосомы просмотрено
2500000 нуклеотидов. На этой длине обнаружено 25 участков, которые сразу
бросаются в глаза своей необычностью. Они приведены ниже в статье.
У данио просмотрено в 1 хромосоме с ее начала 1000000 нуклеотидов обнаружено
33 участка. Визуально у данио очень много мелких однообразных повторов -
от 1 до 5 на 1 страницу текста, но эти участки мало подходят на роль особых
маркерных участков. Приложение 7.
При прогоне последовательности, которые я привел в этой статье, через Repeatmasker, было показано, что эта программа определяет лишь часть последовательностей, которые можно определить при непосредственном просмотре
ДНК глазами. То есть последовательность выглядит как повтор, а программа не относит его к каким-то известным повторам ДНК. Возможно, это не обычные
повторы, а какая-то периодическая доменная структура ДНК, связанная с белками или с РНК. Так в приведеном мной примере периодических или ярко-выделяющихся участков ДНК программа нашла, что только 30 процентов от всех нуклеотидов составляют обычные классические повторы. Таким образом, это подтверждает мое заявление в этой статье, что визуальный поиск повторов или помеченых оригинальными повторами участков ДНК, может быть полезен для поиска.
Таким образом, визуальный способ просмотра текстов ДНК может дать важную
информацию или указать на неизвестные повторы.
Это могут быть как простые повторы, так и повторяющиеся домены в генах.
В литературе показано , что блоки повторов небольшой длины участвуют в
регуляции генов, регуляторные участки эволюционируют независимо от
структурных генов и могут быть консервативны, не изменяясь миллионы лет.
Цитата из "Молекулярные основы геносистематики", изд. МГУ, 1980, стр. 230.
Поэтому надо всегда думать, что магические участки не метки посланий, а
регуляторные участки, и оценивать сумму характеристик участка ДНК. Надо
надеяться на удачу в этой науке. Хотя идея говорит, что это может быть, но
пока никто ничего не нашел от прошлых цивилизаций.
Пока моя роль в движении этой моей идеи поиска посланий в геномах - это
разработка методологии их поиска.
Для начала надо искать визуально оригинальные участки , которые могут играть роль метки, а затем смотреть ниже или выше этого участка, для поиска текстов ввода в послание. Например, это могут быть ряды с переменной периодичностью. Например,  ряд ATAATAAATAAAATAAAAATAAAAAAT  или ряды с переменным количеством одинаковых модулей ACCTTACCTTCCTTACCTTCCTTCCTTA и тому подобное. Всякие ряды нуклеотидов с переменной периодичностью могут указывать на разумность его.






                60
        ДНК говорит. Способы кодирования. Часть 7.
                Гены-маркеры. 12 декабря 2011.

Я думаю,сами гены можно использовать как маркеры для пометки участков генома,
содержащих текстовые послания. При этом текст можно расположить выше или ниже гена, в интергенных участках. Ген,  при просмотре текста ДНК, сразу проявится своей необычной магической структурой - повторами. Таким образом, он обратит внимание человека, что рядом могут быть какие-то значимые участки. В этих участках,  рядом с отличившимся структурой геном, и могут быть предполагаемые разумные тексты. Особые повторы в экзонах гена могут быть только в одном этом месте генома.  Для примера просмотрена хромосома 1 у дрожжей.
При визуальном просмотре последовательности обратил внимание на себя участок заметными повторами движущимися наклонно при протяжке текста. Это оказался кодирующий участок гена. Обнаружено всего 13 повторов размером каждого
около 139 bp.
 Этот пример - ген flo9 S. cerev.  Лектин-подобный белок-флоккулятор через
клеточную стенку. Повторы в белке - структурные и функциональные домены,
а для этого белка участвуют в обороте углекислоты. Его расположение -
хромосома 1, 24001-27969 участок. Ген книзу на расстоянии 3599 bp-  gdh3. Ген кверху на расстоянии 1314 bp - yal063c-a. Это размеры интергенов - участков между генами.
 Конечно,  в эти небольшие интергены вряд ли что-то можно записать значимое,
это только пример. Если выбрать консервативный ген, то он сохранится
сотни миллионов лет и им можно метить участки с текстовой разумной
информацией. Многократные копии этого текста позволят его восстановить
полностью, устранив точковые мутации.
 Программа UGENE при наведении на участок мыши кажет повторы разной длины, например здесь - 17, 25, 50, 95, 116 длиной в комплементарной цепи,
в кодирующей цепи кажет только ORF.
 Таким образом, если особый магический ген - это маркер, то рядом надо искать тексты в нескольких копиях. Это также нужно и для записи информации в ДНК в настоящее время, чтобы сделать послание в геноме какого-то организма на
миллионы лет вперед.
 При сплошном просмотре может быть не видно четкой периодичности,один участок надо просмотреть с разными длинами строки от 50 до 80. Для просмотра использовать фасту. Для расположенного ниже примера длина строки должна быть более 70. Цитировано с http://ncbi. nlm. nih. gov.
 
                ttaaataatt


                61
aaaatatagcagacagcataggcataataaaaaagta

  ДНК ГОВОРИТ. СПОСОБЫ КОДИРОВАНИЯ. ЧАСТЬ 8. СТРУКТУРА ДНК - ВОЗМОЖНЫЙ
                МАРКЕР ПОСЛАНИЙ. 9-10 МАЯ 2012 Г.

 Цепи ДНК могут образовывать более сложные структуры или структуры, отличные
от обычной конформации ДНК - ее B-структуры.
Вначале предполагалось, что таких структур будет не много в геноме и эти аномальные структуры будут как бы указывать на разумные для человека тексты
или послания в ДНК. Однако поиск таких аномальных структур показал, что они очень сильно распространены в геноме.
Количество не-B-структур ДНК в геноме человека. Цитата из статьи:
Nucleic Acids Research,  2011,  Vol.  39,  Database issue, D383–D391
Non-B DB: a database of predicted non-B DNA-forming motifs in mammalian
genomes. Regina Z.  Cer,  Kevin H.  Bruce,  Uma S.  Mudunuri,  Ming Yi,
Natalia Volfovsky, Brian T.  Luke,  Albino Bacolla,  Jack R.  Collins and
Robert M.  Stephens.

G-Quadruplex Forming Repeat(4-цепочные структуры гуанина)374545
Z-DNA Motif       (Z конформация)                294320
Direct Repeat     (тандемные)                871045
Slipped Motif     (2-цепочная ДНК и 1-спиральные петли)  347969
Inverted Repeat   (инвертированные)                1044533
Cruciform Motif   (крестовидные 2-цепочные мотивы)       197910
Mirror Repeat     (зеркальные повторы)                1651723
Triplex Motif     (трехцепочная ДНК)                179623
A-Phased Repeat   (A структура)                1130731

Можно было предположить, что такое фундаментальное свойство материи, как симметрия в физике и химии, может быть какой-то меткой или указателем чего-то необычного в геноме. Речь идет о зеркальных повторах. Пример такого повтора.

5-ATAGGGACTCTGGAGACT*TCAGAGGTCTCAGGGATA-3 ,

где * - точка зеркальной симметрии для оснований ДНК, ось симметрии.
Пример показывает 100 процентную симметрию.
Речь идет именно об информационном уровне последовательности, так как на

                62
химическом уровне полной зеркальности нет из-за разницы положения к оси симметрии 5 и 3 гидроксилов дезоксирибозы.
Теперь я могу сказать, что моя идея о информационной значимости таких
структур в ДНК,  как меток для искусственно записанной информации в ДНК, оказалась под вопросом из-за очень большого количества таких структур в
геноме.
Поэтому , если все-таки использовать эти структуры для мечения записываемой информации в ДНК, то они должны быть сильно отличны от природных и быть исключительно оригинальными. В то же время сами эти структуры имеют большое значение для функционирования генов и эти участки связаны с местами их
регуляции, поэтому знание мест их расположения очень важно. Я изучаю гены-гиганты уже давно, несколько лет. Поэтому я сделал таблицу статистики мест расположения не-B-структур ДНК в следующих генах - DESC1, NEGR1, DOCK3, NRXN1,ROBO2.Был использован онлайн-сервис определения этих участков -
HTTP://WWW. NONB. ABCC. NCIFCFR. GOV

Статистика не-B-структур ДНК в них показана ниже.
ПРИМЕРЫ КОЛИЧЕСТВА НЕ-B-СТРУКТУР В ДНК ГЕНОВ-ГИГАНТОВ ЧЕЛОВЕКА.
ТАБЛИЦУ СОСТАВИЛ КУРНОСОВ М. Н. 10 МАЯ 2012Г. НА ОСНОВЕ ОНЛАЙН-СЕРВИСА
ОПРЕДЕЛЕНИЯ НЕ-В-СТРУКТУР ДНК.

                ГЕН   DISC1    ROBO2    DOCK3    NEGR1   NRNX1
                РАЗМЕР  ТПН     415     607       709      880    1108
G-Quadruplex Forming Repeat      47      34        80       25      51
Z-DNA Motif                40      63        35       89     113
Direct Repeat                115     190       165      262     316
Slipped Motif                41      75        63      107     121
Inverted Repeat                123     301       233      426     459
Cruciform Motif                21      59        55       89     104
Mirror Repeat                238     383       358      543     663
Triplex Motif                49      35        17       25      73
A-Phased Repeat                136     230       368      351     407

Примеры зеркальных повторов в гене NRXN1.
Повтор 1.
5-tagtaatttat tgctgtgaacatc attg aat aat atgcaaaacaagtgta ta
  -----------               ----     ---                --

at ctatacttttccactact taa tgt gtta aactaaaacta tatttaatgat-3
--                ---     ----             -----------

Концы - зеркала , середина только частично зеркальна. Зеркальность
38 процентов.
Повтор 2.
5-gtgtgtgtgtgtgtgtgtgtgtg t gtgtgtgtgtgtgtgtgtgtgtg-3

Чередование любых 2 нуклеотидов с центральным спейсером,
зеркальность 100 процентов.
Повтор 6.
5-taaaaattct aaa ta t c at gtt tcttaaaaat-3
  ----------     --     --     ----------
Зеркальность 75 процентов
Повтор 29.
5-aaatatttat ttttaaaataaagcatgctg at ctg atta actcc
  ----------                --     ----     -

catat atta cata ta aaatgacaaagctgtga tatttataaat-3
-     ----      --                -----------



                63
В спейсере могут быть делеции, инсерции, точковые замены относительно оси симметрии . То есть для метки нужно учитывать возможный мутационный процесс левой и правой частей зеркала. А консервативные участки зеркал скорее всего функционально значимы для клетки и они мало мутируют в ее поколениях.
Большинство определяемых зеркал скорее всего случайные структуры, без информационной составляющей. А 100 процентная симметрия редко встречается и только на коротких повторах. Еще раз скажу, что зеркальность это
информационное свойство в последовательности, то есть признак отношения
высшего разума к этому образованию, если оно не случайное сочетание
нуклеотидов в цепи.
Нужно в метке продемонстрировать что-то оригинальное, не возможное
только обычными природными процессами.
Я предлагаю для начала такую конструкцию метки. Зеркальность плюс
арифметические ряды. Также 100 процентная симметрия для большого участка в
450 нуклеотидов. Пример искусственной метки,сделал Курносов М.
5-TTTTTTTTTTCCCCCCCCCCAAAAAAAAAAGGGGGGGGGG-3
5-TTTTTCCCCCAAAAAGGGGGTTTTTCCCCCAAAAAGGGGG-3 *
5-GGGGGAAAAACCCCCTTTTTGGGGGAAAAACCCCCTTTTT-3
5-GGGGGGGGGGAAAAAAAAAACCCCCCCCCCTTTTTTTTTT-3

В этой конструкции метки * - есть точка зеркальной симметрии. Сколько я
не смотрел последовательностей ДНК, таких структур я не видел. Дублирование частей метки позволит исключить влияние мутаций на информацию.

             ДНК ГОВОРИТ. ДОПОЛНЕНИЕ  ОТ 26 АВГУСТА 2012. ЧАСТЬ 9.

 Особенности живой ДНК, как носителя искусственной текстовой информации,
введенной извне. Размышления автора.
Предпринимаются попытки записать текст в не живую, химическую ДНК,  уже без
его введения в клетку и поддержания клеткой.
Так Джордж Черч и группа авторов,  создали систему кодирования информации
в ДНК,  которая не предполагает использования клеток. Специальное устройство располагает фрагменты химически синтезированной ДНК длиной около 159
нуклеотидов на поверхности чипа. (1).
Я думаю, что какие бы ни были технически хранители информации, все они
имеют временный срок хранения из-за различных спонтанных разрушений, например радиации.
Я считаю , что только в живых организмах можно сохранить информацию в ДНК,
пока существует жизнь в течение многих миллионов лет.
В этом и состоит СМЫСЛ ЖИЗНИ,  как космического явления.
За это время любые технические устройства в результате коррозии, Химической модификации, радиации, температуры и т. п. превратятся в пыль. Еще одно замечание. Цивилизация в своем развитии накапливает в виде Информации сначала гигабайты, затем, что характерно для сегодняшнего времени – терабайты информации, через 10-20 лет - сотни и тысячи терабайт. Вместить такое
количество информации нельзя в ДНК клетки. В клетке реально можно расположить без существенного влияния на ее биологию 100-300 мегабайт информации. Если применить защиту информации в виде ее многократного копирования, то и того меньше - 10-30 мегабайт.
Можно ожидать, что такое количество информации какой-то организм и его
клетки пронесут через миллионы лет. Я думаю , в такое небольшое количество информации записывать какие-то учебники или книги нет смысла, в них можно записать только какую-то информацию глобального значения. Например, места расположения разумной жизни во Вселенной, места расположения на планете Земля хранилища информации высокоразвитой цивилизации прошлого, какие-то глобальные предупреждения для человечества в опасностях развития науки или общества и
так далее. То есть по нашей логике послания в ДНК из прошлого должно быть
Небольшим и давать скорее всего направления дальнейшего поиска или какие-то глобальные предупреждения для цивилизаций будущего, то есть для сегоднешнего человечества.

                64
Можно человеческой цивилизации создать хранилище всей информации
человечества, возможно, что на каких-то носителях информация сохранится
10000-20000 лет. И в какой-то особенный вид живого организма записать
координаты этого хранилища. Это может быть послание человечества в будущее.
Или в каких-то особенных организмах на Земле , в их ДНК, поискать по этой же логике координаты хранилища информации из прошлого от какой-то высокоразвитой цивилизации.
ИСТОЧНИК ИНФОРМАЦИИ.
1. http://dx. doi. org/10. 1126/science. 1226355
Science DOI: 10. 1126/science. 1226355
George M.  Church, Yuan Gao,  Sriram Kosuri
Next-Generation Digital Information Storage in DNA.

 ДНК ГОВОРИТ НА ЯЗЫКЕ ЧЕЛОВЕКА.КУРНОСОВ МИХАИЛ ПЕРЕВОДИТ ДНК В СЛОВА ТЕКСТА.
 01 октября 2006.

 Последовательность нуклеотидов в ДНК можно преобразовать в музыку, о чем написано в разделе о музыке генов, а можно преобразовать в псевдотекст, состоящий из гласных и согласных букв, точек и пробелов. Этот текст можно прочитать или озвучить специальными программами.  Моя идея заключалась в том, что последовательность нуклеотидов в ДНК превратить в обычный литературный текст, а его затем прочитать на компьютере, используя программные читалки текстовых файлов. На самом деле речь человека гораздо более сложная звуковая форма. Звуки гласных состоят не из чистого тона, а из нескольких формант (наложения нескольких тонов), гласные и согласные звуки влияют друг на друга, давая особое звучание. Слоги в слове (близкое понятие фонема)могут звучать
особо в зависимости от самого слова. Литература по физиологии речи [15].
Если кратко, то помочь создать хороший алгоритм перевода ДНК в слова, помогут лингвисты, знающие особенности языков, слов, букв. Я же,  как генетик,
предлагаю здесь упрощенный алгоритм этого перевода. После разбивки ДНК на
слова, возможно потребуется коррекция текста. Для этого надо попробывать
найти на слух слова,  похожие на какой-то настоящий или древний язык , далее скорректировать кодировку звуков и дополнительно корректировать код, на
котором в ДНК записаны гипотетически какие-то послания или тексты.
Таким образом, ДНК можно представить в виде слов речи. Для примера,приведу методику для разбивки ДНК на русскую речь. Конечно, можно использовать другой алфавит и текст, похожий, например, на латинский или английский.К тому же эти алфавиты лучше тем, что количество  букв близко к количеству аминокислот. Английский алфавит - 26 букв, латинский - 24 буквы.

 Пример алгоритма для преобразования текста ДНК.
1. Использование частотного анализа для русского текста.Поскольку аминокислот 20, а букв в русском алфавите 33,то буквы со сходным звучанием объединены,так как это разделение искусственное, связанное с созданием алфавита.Я подсчитал, что проценты букв, пробелов и знаков русского алфавита в тексте составляют следующие значения:
а, я - 7,2     о       - 7,8            е, э - 7,4     к - 2,4
у, ю - 3.1     и, ы, й - 8,4            н    - 5,4     п - 1,9    
л    - 3,4     м       - 3.0            ш, ж - 1,4     т - 4,6
р    - 3,4     х, г    - 2,3            б    - 1,6
ч, щ - 1,2     ц, с, з - 5,8         пробел  - 16,7
ф, в - 3,9     д       - 2,9      остальные  - 6.2
эта таблица приведена для примера.
2. Для составления алгоритма перехода от аминокислот к буквам разделим аминокислоты по их свойствам. Обозначение аминокислоты какой-то буквой латинского алфавита никак не связано со словами или речью, это просто обычно первые буквы химического названия. Для данного примера разделим аминокислоты
на полярные и неполярные. Примем, что полярные заряженные кислоты
соответствуют гласным, а полярные незаряженные - звонким согласным.
Неполярные кислоты распределены между глухими,шипящими и гудящими согласными.

                65
Далее можно распределить по молекулярной массе аминокислоты и буквы - более высокой частоте основной форманты буквы принять более низкую массу.
3. Составление таблицы алгоритма.
Я присваиваю значение буквы алфавита каждой аминокислоте.Получаю следующую таблицу:
Аминокислота. Обозначение аминокислоты.   Буква алфавита.
                Алгоритм 1  2
глютаминовая        e                а  и
глютамин            q                б  и
аспарагиновая       d                е  о
аспарагин           n                г  о
серин               s                н  е
треонин             t                л  а
тирозин             y                м  у
лейцин              l                к  я
лизин               k                и  н
аргинин             r                о  л
гистидин            h                у  м
изолейцин           i                в  в
валин               v                п  г
пролин              p                ж  д
фенилаланин         f                т  б
триптофан           w                р  р
глицин              g                пробел
аланин              a                пробел
цистеин             c                д  .
метионин            m                с  ,

Некоторые буквы могут выпадать их общей закономерности или алгоритм
недостаточно хорош. Приведено два варианта алгоритма. Эта таблица и алгоритмы приведены только для примера.Возможны разные сопоставления аминокислот и букв
алфавита, все зависит от ученого.
4. Для трансляции ДНК в белок используются различные программы. Как правило,в них есть настроечный файл . ini, в котором есть код аминокислот, и этот файл можно редактировать вручную, заменив аминокислоты на буквы в соответствии,как дано выше для принятого алгоритма. Если программа трансляции написана на Perl или Java,то текстовым редактором надо в теле файла заменить буквы аминокислот на буквы принятого алгоритма.
Можно также, используя редактор DOS, заменить в трансляте буквы вручную.Также применяется это при отладке полученного текста, когда надо заменить одну или
две буквы на другие. Для этого надо использовать редактор DOS. В меню ПУСК
WINDOWS выбрать опцию "Выполнить". Набрать команду EDIT text.txt,
где text.txt - редактируемый файл, или указать путь, где находится этот файл. Например, EDIT C:\text. txt. Файл откроется в редакторе DOS.
Кнопкой ALT открыть меню, выбрать "Поиск" - SEARCH,затем "Изменить" - CHANGE,
в окне указать какую букву заменить на какую, затем нажимая на TAB дойти до опции "Изменить все" - CHANGE ALL. В меню "Файл" - FILE, выбрать "Сохранить
как" - SAVE AS. Указать - text1. txt. В Windows для этих операций замены
знаков можно использовать программу Блокнот. Для этого надо выбрать в меню "Правка", опцию "Заменить", выбрать что чем заменить и нажать кнопку
"Заменить все".
После этого во всем тексте нужный знак или буква будет заменен на другой знак или букву или пробел. Можно менять на любые из 255 знаков кода ASCII. Нужный знак можно набрать, удерживая кнопку ALT и набирать нужные цифры на
клавиатуре, после отпускания ALT знак появляется на экране. Например, запятая появится при удержании ALT и наборе числа 44. Это знаки кода ASСII. Если
работа проводится в режиме DOS, то перед редакцией надо запустить русификатор клавиатуры, например KEYRUS. COM,  для переключения алфавитов.
Возможна дополнительная коррекция полученного текста, замена отдельных букв
или дополнительная разбивка слов. Эта работа по оценке или коррекции
полученного текста скорее всего в компетенции лингвиста. Если слова в

                66

трансляте получаются слишком длинными по 15-20 знаков и более, то скорее
алгоритм выбран неверно, так как короткими словами по 3-6 букв можно записать тысячи слов, почти полный набор обычного языка.
Еще раз обращаю Ваше внимание, что все эти файлы лишь примеры, я даю лишь подходы к поиску, облегчаю начальную работу. Если у Вас что-то не пойдет или будет получаться непонятный "тарабарский" текст, то отнеситесь к этому
просто с юмором или как к игре. Я не обещаю,  что обязательно все получится,
это всего лишь рабочая гипотеза.
Для примера в этой статье, я выделил из гена  ДНК-полимеразы А - POLA участок ДНК, соответствующий интрону номер 3. Цитировано с данных генома человека по адресу http://ncbi. nlm. nih. gov.

gtaggtggggcggaggtgg
ag

Гены имеют мозаичное строение, то есть участки , кодирующие белок - экзоны, перемежаются с некодирующими участками - интронами. В описании гена аннотации генома рядом с RNA или РНК и CDS или  кодирующими участками расположены карты JOIN - соединения. Цифрами показаны нуклеотиды экзонов, а запятая означает интрон между соседними экзонами в РНК. Для примера, для гена POLA. Сама последовательность нуклеотидов прилагается рядом с нумерацией нуклеотидов
в аннотации генома или хромосомы в полностью закаченном геноме человека. Цитировано с данных генома человека по адресу http://ncbi. nlm. nih. gov.

 join(16. . 40, 5479. . 5603, 9305. . 9401, 10443. . 10523,
 20608. . 20723, 21195. . 21257, 22416. . 22508, 22938. . 23025,
 23344. . 23545, 23634. . 23812, 29209. . 29321, 30389. . 30505,
 32035. . 32109, 32987. . 33125, 33836. . 33990, 38424. . 38508,
 39809. . 39870, 41453. . 41542, 43679. . 43795, 45429. . 45604,
 47429. . 47558, 48056. . 48175, 49284. . 49383, 51472. . 51596,
 54365. . 54514, 54924. . 55046, 115952. . 115984,
 116762. . 116854,  118712. . 118917, 121033. . 121165,
 127506. . 127637,  132481. . 132655, 147706. . 147884,
 149600. . 149731,  194060. . 194176, 236507. . 236603,
 301859. . 302004)

Если кратко , экзоны - это  структуры гена,необходимые для кодирования белка. Все экзоны объединяются при сплайсинге в единую РНК, а интроны вырезаются и
распадаются. Назначение интронов до конца не ясно. ДНК в них легко мутирует,
то есть хранит информацию с ошибками, примерно 1 замена на миллион лет.
Если интрона в каком-то месте не будет, то для гена обычно ничего не
изменится, если нет регуляторных элементов. На месте интронов могут даже располагаться другие гены. Например, у POLA человека внутри двух интронов
расположились два других гена.


                67
Все это я пишу потому, что именно в интронах может быть расположена любая
внешняя или посторонняя информация, не влияющая на работу гена. В том числе и предполагаемые информационные послания из прошлого. Для поиска надо
подготовить текст ДНК путем разбивки гена на экзоны и интроны . Из карты RNA
или CDS – JOIN находим номера крайних нуклеотидов и открыв редактором
файл текста ДНК, разделяем его и подписываем по порядку все экзоны и интроны.
После этого легко можно из файла текста вырезать нужные участки для анализа. Надо иметь для этого аннотацию к геному. Для удаления цифр и пробелов, чтобы привести файл к виду "фаста",можно пользоваться программами Word  или Texter.
Для облегчения разделения отмечу, что любой интрон должен начинаться с GT,  а заканчивать AG нуклеотидами, это его основное свойство, необходимое для  сплайсинга РНК. Еще одно его свойство - это большое количество кодонов - терминаторов для трансляции РНК. То есть транслироваться с получением
какого-то белка, как экзоны, они не могут.
Интересно то, что все эти терминаторы похожи на разделы между словами в предложениях или на точку. При трансляции интрона обычным кодом я получил следующие варианты: Интрон 3 гена POLA Н. sapiens
Трансляция вперед, рамка +1 - 347 кодонов

VGGAEVGAGMLLPRHCVSCFL*ILTHVVELLLCLGKCKALLGSYLWFGFS
FNYLRMRKQNSRTFIWGYFGESRHIPQDVV*ILQVMAV*ELGGAPCLWGQ
CTALGIKECRFGIHHSYFPIL*PWTSHLISLRLRVFICNMGMRKLPSPRV
VRCI*GSRYEN*LGQ*KAPYKGWS*CPVPLLKAHWFSLVGSDFMAM*MLT
TGSM*IVPVTIYVSTCVVGFSYIASFPL*TGISLWACGNLDSFTFYSSGR
VKLL*SILLWQTLILWAKSFPEVT*LGIIYIIWF*LHTCCVDAVHCLTPV
*TEFCCT*K*HRPGKHLSRYKRFFWSWLKYYWPLLEI*SQY*ILSLQ
рамка +2 - 346 кодонов
*VGRRWGRGCCFLGTVLVASCRFSLMWWSCCFAWANVRHC*DLTFGLDFP
LII*G*GSRIAGHLFGDILENLGTYLRM*YKSSR*WLCKNWEEPLVCGAN
AQRLELRNAGSGSIIPTFQFYDLGQVT*SLCALESSSVIWG*ENYLLPEL
*GVYEVLGMKINLVSRKHHTKAGPNVLCPF*KLIGSHL*GLTSWPCEC*P
QGACRLCL*LFMFLLV*LDSAILPVFPCRLGYLSGLVVILILLLFILLVE
*NCYKASYCGRL*SFGPNRFLRSPD*V*YISFGFDSTPAVWMLCIV*HLC
EQNSAALKNSTGQENI*AGIKGFFGHG*NIIGHF*KFDPSIKFCPC
рамка +3 - 346 кодонов
RWGGGGGGDVAS*ALC*LLLVDSHSCGGVAALPGQM*GTVRILPLVWIFL
*LFEDEEAE*QDIYLGIFWRI*AHTSGCSINPPGNGCVRIGRSPLSVGPM
HSAWN*GMQVRDPSFLLSNSMTLDKSLNLSAP*SLHL*YGDEKTTFSQSC
EVYMRF*V*KLTWSVESTIQRLVLMSCAPSESSLVLTCRV*LHGHVNADH
REHVDCACDYLCFYLCSWIQLYCQFSLVDWDISLGLW*S*FFYFLFFW*S
KTAIKHPIVADFDPLGQIVS*GHLTRYNIYHLVLTPHLLCGCCALSDTCV
NRILLHLKIAQARKTSEQV*KVFLVMAKILLATFRNLIPVLNFVPA
Трансляция назад, то есть по второй цепи ДНК,
рамка -1 - 347 кодонов
LQGQNLILGSNF*KWPIIF*P*PKKPFIPAQMFSWPVLFLSAAEFCSHRC
QTMHSIHTAGVESKPNDIYYT*SGDLRKRFGPKDQSLPQ*DAL*QFYSTR
RIKSKRIKITTSPERYPSLQGKTGNIAESNYTSRNINSHRHNLHAPCGQH
SHGHEVRPYK*EPMSFQKGHRTLGPAFVWCFLLTKLIFIPRTSYTPHNSG
RR*FSHPHITDEDSKAQRD*VTCPRS*NWKVGMMDPEPAFLNSKRCALAP
QTRGSSQFLHSHYLEDLYYILRYVPRFSKISPNKCPAILLPHPQIIKGKS
KPKVRS*QCLTFAQAKQQLHHMSENLQEATNTVPRKQHPRPHLRPTY
рамка -2 - 346 кодонов
CRDKI*YWDQISKSGQ*YFSHDQKNLLYLLRCFPGLCYF*VQQNSVHTGV
RQCTASTQQVWSQNQMIYIIPSQVTSGNDLAQRIKVCHNRMLYSSFTLPE
E*KVKESRLPQAQRDIPVYKGKLAI*LNPTTQVET*IVTGTIYMLPVVSI
HMAMKSDPTSENQ*AFRRGTGH*DQPLYGAFY*PS*FSYLEPHIHLTTLG
EGSFLIPILQMKTLRRREIK*LVQGHRIGK*E*WIPNLHSLIPSAVHWPH
RQGAPPNSYTAITWRIYTTS*GMCLDSPKYPQINVLLFCFLILK*LKENP
NQR*DPNSALHLPRQSSNSTT*VRIYKKQLTQCLGSNIPAPTSAPP
рамка -3 - 346 кодонов
AGTKFNTGIKFLKVANNILAMTKKTFYTCSDVFLACAIFKCSRILFTQVS
DNAQHPHSRCGVKTK*YILYLVR*PQETIWPKGSKSATIGCFIAVLLYQK

                68
NKK*KNQDYHKPREISQSTRENWQYS*IQLHK*KHK*SQAQSTCSLWSAF
TWP*SQTLQVRTNELSEGAQDIRTSLCMVLSTDQVNFHT*NLIYTSQLWE
KVVFSSPYYR*RL*GAERLSDLSKVIELESRNDGSRTCIP*FQALCIGPT
DKGLLPILTQPLPGGFILHPEVCA*ILQNIPK*MSCYSASSSSNN*RKIQ
TKGKILTVPYICPGKAATPPHE*ESTRSN*HSA*EATSPPPPPPHL
Обнаруженные кодоны терминаторы помечены (*).
При замене этих знаков на буквы по алгоритму 2 получим, для примера следующий текст с небольшой дополнительной обработкой. Введены дополнительные разделы между словами, в основном между несколькими гласными или несколькими
согласными. 
Рамка -2 - 346 кодонов:
лонв уро и вене и у бемо ин ня яуя ялбд яуб ги инегма
глиа еаи игре ин и, вув в де игае ноя ил в нг мнл, яуе
ебаяди и нг ни еляди иловд гун ня в ян да аиг иа вга
аву, ядг гевм, , нео даеини бл л а м оидяу бу де бе у
яидм вмяа ая и ебя в двяи, наял л ливн яги млв н и
рвдня мея вде гм рдм
лид днеуа варл вуа ае , яоед ну див нг я яб бявян янинд
нил одне я мядлие енеа а глвун ния аия енвд дае д д

После того, как выделенный участок ДНК транслирован по какому-то алгоритму , получается текст русского языка. Пример для 3 интрона POLA человека.Текст как
бы написан русскими буквами на непонятном языке. Поэтому его лучше не читать,
а слушать. И здесь уже нужны специалисты по языкам, чтобы уловить в тексте
какие-то сочетания фонем или звуков, похожие на какой-то язык, может быть древний язык. Предполагается, что все разговорные слова, особенно простые, состоящие из 1 - 3 букв, не случайны и во многих разных языках схожи.
Предварительный вывод такой, что транслирование интронов дает текст мало
похожий на речь, хотя мной пока слишком мало было обработано материала.
Можно произвести поиск возможных слов и в экзонах,для этого транслировать РНК гена в 6 возможных вариантах. Но структура белка направлена на какую-то его биохимическую функцию, а не на слова. Если предположить, что РНК интронов
может играть какую-то функцию в памяти нервных клеток, то слова и буквы языка могут иметь отражение в ДНК. Хотя я сам считаю эту мою гипотезу невероятной.
Скорее имеет значение наличие большого количества различных повторов в
интронах.Я произвел поиск возможных слов в различных повторах.При этом слова,  полученные по какому-то алгоритму,  будут также повторяться. Например,
трансляция повтора 7 человека из приложения 7 этой книги дает такой текст по алгоритму 2:
"мад мамя оана аиад мамя о марамад иамя оама амад лмая
яоама амад иамя оама амад мам гоама лмад мамя оамар амад
ламя оама амини".
Если отнестись к этому с юмором, то похоже на волшебное
заклинание. Не правда ли? Если повтор 7 данио из приложения 7 транслировать
по алгоритму 1, то получится текст:
лулулу
жжлулулувулулулулулулжлулулулуожлулулулулулулулулулклу
лулулу
лжлулулулулунулклулулулулжлулжлужулулулулулужулжлулулу
лулулм
лулулулулулулжлулулужжлужулулулулулулулулулулуиулглул".
Это больше похоже на какую-то песенку - ДНК поет.
Повтор 5 человека дает такой текст:
"сарг сарг сарн сежг саог сарг карг лесг сарг уарг лаог
каре сакг крг уарг сенв сбкгиежи сбрг карг секг сарг
сенг ларг ларг секг варг сениасирг тирг селг лирг сенг
вбргксарлксарг каргола оспрг сарлосаговег садгпсенг ларг
бакгсерг сарл жсад сенг саргпекгсарг сарг саг карг сенг
саргпкакм лакг каог сарг сарг сенг саргакбрг сенгосарг
иенн сарн сенг сарг сенг сажи са".


                69
Повтор 13 человека дает такой текст:
"око ко ркоко ко ококо ко ококо ко ококо ко ококо ко ок
око ко ококо ко ококо ко ококо ко ококо ко ококо ко ок
око ко ококо ко ококо ко ококо ко ококо ко ококо ко ок
око ко ококо ко ококо ко окнко коа".
Этими примерами я показал, что наиболее демонстративно ДНК говорит именно с
помощью разных повторов.
Чтобы транслировать ДНК можно использовать хорошую форму по адресу http://molbiol. ru/scripts/01_13. html.
В окно формы нужно вставить ДНК и она выдаст его трансляцию. Эта страница
может работать автономно, без подключения к интернет. Для разработки других алгоритмов удобна страница по адресу http://molbiol. ru/appendix/02_01. html. Она описывает основные свойства аминокислот.
Для прослушивания текстов на компьютере есть несколько программ. Для примера, "Говорилка" А. Рязанова. http://www. vector-ski. ru/vecs/govorilka/
До ее использования надо еще установить на WINDOWS звуковой движок.
Это файлы: microsoftagent (msagent. exe, lhttsrur. exe, spchcpl. exe). Также потребуются файл ms_speech_api. exe. Файлы эти можно найти там же.
Подводя итог для этой статьи, могу сказать, что ДНК можно преобразовать в
слова какого-то языка, подобно преобразованию ДНК в ноты музыки генов, но
работы эти я только начал несколько лет назад и каких-то интересных
результатов пока нет. Надо составлять новые алгоритмы и тестировать их, но
это требует много времени.

      ПРИМЕР ИСКАЖЕННОЙ ИНФОРМАЦИОННОЙ ПОСЛЕДОВАТЕЛЬНОСТИ И ЕЕ КОРРЕКЦИЯ.
      20 АПРЕЛЯ 2011.

При рассмотрении последовательности аминокислот в белке часть их в результате мутаций оснований в ДНК заменяется на другие аминокислоты. Если белок предназначен для выполнения каких-то определенных функций,то эти замены могут иметь адаптивное значение в эволюции для выполнения какой-то функции белка.
Меня же интересует сохранность текстовой информации. Для замены одной
аминокислоты на другую мутация основания ДНК может не иметь значения из-за вырожденности кода, либо надо чтоб произошла мутация в 1 , 2 или 3 основаниях для замены одной аминокислоты на другую.
В клетке много белков имеют повторяющиеся структуры в виде доменов. Если они важны для функции белка, то их сохранность поддерживается. Если нужна только часть доменов из молекулы белка, то остальные могут мутировать без вреда для функции. Я приведу здесь пример белка, кодируемого геном LOC732021 из
хромосомы 6. Четко видна основная периодичная структура в виде цепочки - setttastag, с периодом повторения равному 10.
Реальный белок имеет множество замен аминокислот , а также делеции,
приведшие к сдвигу периодичности.
Для коррекции просто взят этот домен по принципу максимального его
количества в молекуле белка, и вся остальная структура представлена
обновленной в виде правильного чередования этих доменов по всей молекуле
белка. Так модулей settt всего 127. В этом белке как бы содержатся несколько повторяющихся чисел, что можно использовать для ввода какой-то разумной информации, это 3 - t , промежуток между s - 6 и 4, размер модуля - 10 и , возможно другие числа, которые можно специально применить для ввода
информации в ДНК.
Разница в аминокислотах наглядно представлена с помощью программы
STADEN PACKAGE. Можно предположить, что ген белка постепенно мутировал много миллионов лет без особого снижения своей функции в клетке, так как оставшихся доменов вполне хватало, или этот белок утратил свою первоначальную функцию в клетке и просто является разновидностью белкового балласта клетки.
Меня интересует прежде сохранность каких-то разумных текстов, которые можно ввести в ДНК , или они уже были введены давно.
Таким образом. используя периодичные структуры в ДНК, или в белке, можно
произвести коррекцию потерянной информации в результате мутаций и

                70
восстановить ее полностью. Срок хранения информации, доступной для чтения, и сохраненный в генах живых организмов может быть очень большим - миллионы или
десятки миллионов лет.

ПРИЛОЖЕНИЕ.
Белок гена LOC732021, цитировано http://ncbi. nlm. nih. gov. ,
без коррекции, corr0. txt
hihgdgygvnhgghyghgggh

Белок после коррекции, хвост белка оставлен без изменения.
Новый белок с коррекцией создал Курносов М. Н. Имя - corr3. txt.
hihgdgygvnhgghyghgggh

                71
Демонстрация возможных замен аминокислот.

Align sequences - сравнение последовательностей
Взяты последовательности:
Added sequence korr0. txt - LOC732021, без коррекции
Added sequence korr3.txt - белок после коррекции автором книги.
          1        11        21        31        41        51
korr0.txt            .****.*::.**:******.******. ..:********.******:*..**:**..*.
korr3.txt           -        10        20        30        40        50

         61        71        81        91       100       110
korr0.txt           .***.**:**.***.**.*:.**.*****..*****. **.******.*..*:***..*:
korr3.txt          60        70        80        90       100       110

        120       130       140       150       160       170
korr0.txt           .******.**.:****.:**.******.**.******* *.:****:***.***.**. *
korr3.txt         120       130       140       150       160       170

        180       190       200       210       220       230
korr0.txt           korr3.txt         180       190       200       210       220       230

        240       249       259       269       279       289
korr0.txt           .*****. **.*****:****:***.** **:*.******.* ***:***.***.*.***
korr3.txt         240       250       260       270       280       290

        299       309       319       329       339       349
korr0.txt           .*****.***.*:***..**.:**.**. :.****..***.******.**.********.
korr3.txt         300       310       320       330       340       350

        359       369       379       389       399       409
korr0.txt           korr3.txt         360       370       380       390       400       410

        419       429       439       449       459       469
korr0.txt           ****.*:.**.. ***********.*.***.:***************.:*.****.** *
korr3.txt         420       430       440       450       460       470

        479       489       499       509       519       529
korr0.txt           .********..* ****. *.**:************:.*:.***.**.******.**.**
korr3.txt         480       490       500       510       520       530

        539       549       559       569       579       589
korr0.txt           .******.**.* ****:******.**.**.*:****.*****.**:***.******.**
korr3.txt         540       550       560       570       580       590



                72
        599       609       619       629       639       649
korr0.txt           korr3.txt         600       610       620       630       640       650

        659       669       679       688       698       708
korr0.txt           .***.*.:*********.*:.*****. *****.***.*..*****..**.******:**
korr3.txt         660       670       680       690       700       710

        718       728       738       748       758       768
korr0.txt           korr3.txt         720       730       740       750       760       770

        778       788       798       808       818       828
korr0.txt           .*****.***.*****..**.:*..**. **.****.***.:*****.**.****..***
korr3.txt         780       790       800       810       820       830

        838       848       858       868       878       888
korr0.txt           .******: ***********************:******:*.****************:*
korr3.txt         840       849       859       869       879       889

        898       908       918       928       938       948
korr0.txt           korr3.txt         899       909       919       929       939       949

        958       968       978       988       998      1008
korr0.txt           korr3.txt         959       969       979       989       999      1009

       1018      1028      1038      1048      1058      1068
korr0.txt           *.*:***.:*********.:*.*****:. *.******:*********.**.********
korr3.txt        1019      1029      1039      1049      1059      1069

       1078      1088      1098      1108      1118      1128
korr0.txt           *.: ****.**.**.******.******. ..**.**********:**.**.:*******
korr3.txt        1079      1089      1099      1109      1119      1129

       1138      1148      1158      1168      1178      1188
korr0.txt           *.***.**. *..*****.**.***:**:*:.***:**:************.********
korr3.txt        1139      1149      1159      1169      1179      1189

       1198      1208      1218      1228      1238      1248
korr0.txt           *.*********.****.**.*.****:*:*:.****.** ..*****.***.: *.*::*
korr3.txt        1199      1209      1219      1229      1239      1249





                73
       1258      1268      1278      1288      1298      1308
korr0.txt           korr3.txt        1259      1269      1279      1289      1299      1309

       1318      1328      1338      1348      1358      1368
korr0.txt           korr3.txt        1319      1329      1339      1349      1359      1369

       1378      1388      1398      1408      1418      1428
korr0.txt           korr3.txt        1379      1389      1399      1409      1419      1429

       1438      1448      1458      1468      1478      1488
korr0.txt           korr3.txt        1439      1449      1459      1469      1479      1489

       1498      1508      1518
korr0.txt glshihgdgygvnhgghyghgggh
          ************************
korr3.txt glshihgdgygvnhgghyghgggh
       1499      1509      1519




































                74
              САМЫЕ БОЛЬШИЕ БЕЛКИ,КОДИРУЕМЫЕ ГЕНОМОМ ЧЕЛОВЕКА.
                14 АПРЕЛЯ 2011.

Для поиска разумных посланий в геноме человека я предпринимаю несколько новый подход. Это рассмотрение каких-то аномалий в белках человека, указывающих на
их искусственное происхождение. Одной из таких аномалий являются особо крупные белки, так как они обращают на себя внимание в первую очередь. Функциональные
домены обычных белков имеют размер от нескольких аминокислот до десятков. Конечно , вроде бы ненужные массивы аминокислот белков-гигантов нужны для конфигурации активных центров молекулы, а могут ли они быть вообще
бесполезными. Другие белки-гиганты состоят из множества небольших доменов. В любом случае,  рассмотрение последовательности аминокислот выглядит более
наглядным для демонстрации необычности его и я предполагаю, что аномальные
белки могут быть как бы метками в геноме для маркирования информационных участков.
В любом случае , эти мои разработки могут пригодится в будущем, если наша цивилизация достигнет необходимости специально вводить информационные участки
в новые организмы будущего. Это может быть полезным для биологических
наномашин. Пока известны науке только естественные наномашины - это
молекулярные комплексы белков, нуклеиновых кислот и других молекул,
выполняющих определенные функции в клетке.Напрмер, ДНК-полимеразный комплекс, рибосома, РНК-полимеразный комплекс, различные помпы мембран для перекачки нужных молекул и т. п. Введение текста в ДНК может быть программой для управления искусственной наномашиной.
Для изучения и разработки биологических наномашин общее представление о
размерах имеет значение. И если особо крупные белки можно представить как
остов машины, то мелкие белки - это инструменты, подвешенные к остову для выполнения нужных работ внутри клетки. Текст ДНК или белка можно использовать для инструктирования этой наномашины. Через эти тексты, введенные в геном,  возможно поддерживать обмен сигналами наномашины с внеклеточной средой или расположенными вне клетки управляющими микро- и макроустройствами.
Привожу примеры белков разного размера, это полезно для их сравнения
в приложении 4.
Если белок очень большой,то для выявления какой-то скрытой периодичности в
нем или доменов,повторов структуры,можно просматривать белок при
прокручивании его в каком-то просмотрщике файла.Будет видна псевдографика
или какие-то необычные картинки при движении файла.Чтобы это облегчить и
уловить скрытую периодичность можно часть аминокислот заменить на пробелы.
Пример ниже.У белка TITIN N2-A я произвел замену EKK на пробелы.

Трудно уловимая периодичность.

Явная периодичность.
pkevvp   vpvppakkpeapppkvpeapkevvp   vpvpppkkpevpptkvpevpkaa
vp   vpeaippkpespppevpeapkevvp   vpaappkkpevtpvkvpeapkevvpek
kvpvpppkkpevpptkvpevpkvavp   vpeaippkpespppevfeepeevaleeppae
vveepepaappqvtvppkkpvp   apavvakkpelppvkvpevpkevvp   vplvvpk
kpeappakvpevpkevvp   vavpkkpevppakvpevpkkpvleekpavpvperaespp
pevyeepeeiapeeeiapeeekpvpvaeeeepevpppavpeepkkiip   vpvikkpea
tplkvpgg   vrkllperkpepkeevvlksvlrkrpeeeepkvepkklekvkkpavpep
Таким образом,просмотр псевдографики при движении файла
может дать открытие чего-то необычного.

                75

Всего в результате длительной трудной работы, просидев за компьютером
несколько недель было просмотрено вручную 34182 белка-предшественника из этой базы, это больше , чем количество генов в геноме индивидуума. Потому, что в
базе часто есть повторы для одного белка разных изоформ, или разных аллелей одного гена.Список больших белков составлен по порядку их расположения в базе белков генома человека из NCBI - protein. gbs.
Статистика для прекурсоров белков человека , кодируемых геномом
человека следующая.
При размере белка в аминокислотах процент таких белков составил:
           до 500         --          64
       500 - 1000         --          26
      1000 - 1500         --           7
      1500 - 2000         --           2
       более 2000         --           1

Я привожу список белков-гигантов при размере их более 1500 аминокислот.
Общее количество белков гигантов составляет менее 3 процентов от общего количества белков. Самые крупные белки, как рекорды для человека будут перечислены индивидуально.
Большинство белков имеют размер 10-300 аминокислот, и поэтому размер
прекурсоров в 5000 - 8000 и выше можно назвать интересным феноменом. Конечно,  эти прекурсоры модифицируются пост-трансляционно, но сам этот феномен есть.
Список рекордных размеров белков-прекурсоров,составил Курносов М.

ABCA13  - 5058 ATP BINDING CASSETE MEMBER 13
AHNAK   - 5890 AHNAK NUCLEOPROTEIN ISOFORMA 1
ALMS1   - 4169 ALSTROM SYNDROME 1
ANK3    - 4377 ANKYRIN 3
APOB    - 4563 APOLIPOPROTEIN B PRECURSOR
BIRC6   - 4829 BACULOVIRAL IAP REPEAT CONTAINING 6
C14ORF78- 5048 - 6287 SIMILAR AHNAK NUCLEOPROTEIN 1
CMYA5   - 4069 CARDIOMYOPATHY ASSOCIATED 5
DNAH1   - 4330 DYNEIN
DNAH11  - 4523 DYNEIN
DNAH3   - 4116 - 4427 DYNEIN
DNAH5   - 4624 DYNEIN
DNAH7   - 4024 DYNEIN
DNAH8   - 4490 DYNEIN
DNAH9   - 4486 DYNEIN
DST     - 5171 - 5497 DYSTONIN
DYNC1H1 - 4646 DYNEIN
DYNC2H1 - 4307 - 4314 DYNEIN
EPPK1   - 5065 EPIPLAKIN 1
FAT     - 4588 FAT TUMOR SUPRESSOR 1
FAT2    - 4349 FAT TUMOR SUPRESSOR
FAT3    - 4601 SIMILAR FAT3
FCGBP   - 5405 FC-FRAGMENT OF IG-G BINDING PROTEIN
FLG     - 4061 FILAGGRIN
FRAS1   - 4011 FRASER SYNDROME 1
GPR98   - 6307 VERY LARGE G-PROTEIN COUPLED RECEPTOR 1 CHR 5
HERC1   - 4861 HECT DOMAIN AND RLC1
HERC2   - 4834 HECT DOMAIN AND RLC2
HMCN1   - 5636 HEMICENTIN 1
HSPG2   - 4391 HEPARIN SULFATE PROTEOGLYCAN 2
HUWE1   - 4374 HECT UBA WWE DOMAINS CONTAINING 1
KIAA1109- 4975 - 5005 SIMILAR CG15133PA
LOC649768 5205 MUCIN 5B
LOC650412 4107 SIMILAR DYNEIN 1
LOC727897 5708 SIMILAR MUCIN 5B PRECURSOR
LOC731751 4096 SIMILAR PROTEIN KINASE DNA ACTIVATED CATALYTIC PP
LPA     - 4548 LIPOPROTEIN LPA

                76
LRP1    - 4544 LOW DENSITY LIPOPROTEIN-RELATED PROTEIN 1
LRP1B   - 4599 LOW DENSITY LIPOPROTEIN-RELATED 1B
LRP2    - 4655 LOW DENSITY LIPOPROTEIN-RELATED PROTEIN 2
MACF1   - 5430 - 5938 MICROFILAMENT AND ACTIN FILAMENT
          CROSS-LINKER PROTEIN 1
MDN1    - 5596 MIDASIN
MLL2    - 5262 MYELOID-LYMPHOID LEUKEMIA 2
MLL3    - 4025 - 4911 MYELOID-LYMPHOID LEUKEMIA 3
MUC16   - 14507 MUCIN 16
MUC17   - 4493 MUCIN 17
MUC19   - 4516 - 7328 MUCIN 19
MUC2    - 5179 MUCIN 2
MYCBP2  - 4640 MYC BINDING PROTEIN 2
NEB     - 6669 NEBULIN
OBSCN   - 6620 OBSCURIN CHR 1
PCLO    - 5010 PICCALO
PCLO    - 5011 - 5021 SIMILAR PICCOLO
PKD1    - 4302 POLYCYSTIN KIDNEY DISEASE 1
PKHD1   - 4074 FIBROCYSTIN 1
PKHD1L1 - 4243 SIMILAR FIBROCYSTIN 1
PLEC1   - 4515 - 4684 PLECTIN 1
PRKDC   - 4128 PROTEIN KINASE DNA-ACTIVATED CATALYTIC PP
RYR1    - 5038 RYANODIN RECEPTOR
RYR2    - 4967 RYANODIN RECEPTOR 2
RYR3    - 4870 RYANODIN RECEPTOR 3
SACS    - 4432 SACSIN
STARD9  - 4552 STAR- RELATED LIPID TRANSFER PROTEIN 9
SYNE1   - 8749 - 8797 NESPRIN
SYNE2   - 6883 SPECTRIN NUCLEAR ENVELOPE
TNXB    - 4289 TENASCIN XB 1
TTN     - 26926 TITIN ISIFORMA N2B
TTN     - 27051 TITIN ISOFORMA NOVEX 1
TTN     - 27118 TITIN ISOFORMA NOVEX 2
TTN     - 33423 TITIN ISOFORMA N2A
TTN     - 5604 TITIN NOVEX 3
USH2A   - 5202 USHERIN
VPS13B  - 4022 VACUOLAR PROTEIN SORTING 13B
VPS13D  - 4363 - 4388 VACUOLAR PROTEIN SORTING 13 D
ZUBR1   - 5183 RETINOBLASTOMA-ASSOCIATED FACTOR 600

Итого 75 генов человека кодируют белки-прекурсоры размером более 4000 аминокислот, из них самый большой белок - титин 33423 аминокислоты,на 2 месте муцин 16 - 14507 аминокислот, на 3 месте несприн (ген SYNE1) - 8797 , на 4
месте SYNE2 - 6883, на 5 месте небулин - 6669. Белки эти имеют много доменов. Сам феномен белков-гигантов требует дальнейшего изучения, что будет
продолжено в следующих сообщениях.

        ТЕЛОМЕРА ХРОМОСОМЫ И ТЕОРИИ СТАРЕНИЯ. 10 ОКТЯБРЯ 2009.
         
Старение человека будет всегда волнующей темой. Сегодня на первое место вышла теломерная теория старения, основная идея которой в том, что конец хромосомы, запечатанный теломерой,перестает функционировать и клетка перестает делиться. При каждом делении клетки участок ДНК на краю хромосомы - теломера
укорачивается до тех пор, пока конец хромосомы перестанет нормально функционировать. Получены результаты на животных продления жизни при
удлинении теломеры. Если клетки имеют возможность большее число раз делиться,
то это эквивалентно повышению резервов организма, которые снижаются в течение жизни до критического или предельного значения перед смертью.
Остается как бы удлинить теломеры у человека - и проблема "вечной молодости" решена. На самом деле все гораздо сложнее, и уж точно, что таблетки, для


                77
удлинения теломер,  не будут продаваться в аптеках. Удлинение теломер - это сложная генетическая операция, при которой в зародышевые или стволовые клетки вводятся векторы или гены для модификации теломеры. Причем количество концов хромосом на гаплоидный набор, то есть в половой клетке, равно 92, и это может
быть самой большой проблемой - удлинить теломеры ВСЕХ концов хромосом.
Возможно, не все 24 хромосомы, а одна или две имеют главное значение в теломерной теории старения, но это пока неизвестно. Затем либо организм клонируется, либо модифицированные клетки размножаются и вводятся в человека. Вся операция полностью индивидуальна, доноры не подойдут, так как будет
иммунная несовместимость клеток. Возможно введение самого фермента теломеразы
с помощью специальных нанокапсул в клетки. Но поскольку этот процесс не
связан с нормальным процессом образования гамет, зародыша и эмбриона,то могут быть всякие неуправляемые осложнения, в том числе образования потенциально раковых клеток.
По этому поводу выскажу некоторые свой соображения. Скорее всего,это не
приведет к значительному увеличению жизни. Как известно,теорий старения около 200, и когда проблема с теломерой будет решена, начнут действовать другие механизмы, приводящие к смерти человека.
Каждая из теорий старения опирается на те процессы, которые вносят свой вклад
в приближение смерти человека. Для тех научных спонсоров, которые инвестируют деньги в науку, и продление жизни , возможно,  будут интересны проекты, могущие
существенно повлиять на длительность жизни.
Это:
1. Митохондрии и старение. Какой бы ни были длины теломеры, будет снижение энергетики с возрастом. Необходима генетическая коррекция митохондрий.
2. Эндогенные вирусы (герпес, папиллома, аденовирусы, эндогенные "нормальные" ретровирусы и несколько других из известных вирусов), которые встраиваются в геном клеток человека и доводят клетки до разрушения независимо от длины теломер. К этой же группе я могу отнести и медленные инфекции.
3. Микробные патогены, которые также снижают резервы организма и играют
большую роль в болезнях старения (микоплазма и другие).
4. Мутации и повреждения генов могут накапливаться в клетках независимо от
длины теломер. Для этого необходимо модифицировать системы репарации генома в клетке для защиты от внешних и внутренних мутагенов.
5. Транспозоны - нечто среднее между мутагенами и вирусами.
Их активность не зависит от длины теломер, но они могут выключать
гены, повреждать их и приводить клетку к гибели.
6. В организме много клеток, которые находятся в состоянии конечной
дифференцировки, они не делятся всю жизнь человека. Это клетки мозга –
нейроны, клетки мышц и сердца, клетки эндокринных желез и другие. Решение проблемы теломеры для старения имеет значение только для делящихся клеток - клетки эпидермиса, клетки кишечника, фибробластов соединительной ткани,клетки костного мозга и другие. Неделящиеся клетки имеют особый, другой механизм старения.
В возрасте старше 60 лет большое значение в долгой и полноценной жизни
человека будут иметь защита мозга от различных дегенеративных процессов типа болезни Альцгеймера, атеросклероза мозга, старческого слабоумия.
Эти темы соответствуют моим интересам в науке и все это показывает, что
старение процесс сложный и требует изучения с разных сторон.
ЛИТЕРАТУРА.
1. Биология старения. Руководство по физиологии. 1982.

 В настоящее время в литературе существует некоторая путаница в названиях
генов, названиях белков, которые могут не совпадать с названием генов, ссылки
в цитатах на гены из разных организмов. То ли это гены дрожжей, то ли мышей,
то ли человека. Разобраться в этом могут только специалисты-биохимики, а
людям, которые просто интересуются наукой для инноваций в генные технологии,
это часто не по силам, в смысле специальных знаний. Чтобы знать, что научная статья именно про тот ген, что интересует, надо знать первичную структуру
белка, или белковые домены для гомологов дрожжей, мышей для сравнения с человеком.
Простой формальный поиск по генным базам может быть ошибочным.

                78
Для примера этого ген TPP1, входящий в защитный комплекс теломер хромосом, на который ссылаются почти в каждой второй статье о теломерах, записан в геноме человека как трипептидил-пептидаза. И это правильно - есть такой ген у
человека, только он никакого отношения к теломерам не имеет.
Только специалист-биохимик сразу это поймет, так как белок TPP1 , входящий в теломеру в защитный комплекс играет функцию биндинга белков и ДНК. Белок TPP1
 - это ген ACD человека.

        ГЕНЫ ПОДДЕРЖКИ И ОБСЛУЖИВАНИЯ ТЕЛОМЕРЫ ХРОМОСОМ В ГЕНОМЕ
        ЧЕЛОВЕКА. СПИСОК И ПЕРЕВОД СДЕЛАЛ КУРНОСОВ М.Н.13 МАРТА 2010.

Гены были найдены по реферативной базе генома человека, а также  по
современным статьям в журналах. Гены указаны все на дату этой статьи, но со     временем их может стать больше, так как наука идет далее.

 ХРОМОСОМА ГЕН      РАЗМЕР НАЗВАНИЕ И ПРИМЕЧАНИЕ
 1.        EST1B    33     Est1p-подобный белок B, каждой
                закороченной теломеры 1B.
                LTPS - взаимодействующий белок.
           C1ORF16  82     ORF, каждой закороченной теломеры 1C,
                рак груди-ассоциированный антиген.
           RAP1     94     RAS онкоген связанный белок, негативная
                регуляция клеточного цикла.
 2.         RIF1    66     RAP1-взаимодействующий фактор, гомолог
                дрожжей, поддержка теломер, ответ на ДНК
                повреждение.
           PAX8     63     Парный бокс белок 8, активатор транскрипции
                теломеразы.
           XRCC5    97     X-лучей дефектная репарация в клетках
                китайского хомячка, Ku80 волчаночный
                антиген, репликация, рекомбинация, репарация
                двойных разрывов, входит в состав комплекса
                теломеры. АТФ-зависимая хеликаза 2.
 3.         TERC    1      РНК теломеразы.
 4.         HNRPD   20     Гетерогенный ядерный РНП Д , AU-богатый
                элемент РНК связывающий белок 1,  37 kDa,
                теломеры поддержка, процессинг РНК,
                активатор транскрипции.
           LOC646316 3     Побобен теломеры повтор связывающий
                фактор 1 - TTAGGG,
                NIMA - взаимодействующий белок 2, белок
                теломеры PIN2-TRF1.
           RFC1     79     Фактор репликации C1, активатор 1,
                145 kDa, TDTM.
           NOLA1    10     Ядерный белок семейство A, член 1, H-ACA
                snRNPs, содержит глицин-аргинин богатый
                домен GAR1.
 5.        LOC442147 1     Подобен TRF2-взаимодействующий белок,
                RAP1 hRAP1.
           TERT     42     Теломераза, обратная транскриптаза,
                4 изоформы.
           SERF1A   18     Малый EDRK-богатый фактор 1A, теломерный,
                нервной системы развитие, неизвестны
                функция, процесс, компонент.
           SMN1     28     Аварийный для моторного нейрона 1,
                теломерный.
           RAD50    87     RAD50-гомолог S. cerv. , регион теломеры
                хромосом, TDTM, рекомбинация, репарация
                двухцепочных разрывов ДНК, 3-5-экзонуклеаза,
                эндонуклеаза одноцепочной ДНК.
           NOLA2    4      Ядерный белок семейство A, член 2.

                79
 6.        ----
 7.        POT1     74     POT1-защита одноцепочной ДНК теломеры,
                гомолог S. pombe. , поддержка теломеры,
                репликация ДНК.
 8.        TNKS     221    Танкираза, TRF1-взаимодействующий
                анкирин-зависимый АДФ-рибозы полимераза,
                NAD-зависимая, АДФ-рибозилирование белков,
                TDTM.
           PINX1    75     PIN2-взаимодействующий белок 1, поддержка
                теломер, негативная регуляция прогрессии
                клеточного цикла.
           TERF1    39     TRF1, Теломерного повтора связывающий
                фактор 1, NIMA-взаимодействующий, связывание
                ДНК теломеры, клеточный цикл, TDTM.
           WRN      141    Вернера синдром, хеликаза, репликация
                теломеры.
 9.        ----
10.        TNKS2    67     Танкираза 2, TRF1-взаимодействующий,
                анкирин-связанный АДФ-рибозы полимераза 2,
                поддержка теломер, АДФ-рибозилирование
                белков.
           OBFC1    36     Олигонуклеотид-олигосахарид-связывающее
                поле 1, поддержка теломеры, ассоциация с
                POT1, TPP1.
11.        TNKS1BP1 23     Танкиразу 1-связывающий белок 1,
                182 kDa, ядерный теломерный гетерохроматин,
                TDTM.
           SCYL1    14     SCY1-подобный 1, S. cerev. , N-терминальная
                киназа-подобный
                белок, тератома-ассоциированный белок,
                регулятора теломеры связанный белок,
                теломеры
                транскрипционный-взаимодействующий элемент.
           MRE11A   76     MRE11-мейоза рекомбинации гомолог S. cerev. ,
                двухцепочных разрывов репарации белок,
                3-5-экзонуклеаза, эндонуклеаза одноцепочной
                ДНК. TDTM.
           ATM      146    Атаксия-телеангиэктазия мутация,
                мейотическая рекомбинация, взаимодействие
                с TRF2.
12.        PTGES3   25     Простагландин Е синтетаза 3, цитозольная,
                теломеразы голоэнзима комплекс, активация
                теломеразы и поддержка теломер, неактивный
                прогестерона рецептор,  23 kDa.
13.        LOC283523 2     Подобен теломерного повтора связывающего
                фактору 1, изоформа 2.
14.        TEP1     46     Теломеразы-ассоциированный белок 1,
                TROVE -домен семейства, член 1, теломеразы
                голоэнзимный комплекс, ДНК репликация и
                хромосомы цикл.
           TINF2    3      TIN2, TERF1 взаимодействующий ядерный
                фактор 2, теломеры длины регулятор, TDTM.
           PARP2    14     АДФ-рибозы полимераза 2.
15.        NOLA3    2      Ядерный белок семейство A, член 3, гомолог
                NOP10 S. cerv.
           BLM      98     Блума синдром, хеликаза.
16.        NOMO1    63     NODAL модулятор 1, PM5-белок, теломерная
                копия.
           TERF2    31     TRF2, Теломеры повтор связывающий фактор 2,
                теломеры ДНК и белок связывающий фактор,
                клеточный цикл, TDTM.


                80
           TERF2IP  10     TERF2-взаимодействующий белок, теломеры
                RAP1 белок, с допамин рецептором
                взаимодействующий белок 5, связывание
                с ДНК теломеры, TDTM.
           ACD      3      Адренокортикальной дисплазии гомолог,
                поддержка теломеры, взаимодействует с POT1
                и TIN2, ДНК, белок TPP1 гомолог.
17.        C17ORF31 244    Каждой закороченной теломеры 1A,
                Est1p-подобный белок A, поддержка теломер.
18.        LOC646359 1     Подобен теломеры повтор связывающий
                белок 1, изоформа 2.
19.        SIRT2    21     Сиртуин 2, гомолог S. cerv. , спокойного
                хроматина комплекс, клеточный цикл.
           ERCC1    14     Эксцизионная репарация ДНК 1.
20.        RTEL1    40     Регулятор теломеры элонгирующей
                хеликазы 1, АТФ-зависимой.
21.        ----
22.        LOC644899 1     Подобен теломеры повтор связывающий
                фактор 2 взаимодействующий белок 1,
                TRF2-взаимодействующий теломеры белок
                RAP1,  hRAP1.
           NHP2L1   15     Ядерный высоко мобильных групп белок,
                гомолог S. cerv. подобный 1, процессинг
                рРНК. Теломеразный комплекс.
           XRCC6    43     X-лучей дефектная репарация в клетках
                китайского хомячка,
                Ku70 тиреоид-волчаночный антиген,
                репликация, рекомбинация, репарация
                двойных разрывов, входит в состав
                комплекса теломеры. АТФ-зависимая
                хеликаза 2. Образует гетеродимеры
                с Ku80.
 X.        DKC1     15     Конгенитальный дискератоз 1, дискерин,
                теломеразы голоэнзимный комплекс,
                регуляция прогрессии клеточного цикла,
                рРНК процессинг, TDTM.
 Y.        CDY1     3      Y-хромосомы хромодомен белок,
                теломерный, сперматогенез.
 Сокращение TDTM - теломера зависимая теломеры поддержка.
Размер генов показан в тысячах пар нуклеотидов, если меньше
1000 пар нуклеотидов, то 1 округленно.
Информационное приложение. Цитировано с данных генома человека,
по адресу http://ncbi. nlm. nih. gov.

1. Ген TERC  - хромосома 3.

         10        20        30        40        50        60

         70        80        90       100       110       120

        130       140       150       160       170       180

        190       200       210       220       230       240


                81
        250       260       270       280       290       300

        310       320       330       340       350       360

        370       380       390       400       410       420

 ccacccctcccaggcccaccctccgcaaccc-3
        430       440       450
 ggtggggagggtccgggtgggaggcgttggg-5                1

 Ген TERC комплементарный в формате фаста.
gcatgtgtgagccgagtcctgggtgcacgtccc
cagttagggttagacaaaaaatggccaccacccctcccaggcccaccctccgcaaccc

 Ген TERC РНК
5-ggguugcggagggugggccugggaggggugguggccauuuuuugu
cuaacccuaac
-----------
gacgugcacccaggacucggcucacacaugc-3
 Подчеркнут домен обратной транскрипции для образования
гексамера TAAGGG теломерного повтора.
 2. Комплекс теломеразы состоит из следующих основных
компонентов:
теломераза       - hTERT
РНК теломеразы   - TERC
дискерин         - DKC1
GAR1             - NOLA1
NOP10            - NOLA3
NHP2             - NHP2L1.
 Комплекс поддержки теломеры , SHELTERIN-COMPLEX , состоит из следующих
основных компонентов , белков, связанных с ДНК теломеры и между собой:
TERF1,TERF2,TINF2,RAP1,TPP1,POT1.
Все эти списки наглядно показывают,что проблема длины теломеры
не сводится только к теломеразе.В процессе участвуют около 50
генов и белков.А для геронтологии может быть иметь большее
значение защитные белки типа POT1,которые по словам китайских
ученых и "есть золото".
 3. Показан конец Y-хромосомы человека, на конце видны
теломерные повторы - ttaggg. Цитировано с данных генома человека
по адресу http://ncbi. nlm. nih. gov.

                82
gtggtgtgtgggtgtgggtgtgggtgtgggtgtgtgggtgtggtgtgtgggtgtggt-3

      ГЕНЫ ПОДДЕРЖКИ ВЫСШИХ ПСИХИЧЕСКИХ СВОЙСТВ ЧЕЛОВЕКА. 24 июля 2008.

В этом проекте я решил дать обзорные описания генов, которые имеют прямое значение для работы мозга и обеспечения именно человеческих функций мозга.
Пока я публикую перевод кратких данных из журналов только одного из них, это
ген неурегулина.
ГЕН NRG1.
Ген расположен в хромосоме 8. Размер гена 212320 п. н. Есть 8  изоформ NRG1 в результате альтернативного сплайсинга. Возможны варианты содержат 3 или 6,или 12, или 13 экзонов. Полный  продукт NRG1 имеет 640 аминокислот и содержит

                83
следующие домены:1. Херегулин HRG. 2. Иммуноглобулин Ig. 3. Эпидермальный
фактор роста подобный EGF-like. 4. Семейство неурегулина. Вес 70392 Д.
Тип 1 содержит домен Ig и гликозилированный домен - изоформы 1-8,
тип 2 - нет гликозилированного домена - изоформа 9, тип 3-есть домен богатый цистеином - изоформа 10. Все формы имеют ткане-специфические функции.
Изоформы в зависимости от наличия этих доменов бывают - херегулин HRG-форма, фактор роста глии GGF-форма, чувствительных и моторных нейронов вторичный
фактор SMDF-форма.
Тип 1 преимущественно экспрессируется в эндокарде. Изоформа альфа
экспрессируется в легких, яичнике, яичках, простате, сердце, скелетных мышцах, молочных железах, плаценте, почках, слюнных железах, немного в кишечнике и мозге, только не в матке, желудке, панкреас и селезенке. Изоформа 3 преимущественно в мезенхимальных клетках и не в нервных органах, тогда как изоформа 5 - большая нейрональная форма. Изоформа 8 - экспрессируется в позвоночнике и мозге. Изоформа 9 -  большая форма в скелетных мышцах, в
нервной системе. Тоже обнаружены во взрослом сердце,плаценте, легком, печени,
почках и панкреас. NRG1 - это главный лиганд для ERBB3,ERBB4 тирозин-киназных
рецепторов.
Также использует ERBB1,  ERBB2 корецепторы. Результат в  усилении
лигандстимулируемого фосфорилирования тирозина и активация ERBB рецепторов.
Входит в состав мембраны  трансмембранно и может локализоваться в ядре.
Функции NRG1 и другие интересные сведения.
1. Участвует в росте и дифференцировке эпителиальных, нейрональных,
глиальных и других клеток.
2. Негативная регуляция транскрипции.
3. Взаимодействует с факторами генов NEU-ERBB рецепторами
тирозин-киназы, повышая уровень фосфорилирования.
4. NRG1 индуцирует экспрессию рецептора ацетилхолина в синаптических
пузырьках нервно-мышечного соединения.
5. NRG1  стимулирует продукцию молока молочными железами и вызывает
дифференцировку клеток рака молочных желез.
6. NRG1 стимулирует пролиферацию Шванновских клеток.
7. NRG1 включен в развитие миокарда сердца.
8. NRG1 связан с возможностью развития шизофрении в различных
популяциях.
В патогенезе нарушено взаимодействие NRG1 и ERBB4 рецептора.
Также мутации в промоторном регионе NRG1 ассоциировались с
шизофренией и полиморфизм 5-конца NRG1.
9. NRG1  риск в болезни Альцгеймера. Потеря синапсов, глиоз, воспаление,
смерть нейронов ассоциируется с изменением  экспрессии NRG1-ERBB.
10. NRG1 может влиять на развитие коронарного атеросклероза,
расширение бляшек, через регуляцию ангиогенного фактора CYR61.
11. Активация NRG1-ERBB сигнального пути запускает пролиферацию в
неопластических клетках Шванна.
12. Херегулин стимулирует агрегацию и ингибирует инвазию бычьих
клеток меланомы через активацию E - кадхерин-катенин комплекса.
13. Пролактин и херегулин преодалевают остановку роста
индуцированную днк повреждением и запускают фосфатидил-инозитол-3
киназа-зависимую пролиферацию в раковых клетках молочной железы.
14. GGF2  из NRG1 защищает допаминэргические нейроны нигро-стриатума
и роль в репарации этих повреждений, что может иметь значение при
болезни Паркинсона.
15. NRG1 имеет 9 потенциальных промоторов и играет центральную роль
в нейральном развитии, пластичности синапсов, что играет большую
роль в реакциях мозга и адаптациях.
16. Точечные разрывы в NRG1 были обнаружены у 6% с раками легких,
яичников или молочных желез.
17. Бетацеллюлин и херегулин имеют значение в эпидермальном
морфогенезе и поддерживают дифференцированный фенотип. Псориаз.
18. NRG1 играет значительную роль в инвазии клеток глиомы.
19. NRG1-бета стимулирует NF-kappa-B фактора транслокацию ядерную.
Влияет на фактор роста эндотелия сосудов в клетках рака груди.

                84
20. Херегулин снижает экспрессию в экстрацеллюлярном матриксе BRCA1.
21. NRG1  активирует JAK-STAT сигнальный путь через рецептор,
HER2-HER3 гетеродимер.
Этот путь играет значительную роль в NRG1- стимуляции пролиферации клеток эпителия легкого.
22. NRG1 стимулирует в эпителии молочной железы  фактор транскрипции GADD153.
23. Цитоплазматический домен взаимодействует с LIM  доменом LIMK1.
Они играют роль в развитии видео-пространственного восприятия.
21. Протеолиз NRG на внешней стороне мембраны освобождает растворимый фактор роста.
Значительное гликозилирование белка предшествует протеолизу.

Изоформы белка даны ниже, цитата из файла protein. gbk (ncbi),
приведены для наглядности связи структуры и функции белка.
NRG1-HRG-ALPHA
atpafrladsrtnpagrfstqeeiqarlssvianqdpiav
NRG1 HRG-BETA1
aasleatpafrladsrtnpagrfstqeeiqarlssvianqdpiav
NRG1 HRG-BETA2
afrladsrtnpagrfstqeeiqarlssvianqdpiav
NRG1 HRG-BETA3
e
NRG1 HRG-GAMMA
kcaekektfcvnggecfmvkdlsnpsrylck


                85
NRG1 GGF
e
NRG1 GGF2
pe
NRG1 NDF43
serhnliaelrrnkahrskcmqiqlsathlrsssiphlgfil
NRG1 SMDF
ektfcvnggecfmvkdlsnpsrylckcpneftgdrcqnyvmasfyststpflslpe

Поскольку эта книга о биоинформатике,  в этой главе я кратко покажу, как работать с литературой. Поиск информации о каком-то гене или белке важная
часть работы. Для начала, можно закачать с сервера ftp. ncbi. nlm. nih. gov
базу белков protein. gbk. gz для нужного организма. Разъархивировать ее и,  открыв в "Блокноте", набрать в строке поиска Gene="NRG1",после чего откроется описание этого белка. Рядом с этим местом дана какая-то литература. Например,

REFERENCE   7  (residues 1 to 696)
AUTHORS   Benzel, I. , Bansal, A. , Browning, B. L. , Galwey, N. W. ,
Maycox, P. R. , McGinnis, R. , Smart, D. , St Clair, D. , Yates, P. and
Purvis, I.
TITLE     Interactions among genes in the ErbB-Neuregulin
signalling network are associated with increased susceptibility
to schizophrenia.
JOURNAL   Behav Brain Funct 3,  31 (2007). PUBMED   17598910.

В этой цитате есть ссылка на авторов, статью, журнал , а также на индекс ПубМеда. Чтобы прочитать эту статью надо зайти на сайт
http://ncbi. nlm. nih. gov , и в поисковике выбрать опцию "PUBMED",
и ввести этот номер. Будет дана ссылка на эту статью, и ее можно закачать в формате . pdf для чтения. Если искать просто по названию гена, то поисковик выдаст 696 источников для NRG, то есть литературы по этому гену очень много,
и нужно всегда запросы делать очень конкретно. Я для поиска нужной информации применяю также следующий способ. Надо с ftp сервера NCBI закачать базу
артиклей. Артикль статьи, как правило,  дает полный текст ее, только без картинок. Удобство поиска по артиклям это быстрота и простота. За несколько
секунд или минут  на компьютере можно провести поиск по ключевым словам. Компьютер просмотрит несколько десятков тысяч статей и укажет те, которые
нужны по содержанию.Например, я распакую архив артиклей у себя, далее проведу поиск по журналу "Nucleic acid research". Для поиска использую Windows


                86
Commander, нажимаю 2 клавиши - Alt и F7 , в строку поиска ввожу, что нужно
найти, например "long term memory" без кавычек. А в строку места поиска введу маску "*. *" без кавычек, что означает поиск во всех файлах. Поисковик выдаст несколько сотен статей. Нажать кнопку у коммандера - "Вывести в лист".
Названия всех найденных статей будут показаны в его окне. Их надо скопировать
в нужную директорию соседнего окна. Область поиска при этом сузилась. Далее
ищем другое слово, уже среди них, например "sleep". Поисковик  выдаст уже несколько десятков статей, которые можно уже быстро прочитать на тему о
влиянии сна на долговременную память на молекулярном уровне, для примера.
Можно уменьшать таким способом количество нужных статей во много раз.
База артиклей находится по адресу.
Ftp://ftp. ncbi. nlm. nih. gov/pub/pmc/articles. A-B. tar. gz
/articles. C-H. tar. gz
/articles. I-N. tar. gz
/articles. O-Z. tar. gz, где буквы означают первые буквы названия журналов. Общий размер этих файлов около 11 Гб в виде архивов. Содержит сотни журналов
и десятки тысяч статей.
Если какие-то статьи интересны, то затем их уже можно закачать в формате .pdf
с картинками, таблицами, графиками.
Для клинического приложения генетики есть база OMIM - Online Mendelian Inheritance in Man. Эту базу можно закачать по адресу
ftp://ftp. omim. org/OMIM/omim. txt. Z.
Этот архив в виде текстового файла размером около 180 Мб можно использовать
для того, чтобы подробно прочитать про какой-то ген, признак человека, его фенотип, заболевание, особенные молекулы, клетки и так далее. Также в тексте
про каждый ген или признак можно найти список литературы. Для примера,открыть эту базу "Блокнотом", в строке поисковика набрать "; NRG1" , точка с запятой, пробел и название без кавычек. Будет открыт в файле участок текста про этот
ген. Размер текста про этот ген около 43 Кб и 42 литературных источника.
В мире издаются сотни  названий научных журналов по генетике и медицине, биоинформатике. Определившись с кругом нужных журналов по своим научным интересам, надо,  конечно, посещать сайт самого журнала. На многих есть свободные архивы с издаваемыми ими журналами, которые и надо читать. Выше показано, как нужно работать профессионально. Для простого ознакомления с
каким-то геном можно использовать сервис Wikipedia. В ней есть информация
почти о всех генах. Например, набрать
http://en. wikipedia. org/wiki/Neuregulin.

                Окончание.

 На примере генов-гигантов мной было показано, что такая работа по биоинформатике,  как составление разных списков и баз данных по генам или биологическим процессам, может дать новую интересную информацию. Ее не
получить путем простого размышления или просмотра целого генома. Лишь после того, как информация была сгруппирована по какому-то признаку,и статистически
обработана, появилось новое знание. В этой книге я продемонстрировал это несколько раз. Мной были составлены следующие списки-базы.
Список генов митохондрий, находящихся в ядре. Список генов-гигантов.
Список белков-гигантов. Список генов обслуживания теломеры.
База визуально-особых участков генома. Список генов обслуживания сплайсинга.
На моем сайте Neogermetic. narod. ru я выложил список всех генов человека с переводом на русский язык их названий.
Таким образом, кропотливая и трудная работа по просмотру большого объема информации - генома, дает свой результат в получении новой информации. Ее уже можно проверять экспериментально. Составление разных генетических или
белковых списков по какому-то признаку - это важная часть работы в биоинформатике ДНК. Тут на помощь приходят разные программы по компьютерному анализу генома. Они помогают выявить какие-то признаки и провести их
статистическое изучение. В этой книге я много раз приводил примеры
использования компьютерных программ при разработке моих проектов. В интернете число таких программ десятки и сотни. Подбор их для работы и освоение

                87
- важная часть биоинформационной работы. Без программного изучения каких-то генетических, молекулярных и других признаков ни обходится ни одна работа.
Большую часть этой книги я уделил проекту записи текстов в ДНК и проекту
поиска текстов. Поиск каких-то текстов в ДНК - это скорее задача для
лингвистов и математиков. Они будут создавать различные алгоритмы поиска. Я в этой книге написал то, что касается больше моей специальности в медицине и
генетике. Надеюсь,  что на стыке этих наук будет получено что-то важное для человеческой цивилизации. По лингвистике написаны сотни книг, так примером
профессиональной книги по лингвистике, как прикладной математики,  может быть литература [31].
Особенностью биоинформатики ДНК является ее тесная связь с лингвистикой, так
как в ДНК закодирован биологический язык. Он имеет свои законы, в нем также
есть буквы, слова, знаки препинания. В книге было показано, что ДНК и слова
речи, языка человека могут иметь что-то общее. Надеюсь, что моя книга поможет  генетикам и лингвистам лучше понимать друг друга.
                Заключение.

 Эта книга не монография, не руководство по работе с ДНК. Эта книга - научные очерки, о том, что я нашел вокруг ДНК интересного, чтобы поделиться с людьми. Эта книга скорее декларация моих намерений или моих научных интересов.
В будущем, возможно, что-то будет осуществлено. Насколько все эти проекты
будут сделаны зависит от финансирования науки. Теоретическое осмысление этих проектов достаточно для их воплощения. Я также понимаю, что одному мне эти
проекты не поднять. Сегодня в генетике медикам и биологам нужны для помощи
в науке и работе физики, химики, инженеры,  программисты, лингвисты и другие специалисты. Если эта книга вызвала у Вас интерес, подключайтесь к
этим проектам в генетике и успехов Вам в работе.

Для связи с автором можно использовать E-mail:z1959z@yandex.ru
Тексты, не вошедшие в книгу можно найти на сайте:
www.neogermetic.narod.ru.
 Курносов Михаил.  Дата 01 мая 2013.
                Об авторе.

 Курносов Михаил Николаевич родился в 1959 году, проживает в Пермском крае. Образование высшее, закончил Пермский государственный медицинский институт по специальности гигиена и эпидемиология в 1986 году. Прошел специализацию
по клинической лабораторной диагностике и биохимии в Институте усовершенствования врачей в Казани в 1987 году. Работал врачем-биохимиком. Последние 24 года занимается свободной научной деятельностью.
 Научные интересы - геронтология, молекулярная биология, биохимия, геномика,
биоинформатика. Написал 2 книги:
1. Здоровье, возраст, старение. 1992 год. Пермь. Книга - сборник методов
оценки биологического возраста человека.
2. Экономическая геронтология. 1995 год. Пермь. Книга о связи геронтологии и  достижении человеком своих жизненных целей.













                88


Приложение 1.Гены компонентов митохондрий в хромосомах ядра человека.
Размер генов в тысячах п. н.  включает интроны. Список и перевод сделал
Курносов М.Н.2008 год.

    ХРОМОСОМА 1
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. CLCC1     31      ХЛОРИД-КАНАЛ
  2. ATP5F1    13      АТФ-СИНТАЗА H-ТРАНСПОРТ
  3. WARS2     110     ТРИПТОФАН-ТРНК-ЛИГАЗА
  4. HSD3B2    8       СТЕРОИД-ДЕГИДРОГЕНАЗА
  5. HSD3B1    8       --
  6. HMGCS2    21      3-ГИДРОКСИ-3-МЕТИЛГЛУТАРИЛ-КОА-СИНТЕТАЗА
  7. SDHB      35      СУКЦИНАТ-ДЕГИДРОГЕНАЗА
  8. ALDH4A1   31      АЛЬДЕГИД-ДЕГИДРОГЕНАЗА
  9. PINK1     18      ПРОТЕИН-КИНАЗА
 10. HMGCL     23      3-ГИДРОКСИ-3-МЕТИЛГЛУТАРИЛ-КОА-ЛИАЗА
 11. NUDT17    3       NUDIX
 12. LOC391139 19      АСТ ПОДОБНЫЙ
 13. DARS2     33      АСП-ТРНК-СИНТЕТАЗА
 14. MRPS14    9       БЕЛОК РИБОСОМЫ S14
 15. TIMM17A   15      БЕЛОК-ТРАНСЛОКАЗА
 16. GLRX2     10      ГЛУТАРЕДОКСИН2
 17. LOC643536 1       ПОРИН
 18. IARS2     54      ИЛЕЙ-ТРНК-СИНТЕТАЗА
 19. MOSC2     36      MOCO-СУЛЬФУРАЗА
 20. ACBD3     42      АЦИЛ-КОА-СВЯЗЫВАющий домен 3
 21. CABC1     48      ШАПЕРОН ABC1
 22. MRPL55    3       БЕЛОК РИБОСОМЫ L55
 23. ABCB10    42      АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА
 24. C1ORF31   10      ЦИТОХРОМ-С-ОКСИДАЗА
 25. TOMM20    19      БЕЛОК-ТРАНСЛОКАЗА
 26. FH        22      ФУМАРАТ-ГИДРАТАЗА
 27. ATPIF1    2       ИНГИБИТОР АТФ-АЗЫ
 28. MECR      38      ЕНОЛ-КОА-РЕДУКТАЗА
 29. AK2       29      АДЕНИЛАТ-КИНАЗА
 30. MRPS15    8       БЕЛОК РИБОСОМЫ S15
 31. MYCBP     10      C-MYC-СВЯЗЫВАЮЩИЙ БЕЛОК
 32. NDUFS5    8       NADH-ДЕГИДРОГЕНАЗА
 33. OXCT2P    1       ОКСОАЦИД-КОА-ТРАНСФЕРАЗА
 34. TRIR1     42      ТРНК-ИЗОПЕНТИНИЛ-ТРАНСФЕРАЗА
 35. UQCRH     13      УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА
 36. ATPAF1    34      ФАКТОР СОБИРАЮЩИЙ АТФ-СИНТАЗЫ КОМПЛЕКС
 37. SCP2      125     СТЕРОИД-ТРАНСПОРТЕР
 38. CPT2      18      КАРНИТИН-ПАЛЬМИТОИЛ-ТРАНСФЕРАЗА
 39. MRPL37    18      БЕЛОК РИБОСОМЫ L37
 40. PARS2     7       ПРО-ТРНК-СИНТЕТАЗА
 41. LOC652318 1       AST
 42. AK3L1     78      АДЕНИЛАТ-КИНАЗА3
 43. ACADM     38      АЦИЛ-КОА-ДЕГИДРОГЕНАЗА
 44. MRPL20    5       БЕЛОК РИБОСОМЫ L20
 45. TFB2M     26      ФАКТОР ТРАНСКРИПЦИИ
 46. MRPS21    15      БЕЛОК РИБОСОМЫ S21
 47. MCL1      5       МИЕЛОИДНАЯ ЛЕЙКЕМИЯ
 48. MRPL9     4       БЕЛОК РИБОСОМЫ L9
 49. SMCP      7       МИТОХОНДРИИ СПЕРМАТОЗОИДОВ
 50. HAX1      3       HCLS1-АССОЦИИРОВАННЫЙ БЕЛОК X1
 51. MTX1      5       МЕТАКСИН1 ТРАНСПОРТ БЕЛКОВ
 52. DAP3      50      СМЕРТЬ-АССОЦИИРОВАННЫЙ БЕЛОК АПОПТОЗА
 53. KIAA0446  19      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 54. MRPL24    3       БЕЛОК РИБОСОМЫ L24
 55. LOC649176 1       ПОРИН
 56. CASQ1     13      МИТОХОНДРИИ МЫШЦ
 57. PPOX      4       ПРОТОПОРФИРИНОГЕН-ОКСИДАЗА
 58. NDUFS2    15      NADH-ДЕГИДРОГЕНАЗА
 59. TOMM40L   5       БЕЛОК-ТРАНСЛОКАЗА
 60. SDHC      50      СУКЦИНАТ-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС
 61. DBT       56      ДИГИДРОЛИПОАМИД-ВЕТВЯЩАЯ-ТРАНСАЦИЛАЗА
 62. ACOT7     29      АЦИЛ-КОА-ТИОЭСТЕРАЗА
 63. BMSC-MCP  44      ТРАНСПОРТНЫЙ БЕЛОК
 64. KIF1B     171     КИНЕЗИН
 65. MFN2      34      МИТОФУЗИН
 66. SLC25A24  65      РАСТВОРОВ ТРАНСПОРТЕР
 67. MGC4399   44      ТРАНСПОРТ БЕЛКОВ
 68. AGMAT     13      АГМАТИН-УРЕОГИДРОЛАЗА
 
                89
 69. LOC440557 3       ПОДОБЕН УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗЕ
 70. LOC653763 2       ГЛИЦИН-РАСЩЕПЛЯЮЩИЙ БЕЛОК
 71. LOC642393 7       ПОДОБЕН БЕЛКУ РИБОСОМ L20

  ХРОМОСОМА 2
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. LOC647847 25      ПОДОБЕН ГЛИЦЕРОЛ-3-ФОСФАТ-АЦИЛ-ТРАНСФЕРАЗЕ
  2. LIPT1     8       ЛИПОИЛ-ТРАНСФЕРАЗА 1
  3. COX5B     2       ЦИТОХРОМ-С-ОКСИДАЗА
  4. MRPL30    18      БЕЛОК РИБОСОМ L30
  5. MRPS9     62      --            S9
  6. COQ10B    22      КОЭНЗИМ Q10 ГОМОЛОГ  S. CEREVIS.
  7. HSRD1     14      60 КДА  БЕЛОК 1 ТЕПЛОВОГО ШОКА, ШАПЕРОНИН
  8. HSPE1     3       10 КДА  --                , ШАПЕРОНИН 10
  9. MARS2     3       МЕТИОНИН-ТРНК-СИНТЕТАЗА 2
 10. NDUFB3    14      NADH-ДЕГИДРОГЕНАЗА, СУБКОМПЛЕКС 3
 11. CASP8     51      КАСПАЗА 8, ЦИСТЕИН-ПЕПТИДАЗА АПОПТОЗА
 12. NDUFS1    37      NADH-ДЕГИДРОГЕНАЗА, FE-S БЕЛОК 1, КОМПЛЕКС 1
 13. ACADL     37      АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, ДЛИННАЯ ЦЕПЬ
 14. CPS1      113     КАРБАМОИЛ-ФОСФАТ-СИНТЕТАЗА 1
 15. BCS1L     4       СБОРЩИК БЕЛКОВ В КОМПЛЕКС
 16. CYP27A1   34      ЦИТОХРОМ P-450 , СЕМЕЙСТВО 27
 17. ABCB6     9       АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА
 18. MRPL44    10      БЕЛОК РИБОСОМ L44
 19. NDUFA10   65      NADH-ДЕГИДРОГЕНАЗА, 42 КДА СУБКОМПЛЕКС 10
 20. AGXT      11      АЛАНИН-ГЛИОКСИЛАТ-АМИНОТРАНСФЕРАЗА
 21. LOC730788 1       MYC-ИНДУКТОР ПОДОБЕН
 22. LOC731973 3       ПОДОБЕН 11 КДА БЕЛКУ КОМ. УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗЫ
 23. HADHA     54      ГИДРОКСИАЦИЛ-КОА-ДЕГИДРОГЕНАЗА, A-СУБЪЕДИНИЦА
 24. HADHB     46      --                , B-СУБЪЕДИНИЦА
 25. MPV17     13      MPV17 БЕЛОК
 26. MRPL33    8       БЕЛОК РИБОСОМ L33
 27. LOC651697 1       ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ
 28. COX7A2L   11      ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7A
 29. LRPPRC    109     ЛЕЙЦИН-БОГАТЫЙ БЕЛОК, ТРАНСПОРТ ВДОЛЬ МИКРОТРУБОЧЕК
 30. MTIF2     38      ФАКТОР ИНИЦИАЦИИ ТРАНСЛЯЦИИ 2
 31. MCEE      20      МЕТИЛ-МАЛОНИЛ-КОА-ЭПИМЕРАЗА
 32. SFXN5     130     СИДЕРОФЛЕКСИН 5
 33. RAB11FIP5 39      RAB11 БЕЛОК ПОСРЕДНИК
 34. DGUOK     32      ДЕЗОКСИГУАНОЗИН-КИНАЗА
 35. MTHFD2    17      МЕТИЛЕН-ТЕТРАГИДРОФОЛАТ-ДЕГИДРОГЕНАЗА 2
 36. MRPL53    1       БЕЛОК РИБОСОМ L53
 37. HTRA2     4       ВЫСОКОЙ ТЕМПЕРАТУРЫ БЕЛОК A2, СЕРИН-ПЕПТИДАЗА
 38. HK2       61      ГЕКСОКИНАЗА 2
 39. MRPL19    15      БЕЛОК РИБОСОМ L19
 40. SUCLG1    36      СУКЦИНАТ-КОА-ЛИГАЗА
 41. IMMT      51      МИТОФИЛИН, БЕЛОК ВНУТРЕННЕЙ МЕМБРАНЫ
 42. MRPL35    14      БЕЛОК РИБОСОМ L35
 43. LOC389049 42      ВЕРОЯТНЫЙ РЕЦЕПТОР ВВОДА
 44. LOC440917 2       ПОДОБЕН ФАКТОРУ СТИМУЛИРУЮЩЕМУ ВВОД
 45. C2ORF25   18      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 46. LOC642727 -       ПОДОБЕН АТФ-СИНТАЗЕ, ЦЕПЬ A
 47. GPD2      160     ГЛИЦЕРОЛ-3-ФОСФАТ-ДЕГИДРОГЕНАЗА 2
 48. SLC25A12  110     ПЕРЕНОСЧИК
 49. MAP1D     81      МЕТИОНИН-АМИНОПЕПТИДАЗА 1D
 50. PDK1      43      ПИРУВАТ-ДЕГИДРОГЕНАЗЫ КИНАЗА 1
 51. ATP5G3    5       АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА C3
 52. MTX2      68      МЕТАКСИН 2, БЕЛКОВ ТРАНСПОРТ
 53. GLS       85      ГЛУТАМИНАЗА
 54. MRPS5     35      БЕЛОК РИБОСОМ S5

    ХРОМОСОМА 3
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. CPOX      14      КОПРОПОРФИРИНОГЕН-ОКСИДАЗА, БИОСИНТЕЗ ГЕМА
  2. TOMM70A   38      БЕЛКОВ ТРАНСЛОКАТОР, ГОМОЛОГ S. CEREVIS.
  3. C3ORF1    26      БЕЛКОВ ТРАНСПОРТ , ВНУТРЕННЯЯ МЕМБРАНА
  4. COX17     8       ЦИТОХРОМ-С-ОКИДАЗА, СОБИРАЮЩИЙ БЕЛОК
  5. C3ORF15   64      MYCBP-СВЯЗЫВАЮЩИЙ БЕЛОК
  6. NDUFB4    6       NADH-ДЕГИДРОГЕНАЗА, 15 КДА B-СУБКОМПЛЕКС 4
  7. ACAD9     34      АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, СЕМЕЙСТВО ОЧЕНЬ ДЛИННЫХ ЦЕПЕЙ, 9
  8. MRPL3     41      БЕЛОК РИБОСОМ L3
  9. PCCB      80      ПРОПИОНИЛ-КОА-КАРБОКСИЛАЗА, B-ПОЛИПЕПТИД
 10. LOC651374 -       ПОДОБЕН АТФ-СИНТАЗЕ, ЛИПИД-СВЯЗАННЫЙ БЕЛОК,  9
 11. MRPS22    13      БЕЛОК РИБОСОМ S22
 12. SLC25A36  36      ПЕРЕНОСЧИК
 13. GFM1      48      G-ЭЛОНГАЦИИ ФАКТОР 1

                90
 14. LOC732067 1       ПОДОБЕН СУКЦИНАТ-ДЕГИДРОГЕНАЗНОМУ КОМПЛЕКСУ, СУБЪЕДИНИЦА D
 15. MFN1      45      МИТОФУЗИН 1
 16. LOC442098 1       ПОДОБЕН МТФ-ДЕГИДРОГЕНАЗЕ/ЦИКЛОГИДРОЛАЗЕ
 17. MRPL47    17      БЕЛОК РИБОСОМ L47
 18. NDUFB5    19      NADH-ДЕГИДРОГЕНАЗА, 16 КДА СУБКОМПЛЕКС B5
 19. DNAJC19   6       DNAJ-ГОМОЛОГ СУБСЕМЕЙСТВО С19, ТРАНСПОРТ И УКЛАДКА БЕЛКОВ
 20. MCCC1     94      МЕТИЛКРОТОНИЛ-КОА-КАРБОКСИЛАЗА 1
 21. PSARL     55      ПОДОБЕН РОМБОИДУ АССОЦИАЦИЯ С ПРЕСЕНИЛИНОМ, СЕРИН-ПЕПТИДАЗА
 22. OPA1      105     ЗРИТЕЛЬНАЯ АТРОФИЯ 1, МИТОХОНДРИИ НЕЙРОНОВ
 23. TRNT1     24      ТРНК-НУКЛЕОТИДИЛ-ТРАНСФЕРАЗА
 24. OGG1      18      8-ОКСОГУАНИН-ДНК-ГЛИКОЗИЛАЗА, РЕПАРАЦИЯ
 25. VHL       11      ВАН ГИППЕЛЯ-ЛИНДАУ СИНДРОМ, СУПРЕССОР РАКА, АНТИАПОПТОЗ, ЦИКЛ
 26. RAF1      80      RAF-ГОМОЛОГ ВИРУС-ЛЕЙКЕМИИ ОНКОГЕН, ПРОТЕИН-КИНАЗА
 27. MRPS25    17      БЕЛОК РИБОСОМ S25
 28. SH3BP5    87      SH3-ДОМЕН СВЯЗЫВАЮЩИЙ БЕЛОК 5, ВНУТРИСИГНАЛЬНЫЙ КАСКАД
 29. OXSM      4       3-ОКСОАЦИЛ-ACP-СИНТАЗА
 30. LOC651462 2       ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
 31. FLJ20551  14      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 32. LARS2     160     ЛЕЙЦИЛ-ТРНК-СИНТЕТАЗА 2
 33. UQCRC1    10      УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА, ОСНОВНОЙ БЕЛОК 1
 34. SLC25A20  42      КАРНИТИН И АЦИЛКАРНИТИН ТРАНСЛОКАЗА
 35. AMT       6       АМИНО-МЕТИЛ-ТРАНСФЕРАЗА, ГЛИЦИНА КАТАБОЛИЗМ
 36. ALAS1     16      АМИНОЛЕВУЛИНАТ-ДЕЛЬТА-СИНТАЗА 1, БИОСИНТЕЗ ГЕМА
 37. CHDH      29      ХОЛИН-ДЕГИДРОГЕНАЗА
 38. PDHB      6       ПИРУВАТ-ДЕГИДРОГЕНАЗА B
 39. SLC25A26  159     S-АДЕНОЗИЛ-МЕТИОНИН ТРАНСПОРТЕР
 40. SUCLG2    277     СУКЦИНАТ-КОА-ЛИГАЗА, ГТФ-СПЕЦИФИЧНАЯ, ЦЕПЬ B
 41. BDH1      63      3-ГИДРОКСИБУТИРАТ-ДЕГИДРОГЕНАЗА 1
 42. SDHAL     32      СУКЦИНАТ-ДЕГИДРОГЕНАЗА СУБЪЕДИНИЦА A, ФЛАВОБЕЛОК ПОДОБНЫЙ 2
 43. LOC642749 15      ---
 43. LOC220729 16      ---
 44. LOC646334 -       ПОДОБЕН АТФ-СИНТАЗЕ, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА F2
 45. LOC285216 51      ПОДОБЕН МТФОЛАТ-ДЕГИДРОГЕНАЗЕ/ЦИКЛОГИДРОЛАЗЕ

    ХРОМОСОМА 4
    ГЕН       РАЗМЕР  НАЗВАНИЕ

  1. C4ORF14   14      ОКИСИ АЗОТА СИНТЕТАЗЫ ОРТОЛОГ ARABIDOPSIS
  2. COX18     15      ЦИТОХРОМ-С-ОКСИДАЗЫ ГОМОЛОГ S. CEREVIS.
  3. ALB       17      АЛЬБУМИН, ПОДДЕРЖКА ЛОКАЛИЗАЦИИ МИТОХОНДРИЙ
  4. MRPL1     89      БЕЛОК РИБОСОМЫ L1
  5. GK2       2       ГЛИЦЕРОЛ-КИНАЗА 2
  6. LOC391674 1       ПОДОБЕН АМИНО-МЕТИЛ-ТРАНСФЕРАЗЕ
  7. COQ2      21      КОЭНЗИМ-Q2-ГОМОЛОГ
  8. MRPS18C   6       БЕЛОК РИБОСОМ S18C
  9. NUDT9     36      NUDIX9 , ТРАНСПОРТ КАТИОНОВ
 10. PPM1K     23      БЕЛОК-ФОСФАТАЗА 1K
 11. LOC133083 1       ПОДОБЕН ПЕПТИДАЗЕ A
 12. PDHA2     2       ПИРУВАТ-ДЕГИДРОГЕНАЗА A2
 13. BDH2      23      3-ГИДРОКСИ-БУТИРАТ-ДЕГИДРОГЕНАЗА 2
 14. PPA2      105     ПИРОФОСФАТАЗА 2 НЕОРГАНИЧЕСКАЯ
 15. HADHSC    16      L-3-ГИДРОКСИАЦЕТИЛ-КОА-ДЕГИДРОГЕНАЗА, КОРОТКАЯ ЦЕПЬ
 16. LETM1     42      ЛЕЙЦИН-СОДЕРЖАЩИЙ ТРАНСМЕМБРАННЫЙ БЕЛОК 1, ЗАСТЕЖКА-МОЛНИЯ
 17. GRPEL1    8       КО-ШАПЕРОН, ВВОД БЕЛКОВ В МАТРИКС
 18. PPARGC1A  98      ОБРАЗОВАНИЯ ПЕРОКСИСОМ РЕЦЕПТОР ГАММА КОАКТИВАТОР 1A,
                РНК-ПОЛ 2 КОМПЛЕКС, МИТОХОНДРИЙ ОРГАНИЗАЦИЯ И БИОГЕНЕЗ
 19. LIAS      18      ЛИПОЕВОЙ КИСЛОТЫ СИНТЕТАЗА
 20. COX7BD    110     ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7B
 21. SLC25A31  43      АДЕНИНА ТРАНСПОРТ, СПЕРМАТОЗОИДЫ
 22. NDUFC1    6       NADH-ДЕГИДРОГЕНАЗА 1 ,   6КДА
 23. UCP1      9       БУРЫЙ ЖИР,  РАЗОБЩАЮЩИЙ БЕЛОК
 24. LOC345041 2       ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
 25. ABCE1     31      АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА, ПОДСЕМЕЙСТВО E1
 26. MMAA      16      МЕТИЛ-МАЛОНАТ-АЦИДУРИЯ A
 27. LOC649288 -       ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ
 28. PET112L   90      ГЛУТАМИЛ-ТРНК-АМИДО-ТРАНСФЕРАЗА, ГОМОЛОГ
 29. ETFDH     36      ЭЛЕКТРОН-ПЕРЕМЕЩАЮЩАЯ-ФЛАВОСОДЕРЖАЩАЯ-ДЕГИДРОГЕНАЗА
 30. SLC25A4   4       АДЕНИНА ТРАНСЛОКАТОР, ПОДДЕРЖКА ГЕНОМА МТ, СКЕЛЕТНЫЕ МЫШЦЫ
 31. FLJ38991  15      COX18 ПОДОБЕН, ВСТАВКА БЕЛКОВ В МЕМБРАНУ
 32. LOC285442 62      ПОДОБЕН ТЕРМИНАТОРУ ТРАНСЛЯЦИИ 1
 33. ATP5I     2       АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СУБЕДИНИЦА E

    ХРОМОСОМА 5
    ГЕН       РАЗМЕР  НАЗВАНИЕ

  1. MCCC2     70      МЕТИЛ-КРОТОНИЛ-КОА-КАРБОКСИЛАЗА 2
  2. MRPS27    101     БЕЛОК РИБОСОМ S27
  3. GFM2      46      G-ЭЛОНГАЦИИ ФАКТОР 2

                91
  4. DMGDH     72      ДИМЕТИЛ-ГЛИЦИН-ДЕГИДРОГЕНАЗА
  5. CKMT2     33      КРЕАТИН-КИНАЗА 2, МЫШЦЫ
  6. COX7C     3       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7C
  7. FTMT      1       ФЕРРИТИН
  8. MRPS36    12      БЕЛОК РИБОСОМ S36
  9. LOC653102 7       ПОДОБЕН СУКЦИНАТ-ДЕГИДРОГЕНАЗЕ
 10. SDHA      39      СУКЦИНАТ-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС, СУБЪЕДИНИЦА A, ФЛАВОБЕЛОК
 11. LOC731488 40      ПОДОБЕН СУКЦИНАТ-ДЕГИДРОГЕНАЗЕ
 12. MRPL36    2       БЕЛОК РИБОСОМ L36
 13. NDUFS6    15      NADH-ДЕГИДРОГЕНАЗЫ, FE-S , БЕЛОК 6  , 13 КДА
 14. MTRR      32      5-МЕТИЛ-ТФ-ГОМОЦИСТЕИН-МЕТИЛТРАНСФЕРАЗЫ РЕДУКТАЗА,
                МЕТИОНИН-СИНТЕТАЗЫ РЕДУКТАЗА
 15. LOC347397 1       ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
 16. LOC642237 2       ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА
 17. LOC646639 2       ГОМОЛОГ ТРАНСЛОКАЗЫ TOM40
 18. AMACR     20      АЛЬФА-МЕТИЛ-АЦИЛ-КОА-РАЦЕМАЗА
 19. ACSL6     7       АЦИЛ-КОА-СИНТЕТАЗА ДЛИННОЙ ЦЕПИ СЕМЕЙСТВА 6
 20. UQCRQ     1       УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА 9, 5 КДА, КОМПЛЕКС 3, СЕ 7
 21. VDAC1     33      ВОЛЬТАЖ-ЗАВИСИМЫЙ -АНИОН-КАНАЛ 1,  АПОПТОЗ
 22. PPP2CA    30      ПРОТЕИН-ФОСФАТАЗА 2, СУБЪЕДИНИЦА A
 23. HSPA9B    20      МОРТАЛИН 2, БЕЛОК ТЕПЛОВОГО ШОКА 9B, АПОПТОЗ
 24. NDUFA2    3       NADH-ДЕГИДРОГЕНАЗА,  A-СУБЪКОМПЛЕКС 2,   8 КДА
 25. LOC731353 1       ПОДОБЕН ГЛИЦИН-РАЗРУШАЮЩЕЙ СИСТЕМЕ
 26. KIAA0141  16      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 27. NR3C1     158     ЯДЕРНЫЙ ГЛЮКОКОРТИКОИДНЫЙ РЕЦЕПТОР
 28. GRPEL2    10      БЕЛКОВ УКЛАДЧИК , ГОМОЛОГ E. COLI
 29. PPARGC1B  117     ПЕРОКСИСОМ РЕЦЕПТОРА АКТИВАТОР, МТ ОРГАНИЗАЦИЯ И БИОГЕНЕЗ
                ЭСТРОГЕН-РЕЦЕПТОР
 30. MRPL22    26      БЕЛОК РИБОСОМ L22
 31. SFXN1     60      СИДЕРОФЛЕКСИН 1, ТРАНСПОРТ FE
 32. AGXT2     50      АЛАНИН-ГЛИОКСИЛАТ-АМИНОТРАНСФЕРАЗА 2
 33. OXCT1     140     3-ОКСОАЦИД-КОА-ТРАНСФЕРАЗА 1
 34. NNT       103     НИКОТИНАМИД-НУКЛЕОТИД-ТРАНСГИДРОГЕНАЗА
 35. MRPS30    7       БЕЛОК РИБОСОМ S30
 36. NDUFS4    123     NADH-ДЕГИДРОГЕНАЗА, FE-S БЕЛОК 4,  18 КДА
 37. MIMITIN   208     MIC-ИНДУКТОР БЕЛОК
 38. NLN       102     НЕВРОЛИЗИН, МЕТАЛЛО-ЭНДО-ПЕПТИДАЗА
 39. MRPS36    16      БЕЛОК РИБОСОМ S36
 40. LOC90624  31      ОКСИДОРЕДУКТАЗА , ГИПОТЕТИЧЕСКИЙ БЕЛОК

    ХРОМОСОМА 6
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. C6ORF149  153     ГИПОТЕТИЧЕСКИЙ БЕЛОК, ОКСИДОРЕДУКТАЗА
  2. MCCD1     1       ДВУХСПИРАЛЬНЫЙ ЗАВИТОК ДОМЕН 1
  3. HSPA1B    2       70 КДА БЕЛОК ТЕПЛОВОГО ШОКА 1B
  4. BAK1      7       BLC2-АНТАГОНИСТ-КИЛЛЕР1, АПОПТОЗНЫЕ ИЗМЕНЕНИЯ МИТОХОНДРИЙ
  5. MTCH1     18      ТРАНСПОРТЕР, АПОПТОЗ-ПРЕСЕНИЛИН СВЯЗАННЫЙ, ГОМОЛОГ 1 C. EL.
  6. MRPS10    11      БЕЛОК РИБОСОМ S10
  7. MRPL2     5       --            L2
  8. C6ORF206  26      MRPS18A ПОДОБЕН
  9. MRPS18A   17      БЕЛОК РИБОСОМ S18A
 10. MRPL14    14      --            L14
 11. SLC25A27  24      ПЕРЕНОСЧИК
 12. MUT       32      МЕТИЛ-МАЛОНИЛ-КОА-МУТАЗА
 13. MRPL18    8       БЕЛОК РИБОСОМ L18
 14. MRPS18B   8       --            S18B
 15. SOD2      14      СУПЕРОКСИД-ДИСМУТАЗА 2
 16. TFB1M     67      ТРАНСКРИПЦИИ ФАКТОР B1, ПРОЦЕССИНГ РРНК
 17. BPHL      34      ПОДОБЕН БИФЕНИЛ-ГИДРОЛАЗЕ
 18. LOC442155 1       ПОДОБЕН ФАКТОРУ ТРАНСКРИПЦИИ B2
 19. FARS2     511     ФЕНИЛАЛАНИН-ТРНК-СИНТЕТАЗА 2
 20. MRS2L     23      ФАКТОР ГОМЕОСТАЗА МАГНИЯ, ГОМОЛОГ S. CEREVIS.
 21. ALDH5A1   43      АЛЬДЕГИД-ДЕГИДРОГЕНАЗА, СЕМЕЙСТВО 5, ЧЛЕН A1
 22. MTO1      39      ФАКТОР ОПТИМИЗАЦИИ ТРАНСЛЯЦИИ 1, ГОМОЛОГ S. CEREVIS.
 23. COX7A2    6       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 7A, ПОЛИПЕПТИД 2
 24. BCKDHB    240     РАЗВЕТВЛЕННЫХ ЦЕПЕЙ КЕТОКИСЛОТ-ДЕГИДРОГЕНАЗА E1, B-ПЕПТИД
                БОЛЕЗНЬ КЛЕНОВОГО СИРОПА
 25. DJ12208   2       ГИПОТЕТИЧЕСКИЙ БЕЛОК, ОКСИДОРЕДУКТАЗА
 26. COQ3      24      КОЭНЗИМ-Q3 ГОМОЛОГ S. CEREVIS. МЕТИЛ-ТРАНСФЕРАЗА, УБИХИНОН
 27. RTN4IP1   57      РЕТИКУЛОН 4 БЕЛОК-ПОСРЕДНИК 1
 28. RAB32     12      RAS-СЕМЕЙСТВО, ГТФ-АЗА
 29. MTHFD1L   236     МЕТИЛЕН-ТЕТРАГИДРОФОЛАТ-ДЕГИДРОГЕНАЗА ПОДОБЕН 1
 30. MTRF1L    15      ФАКТОР ТРАНСЛЯЦИИ

   



                92
ХРОМОСОМА 7
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ


                117
  1. MRPS17    3        БЕЛОК РИБОСОМ S17
  2. GBAS      35       АМПЛИФИЦИРОВАННАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ГЛИОБЛАСТОМЫ,
                ГОМОЛОГ 2 NIPSNAP
  3. MDH2      19       МАЛАТ-ДЕГИДРОГЕНАЗА
  4. FIS1      6        ФАКТОР ДЕЛЕНИЯ 1, АПОПТОЗ, ГОМОЛОГ S. CEREVIS. , TTC11
  5. PMPCB     18       B-ПЕПТИДАЗА, МИТОХОНДРИЙ ПРОЦЕССИНГ
  6. DLD       30       ДИГИДРОЛИПОАМИД-ДЕГИДРОГЕНАЗА
  7. IMMP2L    901      ВНУТРЕНЕЙ МЕМБРАНЫ МТ ПРОТЕАЗА 2 ПОДОБНАЯ, ГОМОЛОГ
                S. CEREVIS.
  8. AASS      58       АМИНОАДИПАТ-СЕМИАЛЬДЕГИД-СИНТАЗА
  9. NDUFA5    17       NADH-ДЕГИДРОГЕНАЗА, 13 КДА A-СУБКОМПЛЕКС 5
 10. CHCHD3    297      ДОМЕН 3 ДВУХСПИРАЛЬНЫХ ЗАВИТКОВ
 11. LOC641857 -        NDP-СИНТАЗЕ ПОДОБЕН
 12. NDUFB2    10       NADH-ДЕГИДРОГЕНАЗА, 8 КДА B-СУБКОМПЛЕКС 2
 13. MRPS33    9        БЕЛОК РИБОСОМ S33
 14. SSBP1     12       БЕЛОК СВЯЗЫВАЮЩИЙ ОДНОЦЕПОЧНУЮ ДНК
 15. GIMAP5    6        IMAP-СЕМЕЙСТВО, ЧЛЕН 5, ГТФ-АЗА, ИММУНИТЕТ
 16. ABCB8     17       АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА
 17. ABCF2     19       ------
 18. C7ORF23   23       ГИПОТЕТИЧЕСКИЙ БЕЛОК
 19. MCFP      40       ТРАНСПОРТ
 20. MTERF     8        ФАКТОР ТЕРМИНАЦИИ ТРАНСКРИПЦИИ
 21. PDK4      13       КИНАЗА ПИРУВАТ-ДЕГИДРОГЕНАЗЫ
 22. SLC25A13  202      ПЕРЕНОСЧИК, ЦИТРИН
 23. ACN9      65       ACN9-ГОМОЛОГ S. CEREVIS.
 24. ATP5J2    8        АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СУБЪЕДИНИЦА F2
 25. NDUFA4    7        NADH-ДЕГИДРОГЕНАЗА, 9 КДА A-СУБКОМПЛЕКС 4
 26. TOMM7     10       БЕЛКОВ ТРАНСПОРТЕР
 27. CYCS      7        ЦИТОХРОМ-С СОМАТИЧЕСКИЙ, АПОПТОЗ
 28. HIBADAH   137      3-ГИДРОКСИ-ИЗОБУТИРАТ-ДГ, ПЕНТОЗО-ФОСФАТНЫЙ ШУНТ
 29. MRPL32    5        БЕЛОК РИБОСОМ L32
 30. MRPS24    3        БЕЛОК РИБОСОМ S24
 31. OGDH      103      ОКСО-ГЛУТАРАТ-ДЕГИДРОГЕНАЗА
 32. LOC730306 2        GRPE-БЕЛОК ГОМОЛОГ 1

    ХРОМОСОМА 8
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. LOC647337 -        ПОДОБЕН ИЗОЛЕЙЦИН-ТРНК-СИНТЕТАЗЕ
  2. DECR1     51       2, 4-ДИЕНОЛ-КОА-РЕДУКТАЗА 1
  3. PPM2C     9        ПРОТЕИН-ФОСФАТАЗА 2C
  4. UQCRB     5        УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗУ СВЯЗЫВАЮЩИЙ БЕЛОК
  5. COX6C     16       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6C
  6. SLC25A32  17       ПЕРЕНОСЧИК ФОЛАТА
  7. MRPL13    50       БЕЛОК РИБОСОМ L13
  8. NDUFB9    11       NADH-ДЕГИДРОГЕНАЗА, 22 КДА, B-СУБКОМПЛЕКС 9
  9. CYP11B1   8        ЦИТОХРОМ P-450, СЕМЕЙСТВО 11, СУБСЕМЕЙСТВО B, ПОЛИПЕПТИД 1
 10. CYP11B2   7        ПОЛИПЕПТИД 2,  МЕТАБОЛИЗМ СТЕРОИДОВ
 11. TOP1MT    27       ТОПОИЗОМЕРАЗА ДНК 1, МИТОХОНДРИАЛЬНАЯ
 12. CYC1      3        ЦИТОХРОМ C 1
 13. MTUS1     158      БЕЛОК ПОСРЕДНИК AT2-РЕЦЕПТОРА, ОПУХОЛИ СУПРЕССОР 1
 14. SLC25A37  44       ПЕРЕНОСЧИК
 15. BNIP3L    30       BCL2-АДЕНОВИРУСА E1B 19 КДА БЕЛКУ ПОСРЕДНИКУ 3 ПОДОБНЫЙ
 16. DCTN6     28       ДИНАКТИН 6, RGD-СОДЕРЖАЩИЙ БЕЛОК, ОРГАНИЗАЦИЯ И БИОГЕНЕЗ МТ
 17. GSR       49       ГЛУТАТИОН-РЕДУКТАЗА
 18. STAR      8        РЕГУЛЯТОР СРОЧНОГО СТЕРОИДОГЕНЕЗА
 19. VDAC3     14       ВОЛЬТАЖ-ЗАВИСИМЫЙ-АНИОН-КАНАЛ 3
 20. MRPL15    13       БЕЛОК РИБОСОМ L13
 21. MTFR1     66       МИТОХОНДРИЙ РЕГУЛЯТОР ДЕЛЕНИЯ 1
 22. MRPS28    111      БЕЛОК РИБОСОМ S28

    ХРОМОСОМА 9
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. FXN       40       ФРАТАКСИН, СИНАПСЫ, АТАКСИЯ
  2. LOC645225 -        ПОДОБЕН АТФ-СИНТАЗЕ, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СЕ F2
  3. AUH       148      AU-RNA СВЯЗЫВАЮЩАЯ, ЕНОЛ-КОА-ГИДРАТАЗА, КАТАБОЛИЗМ МРНК
  4. MRPL50    9        БЕЛОК РИБОСОМ L50
  5. NDUFA8    16       NADH-ДЕГИДРОГЕНАЗА, 19 КДА , СУБЪЕДИНИЦА A8
  6. MRRF      58       РЕЦИКЛИНГ-ФАКТОР РИБОСОМ
  7. FPGS      12       ФОЛИЛ-ПОЛИГЛУТАМАТ-СИНТАЗА
  8. SLC25A25  41       ПЕРЕНОСЧИК, МЫШЦ РАЗВИТИЕ
  9. ENDOG     4        ЭНДОНУКЛЕАЗА G

                93
 10. CRAT      16       КАРНИТИН-АЦИЛ-ТРАНСФЕРАЗА
 11. SARDH     76       САРКОЗИН-ДЕГИДРОГЕНАЗА
 12. MRPS2     4        БЕЛОК РИБОСОМ S2
 13. PMPCA     13       A-ПЕПТИДАЗА, МАТРИКСА ПРОЦЕССИНГ
 14. MRPL41    1        БЕЛОК РИБОСОМ L41
 15. AK3       33       АДЕНИЛАТ-КИНАЗА 3
 16. GLDC      113      ГЛИЦИН-ДЕГИДРОГЕНАЗА
 17. NDUFB6    19       NADH-ДЕГИДРОГЕНАЗА, 17 КДА B-СУБКОМПЛЕКС 6
 18. FLG20245  5        ГИПОТЕТИЧЕСКИЙ БЕЛОК
 19. ALDH1B1   6        АЛЬДЕГИД-ДЕГИДРОГЕНАЗА СЕМЕЙСТВО 1, ЧЛЕН B 1
 20. LOC286239 1        ПОДОБЕН МАЛИК-ЭНЗИМУ NAD

    ХРОМОСОМА 10
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. ALDH18A1  51      АЛЬДЕГИД-ДЕГИДРОГЕНАЗА, СЕМЕЙСТВО 18, ЧЛЕН А1
  2. C10ORF28  110     ГИПОТЕТИЧЕСКИЙ БЕЛОК, РОСТА ИНГИБИТОР
  3. SLC25A28  10      ПЕРЕНОСЧИК
  4. COX15     22      ЦИТОХРОМ-С-ОКСИДАЗУ СОБИРАЮЩИЙ БЕЛОК
  5. NDUFB8    6       NADH-ДЕГИДРОГЕНАЗА, 19 КДА B-СУБКОМПЛЕКС 8
  6. MRPL43    1       БЕЛОК РИБОСОМ L43
  7. PEO1      7       ПРОГРЕССИВНАЯ ВНЕШНЯЯ ОФТАЛЬМОПЛЕГИЯ 1, ХЕЛИКАЗА
  8. SFXN2     24      СИДЕРОФЛЕКСИН 2
  9. GPAM      33      ГЛИЦЕРОЛ-3-ФОСФАТ-АЦИЛ-ТРАНСФЕРАЗА
 10. CASP7     51      КАСПАЗА 7, ЦИСТЕИН-ПЕПТИДАЗА АПОПТОЗА
 11. LOC390007 2       ПОДОБЕН РЕЦЕПТОРУ ВВОДА, ГОМОЛОГ ТРАНСЛОКАЗЫ TOM22
 12. SFXN4     25      СИДЕРОФЛЕКСИН 4
 13. PRDX3     11      ПЕРОКСИРЕДОКСИН 3, АНТИОКСИДАНТ
 14. ACADSB    50      АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, КОРОТКИХ ВЕТВЕЙ ЦЕПИ
 15. OAT       22      ОРНИТИН-АМИНО-ТРАНСФЕРАЗА
 16. BNIP3     14      BCL2 И АДЕНОВИРУСА E1B 19 КДА БЕЛОК ПОСРЕДНИК 3, АПОПТОЗ
 17. MTG1      26      ГТФ-АЗА  1, ГОМОЛОГ S. CEREVIS.
 18. ECHS1     10      ЕНОЛ-КОА-ГИДРАТАЗА КОРОТКИХ ЦЕПЕЙ 1
 19. ATP5C1    20      АТФ-СИНТАЗА, H-ТРАНСПОРТ, F1-КОМПЛЕКС ГАММА, ПОЛИПЕПТИД 1
 20. LOC650237 3       PCD-БЕЛКУ 8 ПОДОБЕН, АПОПТОЗ
 21. MSRB2     25      МЕТИОНИН-СУЛЬФОКСИД-РЕДУКТАЗА B2
 22. YME1L1    44      ПРОТЕАЗА, ГОМОЛОГ S. CEREVIS.
 23. PAPD1     37      ПОЛИ-А-ПОЛИМЕРАЗА СВЯЗАННЫЙ ДОМЕН 1
 24. ZCD1      19      ZN-СВЯЗЫВАЮЩИЙ ФАКТОР, ГЕМОПОЭТИН
 25. TFAM      11      ФАКТОР ТРАНСКРИПЦИИ А
 26. SLC25A16  46      ПЕРЕНОСЧИК
 27. SUPV3L1   28      СУПРЕССОР VAR1, 3 ПОДОБНЫЙ, ХЕЛИКАЗА, ГОМОЛОГ S. CEREVIS.
 28. AMID      21      АПОПТОЗ ИНДУЦИРУЮЩИЙ ФАКТОР АССОЦИИРОВАННЫЙ С МТ
                ДИСУЛЬФИД-ОКСИДОРЕДУКТАЗА
 29. MRPS16    4       БЕЛОК РИБОСОМ S16
 30. VDAC2     20      ВОЛЬТАЖ-ЗАВИСИМЫЙ АНИОН КАНАЛ 2
 31. PPIF      8       ПЕПТИДИЛ-ПРОЛИЛ-ИЗОМЕРАЗА F. ЦИКЛОФИЛИН
 32. GLUD1     44      ГЛУТАМАТ-ДЕГИДРОГЕНАЗА 1
 33. TIMM23    31      ТРАНСЛОКАЗА БЕЛКОВ
 34. ASAH2     61      N-АЦИЛ-СФИНГОЗИН-АМИДОГИДРОЛАЗА 2, ЦЕРАМИДАЗА
 35. LOC644567 6       ПОДОБЕН ГЛУТАМАТ-ДЕГИДРОГЕНАЗЕ 1
 36. LOC653252 18      ПОДОБЕН TIMM23
 37. LOC643580 11      ПОДОБЕН ГЛУТАМАТ-ДЕГИДРОГЕНАЗЕ 1, MRG2
 38. LOC643828 28      ----
 39. LOC644011 28      ----

    ХРОМОСОМА 11
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. LOC390239 1       ПОДОБЕН NADH-ДЕГИДРОГЕНАЗЕ, СУБКОМПЛЕКС B, СУБЪЕДИНИЦА 11
  2. ACAT1     26      АЦЕТИЛ-КОА-АЦЕТИЛ-ТРАНСФЕРАЗА
  3. FDX1      35      ФЕРРЕДОКСИН 1
  4. PPP2R1B   40      ПРОТЕИН-ФОСФАТАЗА 2, РЕГУЛЯТОРНАЯ СУБЪЕДИНИЦА А, ИЗОФОРМА В
  5. DLAT      38      ДИГИДРОЛИПОАМИД-S-АЦЕТИЛ-ТРАНСФЕРАЗА, ПВК-ДГ КОМПЛЕКС
  6. TIMM8B    2       ТРАНСПОРТЕР БЕЛКОВ
  7. SDHD      9       СУКЦИНАТ-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС, СУБЪЕДИНИЦА D
  8. REXO2     10      РНК-ЭКЗОНУКЛЕАЗА 2, ГОМОЛОГ S. CEREVIS.
  9. ATP5L     9       АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА G
 10. ACAD8     12      АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, 8 ЧЛЕН СЕМЕЙСТВА
 11. FXC1      2       FRACTURE CALUS ГОМОЛОГ 1 КРЫСЫ, БЕЛКОВ ТРАНСПОРТ, АДГЕЗИЯ
 12. LOC644169 1       ПОДОБЕН VDAC1, ПОРИН
 13. LOC654244 3       ПОДОБЕН ПЕРЕНОСЧИКУ БЕЛКА
 14. MRPL17    1       БЕЛОК РИБОСОМ L17
 15. IMMP1L    77      ВНУТРЕННЕЙ МЕМБРАНЫ ПЕПТИДАЗА
 16. PDHX      80      ПВК-ДЕГИДРОГЕНАЗНЫЙ КОМПЛЕКС , КОМПОНЕНТ X
 17. NDUFS3    6       NADH-ДЕГИДРОГЕНАЗА, FE-S 30 КДА БЕЛОК 3
 18. MTCH2     30      ПЕРЕНОСЧИК ГОМОЛОГ C. ELEG.
 19. LOC653698 2       ПОДОБЕН ПЕРЕНОСЧИКУ БЕЛКА

                94
 20. SIRT3     21      СИРТУИН 3, ADP-РИБОЗИЛИРОВАНИЕ БЕЛКОВ, ПОКОЙ ХРОМАТИНА
 21. TIMM10    3       ТРАНСЛОКАЗА БЕЛКА
 22. GLYAT     23      ГЛИЦИН-N-АЦЕТИЛ-ТРАНСФЕРАЗА
 23. MRPL16    5       БЕЛОК РИБОСОМ L16
 24. COX8A     2       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 8A
 25. BAD       15      BCL2-АНТАГОНИСТ СМЕРТИ
 26. PRDX5     4       ПЕРОКСИРЕДОКСИН 5
 27. MRPL49    5       БЕЛОК РИБОСОМ L49
 28. LOC283130 7       ГИПОТЕТИЧЕСКИЙ БЕЛОК, ТРАНСПОРТ
 29. FIBP      4       ФАКТОР РОСТА ФИБРОБЛАСТОВ
 30. MRPL11    3       БЕЛОК РИБОСОМ L11
 31. PC        106     ПИРУВАТ-КАРБОКСИЛАЗА
 32. NDUFV1    6       NADH-ДЕГИДРОГЕНАЗА 51 КДА ФЛАВОБЕЛОК 1
 33. NUDT8     2       NUDIX8
 34. NDUFS8    6       NADH-ДЕГИДРОГЕНАЗА, FE-S 23 КДА БЕЛОК 8
 35. CPT1A     61      КАРНИТИН-ПАЛЬМИТОИЛ-ТРАНСФЕРАЗА 1A
 36. MRPL21    15      БЕЛОК РИБОСОМ L21
 37. MRPL48    77      --            L48
 38. UCP2      9       РАЗОБЩАЮЩИЙ БЕЛОК 2, ПРОТОНА ТРАНСПОРТ
 39. UCP3      9       ---               3
 40. LOC387791 13      ПОДОБЕН РЕЦЕПТОРУ ВВОДА, ГОМОЛОГ TOM20
 41. NDUFC2    12      NADH-ДЕГИДРОГЕНАЗА 1, СУБКОМПЛЕКС 2,  РАЗМЕР 14, 5 КДА
 42. NARS2     139     АСПАРАГИН-ТРНК-СИНТЕТАЗА 2
 43. ME3       232     МАЛИК-ЭНЗИМ 3, NADP
 44. SLC25A22  6       L-ГЛУТАМАТ ПЕРЕНОСЧИК
 45. MRPL23    9       БЕЛОК РИБОСОМ L23
 46. LOC441609 -       ПОДОБЕН KCIP1
 47. P53AIP1   8       P53- РЕГУЛИРУЮЩИЙ, АПОПТОЗ ИНДУЦИРУЮЩИЙ БЕЛОК 1

    ХРОМОСОМА 12
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. COQ10A    4       КОЭНЗИМ-Q10 ГОМОЛОГ А
  2. UNG       13      УРАЦИЛ-ДНК-ГЛИКОЗИЛАЗА
  3. TSFM      15      РЕГУЛЯТОР ТРАНСЛЯЦИИ ЭЛОНГАЦИИ ФАКТОР
  4. NDUFA12   32      NADH-ДГ 1,   13 КДА А-СУБКОМПЛЕКС 12, ДИФФЕРЕНЦИРОВКА
  5. DNM1L     65      ОРГАНИЗАЦИИ И БИОГЕНЕЗА МЕМБРАНЫ МТ ДИНАМИН 1 ПОДОБНЫЙ
  6. VAMP1     9       СИНАПТОБРЕВИН 1, С ВЕЗИКУЛАМИ АССОЦИАЦИЯ БЕЛОК МЕМБРАН 1
  7. COX6A1    3       ОКСИДАЗА ЦИТОХРОМА-С, СУБЪЕДИНИЦА 6А, ПОЛИПЕПТИД 1
  8. ATP5B     8       B-ПОЛИПЕПТИД АТФ-СИНТАЗЫ, H-ТРАНСПОРТ, F1 КОМПЛЕКС
  9. SUOX      8       МЕТИОНИН-СУЛЬФИТ-ОКСИДАЗА
 10. NDUFA9    38      NADH-ДЕГИДРОГЕНАЗА, 39 КДА 1А СУБКОМПЛЕКС 9
 11. ACADS     14      АЦИЛ-КОА-ДЕГИДРОГЕНАЗА, КОРОТКАЯ ЦЕПЬ
 12. CYP27B1   5       ВИТАМИНА Д БИОСИНТЕЗ, ЦИТОХРОМ P-450, СЕМЕЙСТВО 27B1
 13. MTERFD3   10      ТРАНСКРИПЦИИ ТЕРМИНАТОР
 14. LOC144363 1       ОКСИДОРЕДУКТАЗА,  ГИПОТЕТИЧЕСКИЙ БЕЛОК
 15. MRPS35    45      РИБОСОМ БЕЛОК, ДЕТЕКЦИЯ ДНК ПОВРЕЖДЕНИЙ
 16. ATP5G2    12      АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СУБЪЕДИНИЦА С2
 17. CS        28      ЦИТРАТ-СИНТЕТАЗА
 18. GLS2      18      ГЛУТАМИНАЗА 2, ЛЕГКИЕ
 19. LOC644745 3       ПОДОБЕН 60 КДА БЕЛКУ ТЕПЛОВОГО ШОКА, ШАПЕРОНИН
 20. SHMT2     5       СЕРИН-ГИДРОКСИМЕТИЛ-ТРАНСФЕРАЗА 2
 21. MON2      126     MON2-ГОМОЛОГ S. CEREVIS.
 22. LOC645328 3       ПОДОБЕН БЕЛКУ РИБОСОМ L40
 23. MRPL42    35      РИБОСОМ БЕЛОК L42
 24. LOC283398 4       ПОДОБЕН СУКЦИНИЛ-КОА-ЛИГАЗЕ, ЦЕПЬ B
 25. SLC25A3   9       ПЕРЕНОСЧИК ФОСФАТ-ИОНА
 26. CRY1      102     КРИПТОХРОМ 1, ПОДОБЕН ДНК-ФОТОЛИАЗЕ, ЦИРКАДИАННЫЙ РИТМ
 27. LOC644203 10      ПОДОБЕН ГЛУТАРИЛ-КОА-ДЕГИДРОГЕНАЗЕ
 28. NIFUN     7       ПОДОБЕН ФИКСАТОРУ АЗОТА, FE-S
 29. MMAB      18      МЕТИЛ-МАЛОНАТ АЦИДУРИЯ, КОБАЛАМИН ЗАВИСИМАЯ АДЕНОЗИЛ-ТА
 30. ALDH2     44      АЛЬДЕГИД-ДЕГИДРОГЕНАЗА 2, АЛКОГОЛЬ
 31. COQ5      26      КОЭНЗИМ-Q5 ГОМОЛОГ, S-АДЕНОЗИЛМЕТИОНИН-МЕТИЛ-ТРАНСФЕРАЗА
 32. DIABLO    18      ДЬЯВОЛ, АКТИВАТОР КАСПАЗ, ГОМОЛОГ D. MELAN.
 33. MRPL51    1       РИБОСОМ БЕЛОК L51
 34. LOC731007 3       ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ
 35. YARS2     10      ТИРОЗИН-ТРНК-СИНТЕТАЗА 2
 36. LOC659538 8       ПОДОБЕН АСПАРТАТ-АМИНО-ТРАНСФЕРАЗЕ
 37. MGST1     17      МИКРОСОМАЛЬНАЯ ГЛУТАТИОН-S-ТРАНСФЕРАЗА 1
 38. LOC390298 1       ПОДОБЕН ТРАНСЛОКАЗЕ TIM17B
 39. LOC645619 3       ПОДОБЕН АДЕНИЛАТ-КИНАЗЕ 4
 40. LOC653324 1       ПОДОБЕН АТФ-СИНТАЗЕ, H-ТРАНСПОРТ, F0 КОМПЛЕКС, СЕ F2B

    ХРОМОСОМА 13
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. PCCA      441      ПРОПИОНИЛ-КОА-КАРБОКСИЛАЗА А-ПОЛИПЕПТИД
  2. LOC390424 -        ПОДОБЕН АТФ-СИНТАЗЕ ЛИПИД-СВЯЗЫВАЮЩИЙ БЕЛОК

                95
  3. MRP63     3        БЕЛОК РИБОСОМЫ 63
  4. MIPEP     159      ПЕПТИДАЗА-ПОСРЕДНИК , БЕЛКОВ ПРОЦЕССИНГ
  5. MTIF3     15       ФАКТОР ИНИЦИАЦИИ ТРАНСЛЯЦИИ 3
  6. LOC122038 -        ПОДОБЕН ТРАНСЛОКАЗЕ TIM22 ГОМОЛОГ
  7. LOC647298 2        ПОДОБЕН 60KDA БЕЛКУ ТЕПЛОВОГО ШОКА
  8. MRPS31    41       БЕЛОК РИБОСОМЫ S31
  9. SLC25A15  20       L-ОРНИТИНА ПЕРЕНОСЧИК , ЦИКЛ МОЧЕВИНЫ
 10. MTRF1     47       ФАКТОР 1 ОСВОБОЖДЕНИЯ ТРАНСЛЯЦИИ
 11. KIAA0564  394      УКЛАДЧИК БЕЛКОВ
 12. LOC341651 4        ПОДОБЕН ФУМАРАТ-ГИДРАТАЗЕ
 13. SLC25A30  23       ПЕРЕНОСЧИК РАСТВОРОВ, ПОЧКИ
 14. LOC652170 2        ПОДОБЕН ЦИТОХРОМ-С-ОКСИДАЗЕ СУБЪЕДИНИЦА 4 ИЗОФОРМА 1
 15. SUCLA2    59       СУКЦИНАТ-КОА-ЛИГАЗА АДФ B-СУБЪЕДИНИЦА

    ХРОМОСОМА 14
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. OXA1L     5        ОКСИДАЗЫ ЦИТОХРОМА-С СБОРЩИК 1 ПОДОБНЫЙ
  2. MRPL52    5        БЕЛОК РИБОСОМЫ L52
  3. BCL2L2    5        BCL2 ПОДОБНЫЙ 2, АНТИАПОПТОЗ, СПЕРМАТОГЕНЕЗ
  4. DHRS4     18       ДЕГИДРОГЕНАЗА-РЕДУКТАЗА NADP SDR-СЕМЕЙСТВО ЧЛЕН 4
  5. PCK2      9        ФОСФО-ЕНОЛ-ПИРУВАТ-КАРБОКСИКИНАЗА 2
  6. SLC25A21  493      ПЕРЕНОСЧИК ОКСОДИКАРБОКСИЛАТОВ
  7. LOC644589 -        ПОДОБЕН ТРАНСЛОКАЗЕ TIMM
  9. L2HGDH    66       L-2-ГИДРОКСИГЛУТАРАТ-ДЕГИДРОГЕНАЗА
 10. LOC647340 1        ПОДОБЕН АТФ-СИНТАЗЕ F1-КОМПЛЕКС ГАММА ИЗОФОРМА H, СЕРДЦЕ
 11. UNQ9438   12       ПОДОБЕН TIMM9
 12. TIMM9     19       ТРАНСЛОКАЗА БЕЛКОВ
 13. ESR2      112      ЭСТРОГЕН РЕЦЕПТОР 2
 14. MTHFD1    71       МЕТИЛЕН-ТЕТРАГИДРОФОЛАТ-ДЕГИДРОГЕНАЗА
 15. ARG2      32       АРГИНАЗА 2, ОКИСЬ АЗОТА БИОСИНТЕЗ, ЦИКЛ МОЧЕВИНЫ, ПОЧКИ
 16. SYNJ2BP   45       СИНАПТОДЖАНИН 2 СВЯЗИ БЕЛОК, ПОСРЕДНИК АКТИВИН-РЕЦЕПТОРА
 17. PSEN1     84       ПРЕСЕНИЛИН 1, ПРОТЕОЛИЗ, БЕЛКОВ ПРОЦЕССИНГ, АЛЬЦГЕЙМЕР 3
 18. ACOT2     6        АЦИЛ-КОА-ТИОЭСТЕРАЗА 2
 19. ALDH6A1   24       АЛЬДЕГИД-ДЕГИДРОГЕНАЗА СЕМЕЙСТВА 6 ЧЛЕН А1
 20. DLST      22       ДИГИДРОЛИПОАМИД-S-СУКЦИНИЛ-ТРАНСФЕРАЗА
 21. GSTZ1     11       ГЛУТАТИОН-ТРАНСФЕРАЗА Z1 , АРОМАТИЧЕСКИХ АМИНОКИСЛОТ ОБМЕН
 22. C14ORF159 110      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 23. NDUFB1    6        NADH-ДЕГИДРОГЕНАЗА B1 СУБКОМПЛЕКС 1,   7 КДА
 24. COX8C     1        ЦИТОХРОМ-С-ОКСИДАЗА СУБЪЕДИНИЦА 8С
 25. LOC341965 1        VDAC 3 ПОДОБНЫЙ АНИОН-КАНАЛ
 26. SLC25A29  16       КАРНИТИН И АЦИЛКАРНИТИН-ТРАНСЛОКАЗЕ ПОДОБЕН
 27. C14ORF68  7        ТРАНСПОРТНЫЙ БЕЛОК
 28. C14ORF2   9        ГИПОТЕТИЧЕСКИЙ БЕЛОК
 29. LOC122867 1        ПОДОБЕН ЦИТОХРОМ-С-ОКСИДАЗЕ СУБЪЕДИНИЦА 4
 30. LOC646121 1        ПОДОБЕН АТФ-СИНТАЗЕ А-ЦЕПЬ

    ХРОМОСОМА 15
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. MRPL46    7       БЕЛОК РИБОСОМ L46
  2. MRPS11    10      БЕЛОК РИБОСОМ S11, ПОВРЕЖДЕНИЯ ДНК
  3. POLG      19      ДНК-ПОЛИМЕРАЗА ГАММА, РЕПАРАЦИЯ , РЕПЛИКАЦИЯ
  4. IDH2      19      ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 2, NADP
  5. IVD       13      ИЗОВАЛЕРИЛ-КОА-ДЕГИДРОГЕНАЗА
  6. CKMT1B    7       КРЕАТИН-КИНАЗА 1B
  7. CKMT1A    6       ---            1A
  8. LOC645229 1       ПОДОБЕН АТФ-СВЯЗЫВАЮЩЕЙ КАССЕТЕ, СЕМЕЙСТВО B10
  9. IDH3A     21      ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 3A, NAD
 10. GATM      31      ГЛИЦИН-АМИДИНО-ТРАНСФЕРАЗА
 11. SQRDL     56      СУЛЬФИД-ХИНОН-РЕДУКТАЗЕ ПОДОБЕН
 12. DUT       12      ДЕЗОКСИ-УТФ-ПИРОФОСФАТАЗА
 13. BCL2L10   3       BCL2-ПОДОБЕН 10, ДЛЯ АПОПТОЗА, ЖЕНСКИХ ГАМЕТ ГЕНЕРАЦИЯ
 14. LACTB     20      B-ЛАКТАМАЗА, БЕЛОК L56
 15. KIAA0101  16      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 16. MTFMT     27      МЕТИОНИЛ-ТРНК-ФОРМИЛ-ТРАНСФЕРАЗА
 17. CLPX      35      КАЗЕИН ПЕПТИДАЗА X, ГОМОЛОГ E. COLI, ТРАНСПОРТ, УКЛАДКА БЕЛКОВ
 18. CYP11A1   28      ЦИТОХРОМ P-450, СЕМЕЙСТВО 11A, ПОЛИПЕПТИД 1
 19. COX5A     18      ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 5A
 20. IMP3      2       IMP3 ГОМОЛОГ, МЯ-РНК, РРНК ПРОЦЕССИНГ, БЕЛОК РИБОСОМ S4
 21. ETFA      95      ЭЛЕКТРОН-ПЕРЕНОСЯЩИЙ-ФЛАВОБЕЛОК, A-ПОЛИПЕПТИД

    ХРОМОСОМА 16
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. LOC645443 3       ПОДОБЕН АТФ-СИНТАЗЕ А-ЦЕПЬ
  2. DHODH     17      ДИГИДРООРОТАТ-ДЕГИДРОГЕНАЗА, СИНТЕЗ ПИРИМИДИНОВ
  3. LDHD      5       ЛАКТАТ-ДЕГИДРОГЕНАЗА D

                96
  4. KARS      20      ЛИЗИЛ-ТРНК-СИНТЕТАЗА
  5. LOC124496 1       ПОДОБЕН АТФ-СИНТАЗЕ, B-ЦЕПЬ
  6. WWOX      370     WW-ДОМЕН СОДЕРЖАЩИЙ ОКСИДОРЕДУКТАЗЫ
  7. GCSH      13      ГЛИЦИН-РАСЩЕПЛЯЮЩЕЙ СИСТЕМЫ БЕЛОК-H, АМИНОМЕТИЛ-ПЕРЕНОСЧИК
  8. MLYCD     17      МАЛОНИЛ-КОА-ДЕКАРБОКСИЛАЗА
  9. COX4NB    21      COX4-СОСЕД, ФУНКЦИЯ НЕИЗВЕСТНА
 10. COX4I1    7       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 4, ИЗОФОРМА 1
 11. CA5A      48      АНГИДРАЗА УГОЛЬНОЙ КИСЛОТЫ 5A
 12. LOC731439 19      ПОДОБЕН АНГИДРАЗЕ УГОЛЬНОЙ КИСЛОТЫ
 13. CYBA      8       ЦИТОХРОМ B-245, А-ПОЛИПЕПТИД, МЕТАБОЛИЗМ СУПЕРОКСИДА
 14. SPG7      49      СПАСТИЧЕСКАЯ ПАРАПЛЕГИЯ 7, ПРОТЕОЛИЗ, АДГЕЗИЯ, ЦНС РАЗВИТИЕ
 15. AFG3L1    24      АТФ-АЗА СЕМЕЙСТВА 3, ПОДОБЕН 1
 16. MRPL28    3       БЕЛОК РИБОСОМ L28, МЕЛАНОМЫ АНТИГЕН
 17. NME4      3       НЕМЕТАСТАТИЧЕСКИЕ КЛЕТКИ 4, НУКЛЕОЗИД-ДИФОСФАТ-КИНАЗА 4
 18. MRPS34    2       БЕЛОК РИБОСОМ S34
 19. RHOT2     6       RAS-ГОМОЛОГ, СЕМЕЙСТВО T2, ГТФ-АЗА, СИГНАЛ-ТРАНСДУКТОР
 20. NDUFB10   2       NADH-ДЕГИДРОГЕНАЗА 1, B-СУБКОМПЛЕКС 10,   22 КДА
 21. DCI       12      ДОДЕЦЕНОЛ-КОА-ДЕЛЬТА-ИЗОМЕРАЗА
 22. TRAP1     59      TFN-РЕЦЕПТОР-СВЯЗАННЫЙ БЕЛОК 1, ТУМОР НЕКРОТИЧЕСКИЙ ФАКТОР
 23. MAGMAS    13      БЕЛОК ПЕРЕДАЮЩИЙ СИГНАЛ, ФСК ГРАНУЛОЦИТОВ И МАКРОФАГОВ
 24. DNAJA3    31      DNAJ-ГОМОЛОГ D. MELAN. СУБСЕМЕЙСТВО A3, АПОПТОЗ, HSP40
 25. ABAT      110     4-АМИНОБУТИРАТ-АМИНО-ТРАНСФЕРАЗА, ГАМК МЕТАБОЛИЗМ, СИНАПСЫ
 26. MRV17L    13      MRV17 - ПОДОБЕН
 27. COQ7      13      КОЭНЗИМ-Q7 ГОМОЛОГ
 28. ACSM      73      АЦИЛ-КОА-СИНТЕТАЗА, СРЕДНИХ ЦЕПЕЙ СЕМЕЙСТВО, ЧЛЕН 1
 29. LOC57149  24      ГИПОТЕТИЧЕСКИЙ БЕЛОК,  ОКСИДОРЕДУКТАЗА
 30. EARS2     36      ГЛУТАМИЛ-ТРНК-СИНТЕТАЗА 2
 31. NDUFAB1   16      NADH-ДГ 1, AB-СУБКОМПЛЕКС 1,   8 КДА, АЦИЛ-ТРАНСПОРТ
 32. CLN3      14      ЦЕРОИД-ЛИПОФУСЦИНОЗ, ЮВЕНИЛЬНЫЙ НЕЙРОНАЛЬНЫЙ 3, УКЛАДЧИК
 33. TUFM      4       ФАКТОР ЭЛОНГАЦИИ ТРАНСЛЯЦИИ TU
 34. BCKDK     4       РАЗВЕТВЛЕННЫХ ЦЕПЕЙ КЕТОКИСЛОТ ДЕГИДРОГЕНАЗЫ КИНАЗА
 35. LOC649171 12      ПОДОБЕН АНГИДРАЗЕ УГОЛЬНОЙ КИСЛОТЫ 5A
 36. COQ9      13      КОЭНЗИМ-Q9 ГОМОЛОГ S. CEREVIS.
 37. GOT2      27      ГЛУТАМАТ-ОКСАЛОАЦЕТАТ-ТРАНСФЕРАЗА 2
 38. TK2       41      ТИМИДИН-КИНАЗА 2, РЕПЛИКАЦИЯ ДНК
 39. PDP2      7       ПИРУВАТ-ДЕГИДРОГЕНАЗЫ ФОСФАТАЗА 2
 40. DDX28     3       DEAD-БОКС ПОЛИПЕПТИД 28, ASP-GLU-ALA-ASP И HIS, ХЕЛИКАЗА
 41. PDF       2       ПЕПТИД-ДЕФОРМИЛАЗА
 42. CYB5B     42      ЦИТОХРОМ B5, ТИП B
 43. COX6A2    1       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6A, ПОЛИПЕПТИД 2

    ХРОМОСОМА 17
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. TIMM22    5       ТРАНСПОРТЕР БЕЛКОВ
  2. YWHAE     56      ТИРОЗИН-3-МАО И ТРИПТОФАН-5-МАО АКТИВИРУЮЩИЙ БЕЛОК ЭПСИЛОН
  3. SLC25A11  3       ТРАНСПОРТ ОКСОГЛУТАРАТА
  4. C1QBP     7       КОМПЛЕМЕНТА КОМПОНЕНТ 1, Q-СУБКОМПЛЕКС СВЯЗЫВАЮЩИЙ БЕЛОК
  5. ACADVL    5       АЦИЛ-КОА-ДЕГИДРОГЕНАЗА , ОЧЕНЬ БОЛЬШИЕ ЦЕПИ
  6. TP53      19      БЕЛОК ОПУХОЛЕЙ P53, РЕГУЛЯТОР ПРОНИЦАЕМОСТИ МИТОХОНДРИЙ
  7. SCO1      17      SCO-ЦИТОХРОМ-ОКСИДАЗА, СБОРКА КОМПЛЕКСА, ГОМОЛОГ ДРОЖЖЕЙ
  8. COX10     139     COX10-ГОМОЛОГ, ЦИТОХРОМ-С-ОКСИДАЗЫ, СОБИРАЮЩИЙ БЕЛОК
                ПРОТОГЕМ-9-ФАРНЕЗИЛ-ТРАНСФЕРАЗА
  9. AKAP10    73      ДВОЙНОЙ СПЕЦИФИЧНОСТИ А-КИНАЗА, ЗАКРЕПЛЯЕТ БЕЛОК 10
 10. NT5M      44      5, 3-НУКЛЕОТИДАЗА
 11. PEMT      86      ФОСФАТИДИЛЭТАНОЛАМИН-N-МЕТИЛ-ТРАНСФЕРАЗА
 12. ATPAF2    21      АТФ-СИНТАЗА, F1-КОМПЛЕКС, СОБИРАЮЩИЙ ФАКТОР 2
 13. FDXR      10      ФЕРРЕДОКСИН-РЕДУКТАЗА
 14. ATP5H     8       АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0-КОМПЛЕКС, СУБЪЕДИНИЦА D
 15. MRPS7     5       БЕЛОК РИБОСОМ S7
 16. SLC25A19  17      ТРАНСПОРТЕР ДЕЗОКСИНУКЛЕОТИДОВ
 17. MRPS38    6       БЕЛОК РИБОСОМ S38
 18. MRPL12    5       БЕЛОК РИБОСОМ L12
 19. SLC25A10  8       ТРАНСПОРТЕР ДИКАРБОНОВЫХ КИСЛОТ
 20. LOC651191 1       ПОДОБЕН ФАКТОРУ ЭЛОНГАЦИИ TU
 21. CENTA2    37      ЦЕНТАУРИН A2, СВЯЗЫВАЕТ БЕЛКИ МОСТИКОМ, РЕГУЛЯЦИЯ ГТФ-АЗЫ
 22. RHOT2     84      RAS-ГОМОЛОГ, СЕМЕЙСТВО T 1, ГТФ-АЗА, СИГНАЛ-ТРАНСДУКТОР
 23. MRM1      7       РРНК-МЕТИЛ-ТРАНСФЕРАЗА 1, ГОМОЛОГ S. CEREVIS.
 24. MRPL45    3       БЕЛОК РИБОСОМ L45
 25. STARD3    26      БЕЛОК РЕГУЛЯЦИИ СРОЧНОГО СТЕРОИДОГЕНЕЗА, ТРАНСПОРТ
 26. NAGS      4       N-АЦЕТИЛ-ГЛУТАМАТ-СИНТЕТАЗА, ЦИКЛ МОЧЕВИНЫ
 27. CGI-69    5       ГИПОТЕТИЧЕСКИЙ БЕЛОК , ТРАНСПОРТ
 28. MRPL10    8       БЕЛОК РИБОСОМ L10
 29. ATP5G1    3       АТФ-СИНТАЗА, H-ТРАНСПОРТ, F0 СУБКОМПЛЕКС, СУБЪЕДИНИЦА C1
 30. PHB       11      ПРОХИБИТИН, РЕГУЛЯЦИЯ АПОПТОЗА, ДНК РЕПЛИКАЦИИ, ЦИКЛА
 31. PDK2      16      ПИРУВАТ-ДЕГИДРОГЕНАЗЫ КИНАЗА, ИЗОЭНЗИМ 2
 32. MRPL27    5       БЕЛОК РИБОСОМ L27
 33. COX11     17      COX11-ГОМОЛОГ, ЦИТОХРОМ-С-ОКСИДАЗЫ, КОМПЛЕКС СБОРЩИК

                97
 34. AKAP1     36      К А-КИНАЗЕ ЗАЯКОРЕННЫЙ БЕЛОК 1, СВЯЗВАЕТ РНК, СПЕРМАТИДЫ
 35. MRPS23    11      БЕЛОК РИБОСОМ S23
 36. BZRAP1    27      БЕНЗОДИАЗЕПИНОВ РЕЦЕПТОР АССОЦИИРОВАННЫЙ БЕЛОК 1
 37. SEPT4     12      СЕПТИН 4, АПОПТОЗ, КЛЕТОЧНЫЙ ЦИКЛ
 38. PTRH2     10      ПЕПТИДИЛ-ТРНК-ГИДРОЛАЗА 2, BCL2-ИНГИБИТОР ТРАНСКРИПЦИИ
 39. POLG2     20      ДНК-ПОЛИМЕРАЗА ГАММА 2, ВСПОМОГАТЕЛЬНАЯ СУБЪЕДИНИЦА
 40. LOC651054 18      ПОДОБЕН ДНК-ЗАВИСИМОЙ РНК-ПОЛИМЕРАЗЕ
 41. LOC284100 42      ПОДОБЕН 14-3-3E, СТИМУЛЯЦИЯ ВВОДА В МИТОХОНДРИИ
 42. LOC653479 38      ПОДОБЕН БЕЛКУ РИБОСОМ L45
 43. BIT1      10      BCL2-ИНГИБИТОР ТРАНСКРИПЦИИ, АПОПТОЗ
    
   ХРОМОСОМА 18    
   ГЕН        РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЯ

  1. LOC650194 1       ПОДОБЕН ПЕРЕНОСЧИКУ ТРИПЛЕТНЫХ ПОВТОРОВ
  2. NDUFV2    31      NADH-ДГ ФЛАВОБЕЛОК2 24KDA, НЕРВНОЙ СИСТЕМЫ РАЗВИТИЕ
  3. NARG      25      N-ЭТИЛМАЛЕИМИД-ЧУВСТВИТЕЛЬНЫЙ ФАКТОР СОЕДИНЕН БЕЛОК ГАММА,
                ТРАНСПОРТ И СБОРКА БЕЛКОВ
  4. AFG3L2    48      AFG3-АТФАЗА СЕМЕЙСТВО 3 ПОДОБНЫЙ 2, ПРОТЕОЛИЗ
  5. MIB1      130     MINDBOMB - ГОМОЛОГ 1 ДРОЗОФИЛЫ, БЕЛКОВ УБИКВИТАЦИЯ
  6. LOC440490 -       ПОДОБЕН СТРЕСС БЕЛКУ 70, МОРТАЛИН
  7. MCART2    1       ПЕРЕНОСЧИК ТРИПЛЕТНЫХ ПОВТОРОВ 2
  8. ATP5A1    14      АТФ-СИНТАЗА, H-ТРАНСПОРТ, F1 КОМПЛЕКС A, СУБЪЕДИНИЦА 1, СЕРДЦЕ
  9. ACAA2     30      АЦЕТИЛ-КОА-АЦИЛ-ТРАНСФЕРАЗА 2
 10. ME2       69      МАЛИК-ЭНЗИМ 2, HAD
 11. FECH      39      ФЕРРОХЕЛАТАЗА, ГЕМ БИОСИНТЕЗ, ПРОТОПОРФИРИЯ
 12. BCL2      197     B-КЛЕТОЧНАЯ ЛИМФОМА 2, ОСВОБОЖДЕНИЕ ЦИТОХРОМА-С ИЗ МТ,
                АПОПТОЗ
 13. LOC731095 1       ПОДОБЕН АТФ-СИНТАЗЕ
 14. LOC653892 2       --
 15. CYB5A     39      ЦИТОХРОМ B5 ТИП А
 16. C18ORF22  12      R-RNA ПРОЦЕССИНГ

    ХРОМОСОМА 19
    ГЕН       РАЗМЕР  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. UQCRFS1   5       УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА, РИСКЕ FE-S ПОЛИПЕПТИД 1
  2. COX6B1    9       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6B, ПОЛИПЕПТИД 1
  3. COX7A1    2       ---                7A, ПОЛИПЕПТИД 1
  4. ECH116    16      ЕНОЛ-КОА-ГИДРАТАЗА 1
  5. SARS2     15      СЕРИЛ-ТРНК-СИНТЕТАЗА 2
  6. MRPS12    2       БЕЛОК РИБОСОМ S12
  7. TIMM50    11      БЕЛКОВ ТРАНСЛОКАТОР
  8. BCKDHA    27      ВЕТВЕЙ ЦЕПИ КЕТОКИСЛОТ-ДЕГИДРОГЕНАЗА, ПОЛИПЕПТИД A
  9. ETHE1     22      ЭТИЛ-МАЛОНОВАЯ ЭНЦЕФАЛОПАТИЯ 1
 10. TOMM40    13      БЕЛКОВ ТРАНСЛОКАЗА
 11. OPA3      57      ЗРИТЕЛЬНАЯ АТРОФИЯ 3
 12. BBC3      11      BLC2-СВЯЗЫВАЮЩИЙ КОМПОНЕНТ, АПОПТОЗ
 13. BCAT2     16      ВЕТВЕЙ ЦЕПИ АМИНОТРАНСФЕРАЗА 2
 14. BAX       7       BCL2-СВЯЗАННЫЙ БЕЛОК X, АПОПТОЗ
 15. CPT1C     22      КАРНИТИН-ПАЛЬМИТОИЛ-ТРАНСФЕРАЗА 1C
 16. POLRMT    6       РНК-ПОЛИМЕРАЗА
 17. ETFB      21      ЭЛЕКТРОН-ПЕРЕНОСЯЩИЙ-ФЛАВОПРОТЕИН, ПОЛИПЕПТИД B
 18. PPP2R1A   36      ПРОТЕИН-ФОСФАТАЗА 2
 19. NDUFA3    4       NADH-ДЕГИДРОГЕНАЗА, 9 КДА СУБКОМПЛЕКС 3
 20. COX6B     5       ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 6B, ПОЛИПЕПТИД 2, ТЕСТИС
 21. LOC440544 3       ПОДОБЕН ГЛИЦЕРОЛ-3-ФОСФАТ-ДЕГИДРОГЕНАЗЕ
 22. LOC649204 1       -
 23. GPX4      3       ГЛУТАТИОН-ПЕРОКСИДАЗА 4, СЕЛЕН
 24. ATP5D     3       АТФ-СИНТАЗА, H-ТРАНСПОРТ, F1 КОМПЛЕКС, ДЕЛЬТА
 25. NDUFS7    12      NADH-ДЕГИДРОГЕНАЗА, 20 КДА FE-S БЕЛОК 7
 26. UQCR      9       УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА, СУБЪЕДИНИЦА 6, 4 КДА
 27. TIMM13    3       БЕЛКОВ ТРАНСЛОКАТОР
 28. MRPL54    4       БЕЛОК РИБОСОМ L54
 29. PRSS15    29      СЕРИН-ПРОТЕАЗА 15
 30. NDUFA11   9       NADH-ДЕГИДРОГЕНАЗА,    14, 7 КДА СУБКОМПЛЕКС A11
 31. CLPP      9       КАЗЕИНОЛИТИЧЕСКАЯ ПРОТЕАЗА , ГОМОЛОГ E. COLI.
 32. MGC34725  9       ГИПОТЕТИЧЕСКИЙ БЕЛОК
 33. SLC25A23  20      ПЕРЕНОСЧИК , КАЛЬЦИЙ
 34. TIMM44    17      БЕЛКОВ ТРАНСЛОКАТОР
 35. NDUFA7    10      NADH-ДЕГИДРОГЕНАЗА,   14, 5 КДА СУБКОМПЛЕКС A7
 36. MRPL4     8       БЕЛОК РИБОСОМ L4
 37. GCDH      9       ГЛУТАРИЛ-КОА-ДЕГИДРОГЕНАЗА
 38. NDUFB7    6       NADH-ДЕГИДРОГЕНАЗА,  18 КДА СУБКОМПЛЕКС B7
 39. LOC648662 1       ПОДОБЕН РНК-ПОЛИМЕРАЗЕ
 40. MRPL34    1       БЕЛОК РИБОСОМ L34
 41. GTPBP3    5       ГТФ-СВЯЗЫВАЮЩИЙ БЕЛОК 3
 42. MGC26694  49      ГИПОТЕТИЧЕСКИЙ БЕЛОК
 
                98
 43. NDUFA13   13      NADH-ДЕГИДРОГЕНАЗА, 1 A СУБКОМПЛЕКС 13
 44. LOC654085 1       ПОДОБЕН ГЛИЦИН-РАСЩЕПЛЯЮЩЕМУ БЕЛКУ

    ХРОМОСОМА 20
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. IDH3B     6        ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 3B
  2. MRPS26    3        БЕЛОК РИБОСОМ S26
  3. VISA      21       АНТИВИРУСНЫЙ СИГНАЛЬНЫЙ БЕЛОК
  4. PANK2     35       ПАНТОТЕНАТ-КИНАЗА 2
  5. CDS2      65       ЦИТИДИЛ-ТРАНСФЕРАЗА 2
  6. CRLS1     31       КАРДИОЛИПИН-СИНТЕТАЗА 1
  7. ACSS1     51       АЦИЛ-КОА-СИНТЕТАЗА 1
  8. COX4I2    7        ЦИТОХРОМ-С-ОКСИДАЗА 4I2
  9. BCL2L1    59       BCL2 ПОДОБНЫЙ ФАКТОР АНТИАПОПТОЗА 1
 10. NFS1      30       АЗОТА ФИКСАТОР 1 ГОМОЛОГ S. CEREV.
 11. TOMM34    18       ТРАНСЛОКАЗА
 12. CYP24A1   1        ЦИТОХРОМ-P-450 СЕМЕЙСТВО 24 A1
 13. ATP5E     3        АТФ-СИНТАЗА H-ТРАНСПОРТ КОМПЛЕКС E
 14. PRPR6     51       СПЛАЙСИНГ
 15. C20ORF14  51       ПРЕДПОЛАГАЕМЫЙ РЕЦЕПТОР ВВОДА БЕЛКОВ И СПЛАЙСИНГ

    ХРОМОСОМА 21
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. MRPL39    22       БЕЛОК РИБОСОМ L39
  2. ATP5J     11       АТФ-СИНТАЗА H-ТРАНСПОРТ КОМПЛЕКС J
  3. ATP50     12       --
  4. MRPS6     70       БЕЛОК РИБОСОМ S6
  5. NDUFV3    16       NADH-ДЕГИДРЛГЕНАЗА ФЛАВОПРОТЕИН 3
  6. C21ORF33  12       ГОМОЛОГ E. COLI ES1
  7. C21ORF2   10       ЗНАЧЕНИЕ НЕИЗВЕСТНО

    ХРОМОСОМА 22
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. HSC20     15       КО-ШАПЕРОН
  2. NIPSNAP1  27       ГОМОЛОГ C. ELEGANS
  3. UCRC      3        УБИХИНОЛ-ЦИТОХРОМ-С-РЕДУКТАЗА КОМПЛЕКС
  4. MTP18     3        БЕЛОК АПОПТОЗА 18 КДА
  5. LOC441996 1        ПОДОБЕН АКОНИТАЗЕ 2
  6. TXN2      15       ТИОРЕДОКСИН 2
  7. TST       9        ТИОСУЛЬФАТ-СЕРА-ТРАНСФЕРАЗА
  8. MPST      10       МЕРКАПТОПИРУВАТ-СЕРА-ТРАНСФЕРАЗА
  9. GCAT      9        ГЛИЦИН-С-АЦЕТИЛ-ТРАНСФЕРАЗА
 10. TOMM22    3        ТРАНСЛОКАЗА БЕЛКОВ
 11. SLC25A17  50       РАСТВОРОВ ТРАНСПОРТ
 12. ACO2      60       АКОНИТАЗА 2
 13. NDUFA6    6        NADH-ДЕГИДРОГЕНАЗА
 14. MT        9        МАЛОНИЛ-ТРАНСФЕРАЗА
 15. TSPO      12       ТРАНСЛОКАТОР
 16. SAMM50    41       ГОМОЛОГ S. CEREVIS.
 17. TRMU      22       МЕТИЛ-ТРАНСФЕРАЗА ПРОЦЕССИНГ ТРНК
 18. SCO2      2        ЦИТОХРОМ-ОКСИДАЗА
 19. ECGF1     5        ФАКТОР РОСТА ЭНДОТЕЛИЯ СОХРАНЯЕТ ГЕНОМ МТ
 20. SLC25A18  28       РАСТВОРОВ ТРАНСПОРТ
 21. BCL2L13   90       BLC2-ПОДОБНЫЙ КАСПАЗ АКТИВАТОР
 22. BID       40       BH3-ПОСРЕДНИК УСИЛИТЕЛЬ СМЕРТИ
 23. PRODH     24       ПРОЛИН-ДЕГИДРОГЕНАЗА
 24. SLC25A1   3        РАСТВОРОВ ТРАНСПОРТ
 25. MRPL40    4        БЕЛОК РИБОСОМ L40
 26. TXNRD2    65       ТИОРЕДОКСИН-РЕДУКТАЗА 2
 27. LOC646677 -        ПОДОБЕН АКОНИТАЗЕ 2
 28. BZRP      11       РЕЦЕПТОР БЕНЗОДИАЗЕПИНОВ

    ХРОМОСОМА X
    ГЕН       РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ
  1. SLC9A6    62       РАСТВОРОВ ТРАНСПОРТ
  2. SLC25A6   6        ТРАНСПОРТ АТФ,  АДФ
  3. HCCS      11       ГОЛОЦИТОХРОМ-С-СИНТАЗА
  4. CA5B      47       КАРБОНАТ-ДЕГИДРАТАЗА 5B
  5. PDHA1     16       ПИРУВАТ-ДЕГИДРОГЕНАЗА A1
  6. ACOT9     40       АЦИЛ-КОА-ТИОЭСТЕРАЗА 9
  7. PDK3      69       КИНАЗА ПИРУВАТ-ДЕГИДРОГЕНАЗЫ 9
  8. GK        78       ГЛИЦЕРОЛ-КИНАЗА
  9. IDH3G     9        ИЗОЦИТРАТ-ДЕГИДРОГЕНАЗА 3G
 10. MTCP1     10       ФАКТОР ПРОЛИФЕРАЦИИ ЗРЕЛЫХ Т-КЛЕТОК 1
 11. LOC648605 38       ПОДОБЕН ТРИМЕТИЛЛИЗИН-ДИОКСИГЕНАЗЕ
 
                99
 12. OTC       69       ОРНИТИН-КАРБАМОИЛ-ТРАНСФЕРАЗА
 13. MAOA      87       МОНОАМИНО-ОКСИДАЗА А
 14. MAOB      116      --                B
 15. NDUFB11   3        NADH-ДЕГИДРОГЕНАЗА НЕЙРОНОВ
 16. LOC648399 -        ПОДОБЕН ОРНИТИН-АМИНО-ТРАНСФЕРАЗЕ
 17. TIMM17B   5        ТРАНСЛОКАЗА БЕЛКА
 18. LOC648603 1        ПОДОБЕН 3-КЕТОАЦИЛ-КОА-ТИОЛАЗЕ
 19. HADH2     3        ГИДРОКСИАЦИЛ-КОА-ДЕГИДРОГЕНАЗА 2
 20. ALAS2     22       АМИНОЛЕВУЛИНАТ-СИНТАЗА 2 , СИНТЕЗ ГЕМА
 21. LOC644924 54       ПОДОБЕН АСТ
 22. ABCB7     103      АТФ-СВЯЗЫВАЮЩАЯ КАССЕТА 7
 23. COX7B     5        ЦИТОХРОМ-С-ОКСИДАЗА 7B
 24. TIMM8A    3        ТРАНСЛОКАЗА БЕЛКА
 25. MCART6    57       ПЕРЕНОСЧИК
 26. LOC203427 55       ПЕРЕНОСЧИК РАСТВОРОВ
 27. SLC25A5   3        --
 28. NDUFA1    5        NADH-ДЕГИДРОГЕНАЗА A1
 29. GLUD2     3        ГЛУТАМАТ-ДЕГИДРОГЕНАЗА 2
 30. PDCD8     36       ПРОГРАММА СМЕРТИ ПОСЛЕ ДНК ПОВРЕЖДЕНИЯ 8
 31. SLC25A14  33       ПЕРЕНОСЧИК АНИОНОВ, БЕЛОК-РАЗОБЩИТЕЛЬ /UNCOUPLING/
 32. CYBB      33       ЦИТОХРОМ-B-245
 33. LOC643554 -        ПОДОБЕН ОРНИТИН-АМИНО-ТРАНСФЕРАЗЕ
 34. LOC643687 6        ПОДОБЕН 3-КЕТОАЦИЛ-КОА-ТИОЛАЗЕ
 35. PIN4      16       ПАРВУЛИН 4
 36. LOC644394 -        ПОДОБЕН TIMM8
 37. TMLHE     123      3-МЕТИЛЛИЗИН-ГИДРОКСИЛАЗА

   ХРОМОСОМА Y
   ГЕН        РАЗМЕР   НАЗВАНИЕ И ПРИМЕЧАНИЕ
  1. SLC25A6   6        ПЕРЕНОСЧИК

Приложение 2.

ВАРИАНТ ГЕНОМА МИТОХОНДРИИ ЧЕЛОВЕКА ИЗ АФРИКИ, ЙОРУБА.  Размер 1-16571 п. н.

    ГЕН       РАЗМЕР П. Н.  НАЗВАНИЕ И ПРИМЕЧАНИЕ

  1. TRNF      579-649     ТРНК ФЕНИЛАЛАНИНА
  2. RNR1      650-1603    12S РНК РИБОСОМЫ
  3. TRNV     1604-1672    ТРНК ВАЛИНА
  4. RNR2     1673-3230    16S РНК РИБОСОМЫ
  5. TRNL1    3231-3305    ТРНК 1 ЛЕЙЦИНА UUA/UUG
  6. ND1      3308-4264    NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 1
  7. TRNI     4264-4332    ТРНК ИЗОЛЕЙЦИНА
  8. TRNQ     4330-4401    ТРНК ГЛУТАМИНА
  9. TRNM     4403-4470    ТРНК МЕТИОНИНА
 10. ND2      4471-5514    NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 2
 11. TRNW     5513-5580    ТРНК ТРИПТОФАНА
 12. TRNA     5580-5656    ТРНК АЛАНИНА
 13. TRNN     5658-5730    ТРНК АСПАРАГИНА
 14. TRNC     5762-5827    ТРНК ЦИСТЕИНА
 15. TRNY     5827-5892    ТРНК ТИРОЗИНА
 16. COX1     5905-7446    ЦИТОХРОМ-С-ОКСИДАЗА, СУБЕДИНИЦА 1
 17. TRNS1    7446-7517    ТРНК 1 СЕРИНА UCN
 18. TRND     7519-7586    ТРНК АСПАРАГИНОВОЙ КИСЛОТЫ
 19. COX2     7587-8270    ЦИТОХРОМ-С-ОКСИДАЗА, СУБЪЕДИНИЦА 2
 20. TRNK     8396-8365    ТРНК ЛИЗИНА
 21. ATP8     8367-8573    АТФ-СИНТАЗА, F0 КОМПЛЕКС, СУБЪЕДИНИЦА 8
 22. ATP6     8528-9208    АТФ-СИНТАЗА, F0 КОМПЛЕКС, СУБЪЕДИНИЦА 6
 23. COX3     9208-9988    ЦИТОХРОМ-С-ОКСИДАЗА, СУБЕДИНИЦА 3
 24. TRNG     9992-10052   ТРНК ГЛИЦИНА
 25. ND3     10060-10405   NADH-ДЕГИДРОГЕНАЗА, СУБЪЕДИНИЦА 3
 26. TRNR    10406-10470   ТРНК АРГИНИНА
 27. ND4L    10471-10767   NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 4L
 28. ND4     10761-12138   NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 4
 29. TRNH    12139-12207   ТРНК ГИСТИДИНА
 30. TRNS2   12208-12266   ТРНК 2 СЕРИНА AGU/AGC

                100
 31. TRNL2   12267-12337   ТРНК 2 ЛЕЙЦИНА CUN
 32. ND5     12338-14149   NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 5
 33. ND6     14150-14674   NADH-ДЕГИДРОГЕНАЗА, КОМПЛЕКС 1, СУБЪЕДИНИЦА 6
 34. TRNE    14675-14743   ТРНК ГЛУТАМИНОВОЙ КИСЛОТЫ
 35. CYTB    14748-15882   ЦИТОХРОМ B
 36. TRNT    15889-15954   ТРНК ТРЕОНИНА
 37. TRNP    15954-16024   ТРНК ПРОЛИНА
Приложение 3.
Список генов-гигантов, размером более 400 тпн и их функция. Сделал и
перевел Курносов М.Н.2008 год.
Проведен анализ функции и экспрессии генов большого размера. Гены общего
назначения, которые функционируют в разных тканях,  обозначены буквой "о".
Гены неизвестной функции "х".
Гены работающие преимущественно в нервной системе "н".
Их количество составило "х" - 25, "о" - 139, "н" - 160. Таким образом среди
генов-гигантов размером более 400 тпн, количество генов имеющих отношение
к ЦНС составило около 49, 4 процентов.
В связи с тем, что геном недостаточно изучен, этот процент может быть
значительно больше.

 ХР  ГЕН      РАЗМЕР  МАКС-ИНТРОН   НАЗВАНИЕ И ПРИМЕЧАНИЕ
 1   CLCC1    490  o   i4 -153      Хлорид-канал 1
     CAMTA1   990  н   i3 -264      Кальмодулин связывающий активатор
                транскрипции 1,
                делеция при глиоме, нейробластоме
     KIAA1026 470  x   i2 -362      Гипотетический белок
     CSMD2    650  н   i67-100      CUB и SUSHI мембранные домены 2,
                повышена экспрессия в мозге
     MACF1    406  o   i3 -146      Микротрубочки-актин соединяющий фактор
                1, WNT путь, развитие эмбриона
     HIVEP3   409  o   i8 -218      Иммунодефицита вируса энхансер 3,
                воспаление, апоптоз,  масса кости
     AGBL4    462  o   i5 -204      АТФ-ГТФ-связывающий белок 4
     FAF1     520  x   i9 -122      FAS ассоциированный фактор 1
     DAB1    1253  н   i16-366      DISABLED гомолог 1, развитие коры
                нервной системы
     ROR1     404  н   i1 -232      Рецептор тирозин-киназы подобной орфан
                рецептор 1, модуляция роста нейритов
                в ЦНС
     NEGR1    880   н  i6 -347      Регулятор роста нейронов 1
     SLC44A5  404   н  i22-145      Переносчик, холина транспорт, курение,
                Альцгеймера болезнь
     ST6GALNAC3 560 o  i1 -239      ST6GALNAC3
     DPYD     843   o  i3- 94       Дигидропиримидин-дегидрогеназа
     DNM3     572   н  i14-123      Динамин 3, высокая экспрессия в мозге
     RABGAP1L 798   о  i19-145      RAB GTP-азу активирующий белок 1
                подобный, пролиферация и инвазия меланом
     HMCN1    456  о   i1 -111      Гемицентрин 1, иммуноглобулин семейство,
                макулы дегенерация
     DISC1    415  н   i8 -140      Поврежден при шизофрении 1
     SLC35F3  420  о   i2 -326      Переносчик
     RYR2     791  о   i1 -226      Рианодин рецептор 2, сердечная мышца
     RGS7     582  о   i16-257      Регулятор G-белка сигналинга 7
     PLD5     445  х   i9 -176      Фосфолипаза D 5
     SMYD3    668  о   i7 -397      SET - MYND домены 3, раки , сперматогенез
     KCNH1    451  н   i4 -114      Калий-канал H 1, выокая экспрессия
                в мозге
     ESRRG    586  н   i6 -262      Эстроген связанный рецептор развития G,
                регуляция развития, высокий уровень
                в фетальном мозге

                101
 2   DPP10    682  о   i5 -164      Дипептидил-пептидаза 10, астма
     CNTNAP5  890  н   i1 -196      Контактин ассоциированный белок 5,
                нервная система, адгезия и рецепция
                клеток
     FLJ34870 644  х   i6 -214      Гипотетический белок
     KIAA1679 687  х   i11-130      Абнормальное гонад развитие
     LRP1B   1901  о   i89-329      ЛПНП-связанный белок 1B
     ARHGAP15 639  о   i6 -189      Rho-GTPase - активирующий белок 15
     BRE      448  н   i8 -108      BRE, мозг и гонады экспрессия, ответ на
                ДНК повреждение и ретиноевую кислоту
     ALK      729  н   i28-202      Анапластическая лимфома киназа, ведущая
                роль в развитии мозга и работы нейронов
     LTBP1    452  о   i3 -89       Скрытый трансформирующий фактор роста 
                связывающий белок 1
     PRKCE    536  н   i1 -191      Протеин-киназа, различные сигнальные пути,
                активация нейронных каналов,
                поведение тревоги
     NRXN1   1108  н   i17-299      Неурексин 1, адгезия и рецепция в
                нервной системе
     FLJ16124 648  х   i4 -208      Гипотетический белок
     SEC15L2  650  н   i2 -151      SEC15 гомолог, высокая активность в
                амигдале мозга, синаптосомы, экзоцитоз
     CTNNA2  1135  н   i7 -484      Катенин A 2, ключевой нейральный
                регулятор кадхерина и мультиклеточной
                организации
     AFF3     595  о   i18-169      AF4-FMR2 семейство 3, лимфоидное
                развитие и онкогенез
     MYT1L    542  н   i23-112      Миелина транскрипции фактор 1 L
     GALNT13  509  о   i1 -196      GALNT13
     KCNH7    467  н   i14-299      Калий-вольтаж-канал 7
     TTC21B   612  о   i1 -533      Тетратрикопептидный домен 21 B
     MYO3B    476  о   i7 -99       Миозин 3 B, экспрессия в палочки и
                колбочки сетчатки
     PDE11A   444  о   i18-109      Фосфодиэстераза цАМФ цГМФ 11 A, кушинга
                болезнь
     ZNF533   419  н   i7 -224      Zn - фингер, умственное развитие
     ALS2CR19 1070 н   i3 -276      БАС, моторные нейроны
     ERBB4    1156 о   i27-413      Эритробластной лейкемии онкоген 4, рак
     SPAG16   1126 о   i10-372      Спермы антиген 16
     CENTG2   631  н   i1 -214      Центаурин G 2, высокая экспрессия в
                мозге взрослых
 3   FAM19A1  541  н   i2 -411      Семейство 19 A 1, мозг специфические
                хемокины или нейрокины
     FOXP1    628  о   i18-134      FOXP1, форкхеад бокс,  транскрипции
                фактор, тумор супрессия
     ROBO2    607  н   i2 -379      Обходной путь 2, аксон направитель,
                нейрональная миграция
     ROBO1    992  н   i29-464      Обходной путь 1, аксон направитель,
                нейрональная миграция
     EPHA6    938  о   i3 -239      Эфрин рецептор A 6
     ZBTB20   809  н   i5 -193      Zn фингер и BTB домен 20, пирамидальных
                клеток коры развитие
     LSAMP    635  н   i6 -358      Лимбической системой ассоциированный,
                нейрональное взаимодействие мембранный
                белок
     STXBP5L  513  н   i4 -86       Синтаксин связанный белок подобный 5,
                нейротрансмиссия
     KALRN    627  н   i1 -133      Калирин, ключевая роль в работе
                синапса, связь с хунтингтином,
                шизофрения

                102
     CPNE4    500  о   i14-182      Копин 4, кальций сигналинг
     EPHB1    465  н   i3 -154      Эфрин рецептор B 1, развитие и
                в нервной системе, шизофрения
     STAG1    415  о   i33-122      Стромы антиген 1, компонент когезина,
                работа хромосом
     CLSTN2   632  н   i2 -227      Калсинтенин 2, модулятор эпизодической
                памяти, нейрональная экспрессия
     SLC9A9   583  н   i12-101      Переносчик, обмен натрий-протон,
                гомеостаз катионов, внимание и
                активность в поведении
     KCNAB1   418  н   i1 -301      Калий-вольтаж-канал 1, нейротрансмиссия,
                возбудимость нейронов, эпилепсия
     RSRC1    434  о   i6 -106      Арг-Сер-богатый C-C домен 1, спайсосома
     SCHIP1   624  н   i1 -491      Шванномин взаимодействующий белок 1,
                компонент перехвата Ранвье
     MDS1     514  о   i3 -282      Миелодисплазия 1
     NLGN1    885  н   i4 -468      Невролигин 1, белок поверхности нейрона,
                функция и ремоделлинг синапсов
     NAALADL2 946  о   i1 -237      N-ацетилированная A-связанная кислая
                дипептидаза подобная 2
     LPP      667  о   i2 -181      LIM домен липома, адгезия клеток
     FGF12    586  н   i4 -367      Фактор роста фибробластов 12, участвует
                во многих процессах (развитие нервной
                системы)
     CNTN4    957  н   i1 -238      Контактин 4, аксон ассоциированная
                адгезия клеток, нервная сеть, аутизм
     GRM7     881  н   i1 -285      Глутамат рецептор 7
     TBC1D5   583  н   i20-115      TBC домен, возможная роль в атаксиях,
                дегенерация клеток Пуркинье
     RBMS3    724  о   i4 -153      Одноцепочную РНК связывающий
                основной 3
     MYRIP    450  о   i2 -143      Миозин взаимодействующий белок
     ULK4     713  о   i1 -148      UNC51 киназа 4
     DOCK3    709  н   i5 -130      Предназначенный цитокинезу 3, нервная
                система, гуанин обменный фактор, адгезия,
                пресенилин связывающий
     CACNA2D3 952  о   i2 -197      Кальций-вольтаж-канал A 2 D 3
     CAST1    960  н   i1 -172      CAZ-ассоциированный структурный белок
                1, ERC2, пресинаптический белок
     FHIT    1502  о   i5 -523      Ломких триад гистидина ген, тумор
                супрессор, бис-5'-аденозил трифосфатаза
     PTPRG    732  о   i2 -241      Протеин-тирозин-фосфатаза
                рецепторная G
     CADPS    477  н   i26-109      Кальций-зависимый активатор секреции,
                нейроэндокринные клетки
     MAGI1    685  о   i22-416      Мембрана ассоциированная гуанилат-
                киназа WW и PDZ домены содержащая 1,
                папиллома вирус, плотные соединения
                клеток
 4   SCFD2    493  н   i5 -128      SEC1 семейство домен содержащий 2,
                синтаксин связывающий белок 1 подобный,
                работа синапса
     LPHN3    575  н   i1 -90       Латрофилин 3, работа мозга, внимания
                дефицит-гиперактивности расстройство
     FRAS1    487  о   i3 -180      Фразер синдром 1, развитие,
                экстрацеллюлярный матрикс
     MGC35043 628  х   i3 -286      Гипотетический белок
     ARHGAP24 507  о   i3 -202      Rho GTP-ase активирующий белок 24,
                участвует в ремоделлинге актина,
                клеточной миграции и полярности


                103
     MAPK10   437  н   i12-160      Митоген активируемая протеин
                киназа 10, нейрональная
     MGC48628 547  х   i5 -159      Гипотетический белок
     GRID2   1468  н   i2 -494      Глутамат рецептор ионотропный D 2,
                работа нейронального рецептора, клетки
                Пуркинье, апоптоз нейронов
     MGC46496 585  х   i1 -154      Гипотетический белок
     COL25A1  488  о   i35-250      Коллаген 25 A 1
     MAML3    438  о   i4 -262      мастерминд гомолог дрозофилы 3,
                связывает NOTCH1, сигнальный путь
     LRBA     751  о   i17-97       Везикул перенос в иммунных клетках
     FSTL5    780  о   i12-144      Фоллистатин 5
     SPOCK3   507  о   i10-151      Тестикан 3, протеогликан
                экстрацеллюлярного матрикса
     PALLD    432  о   i10-179      Палладин, организация актинового
                цитоскелета
     ODZ3     558  н   i3 -254      ODZ гомолог 3, теневрин, высокий уровень
                экспрессии в ядрах мозга
     STK32B   450  о   i3 -163      Серин-треонин-киназа 32 B
     SORCS2   551  н   i1 -203      рецепторный белок для VPS10,
                нейропептид сигнальный путь
     KCNIP4   574  н   i7 -453      Калий-вольтаж-канал связанный  белок 4,
                возбудимость нейронов, взаимодействие с
                пресенилином
     PCDH7    423  о   i4 -222      Протокадхерин 7, адгезия и рекогниция
                клеток
 5   ARHGAP26 458  о   i1 -102      Rho-GTP-ase активирующий белок 26
     PPP2R2B  491  н   i9 -224      Белок-фосфатаза 2 регуляторная
                единица B, спино-церебеллярная атаксия,
                нейрональная
     ADCY2    434  н   i2 -106      Аденилат-циклаза 2 мозга
     SEMA5A   508  н   i22-108      SEMA домен 5A , аксона направитель при
                невральном развитии
     CTNND2   933  н   i20-167      Катенин D 2, адгезия клеток, мозга и
                глаз развитие
     FBXL7    439  о   i2 -311      F-бокс и лейцин богатый повтор белок 7,
                убиквитин-лигаза комплекса часть
     CDH18    509  н   i11-141      Кадхерин 18, кальций-зависимая адгезия
                клеток, нейрональный, аксон вырост и
                направитель, синапсов адгезия
     CDH12   1103  н   i14-347      Кадхерин 12, нейрональное развитие,
                синаптогенезис
     HCN1     434  н   i6 -184      Гиперполяризация К-канала, цАМФ цГМФ,
                спонтанная ритмическая активность
                сердца и мозга
     SGCD     439  о   i3 -164      Саркогликан D, мышц
     EBF      402  н   i10-233      Раннего включения фактор транскрипции,
                обонятельный,  нейрональный
     ODZ2     979  н   i1 -302      ODZ гомолог, высокая экспрессия в мозге
     DOCK2    446  о   i27-152      Предназначенный цитокинезу 2,
                гемопоэтических клеток, миграция
                лимфоцитов
     RANBP17  438  о   i14-202      RAN-связанный белок 17, участвует в
                импорте белка с лидером через ядерную
                пору
     ARL15    426  о   i1 -227      АДФ-рибозилирования фактор 15,
                адипонектина уровень, ожирение
     PDE4D    615  о   i14-370      Фосфодиэстераза 4 D cAMP, передача
                сигнала у многих клеток
     EDIL3    442  о   i10-130      EGF и дискордин 1 подобные домены 3,
                лиганд интегрина, роль в ангиогенезе

                104
     GPR98    606  н   i85-83       G-протеин-объединяющий-рецептор 98,
                экспрессия в ЦНС, Ашер синдром
     C5ORF21  457  х   i1 -155      Открытая рамка чтения 21, FAM172A
     MCTP1    577  о   i21-266      Множество C2-домены трансмембранные 1
     FBXL17   522  о   i3 -165      F-бокс и лейцин богатый повтор
                белок 17, F-бокс белок
     FSTL4    416  о   i13-166      Фоллистатин подобный 4
     SPOCK1   524  о   i9 -232      SPARC-остеонектин CNCV Kazal подобный
                домен протеогликан 1, тестикан 1,
                протеогликан семинальной плазмы,
                ингибитор протеаз
 6   PACRG    588  н   i3 -248      Корегулятор PARK2, шаперон и шаперонин
                связывающий , белок Паркинсона болезни
     UTRN     559  н   i1 -111      Утрофин, нейромускулярный синапс,
                постсинаптическая поддержка, кластер
                ацетилхолинового рецептора
     RPS6KA2  453  н   i20-320      Рибосомы белка S6 киназа A 2, развитие
                мозга, нейритов вырост
     ATXN1    462  н   i3 -158      Оливопонтоцеребеллярная атаксия,
                атаксин 1
     PARK2   1379  н   i7 -470      Синдром Паркинсона молодых 2
     DST      385  н   i93-108      Организация и генез цитоскелета
                дистонин, заякоривание нейральных
                промежуточных филаментов,
                нейродегенерация
     BTBD3    422  х   i5 -232      BTB домен
     BAI3     752  н   i2 -291      Ангиогенеза ингибитор мозга 3
     KCNQ5    572  н   i1 -381      Вольтаж- калий-канал тип Q 5, мозга и
                мышц, мускариновый рецептор
     TRDN     422  о   i41-66       Триадин, отношение к рианодин рецептору
                скелетных мышц
     SYNE1    515  о   i144-88      Оболочки ядра специфический повтор 1,
                спиноцеребеллярная атаксия 8
     PHACTR1  569  о   i3 -303      Регулятор актина и фосфатаза 1
     CDKAL1   698  х   i9 -109      CDK5-ассоциированный белок подобный 1,
                метилтиотрансфераза, функция неизвестна
     SUPT3H   549  о   i9 -206      Супрессор Ty 3 гомолог,
                ТАТА связывающий белок-ассоциированный
                фактор
     PKHD1    472  о   i7 -85       Поликистоз почек и гепатит 1
     KHDRBS2  606  о   i3 -161      KH домен РНК связывает,  сигнала
                передача 2
     RIMS1    514  н   i2 -128      Регулятор экзоцитоза синапсов 1
     GMDS     621  о   i4 -184      ГДФ-манноза-4, 6-дегидратаза, работа
                NK лимфоцитов
     FARS2    510  о   i6 -158      Фен-тРНК-синтетаза МТ
     GRIK2    670  н   i1 -223      Глутамат рецептор ионотропный
                каинатный 2
     SLC35F1  410  о   i1 -247      Переносчик
     PTPRK    552  о   i29-122      Белок-тирозин-фосфатаза рецепторная K,
                многие ткани, контакт и адгезия клеток
     LAMA2    634  о   i1 -167      Ламинин A 2, компонент основной
                мембраны, внеклеточный, конгенитальная
                мышечная дистрофия
     GRM1     409  н   i2 -145      Глутамат рецептор метаботропный 1
     ARID1B   431  о   i5 -149      Домен взаимодействует с
                AT-богатыми 1 B
 7   PMS2L2   501  х   i2 -484      Постмейотическая сегрегация 2
                подобный 2


                105
     MAGI2   1437  н   i21-446      Мембранная гуанилат-киназа WW и
                PDZ домены
                содержашая 2, взаимодействие с
                атрофином 1               
     CACNA2D1 594  н   i36-164      Кальций-вольтаж-канал  A2
                субъединица D1,
                пресинаптические терминали, нейрон
     FLJ32110 577  х   i1 -458      Гипотетический белок
     CUTL1    468  о   i2 -112      CUT - CCAAT-работающий белок, CUX1,
                гомеодомен се6мейство ДНК связывающих
                белков
     RELN     518  н   i62-84       Реелин, экстрацеллюлярного матрикса
                белок, нейронов миграция при развитии
                мозга
     LHFPL3   579  о   i1 -407      Липома,  слияния с HMGIC партнер
                подобный 3
     IMMP2L   899  о   i3 -523      Внутренней мембраны пептидаза
                подобная 2
     DOCK4    481  н   i51-202      Предназначенный  цитокинезу 4, контакты
                клеток, миграция, активатор ГТФазы,
                аутизм
     KCND2    476  н   i1 -457      Калий-вольтаж-канал D 2
     CADPS2   567  н   i27-149      Кальций-активируемый белок для
                секреции 2, регулирует экзоцитоз
                синаптических везикул
     GRM8     804  н   i8 -202      Глутамат рецептор метаботропный 8
     SND1     441  о   i10-86       Стафилококк-нуклеазы домен 1
     EXOC4    813  н   i10-187      Экзоцисты комплекс компонент 4,
                транспорт везикул в нейронах
     DGKI     457  о   i33-157      Диацил-глицерол-киназа I
     CNTNAP2 2305  н   i1 -657      Контактин-ассоциированный белок 2, член
                неурексина семейства, клеток адгезия и
                рецепция в нервной системе
     MAD1L1   417  о   i1 -82       Митоза остановка дефицит 1 подобный 1,
                сборки веретена контрольная точка
     SDK1     964  н   i1 -317      (Сайдекик) Дружок гомолог 1, ламина
                специфическая синаптическая связь
     KIAA0960 457  х   i27-195      Гонад абнормальное развитие
     DGKB     693  о   i3 -161      Диацил-глицерол-киназа B, ключевая роль
                в клеточных процессах и сигналинге
     HDAC9    501  о   i2 -89       Гистон-деацилаза 9
     CREB5    527  о   i1 -195      Ответ на цАМФ элемент белок
                связывающий 5
     PTHB1    476  о   i19-118      Ответ на паратиреоидный гормон B 5,
                BBS9
     ELMO1    595  о   i6 -118      Поглощение и подвижность фагоцитов 1,
                взаимодействие с DOCK
     POU6F2   458  о   i4 -132      POU-домен 6 F 2, ДНК связывающие домены
     C7ORF10  726  о   i12-188      Открытая рамка чтения и
                Русселя-Сильвера синдром,
                глютаровая ацидурия
     HECW1    450  н   i2 -130      HECT, C2, WW домены с E3 убиквитин-
                белок-лигазой 1, нейрональная
     ABCA13   449  н   i53-52       АТФ-связывающая кассета, кандидат на
                шизофрению,  биполярное расстройство и
                аутизм
     AUTS2   1194  н   i4 -302      Аутизм предрасположенность кандидат 2
     WBSCR17  580  о   i1 -202      Вильямса-Беурена синдром и полипептид-
                N-ацетил-галактозамин-трансфераза
     CALN1    629  н   i2 -213      Калнейрон 1, мозг специфический кальций
                связывающий белок

                106
 8   CNBD1    517  о   i4 -266      Циклические-нуклеотиды связывающий
                домен, содержащий 1
     PGCP     498  о   i1 -140      Плазменная глутамат-карбокси-пептидаза               
     VPS13B   864  н   i19-109      Вакуолярных белков сортировщик 13 B,
                участвует в функции глаз и ЦНС
     RIMS2    433  н   i17-230      Регулятор экзоцитоза синапса 2
     ZFPM2    485  о   i5 -155      Zn-фингер мультитип 2               
     CSMD3   1214  о   i68-122      CUB-SUSHI-множественные домены 3
     NIBP     726  н   i6 -197      NIK IKK -связывающий белок, мозга
                развитие
     CSMD1   2057  о   i68-387      CUB-SUSHI-множественные домены 1   
     DLC1     432  о   i13-189      Удален при раке печени 1, rho ГТФазу
                активирующий белок
     SGCZ    1148  о   i7 -683      Саркогликан Z , часть дистрофин-
                гликопротеиновый комплекса, соединяет
                цитоскелет и экстрацеллюлярный матрикс
     PSD3     484  о   i7 -109      Плекстрин и SH3-домен 3,
                АДФ рибозилирования фактор
                гуанин нуклеотид  фактор 6
     KIAA0146 475  х   i8 -155      Гипотетический белок
     SNTG1    881  н   i1 -260      Синтрофин гамма 1, экспрессия в мозге,
                содержит PH и PDZ домены
     XKR4     424  о   i1 -254      Келл-группа крови субъединица 4
     FAM77D   751  о   i1 -330      Семейство 77 член D, натрий-калий
                АТФаза субъединица
     KCNB2    401  н   i2 -368      Калий-вольтаж-канал B 2    
 9   TRPM3    587  н   i22-80       Временный рецептор катион-канала
     GABBR2   421  н   i18-130      ГАМК-рецептор 2               
     ASTN2    990  н   i4 -131      Астротактин 2 , экспрессия в мозге,
                нейрональная миграция
     DENND1A  550  н   i9 -100      DENN-MADD домен 1 A , клатрин связанное
                везикул синапсов функционирование
     PTPRD    701  н   i33-285      Белок-тирозин-фосфатаза рецепторная D,
                нейритов рост, аксон направитель
     BNC2     461  о   i4 -144      Базонуклин, регулятор транскрипции
     LRRN6C   771  н   i2 -283      Лей-богатые повторы нейрональный 6 C
10   PRKG1   1221  о   i3 -337      Протеин-киназа цГМФ зависимая 1
     PCDH15   980  о   i30-149      Протокадхерин 15, кальций-адгезия
                клеток, сетчатка и улитка
     CTNNA3  1776  о   i11-405      Катенин A 3, адгезия клеток, сердце и
                тестис
     CDH23    419  о   i3 -63       Кадхерин подобный 23, улитка, глухота
     ADK      558  н   i6 -127      Аденозин-киназа, много функций
                аденозина, также в мозге
     C10ORF11 775  о   i4 -266      Открытая рамка чтения, лейцин-богатый
                повтор содержащий белок
     KCNMA1   768  н   i28-234      Калий-канал большой кальций
                активируемый
     DIP2C    414  н   i36-203      Диско-взаимодействующий белок 2 C,
                экспрессия в нервной системе,
                ацил-КоА-синтетаза
     CAMK1D   480  о   i1 -204      Кальций-кальмодулин зависимая
                киназа 1 D, гранулоциты
     FRMD4A   687  о   i23-471      FERM домен 4 A
     NRG3    1110  н   i1 -481      Неурегулин 3, лиганд для ERBB3 и 4,
                эмбриогенез, нейробласт, шизофрения
     GRID1    767  н   i12-222      Глутамат рецептор ионотропный 1
     HPSE2    777  о   i9 -400      Гепараназа 2
     SORCS3   624  н   i1 -201      Сортилин,  VPS10 домен содержащий
                рецепторный белок 3, нервная система

                107
     SORCS1   591  н   i25-208      Сортилин,  VPS10 домен содержащий
                рецепторный белок 1, нервная система
     ATRNL1   856  о   i26-178      Аттрактин подобный 1
     CACNB2   401  н   i2 -251      Кальций-вольтаж-канал  бета 2, мозг,
                мышцы, Ламберта-Итона миастения
     C10ORF112 499 о   i12-100      Открытая рамка чтения, МАМ и LDL
                домены содержащий
     PLXDC2   464  о   i1 -185      Плексин домен 2, ангиогенез
     GPR158   427  х   i2 -175      Предполагаемый G-белок объединяющий
                рецептор 158
     PARD3    704  о   i23-179      PAR3 дефект, клеточная полярность,
                ориентация веретена, эндотелий сосудов
     DOCK1    482  о   i26-141      Предназначенный цитокинезу 1, адгезия
                клеток, фагоцитоз
11   DLG2    1469  н   i22-388      Диски большие гомолог 2, мембрана
                ассоциированная гуанилат киназа,
                канал-ассоциированный
                постсинаптический белок
     GRM5     540  н   i7 -198      Глутамат рецептор метаботропный 5
     FAT3     546  н   i3 -173      FAT3, кадхерина домены, адгезия клеток,
                мозг
     CNTN5   1335  н   i1 -304      Контактин 5, нейрональный
                иммуноглобулин, адгезия,
                аксона взаимодействие
     KIRREL3  576  н   i16-437      KIRREL3, нефрин подобный,
                экспрессия в мозге и почках
     HNT      426  н   i1-236       Неуротримин, нейрональный
                иммуноглобулин, адгезия, нейритов вырост
     OPCML   1117  н   i7 -589      Опиоид связывающий белок
     KCNQ1    404  н   i11-107      Калий-вольтаж-канал Q 1
     SBF2     515  н   i38-151      SET-связывающий фактор 2, миотубуларин
                связанный белок, нейропатия, нарушение
                укладки миелина
     SOX6     506  н   i15-135      Половых различий регион бокс 6,
                ДНК связывающий фактор транскрипции,
                развитие мозга, хряща и мышц
     NAV2     408  н   i1 -119      Нейрон навигатор 2
     NELL1    906  н   i15-164      NEL подобный 1, протеин киназа С
                связывающий белок, остеогенез,
                мозгоспецифичный
     LUZP2    586  н   i1-237       Лейцин-застежка молния (zipper)
                белок 2, экспрессия только в мозге
12   PPFIA2   500  н   i29-215      Белок-тирозин-фосфатаза рецепторная 
                взаимодействующий 2, липрин, участвует
                в направлении аксона
     TMTC2    447  х   i1 -169      Трансмембранный и тетратрикопептидный
                повтор 2
     MGAT4C   860  о   i7 -292      MGAT4C, N ацетил глюкозаминил-
                трансфераза
     ANKS1B  1249  н   i9 -221      Анкирин повтор и стерил-домен 1 B,
                амилоид бета ассоциированный белок,
                экспрессия в тестис и мозге
     CACNA1C  640  н   i3 -329      Кальций-вольтаж-канал 1 C
     TMEM132C 440  х   i1 -136      Трансмембранный белок 132 C
     TMEM132D 832  х   i8 -202      Трансмембранный белок 132 D
     GRIN2B   419  н   i11-112      Глутамат рецептор NMDA 2 B
     SOX5    1030  о   i14-386      Половых различий регион бокс 5,
                регулятор транскрипции, хондрогенез
     ITPR2    501  о   i56-65       Инозитол-3-фосфат рецептор 2
     TMEM117  553  х   i3 -199      Трансмембранный белок 117

                108
     FAM19A2  484  н   i4 -324      Семейство 19 A 2, нейрокины,
                мозгоспецифичные хемокины
     GRIP1    456  н   i23-207      Глутамат рецептор связанный  белок 1
13   ATP8A2   551  о   i17-128      АТФаза 8 A 2, фосфолипид трпнспортная
     KIAA0774 479  о   i3 -180      Микротубулы ассоциированный рака
                супрессор 2
     PIG38    454  о   i15-183      Пролиферацию индуцирующий белок 3,
                ENOX1, дисульфид-тиол обменник,
                осциллятор в 24 минуты
     PCDH9    928  н   i2 -580      Протокадхерин 9, синапсов соединения
     KLHL1    408  н   i10-132      Келч гомолог подобный 1, актин
                связывающий белок мозгоспецифичный
     DACH1    429  о   i5 -190      DAC гомолог 1, связан с транскрипцией,
                формирование глаз в развитии
     KLF12    448  о   i7 -138      Круппель фактор 12, цинк фингер
     GPC5    1469  н   i7 -722      Глипикан 9, гепарин сульфат
                протеогликан, высокая экспрессия
                в развивающемся мозге
     GPC6    1177  н   i1 -318      Глипикан 6, поверхностный рецептор для
                многих факторов, контроль роста и
                разделения, фетальный мозг
     HS6ST3   749  о   i1 -741      Гепарин-сульфат-трансфераза 3
     PCCA     441  о   i19-57       Пропионил-КоА-карбоксилаза, митохондрия
     FGF14    679  н   i4 -526      Фактор роста фибробластов 14, развитие
                нервной системы, аксональный транспорт,
                церебральная атаксия
     MYR8     612  о   i1 -69       Миозин 8 тяжелая цепь
14   AKAP6    504  н   i1 -104      A-киназы якорный белок 6, высокая
                экспрессия в мозге, сердце и скелетных
                мыщцах
     NPAS3    862  н   i1 -276      Нейрональный PAS-домен 3
     SLC25A21 493  о   i9 -297      Переносчик оксодикарбоксилатный
                митохондриальный
     MAMDC1   503  н   i15-83       MAM-домен 1, меприн, MDGA2,
                иммуноглобулин домен,
                нервной системы развитие
     GPHN     675  н   i1 -172      Гефирин, постсинаптический цитоскелет,
                якорный, рецептора домен и тубулин
     RAD51L1  776  о   i7 -405      RAD51 подобный 1, ДНК репарация при
                гомологической рекомбинации
     RGS6     631  н   i2 -387      Регулятор G-белка сигналинга 6, может
                модулировать нейрональную активность
     NRXN3   1461  н   i12-479      Неурексин 3, нервная система, адгезия
                и рецепция
     C14ORF145 443 о   i6 -143      Открытая рамка чтения, CEP128,
                центросомальный белок
15   RYR3     555  н   i1 -163      Рианодин рецептор 3, мозга
     UNC13C   616  х   i1 -127      UNC13C
     THCD4    642  н   i6 -249      Тромбоспондин 4, развитие и сигналинг в
                нервной системе, нейритов вырост, адгезия
                клетка-клетка, клетка-матрикс, THBS4
     ZNF291   536  о   i9 -69       Zn - фингер 291, SCAPER, S-фазы циклин
                A-ассоциированный белок ЭПР
16   FTO      410  о   i8 -177      FTO, жира масса, не гемового железа
                оксигеназа
     CDH13   1170  н   i1 -232      Кадхерин 13, адгезия клеток, негативная
                регуляция роста аксона при
                нейрональном развитии

                109
     A2BP1   1693  н   i4 -466      Атаксин 2 связывающий белок 1,
                РНК связывающий белок,
                нейродегенеративные расстройства
17   CA10     529  н   i6 -183      Угольная ангидраза 10, нервной системы,
                развитие мозга
     MSI2     443  н   i5 -140      MSI2, РНК связывающий белок Мусаши 2,
                развитие,  регуляция в нейронах
     BCAS3    715  о   i22-284      Груди рак амплифицированный участок 3
     CCDC46   556  о   i6 -101      C-c домен (биспиральный) 46,
                центросомальный белок 112 кд
     PRKCA    508  о   i2 -191      Протеин-киназа С связанная с возрастом,
                различные сигнальные пути
     SLC39A11 447  о   i4 -113      Переносчик цинка
18   PTPRM    839  о   i1 -207      Белок-тирозин-фосфатаза рецепторная,
                клеточная адгезия
     C18ORF1  434  х   i4 -183      Открытая рамка чтения
     C18ORF34 503  х   i3 -119      Открытая рамка чтения
     FHOD3    483  о   i3 -129      Формин домен 3, регуляция актинового
                цитоскелета
     DYM      417  н   i4 -93       Димеклин, развитие скелета и функция
                мозга
     DCC     1190  н   i1 -411      Удален при раке толстого кишечника,
                нетрин 1 рецептор, направление аксона
     DOK6     441  о   i1 -163      Докинг белков 6    
19   -----
20   PLCB1    752  о   i4 -280      Фосфолипаза-C B 1, трансдукция внутрь
                клетки многих внешних сигналов
     C20ORF133 2057н   i5 -545      Открытая рамка чтения, MACROD2,
                АДФ-рибозу связывающий сайт,
                Кабуки синдром с умственной задержкой,
                экспрессия в мозге и других тканях
     SLC24A3  510  н   i2 -235      Переносчик калия, натрия, кальция,
                проведение электричества, высокая
                экспрессия в мозге и других тканях
     PTPRT   1117  н   i30-304      Белок-тирозин-фосфатаза рецепторная,
                сигнала проведение  и адгезия в ЦНС
     TSHZ2    515  о   i1 -280      Теаширт-семейство Zn фингер
     CDH4     685  н   i2 -489      Кадхерин 4, адгезия клеток, ведущая роль
                в сегментации мозга и нейрональном
                выросте
 X   ARHGAP6  528  о   i12-410      Rho GTP-ase активирующий белок 6,
                актина ремоделлинг
     PDZK10   584  н   i1 -360      PDZ домен содержащий 10,
                поддержка синаптической передачи
     IL1RAPL1 1369 н   i2 -493      IL1 рецептор связанный  белок
                подобный 1, умственная задержка,
                экспрессия в гиппокампе,
                память и обучение
     DMD     2220  н   i35-248      Дистрофин, связь цитоскелета и
                экстрацеллюлярного матрикса,
                Дюшенна мышечная дистрофия,
                Бекера мышечная дистрофия, шизофрения,
                умственная задержка,
                при ДМД - фрамешифт,
                при БМД - ненормальное укорочение
                дистрофина, разные изоформы


                110
     TTC28    702  о   i21-364      Тетратрикопептидов повтор домен 28,
                ожирение
     DACH2    684  н   i1 -228      Dachshund (собака такса) гомолог,
                экспрессия при развитии в мозге
     PCDH11X  844  н   i3 -322      Протокадхерин 11 X, незаменим для
                сегментации и функции ЦНС
     DIAPH2   794  о   i4 -123      Diaphanous (прозрачный) гомолог,
                функция яичников
     IL1RAPL2 1201 н   i2 -537      IL1 рецептор связанный белок
                подобный 2, умственная задержка
     ODZ1     584  н   i28-157      ODZ гомолог 1, теневрин, экспрессия в
                нейронах, передача сигналов
     GPC3     450  о   i6 -199      Глипикан 3, клеточный рост и деление,
                мембранный протеогликан
     AFF2     500  н   i1 -151      AF4-FMR2 - семейство,
                ломкости Х умственная задержка
21   C21ORF34 537  х   i4 -160      Открытая рамка чтения
     NCAM2    541  н   i1 -282      Нейрональных клеток молекула адгезии 2
     GRIK1    403  н   i15-245      Глутамат рецептор ионотропный
                каинатный 1
     TIAM1    439  н   i27-125      Т-лимфома инвазия и метастазирование 1,
                высокая экспрессия в мозге, нейритов
                вырост в коре и гиппокампе
     DSCAM    834  н   i30-323      Дауна синдром клеток адгезии молекула,
                межклеточная адгезия, развитие мозга
22   SYN3     494  н   i7 -268      Синапсин 3, цитоплазматическая
                поверхность синаптических везикул,
                шизофрения
     LARGE    647  н   i14-158      Гликозил трансфераза подобный, мышечная
                дистрофия и умственная задержка
 Y   PCDH11Y  742  н   i4 -155      Протокадхерин 11 Y

Приложение 4.     Гены сплайсинга.Список сделал и перевел Курносов М.Н.
6 февраля 2009.
 Хр Ген     Размер Название и примечание. СС - сплайсосома, ССС - ядерных
                мРНК  сплайсинг через СС.
 1.DDX20   12      DEAD-бокс полипептид 20, сборка трех sn-RNP (мя-РНП),
                РНК-хеликаза АТФ-зависимая, ССС.
   BCAS2   14      Рака груди умноженная последовательность 2, ассоцииро-
                ванная  с СС.
   TTF2    43      Фактор терминации транскрипции РНК-полимеразы 2,
                АТФ-зависимая хеликаза, ССС.
   RBM8A    4      РНК-связывающий главный белок 8A, транспорт мРНК из
                ядра, ССС.
   FUSIP1  14      FUS-взаимодействующий белок1, сер-арг богатый, выбор сайта
                сплайсинга, транспорт мРНК из ядра, сборка sn-RNP,
                негативная  регуляция ССС, регуляция транскрипции.
   SRRM1   31      Сер-арг повторяющийся матрикс 1, РНК процессинг, ССС.
   PPP1R8  21      Белок-фосфатаза 1, регулятор субъединица 8 - ингибитор,
                рибонуклеаза E, ССС.
   SFRS4   34      Сплайсинг-фактор 4, сер-арг богатый, ССС.
   WDR57   37      WD - повтор домен 57,  U5 sn-RNP специфичный, ССС.
   SFPQ     9      Сплайсинг-фактор про-глн богатый, ассоциирован с поли-
                пиримидиновый тракт связывающим белком, ССС, репарация и
                рекомбинация ДНК, регуляция транскрипции.
   LSM10    5      LSM10, U7 - sn-RNP ассоциированый, ССС.
   SF3A3   33      Сплайсинг-фактор 3, субъединица A3, 60 kDa, ССС, 3 - конца 

                111
                сайт сплайсинга нахождение.
   RRAGC   21      RAS - GTP - связывающий С, сплайсинг, апоптоз, рост,
                транскрипция, гетеродимеризация белка.
   PPIH    19      Пептидил-пролил-изомераза H, snRNP ввод в ядро,
                ССС, фольдинг и сборка белков, циклофилин H.
   YBX1    19      Y-бокс связывающий белок 1, ССС, регуляция транскрипции,
                большой комплекс гистосовместимости 2.
   MAGOH   12      mago-nashi гомолог D. melan. , ССС, экспорт мРНК из ядра,
                женских гамет генерация.
   SFRS11  46      Сплайсинг-фактор арг-сер богатый 11, ССС.
   ZRANB2  18      Zn-фингер RAN домен содержащий 2, сплайсинг.
   PTBP2   93      Полипиримидиновый тракт связывающий белок 2, нейральный,
                сплайсинг регулятор, процессинг РНК.
   RTCD1   26      РНК-концевой фосфат-циклаза домен 1, сборка СС
                три-sn-RNP.
   TARDBP  12      TAR DNA связывающий белок, ССС, транскрипция.
   SF3B4    5      Сплайсинг-фактор 3b, субъединица 4, ССС, U2 sn-RNP.
   PRPF3   32      PRP3 пре-мРНК процессинг фактор 3, ССС, U4/U6
                ассоциированный сплайсинг-фактор, пигментозный ретинит 18.
   TNRC4   14      Тринуклеотидов повтор содержащий 4, CAG/CTG 4, CCC,
                нервной системы развитие.
  IVNS1ABP 21      Гриппа вирус NS1A связывающий белок, РНК сплайсинг, СС,
                ответ на вирус, запуск транскрипции с РНК-пол 3.
   SNRPE    9      Sn-RNP полипептид E, СС, сплайсосомы сборка.
   SYF2    11      SYF2 гомолог, РНК сплайсинг.
 2.SF2B14   9      Сплайсинг-фактор 3B, ССС, пре-мРНК развилка сайта, 14 кДа.
   SFRS7    8      Сплайсинг-фактор арг-сер богатый 7, ССС, с возрастом
                ассоциированный белок.
   SNRPG   12      Sn-RNP полипептид G, сборка СС.
 MPHOSPH10 20      M-фазы фосфобелок 10, U3 sn-RNP,рРНК процессинг,сплайсинг.
   ZNF638 104      Zn-фингер, РНК сплайсинг.
   USP39   33      Убиквитин-специфичная пептидаза 39, ССС, сборка sn-RNP,
                U4/U6, U5 три sn-RNP ассоциированный белок 65 кДа.
   ASCC3L1 32      Активатор сигнала коинтеграции  в комплекс, субъединица 3,
                подобен 1, ССС, U5 sn-RNP, цис-сборка U2 типа
                предкаталитической СС.
   SF3B1   43      Сплайсинг-фактор 3B, субъединица 1, ССС, 155 кДа.
   GEMIN6   4      Гем ассоциированный белок 6, сборка СС, биогенез sn-RNP.
   PPIG    53      Пептидил-пролил-изомераза G, РНК сплайсинг, циклофилин G.
   DDX1    40      DEAD бокс полипептид 1, АТФ-хеликаза-РНК, рибосом
                биогенез, сборка СС.
 3.SFRS10  21      Сплайсинг-фактор арг-сер богатый 10, ССС.
   LSM3    19      LSM3 гомолог, U6 sn-RNP, ССС.
   TSEN2   48      Сплайсинг эндонуклеаза тРНК 2, мРНК процессинг.
  LOC645852 1      Подобен сплайсинг-фактору 3A, субъединица 2,  66 кДа.
  LOC729418 1      -
   NCBP2    7      Ядерный кэп связывающий белок 2,  20 кДа, сплайсинг и про-
                цессинг, экспорт из ядра мРНК и мя-РНК, пролиферация.
 4.YTHDC1   40     YTH домен содержащий 1, ССС.
   LSM6     14     LSM6 гомолог, U6 sn-RNP ассоциированный белок, ССС.
   PLRG1    14     Плейотропный регулятор 1, СС, ССС, передача сигнала,
                активация корепрессора транскрипции.
   PPARGC1A 98     Пероксисом пролиферации активатор рецептора G,
                коактиватор 1A, сплайсинг, процессинг РНК, сборка белков и
                много других процессов.
   DHX15    57     DEAD/H бокс полипептид 15, минорный U12- зависимый СС,
                АТФ-хеликаза, ССС.
 LOC391718   3     Подобен сплайсинг-эндонуклеазе 2 тРНК.   

                112
 5.GEMIN3   50     Гем ассоциированный белок 3, СС, белков сборка, sn-RNP
                биогенез.
   LSM11    13     LSM11,  U7 sn-RNP ассоциированный, ССС.
   SLU7     16     Сплайсинг-фактор 7, второго шага, выбор сайта сплайсинга
                и процессинг РНК.
   THOC3     8     THO комплекс 3, ССС, экспорт мРНК из ядра.
   P18SRP   46     Сплайсинг регулирующий белок P18.
   SFRS12   22     Сплайсинг-фактор арг-сер богатый 12, СС, ССС.
   SMN1     28     Аварийный для моторного нейрона 1, теломерный, тело Cajal,
                СС сборка, спинальная мышечная атрофия.
   LOC402229 2     Подобен сплайсинг-фактору 4 , псевдо.
   PPP2CA   29     Белок-фосфатаза 2, каталитическая субъединица A, РНК
                сплайсинг и много других процессов.
 6.WTAP1    29     Вильямса рак 1 ассоциированный белок, сплайсинга
                регулятор летальный женский.
   QKI     159     Квакинг-гомолог, РНК связывающий белок, ССС, экспорт мРНК
                из ядра.
   DNX16    20     DEAH бокс полипептид 16, ССС, АТФ-хеликаза-РНК, регуляция
                прохождения клеточного цикла.
   BAT1     12     HLA-B ассоциированный транскрипт 1, АТФ-хеликаза-РНК,
                DEAD бокс, ССС, идентичный белок связывает, мРНК экспорт
                из ядра.
   LSM2      9     U6 - sn-RNP Sm подобный белок, ССС.
   SNRPC    16     Sn-RNP полипептпд C, сплайсинг, sn-RNP U1.
   SRPK1    88     SFRS - белок-киназа 1, ССС, много других процессов.
   SFRS3     9     Сплайсинг-фактор арг-сер богатый 3, ССС.
   CDC5L    59     Цикла клетки разделение,  5 подобный, СС, ССС, регуляция
                транскрипции.
   SYNCPIP  29     Синаптотагмин связывающий, с РНК цитоплазмы
                взаимодействующий белок, ССС.
   SRRP35   19     Сер-арг репрессор белок, 35 кДа, сборка СС три sn-RNP,
                негативная регуляция ССС, альтернативный ССС,
                5-сайта мРНК сплайсинга определение.
   PRPF4B   44     Пре-мРНК процессинг фактор 4B, сер-тре-протеин-киназа,
                ССС.
   C6ORF151 22     Открытая рамка чтения 151, ССС, СС.
   CDC40    51     Цикла клетки разделение 40, ССС.
   RFXDC1   55     Регуляторный фактор X домен содержащий 1, тРНК-интрон-
                эндонуклеаза, сплайсинг тРНК, регуляция транскрипции.
   MYB      38     Миелобластный вирусный онкоген, ССС, клеточный цикл,
                транскрипция.
   SF3B5     1     Сплайсинг-фактор 3B, субъединица 5,   10 кДа, ССС.   
 7 SRPK2   272     SFRS-протеин-киназа 2, каскад сер-тре-киназ ,
                сборка СС, сплайсинг РНК,  дифференцировка.
   LSM8      9     LSM8 гомолог,  U6 sn-RNP ассоциированный, ССС.
   TRA2A    27     Трансформер 2 альфа, ССС.
   HNRPA2B1  9     Гетерогенный ядерный РНП A2/B1, ССС.
   LSM5      3     LSM5 гомолог,  U6 sn-RNP ассоциированный, ССС.
   RP9      23     Пигментозный ретинит 9, РНК сплайсинг, зрительная
                рецепция.
  LOC647145 12     Подобен арг-сер богатый сплайсинг-фактор, 46 кДа.            
 8.RBPMS   188     РНК связывающий белок для множественного сплайсинга
                и процессинга.
   LSM1     13     LSM1 гомолог,  U6 sn-RNP ассоциированный белок, ССС.
   SIAHBP1  13     Разделения-связывания белок посредник репрессор,
                пиримидиновый тракт связывающий сплайсинг-фактор.
 9.NCBP1    38     Ядерной РНК кэп связывающий белок, субъединица 1,  80 кДа,
                сплайсинг РНК, регуляция процессинга 3-конца,

                113
                экспорт мРНК из ядра.
   PRPF4    17     Пре-мРНК процессинг-фактор 4, РНК сплайсинг, ССС.
   CIZ1     38     CDKN1A посредник Zn-фингер белок 1, ССС.
10.HNRPH3   12     Гетерогенный ядерный РНП H3, CCC.
   SMNDC1   12     Сборка СС, апоптоз, нейрон.
   RBM17    28     РНК связывающий главный белок 13, ССС.
   PRPF18   44     Пре-мРНК процессинг-фактор 18, ССС.
   LOC644251 5     Подобен сплайсинг коактиватор субъединице SRm300.
11.PRPF19   16     Пре-мРНК процессинг-фактор 19, ССС.
   TRPT1    72     Сплайсинг тРНК,  тРНК-фосфотрансфераза 1.
   SF1      15     Сплайсинг-фактор 1, сборка СС.
   SF3B2    17     Сплайсинг-фактор 3B, субъединица 2, ССС.
   RBM4      8     РНК связывающий главный белок 4, ССС.
   RBM4B    13     RBM30, ---------------------- 4B, ССС.    
   SPR46     2     Сплайсинг-фактор арг-сер богатый, 46 kDa.
   PPP2R1B  39     Белок-фосфатаза 2, регуляторная субъединица A, бета.
   SART1    19     Чешуйчатых клеток раковый антиген Т-клеток 1, ССС.
   RBM4B    13     РНК связывающий главный белок 4B.
   API5     33     Апоптоз ингибитор 5, СС цитоплазмы.
   CUGBP1   84     CUG триплет повтор РНК связывающий белок 1, выбор
                сайта сплайсинга в РНК, эмбриональное развитие.
   LOC401703 1     Подобен SF U2AF, 35 kDa.
12.WBP11    17     WW домен связывающий белок 11, рРНК процессинг, мРНК
                сплайсинг через СС, одноцепочную ДНК связывает.
   SFRS2IP   9     Сплайсинг-фактор арг-сер богатый, посредник для РНК-
                полимеразы 2.
   DDX23    23     DEAD бокс полипептид 23, хеликаза, ССС.
   SNRPF     8     Sn-RNP полипептид F, ССС.
   SFRF9     9     Сплайсинг-фактор арг-сер богатый 9, ССС.
   FLJ11021 22     Подобен сплайсинг-фактору арг-сер богатому 4.
   SFRS8    89     Сплайсинг-фактор арг-сер богатый 8, ССС, выбор сайта
                сплайсинга , регуляция транскрипции.               
   HNRPA1    5     Гетерогенный ядерный РНП A1, ССС, мРНК экспорт из ядра.
13.PSPC1   108     Paraspeckle компонент, регуляция транскрипции, ССС.
   WBP4     23     WW домен связывающий белок 4, ССС.
14.HNRPC    59     Гетерогенный ядерный РНП С, ССС.
   NOVA1   152     Нейро-раковый вентральный антиген 1, сплайсинг,
                синаптическая передача, поведение.
   SIP1     22     Аварийный моторного нейрона белок взаимодействующий
                белок 1, активатор сплайсинга, сборка СС.
   SFRF5     5     Сплайсинг-фактор арг-сер богатый 5, выбор сайта
                сплайсинга, ССС.
   RBM25    62     РНК связывающий главный белок 25, ССС.
   SNW1     44     SNW домен содержащий 1, ССС.
   WDR25   154     WD повтор домен 25, сплайсинг-фактор.
15.LOC441722 1     U2AF подобен
   RBPMS2   36     РНК связывающий белок для множественного сплайсинга 2.
   CPEB1    96     Поли-A связывающий фактор цитоплазмы, ССС.
   SNRPA1   14     U2 sn-RNP полипептид A, ССС.
   SNURF    24     Sn-RNP полипептид N, особого входа рамка чтения,
                тканеспецифический сплайсинг.
16.LKAP     49     Лимкаин B1, ССС.
   NOL3      1     Ядрышка белок 3, антиапоптоз, ССС.
   SF3B3    49     Сплайсинг-фактор 3B, субъединица 3, ССС.
   TXNL4B    9     Тиоредоксин подобный 4B, CCC.

                114
   DNX38    20     DEAH бокс полипептид 38, АТФ-хеликаза, ССС.
   RNPS1    15     РНК связывающий белок S1, сер-богатый домен, сплайсинг.
   SRRM2    19     SRm субъединица, коактиватор сплайсинга, арг-сер богатый
                без конца повторов матрикс 2.
17.GEMIN4    7     Ассоциированый с гем белок 4, рРНК процессинг,ССС, sn-RNP.
   SFRS1     3     Выбор сайта сплайсинга, ССС, сплайс-фактор арг-сер
                богатый 1
   PRPF8    34     От U5 sn-RNP белок 8, ССС, пре-мРНК процессинг.
   CROP     33     Резистентности к цисплатинату белок , РНК сплайсинг.
   C1QBP     6     Q-субъединицу связывающий комплемент 1  и SF2.
   RAD52B          RAD52B и СС.
   LOC644422 1     На арг-сер богатый фактор сплайсинга 6 похожий.
   THOC4     4     Особый THO комплекс 4, ССС, мРНК экспорт из ядра.
   SERS2     3     Сплайсинг-фактор арг-сер богатый 2, ССС.
   EFTUD2   48     От фактора элонгации Tu-GTP связывающий домен 2, ССС.
   PPP1R9B  17     B9 регулятор субъединица белок-фосфатазы 1, цикл клетки.
   DHX8     40     DEAH бокс полипептид 8, ССС, АТФ-хеликаза-РНК.
   TSEN54    9     Сплайсинга эндонуклеаза тРНК 54.
   TADA2L   70     Транскрипции адаптор 2 похожий, ССС.
18.THOC1    54     THO комплекс 1,  ССС, экспорт мРНК из ядра.
   SNRPD1   18     Sn-RNP D1 полипептид, ССС.
   TXNL4A   15     Тиоредоксин похожий 4A, СС сборка, ССС, цикл клетки.
19.U2AF1L3   3     U2 sn-RNP вспомогательный фактор 1 подобный 3, СС.
   U2AF1L4   3     U2 sn-RNP --------------------------------- 4, СС.
   SNRPA    15     Sn-RNP полипептид A,  U1 sn-RNP.
   SFRS16   32     Сплайсинг-фактор арг-сер богатый 16.
   SNRPD2    5     Sn-RNP полипептид D2, ССС.
   SNRP70   24     U1 sn-RNP 70 kDa полипептид, ССС.
   HNRPM    44     Гетерогенный ядерный РНП M, ССС.
   SR-A1    22     Сплайсинг-фактор арг-сер богатый A1.
   PPP2R1A  36     Белок-фосфатаза 2 регуляторная субъединица A, сплайсинг
                и много других процессов.
   TSEN34    3     Эндонуклеаза сплайсинга тРНК 34.
   U2AF2    21     U2 sn-RNP вспомогательный фактор 2, ССС.
   PTBP1    15     Полипиримидиновую дорожку связывающий белок 1, ССС.
   SF3A2    12     Сплайсинг-фактор 3A, субъединица 2, ССС.
   LSM7      7     U6 sn-RNP связывающий фактор, ССС, LSM7 гомолог.
   KHSRP    11     Сплайсинг регулирующий фактор KH типа, ССС, экспорт РНК
                из ядра.
   XAB2     10     XPA связывающий белок 2, РНК процессинг и сплайсинг.
   PPAN      5     Peter pan гомолог, сплайсинг-фактор 1 второй шаг.
   DDX39    10     DEAD бокс полипептид 39, АТФ-хеликаза-РНК, ССС.
   LSM4     16     LSM4 гомолог, U6 sn-RNP ассоциированный белок, ССС.
   SFRS14   43     Сплайсинг-фактор арг-сер богатый 14.
   SF4      45     Сплайсинг-фактор 4, СС, ССС.   
20.SNRPB     9     Sn-RNP полипептид B/B1, СС, мРНК процессинг и сплайсинг.
   SFRS6     6     Сплайсинг-фактор арг-сер богатый 6, ССС, выбор сайта
                сплайсинга.
   PRPF6    52     Пре-мРНК процессинг фактор, сборка СС, U5 sn-RNP
                ассоциированный белок 102 кДа.
   SNRPB2   12     Sn-RNP  B2, U2 sn-RNP, ССС.
   CRNKL1  121     CRN гомолог, сборка СС, функция неизвестна.
   RBM39    39     РНК связывающий главный белок 39, процессинг мРНК, ССС.
21.SFRS15   61     Сплайсинг-фактор арг-сер богатый 15, сплайсинг пре-мРНК.
   U2AF1    15     U2 sn-RNP вспомогательный фактор 1, ССС.
   LOC402026 1     Подобен арг-сер богатый 9.

                115
22.SNRPD3   17     Sn-RNP D3 полипептид, 18 кДа, ССС, белок центра sn-RNP.
   SF3A1    25     Сплайсинг-фактор 3A, субъединица 1,  120 кДа, ССС,
                определение 3-сайта сплайсинга.
   PHF5A     9     PHD-фингер белок 5A,  U2 sn-RNP, СС.
   NHP2L1   15     Негистоновый белок хромосом 2, подобный 1, ССС, рибосом
                сборка и биогенез, U4/U6, U5 - три sn-RNP связывающий
                РНК белок,   15, 5 кДа.
 X.U2AF1L2  33     U2 sn-RNP вспомогательный фактор 1, подобен 2 минорный
                компонент U12 СС.
   THOC2    86     THO комплекс 2, ССС, экспорт мРНК из ядра.
   NONO     18     Не POU домен октамер ATGCAAAT связывающий
                белок, ССС, ДНК рекомбинация и репарация.
 Y. -----
 Всего 190 генов имеющих значение для сплайсинга.

                ПРИЛОЖЕНИЕ 5. СПИСОК БОЛЬШИХ БЕЛКОВ ЧЕЛОВЕКА.
                СОСТАВИЛ КУРНОСОВ М. Н.  14 АПРЕЛЯ 2011.

ABCA1   - 2261   AKAP9   - 3899   ATRX    - 2288
ABCA10  - 1543   AKAP9   - 3907   ATRX    - 2454
ABCA12  - 2277   AKAP9   - 3911   ATRX    - 2492
ABCA12  - 2595   ALK     - 1620   BAHCC1  - 2730
ABCA13  - 5058   ALMS1   - 4169   BAI1    - 1584
ABCA2   - 2436   ALPK3   - 1907   BAI2    - 1572
ABCA2   - 2466   ALS2    - 1657   BAI3    - 1522
ABCA3   - 1704   ANAPC1  - 1944   BAT2    - 2145
ABCA4   - 2273   ANK1    - 1719   BAT2    - 2157
ABCA5   - 1642   ANK1    - 1856   BAT2D1  - 2701
ABCA6   - 1617   ANK1    - 1880   BAZ1A   - 1524
ABCA7   - 2008   ANK1    - 1881   BAZ1A   - 1556
ABCA7   - 2146   ANK2    - 1872   BAZ2A   - 1905
ABCA8   - 1581   ANK2    - 3957   BAZ2B   - 2168
ABCA9   - 1624   ANK3    - 4377   BCOR    - 1721
ABCC1   - 1531   ANKHD1  - 2542   BCORL1  - 1711
ABCC2   - 1545   ANKRD11 - 2663   BDP1    - 2254
ABCC3   - 1527   ANKRD12 - 2062   BIRC6   - 4829
ABCC6   - 1503   ANKRD17 - 2352   BRCA1   - 1567
ABCC8   - 1581   ANKRD17 - 2603   BRCA1   - 1598
ABCC9   - 1513   ANKRD26 - 1709   BRCA1   - 1624
ABCC9   - 1549   ANKRD31 - 1873   BRCA1   - 1822
ABCC9   - 1549   ANKRD31 - 1873   BRCA1   - 1863
ACACA   - 2268   APC     - 2843   BRCA1   - 1863
ACACA   - 2288   APC2    - 2303   BRCA1   - 1863
ACACA   - 2346   APOB    - 4563   BRCA2   - 3418
ACACA   - 2346   ARFGEF1 - 1849   BRWD1   - 2269
ACACA   - 2383   ARFGEF2 - 1785   BRWD1   - 2320
ACACB   - 2458   ARHGAP21- 1957   BRWD3   - 1802
ADAMTS12- 1594   ARHGAP23- 1684   BSN     - 3926
ADAMTS20- 1502   ARHGAP5 - 1501   BTAF1   - 1849
ADAMTS20- 1908   ARHGAP5 - 1502   BTBD12  - 1834
ADAMTS7 - 1686   ARHGEF11- 1522   BZRAP1  - 1857
ADAMTS9 - 1935   ARHGEF11- 1562   C10ORF18- 2726
ADAMTSL3- 1691   ARHGEF12- 1544   C10ORF18- 2726
AGC1    - 2316   ARHGEF17- 2063   C10ORF79- 1665
AGC1    - 2415   ARHGEF5 - 1597   C10ORF93- 1642
AGL     - 1515   ARID1A  - 2068   C12ORF35- 1747
AGL     - 1516   ARID1A  - 2285   C14ORF78- 5048
AGL     - 1532   ARID1B  - 2178   C14ORF78- 6287

                116
AGL     - 1532   ARID1B  - 2191   C17ORF27- 3280
AGL     - 1532   ARID1B  - 2231   C17ORF41- 1818
AGL     - 1532   ARID2   - 1835   C17ORF41- 1844
AGRIN   - 1823   ASCC3   - 2202   C1ORF173- 1530
AGRIN   - 2045   ASCC3L1 - 2136   C20ORF174 1677
AHCTF   - 2266   ASH1L   - 2969   C20ORF174 1677
AHCTF1  - 2223   ASPM    - 3477   C20ORF74- 1873
AHDC1   - 1603   ASXL1   - 1541   C2ORF16 - 1984
AHNAK   - 5890   ATBF1   - 3703   C3      - 1663
AIM1    - 1723   ATM     - 1708   C4A     - 1744
AKAP11  - 1901   ATM     - 3056   C4B     - 1744
AKAP12  - 1684   ATP10B  - 1520   C5      - 1676
AKAP12  - 1782   ATP10B  - 1520   C8ORFK23- 1857
AKAP13  - 2813   ATP7A   - 1500   C9ORF84 - 1508
AKAP6   - 2319   ATR     - 2612   CABIN1  - 2220
AKAP9   - 1655   ATR     - 2644   CACNA1A - 2261
CACNA1A - 2505   CHD1    - 1710   CPAMD8  - 1885
CACNA1B - 2339   CHD2    - 1739   CPS1    - 1500
CACNA1C - 2138   CHD3    - 1966   CR1     - 1520
CACNA1D - 2181   CHD3    - 2000   CR1     - 2039
CACNA1E - 2270   CHD3    - 2045   CR1     - 2489
CACNA1F - 1977   CHD4    - 1912   CREBBP  - 2442
CACNA1G - 1555   CHD5    - 1954   CROCC   - 2017
CACNA1G - 2243   CHD6    - 2715   CSMD1   - 3565
CACNA1G - 2250   CHD7    - 2997   CSMD2   - 3487
CACNA1G - 2261   CHD8    - 2302   CSMD3   - 3501
CACNA1G - 2266   CHD9    - 2898   CSMD3   - 3667
CACNA1G - 2273   CIC     - 1608   CSMD3   - 3707
CACNA1G - 2284   CIT     - 2027   CSPG2   - 3396
CACNA1G - 2298   CKAP5   - 1972   CSPG4   - 2322
CACNA1G - 2306   CKAP5   - 2032   CTTNBP2 - 1663
CACNA1G - 2321   CLASP1  - 1538   CUBN    - 3623
CACNA1G - 2332   CLASP2  - 1506   CUL7    - 1698
CACNA1G - 2343   CLTC    - 1675   CUTL1   - 1505
CACNA1G - 2354   CLTCL1  - 1569   CXXC6   - 2136
CACNA1G - 2377   CLTCL1  - 1626   DCHS1   - 3298
CACNA1H - 2347   CMYA1   - 1843   DCHS2   - 2916
CACNA1H - 2353   CMYA3   - 3345   DENND4A - 1865
CACNA1I - 2188   CMYA5   - 4069   DENND4B - 1708
CACNA1I - 2223   CNOT1   - 1551   DENND4B - 1725
CACNA1S - 1873   CNOT1   - 2376   DENND4C - 1557
CAD     - 2225   COL11A1 - 1767   DEPDC2  - 1606
CAMTA1  - 1673   COL11A1 - 1806   DEPDC5  - 1572
CASC5   - 2316   COL11A1 - 1818   DICER1  - 1922
CASC5   - 2342   COL11A2 - 1629   DICER1  - 1922
CASP8AP2- 1982   COL11A2 - 1650   DIDO1   - 2240
CCDC108 - 1925   COL11A2 - 1736   DIP2A   - 1571
CCDC131 - 1989   COL12A1 - 1899   DIP2B   - 1576
CDC2L5  - 1512   COL12A1 - 3063   DIP2C   - 1556
CDC42BPA- 1638   COL14A1 - 1796   DISP1   - 1524
CDC42BPA- 1719   COL16A1 - 1603   DKFZP586P0123 - 1963
CDC42BPB- 1711   COL18A1 - 1516   DLC1    - 1528
CDC42BPG- 1551   COL22A1 - 1626   DLEC1   - 1755
CDH23   - 3354   COL24A1 - 1714   DLEC1   - 1778
CDK5RAP2- 1814   COL27A1 - 1860   DLG5    - 1809
CDK5RAP2- 1893   COL4A1  - 1669   DMBT1   - 1784
CECR2   - 1548   COL4A2  - 1712   DMBT1   - 1785
CECR2   - 2548   COL4A3  - 1637   DMBT1   - 2403
CELSR1  - 3014   COL4A3  - 1670   DMBT1   - 2413
CELSR2  - 2923   COL4A4  - 1690   DMD     - 2341
CELSR3  - 3312   COL4A5  - 1685   DMD     - 2344
CENPE   - 2701   COL4A5  - 1688   DMD     - 3562

                117
CENPF   - 3114   COL4A6  - 1690   DMD     - 3562
CENTD1  - 1704   COL4A6  - 1691   DMD     - 3677
CENTD3  - 1544   COL5A1  - 1838   DMD     - 3681
CEP110  - 2325   COL5A3  - 1745   DMD     - 3685
CEP170  - 1584   COL6A3  - 2971   DMN     - 1565
CEP192  - 1941   COL6A3  - 2976   DMXL1   - 3027
CEP250  - 2386   COL6A3  - 2977   DMXL2   - 3036
CEP250  - 2442   COL6A3  - 3010   DNAH1   - 4330
CEP290  - 2479   COL6A3  - 3177   DNAH11  - 4523
CEP350  - 3117   COL7A1  - 2944   DNAH3   - 4116
DNAH5   - 4624   FALZ    - 2903   FRY     - 3012
DNAH7   - 4024   FALZ    - 2920   GARNL1  - 2036
DNAH8   - 4490   FAM38A  - 2035   GARNL1  - 2083
DNAH9   - 4486   FAM44A  - 3051   GBF1    - 1859
DNAJC13 - 2243   FANCM   - 2048   GCC2    - 1583
DNHD3   - 4427   FASN    - 2511   GCC2    - 1684
DNMBP   - 1577   FAT     - 4588   GCN1L1  - 2671
DNMT1   - 1616   FAT2    - 4349   GEMIN5  - 1508
DOCK1   - 1865   FAT3    - 4601   GLI2    - 1586
DOCK11  - 2073   FAT3    - 4601   GLI3    - 1580
DOCK2   - 1830   FAT4    - 3222   GLTSCR1 - 1509
DOCK3   - 2030   FBN1    - 2871   GOLGA4  - 2230
DOCK4   - 1966   FBN2    - 2912   GOLGB1  - 3259
DOCK5   - 1870   FBN3    - 2809   GON4L   - 1529
DOCK6   - 2047   FCGBP   - 3070   GON4L   - 2240
DOCK7   - 2109   FCGBP   - 5405   GPATC8  - 1502
DOCK8   - 2031   FER1L3  - 2048   GPR112  - 3080
DOCK9   - 2069   FER1L3  - 2061   GPR179  - 1668
DOPEY1  - 2465   FLG     - 4061   GPR179  - 2367
DOPEY2  - 2298   FLG2    - 2391   GPR98   - 6307
DOT1L   - 1537   FLG40176- 2452   GREB1   - 1949
DSCAM   - 1571   FLJ10357- 1519   GRLF1   - 1513
DSCAM   - 2012   FLJ13231- 2095   GTF3C1  - 2109
DSCAML1 - 2113   FLJ20035- 1712   GVIN1   - 2423
DSI     - 2649   FLJ23577- 1822   GVIN1   - 2423
DSP     - 2272   FLJ23588- 1501   HAK     - 1933
DSP     - 2871   FLJ30092- 3000   HCFC1   - 1938
DST     - 3062   FLJ30092- 3000   HD      - 3144
DST     - 5171   FLJ31033- 1707   HEATR1  - 2144
DST     - 5497   FLJ31033- 1723   HECTD1  - 2612
DUOX1   - 1551   FLJ34306- 1634   HECW1   - 1606
DUOX1   - 1551   FLJ36157- 1692   HECW2   - 1572
DUOX2   - 1548   FLJ36157- 1692   HELZ    - 1942
DYNC1H1 - 4646   FLJ40176- 2452   HERC1   - 4861
DYNC2H1 - 4307   FLJ40243- 1585   HERC2   - 4834
DYNC2H1 - 4307   FLJ43950- 1596   HIVEP1  - 2717
DYNC2H1 - 4314   FLJ46321- 1576   HIVEP2  - 2500
DYSF    - 2080   FLNA    - 2647   HIVEP3  - 2406
EDD1    - 2799   FLNB    - 2602   HMCN1   - 5636
EFCAB5  - 1503   FLNC    - 2705   HSPG2   - 4391
EHBP1L1 - 1523   FMN2    - 1865   HUWE1   - 4374
EIF2AK4 - 1649   FN1     - 2176   IANC1   - 1861
EIF4G1  - 1512   FN1     - 2296   IFT172  - 1749
EIF4G1  - 1599   FN1     - 2330   IGF2R   - 2491
EIF4G1  - 1599   FN1     - 2355   IGSF10  - 2623
EIF4G3  - 1585   FN1     - 2421   INADL   - 1524
EML5    - 1977   FN1     - 2477   INADL   - 1552
EP300   - 2414   FNDC1   - 1836   INADL   - 1582
EP400   - 3122   FRAP1   - 2549   INADL   - 1801
EPPK1   - 5065   FRAS1   - 4011   INOC1   - 1556
EPRS    - 1512   FREM2   - 3169   INTS1   - 2381
ESPL1   - 2120   FREM3   - 2289   INTS1   - 2382

                118
EVPL    - 2033   FREM3   - 2289   INTS1   - 2382
EXPH5   - 1989   FRMPD1  - 1578   IQGAP1  - 1657
F5      - 2224   FRMPD3  - 1810   IQGAP2  - 1575
F8      - 2351   FRMPD3  - 1810   IQGAP3  - 1631
ITGB4   - 1752   KIAA1509- 2035   LBA1    - 3118
ITGB4   - 1805   KIAA1509- 2035   LCT     - 1927
ITGB4   - 1822   KIAA1542- 1649   LMTK2   - 1503
ITPR1   - 2695   KIAA1549- 1884   LOC121006 1628
ITPR2   - 2701   KIAA1549- 1884   LOC121006 1951
ITPR3   - 2671   KIAA1549- 1884   LOC127602 3198
ITSN1   - 1721   KIAA1571- 2354   LOC127602 3198
ITSN2   - 1669   KIAA1571- 2354   LOC131873 2479
ITSN2   - 1696   KIAA1618- 1600   LOC131873 2479
JARID1A - 1722   KIAA1632- 2579   LOC150221 1639
JARID1B - 1544   KIAA1639- 1778   LOC285556 1826
JMJD1B  - 1761   KIAA1666- 1639   LOC285556 1826
JMJD1C  - 2303   KIAA1666- 1639   LOC339766 1806
JMJD3   - 1682   KIAA1679- 1577   LOC339766 1832
JMJD3   - 1684   KIAA1713- 1955   LOC440804 1639
KALRN   - 1663   KIAA1713- 2223   LOC642103 1518
KALRN   - 2985   KIAA1769- 1577   LOC642132 1602
KIAA0100- 2235   KIAA1787- 1560   LOC643677 3632
KIAA0133- 1524   KIAA1787- 1562   LOC647546 1527
KIAA0363- 1759   KIAA1797- 1801   LOC648187 1797
KIAA0363- 1782   KIAA1840- 2443   LOC648502 3534
KIAA0363- 1782   KIAA1856- 1687   LOC649768 5205
KIAA0367- 2724   KIAA1856- 1687   LOC650412 4107
KIAA0368- 2017   KIAA1856- 1687   LOC65120- 1572
KIAA0368- 2017   KIAA1863- 1706   LOC651200 1572
KIAA0372- 1564   KIAA2002- 1746   LOC651610 2932
KIAA0404- 1938   KIAA2002- 1746   LOC651758 1702
KIAA0423- 1720   KIAA2018- 2186   LOC651921 2011
KIAA0430- 1742   KIAA2022- 1516   LOC652147 1622
KIAA0467- 2533   KIDINS220 1771   LOC653489 1757
KIAA0556- 1618   KIF13A  - 1805   LOC653489 1758
KIAA0564- 1905   KIF13B  - 1826   LOC653489 1760
KIAA0586- 1504   KIF14   - 1648   LOC653489 1766
KIAA0802- 1586   KIF1A   - 1690   LOC653877 2785
KIAA0947- 2556   KIF1B   - 1770   LOC727851 1625
KIAA0947- 2659   KIF21A  - 1661   LOC727851 1734
KIAA0960- 1657   KIF21B  - 1624   LOC727851 1756
KIAA0960- 1657   KIF26A  - 1882   LOC727851 1765
KIAA0960- 1657   KIF26A  - 2042   LOC727897 5708
KIAA1109- 4975   KIF26B  - 2108   LOC727957 1706
KIAA1109- 5005   KIF26B  - 2108   LOC728307 1934
KIAA1210- 1569   KNDC1   - 1749   LOC728317 2028
KIAA1210- 1569   KNTC1   - 2209   LOC728763 1529
KIAA1212- 1843   LAMA1   - 3069   LOC728849 2493
KIAA1217- 1943   LAMA1   - 3075   LOC729197 3784
KIAA1239- 1742   LAMA2   - 3122   LOC729540 1655
KIAA1239- 1742   LAMA3   - 1724   LOC729540 1734
KIAA1244- 2106   LAMA3   - 3333   LOC729540 1756
KIAA1305- 1898   LAMA4   - 1816   LOC729540 1765
KIAA1305- 1898   LAMA5   - 3695   LOC729605 1545
KIAA1345- 1561   LAMB1   - 1786   LOC729792 1612
KIAA1345- 1561   LAMB2   - 1798   LOC729857 1745
KIAA1409- 2458   LAMB4   - 1761   LOC729857 1747
KIAA1414- 2071   LAMC1   - 1609   LOC729857 1763
KIAA1429- 1812   LAMC3   - 1575   LOC729859 1756
KIAA1509- 2028   LBA1    - 3118   LOC729871 3437
LOC730401 1521   MEGF6   - 1565   MYO10   - 2058
LOC730409 1521   MEGF8   - 2386   MYO15A  - 3530

                119
LOC730429 2796   MGA     - 3033   MYO18A  - 2039
LOC730839 1885   MGA     - 3033   MYO18A  - 2054
LOC730855 3141   MGA     - 3114   MYO18B  - 2567
LOC730979 2061   MGA     - 3114   MYO3A   - 1616
LOC731751 4096   MGAM    - 1857   MYO5A   - 1855
LOC732021 1521   MGC22014- 1660   MYO5B   - 1848
LOC732294 1559   MGC22014- 1660   MYO5B   - 1848
LOC90342- 2217   MIA3    - 1808   MYO5C   - 1742
LOC90342- 2217   MIA3    - 1808   MYO7A   - 2215
LOXHD1  - 1533   MIA3    - 1848   MYO7B   - 2116
LPA     - 4548   MIA3    - 1907   MYO7B   - 2116
LRBA    - 2863   MIA3    - 1907   MYO9A   - 2548
LRKK2   - 2537   MKI67   - 3256   MYO9B   - 2157
LRP1    - 4544   MLL     - 3969   MYOM1   - 1685
LRP1B   - 4599   MLL2    - 5262   MYR8    - 1858
LRP2    - 4655   MLL3    - 4025   MYST3   - 2004
LRP4    - 1905   MLL3    - 4911   MYST4   - 2073
LRP5    - 1615   MLL4    - 2715   N4BP2   - 1770
LRP6    - 1613   MLL5    - 1858   NAG     - 2371
LRRC37A - 1606   MLL5    - 1858   NAV1    - 1874
LRRC7   - 1537   MLLT4   - 1612   NAV2    - 2429
LRRK1   - 2015   MLLT4   - 1651   NAV2    - 2488
LTBP1   - 1722   MLLT4   - 1834   NAV3    - 2363
LTBP2   - 1821   MON2    - 1717   NBEA    - 2946
LTBP4   - 1587   MPDZ    - 2042   NBEAL2  - 2833
LY75    - 1722   MPHOSPH1- 1780   NBEAL2  - 2833
LYST    - 2001   MUC16   - 14507  NCOA6   - 2063
LYST    - 3801   MUC17   - 4493   NCOR1   - 2440
MACF1   - 5430   MUC19   - 4516   NCOR2   - 2524
MACF1   - 5938   MUC19   - 7328   NEB     - 6669
MADD    - 1545   MUC2    - 5179   NES     - 1621
MADD    - 1565   MUC4    - 2169   NF1     - 2818
MADD    - 1581   MUC6    - 1841   NFAT5   - 1531
MADD    - 1588   MXRA5   - 2828   NHS     - 1517
MADD    - 1588   MYCBP2  - 4640   NHS     - 1630
MADD    - 1608   MYH1    - 1939   NHSL1   - 1977
MADD    - 1647   MYH11   - 1938   NHSL1   - 1977
MAP1A   - 2680   MYH11   - 1972   NIN     - 2029
MAP1B   - 2342   MYH13   - 1938   NIN     - 2073
MAP1B   - 2468   MYH14   - 1995   NIN     - 2090
MAP2    - 1827   MYH15   - 1946   NIN     - 2096
MAP3K1  - 1748   MYH15   - 1946   NIN     - 2116
MAP3K1  - 1773   MYH2    - 1941   NIPBL   - 2697
MAP3K4  - 1558   MYH3    - 1940   NIPBL   - 2804
MAP3K4  - 1608   MYH4    - 1939   NISCH   - 1504
MAPKBP1 - 1508   MYH6    - 1939   NOD27   - 1866
MASK-BP3- 2617   MYH7    - 1935   NOTCH1  - 2556
MAST1   - 1570   MYH7B   - 1983   NOTCH2  - 2279
MAST2   - 1734   MYH8    - 1937   NOTCH2  - 2471
MCM3AP  - 1980   MYH9    - 1960   NOTCH3  - 2321
MDC1    - 2089   MYLK    - 1794   NOTCH4  - 2003
MDN1    - 5596   MYLK    - 1845   NRAP    - 1695
MED12   - 2212   MYLK    - 1863   NRAP    - 1730
MED12L  - 2145   MYLK    - 1914   NRK     - 1582
NRXN2   - 1642   PIK3C2B - 1634   PTPN13  - 2490
NRXN2   - 1712   PIK4CA  - 2044   PTPN23  - 1636
NSD1    - 2427   PIP5K3  - 1779   PTPRB   - 1997
NSD1    - 2696   PIP5K3  - 2098   PTPRD   - 1501
NUMA1   - 2115   PKD1    - 4302   PTPRD   - 1899
NUP188  - 1749   PKD1    - 4303   PTPRD   - 1903
NUP205  - 2012   PKD1L1  - 2849   PTPRD   - 1912
NUP210  - 1887   PKD1L2  - 1817   PTPRF   - 1888

                120
NUP210L - 1591   PKD1L2  - 2459   PTPRF   - 1897
NUP214  - 2090   PKD1L3  - 1731   PTPRQ   - 2978
NUP98   - 1726   PKD1L3  - 1731   PTPRQ   - 2978
NUP98   - 1800   PKDREJ  - 2253   PTPRS   - 1501
OBSCN   - 6620   PKHD1   - 3396   PTPRS   - 1505
OBSL1   - 1530   PKHD1   - 4074   PTPRS   - 1910
OBSL1   - 1530   PKHD1L1 - 4243   PTPRS   - 1948
ODZ1    - 2725   PLCE1   - 2303   PTPRZ1  - 2315
ODZ2    - 2029   PLCH1   - 1655   PXDN    - 1559
ODZ2    - 2029   PLEC1   - 4515   QRICH2  - 1663
ODZ2    - 2029   PLEC1   - 4525   RAI1    - 1906
ODZ2    - 2535   PLEC1   - 4533   RANBP2  - 3224
ODZ2    - 2609   PLEC1   - 4547   RAPGEF2 - 1528
ODZ2    - 2609   PLEC1   - 4547   RAPGEF2 - 1528
ODZ3    - 2699   PLEC1   - 4551   RAPGEF2 - 1569
ODZ3    - 2699   PLEC1   - 4574   RAPGEF2 - 1569
ODZ3    - 2715   PLEC1   - 4684   RAPGEF2 - 1672
ODZ3    - 2736   PLXNA1  - 1873   RAPGEF2 - 1672
ODZ4    - 2769   PLXNA2  - 1894   RAPGEF6 - 1601
OTOF    - 1997   PLXNA3  - 1871   RB1CC1  - 1594
OTOG    - 2924   PLXNB1  - 2135   RBBP6   - 1758
OTOG    - 2924   PLXNB2  - 1884   RBBP6   - 1792
PAPPA   - 1627   PLXNB2  - 1901   RELN    - 3458
PAPPA2  - 1790   PLXNB3  - 1909   RELN    - 3460
PARC    - 2517   PLXNC1  - 1568   RERE    - 1566
PARP14  - 1518   PLXND1  - 1925   REV3L   - 3052
PARP4   - 1724   POLE    - 2286   RGNEF   - 1651
PB1     - 1582   POLQ    - 2590   RGNEF   - 1651
PB1     - 1582   POLR1A  - 1717   RGNEF   - 1687
PB1     - 1602   POLR2A  - 1970   RGPD2   - 1748
PCDH15  - 1955   PPARBP  - 1581   RGPD5   - 1765
PCF11   - 1555   PPL     - 1756   RICS    - 1738
PCLO    - 5010   PPRC1   - 1664   RICTOR  - 1708
PCLO    - 5011   PRDM15  - 1507   RIF1    - 2472
PCLO    - 5021   PRDM2   - 1682   RIMS1   - 1692
PCM1    - 2022   PRDM2   - 1718   RLF     - 1914
PCNT    - 3336   PREX1   - 1659   RNF17   - 1623
PCNX    - 2341   PRIC285 - 2080   ROBO1   - 1612
PCNXL3  - 1843   PRIC285 - 2649   ROBO1   - 1651
PCNXL3  - 1843   PRKDC   - 4128   ROS1    - 2347
PCNXL3  - 1915   PRPF8   - 2335   RP1     - 2156
PCNXL3  - 1915   PRR12   - 2187   RP1L1   - 2480
PDCD11  - 1871   PSME4   - 1729   RREB1   - 1687
PDE4DIP - 2346   PTCHD2  - 1585   RREB1   - 1687
PDZD2   - 2839   PTCHD2  - 1586   RREB1   - 1742
PEG3    - 1588   PTPN13  - 2294   RTTN    - 2226
PHF3    - 2039   PTPN13  - 2466   RUSC2   - 1516
PIK3C2A - 1686   PTPN13  - 2485   RYR1    - 5038
RYR2    - 4967   SPTA1   - 2429   TNRC6A  - 1962
RYR3    - 4870   SPTAN1  - 2472   TNRC6B  - 1722
SAC     - 1610   SPTB    - 2137   TNRC6C  - 1690
SACS    - 4432   SPTB    - 2328   TNS1    - 1735
SAMD9   - 1589   SPTBN1  - 2155   TNXB    - 4289
SAMD9L  - 1584   SPTBN1  - 2364   TOP2A   - 1531
SBF1    - 1867   SPTBN2  - 2390   TOP2B   - 1621
SBF2    - 1849   SPTBN4  - 2559   TP53BP1 - 1972
SCN10A  - 1956   SPTBN4  - 2564   TPR     - 2349
SCN11A  - 1791   SPTBN5  - 3674   TRIO    - 3097
SCN1A   - 1998   SRCAP   - 2971   TRIOBP  - 2365
SCN2A2  - 2005   SRRM2   - 2752   TRIP11  - 1979
SCN2A2  - 2005   STAB1   - 2570   TRIP12  - 1992
SCN2A2  - 2005   STARD9  - 4552   TRPM1   - 1603

                121
SCN3A   - 2000   STRC    - 1775   TRPM2   - 1503
SCN4A   - 1836   SUPT6H  - 1726   TRPM3   - 1544
SCN5A   - 1663   SVEP1   - 3568   TRPM3   - 1554
SCN5A   - 2015   SVEP1   - 3568   TRPM3   - 1556
SCN5A   - 2016   SVIL    - 1788   TRPM3   - 1566
SCN7A   - 1682   SVIL    - 2214   TRPM3   - 1569
SCN8A   - 1980   SYCP2   - 1530   TRPM3   - 1579
SCN9A   - 1977   SYNE1   - 3321   TRPM3   - 1707
SCRIB   - 1630   SYNE1   - 8749   TRPM6   - 2022
SCRIB   - 1655   SYNE1   - 8797   TRPM7   - 1864
SDK1    - 2213   SYNE2   - 3269   TRRAP   - 3830
SDK2    - 1851   SYNE2   - 6883   TSC2    - 1763
SETBP1  - 1542   SYNJ1   - 1573   TSC2    - 1764
SETD1A  - 1707   TACC2   - 2948   TSC2    - 1807
SETD1B  - 2145   TAF1    - 1872   TTBK2   - 1649
SETX    - 2677   TAF1    - 1893   TTC28   - 2481
SHANK1  - 2161   TAF1L   - 1826   TTC28   - 2481
SHANK3  - 1747   TANC2   - 1900   TTC3    - 2025
SHANK3  - 1823   TANC2   - 1900   TTC3    - 2025
SHPRH   - 1659   TARBP1  - 1621   TTN     - 26926
SHRM    - 1995   TCF20   - 1938   TTN     - 27051
SHROOM2 - 1616   TCF20   - 1964   TTN     - 27118
SI      - 1827   TDRD6   - 2096   TTN     - 33423
SIGLEC1 - 1709   TECTA   - 2155   TTN     - 5604
SIPA1L1 - 1804   TEP1    - 2627   TUBGCP6 - 1819
SIPA1L3 - 1781   TEX15   - 2789   TULP4   - 1543
SKIP    - 1671   TG      - 2768   UBR1    - 1749
SLIT2   - 1529   THADA   - 1953   UBR2    - 1755
SMARCA2 - 1572   THRAP1  - 2174   UGCGL1  - 1531
SMARCA2 - 1590   THRAP2  - 2210   UGCGL1  - 1555
SMARCA4 - 1647   TIAM1   - 1591   UGCGL2  - 1516
SMCHD1  - 1861   TIAM2   - 1701   UNC13A  - 1724
SMCHD1  - 1861   TJP1    - 1668   UNC13A  - 1791
SMCX    - 1560   TJP1    - 1748   UNC13B  - 1591
SMCY    - 1539   TLN1    - 2541   UNC13C  - 2214
SMG1    - 3661   TLN2    - 2542   UNC13C  - 2214
SON     - 2303   TMEM131 - 1770   USH2A   - 1546
SON     - 2426   TMEM131 - 1770   USH2A   - 5202
SORL1   - 2214   TMEM131 - 1883   USP24   - 2454
SPAG17  - 2223   TNC     - 2201   USP24   - 2460
SPEG    - 3649   TNKS1BP1- 1729   USP32   - 1604
SPEN    - 3664   TNRC6A  - 1709   USP34   - 3395
USP9X   - 2554   VWF     - 2813   ZFP106  - 1883
USP9X   - 2570   WDFY3   - 3526   ZFYVE16 - 1539
USP9Y   - 2555   WDR62   - 1518   ZFYVE26 - 2539
UTP20   - 2785   WDR87   - 2602   ZMYM4   - 1548
UTRN    - 3433   WDR90   - 1748   ZNF142  - 1524
VGCNL1  - 1738   WNK1    - 2382   ZNF236  - 1845
VPRBP   - 1507   WNK2    - 2217   ZNF292  - 2723
VPS13A  - 3069   WNK3    - 1743   ZNF294  - 1766
VPS13A  - 3095   WNK3    - 1800   ZNF318  - 2099
VPS13A  - 3135   XRN1    - 1706   ZNF462  - 2506
VPS13A  - 3174   YLPM1   - 2146   ZNF469  - 3925
VPS13B  - 3997   YLPM1   - 2146   ZNF608  - 1512
VPS13B  - 3997   ZAN     - 2721   ZNF638  - 1978
VPS13B  - 4022   ZAN     - 2812   ZNF638  - 1978
VPS13C  - 3585   ZC3H13  - 1564   ZNF646  - 1832
VPS13C  - 3628   ZCCHC11 - 1640   ZNFX1   - 1918
VPS13C  - 3710   ZCCHC11 - 1644   ZUBR1   - 5183
VPS13D  - 4363   ZCCHC11 - 1645   ZZEF1   - 2961
VPS13D  - 4388   ZFHX4   - 3567   
VPS13S  - 3753   ZFNX2   - 1517          

                122
Приложение 6. Список повторов в изученных интронах генов-гигантов.Список генерирован программой для поиска повторов. Каждый интрон был разбит мной на
последовательные участки, которые по порядку названы локусами.Автор Курносов М.Н.
GENE - DISC1-i9
LOCUS       0. 001     23144 bp
DEFINITION
     repeat_region   complement(3207. . 3484)
                /note= "Alu"
     repeat_region   complement(4129. . 4541)
                /note= "MSTC"
     repeat_region   complement(8483. . 8768)
                /note= "Alu"
     repeat_region   8501. . 8636
                /note= "SVA"
     repeat_region   complement(10859. . 11134)
                /note= "Alu"
     repeat_region   10872. . 11014
                /note= "FRAM"
     repeat_region   complement(11154. . 11561)
                /note= "LTR7"
     repeat_region   11156. . 11470
                /note= "RETROVIRAL4"
     repeat_region   11570. . 11940
                /note= "RETROVIRAL2"
     repeat_region   12297. . 13225
                /note= "RETROVIRAL3"
     repeat_region   16721. . 17034
                /note= "RETROVIRAL4"
     repeat_region   16960. . 17108
                /note= "RETROVIRAL4"
     repeat_region   complement(16719. . 17156)
                /note= "LTR7"
     repeat_region   complement(21115. . 21488)
                /note= "MSTA"
     repeat_region   complement(22201. . 22298)
                /note= "Alu"
     repeat_region   22489. . 22637
                /note= "MER46"
LOCUS       0. 002     23139 bp
DEFINITION
     repeat_region   2568. . 2834
                /note= "MER21B"
     repeat_region   complement(2780. . 2942)
                /note= "MER4A"
     repeat_region   complement(2780. . 3012)
                /note= "MER4B"
     repeat_region   3010. . 3274
                /note= "Alu"
     repeat_region   complement(3402. . 3598)
                /note= "MER4B"
     repeat_region   complement(5371. . 5761)
                /note= "MLT1B"
     repeat_region   complement(5511. . 5761)
                /note= "MLT1C"
     repeat_region   complement(7470. . 7759)
                /note= "Alu"
     repeat_region   7500. . 7755
                /note= "SVA"
     repeat_region   7492. . 7625
                /note= "FRAM"
     repeat_region   13218. . 13354
                /note= "FRAM"
     repeat_region   11588. . 11932
                /note= "MER7A"
     repeat_region   11588. . 11864
                /note= "MER7B"
     repeat_region   complement(13068. . 13355)
                /note= "Alu"
     repeat_region   complement(17606. . 17795)
                /note= "MLT1D"
     repeat_region   complement(17604. . 17965)
                /note= "MLT1A"
     repeat_region   18621. . 18838
                /note= "MER46"
     repeat_region   complement(21585. . 21870)
                /note= "Alu"

                123
     repeat_region   22722. . 23008
                /note= "Alu"
LOCUS       0. 003     23136 bp
DEFINITION
     repeat_region   3781. . 3913
                /note= "Alu"
     repeat_region   3920. . 4091
                /note= "Alu"
     repeat_region   4583. . 4653
                /note= "MER28"
     repeat_region   4567. . 4653
                /note= "TIGGER2-2"
     repeat_region   complement(4626. . 4784)
                /note= "MSTC"
     repeat_region   complement(4626. . 4752)
                /note= "MSTA"
     repeat_region   complement(9053. . 9350)
                /note= "Alu"
     repeat_region   complement(9369. . 9659)
                /note= "Alu"
     repeat_region   9385. . 9513
                /note= "SVA"
     repeat_region   9794. . 9892
                /note= "Alu"
     repeat_region   9831. . 10125
                /note= "Alu"
     repeat_region   11269. . 11379
                /note= "THE1B"
     repeat_region   11269. . 11694
                /note= "MSTA"
     repeat_region   11600. . 11694
                /note= "THE1B"
     repeat_region   11512. . 11694
                /note= "MSTC"
     repeat_region   14242. . 14470
                /note= "MER46"
     repeat_region   15173. . 15583
                /note= "MSTC"
     repeat_region   15174. . 15579
                /note= "MSTA"
     repeat_region   15173. . 15277
                /note= "MLT1A"
     repeat_region   complement(16422. . 16837)
                /note= "MLT1B"
     repeat_region   complement(16579. . 16837)
                /note= "MLT1C"
     repeat_region   complement(21078. . 21459)
                /note= "MLT1A"
     repeat_region   complement(22073. . 22360)
                /note= "Alu"
LOCUS       0. 004     23145 bp
DEFINITION
     repeat_region   528. . 811
                /note= "Alu"
     repeat_region   3175. . 3395
                /note= "MER30"
     repeat_region   4945. . 5237
                /note= "Alu"
     repeat_region   10715. . 11004
                /note= "Alu"
     repeat_region   complement(10855. . 10991)
                /note= "SVA"
     repeat_region   11277. . 11442
                /note= "MER5A"
     repeat_region   14409. . 14673
                /note= "Alu"
     repeat_region   17402. . 17696
                /note= "Alu"
     repeat_region   17696. . 18012
                /note= "MER42C"
     repeat_region   complement(18098. . 18384)
                /note= "Alu"
     repeat_region   complement(19231. . 19928)
                /note= "L1-4"
     repeat_region   complement(19929. . 21743)
                /note= "L1-3"
     repeat_region   complement(21744. . 23145)
                /note= "L1-2"

                124
LOCUS       0. 005     23138 bp
DEFINITION
     repeat_region   complement(1. . 422)
                /note= "L1-2"
     repeat_region   complement(423. . 1682)
                /note= "L1-1"
     repeat_region   complement(1840. . 2094)
                /note= "Alu"
     repeat_region   4422. . 4708
                /note= "Alu"
     repeat_region   5315. . 5582
                /note= "Alu"
     repeat_region   complement(5428. . 5561)
                /note= "SVA"
     repeat_region   complement(9837. . 10133)
                /note= "Alu"
     repeat_region   9867. . 9991
                /note= "SVA"
     repeat_region   11917. . 12215
                /note= "Alu"
     repeat_region   complement(12060. . 12194)
                /note= "SVA"
     repeat_region   13602. . 13739
                /note= "SVA"
     repeat_region   complement(13587. . 13875)
                /note= "Alu"
     repeat_region   14472. . 14937
                /note= "MLT1C"
     repeat_region   14483. . 14841
                /note= "MLT1D"
     repeat_region   14801. . 14937
                /note= "MLT1B"
     repeat_region   complement(17271. . 18200)
                /note= "L1-2"
LOCUS       0. 006     23136 bp
DEFINITION
     repeat_region   3888. . 4173
                /note= "MLT1D"
     repeat_region   4099. . 4343
                /note= "MLT1D"
     repeat_region   4191. . 4507
                /note= "MLT1E"
     repeat_region   5029. . 5127
                /note= "MIR2"
     repeat_region   complement(5535. . 5822)
                /note= "Alu"
     repeat_region   5555. . 5684
                /note= "SVA"
     repeat_region   complement(7266. . 7550)
                /note= "Alu"
     repeat_region   7286. . 7409
                /note= "SVA"
     repeat_region   8164. . 8453
                /note= "Alu"
     repeat_region   complement(8304. . 8440)
                /note= "SVA"
     repeat_region   complement(9516. . 9805)
                /note= "Alu"
     repeat_region   10555. . 11645
                /note= "L1-2"
     repeat_region   10608. . 11899
                /note= "L1-2"
     repeat_region   11900. . 13713
                /note= "L1-3"
     repeat_region   13715. . 14397
                /note= "L1-4"
     repeat_region   complement(14661. . 14949)
                /note= "Alu"
     repeat_region   14679. . 14809
                /note= "SVA"
     repeat_region   17566. . 17767
                /note= "Alu"
     repeat_region   17694. . 17866
                /note= "Alu"
     repeat_region   17743. . 17866
                /note= "Alu"
     repeat_region   complement(21279. . 21571)
                /note= "Alu"

                125
     repeat_region   21300. . 21432
                /note= "SVA"
     repeat_region   complement(21770. . 22213)
                /note= "MER39"
LOCUS       0. 007     1474 bp
DEFINITION
GENE - NEGR1-i6
LOCUS       0. 001     23921 bp
DEFINITION
     repeat_region   complement(500. . 791)
                /note= "Alu"
     repeat_region   complement(4505. . 4653)
                /note= "MIR"
     repeat_region   complement(6427. . 6605)
                /note= "MIR"
     repeat_region   complement(7205. . 7494)
                /note= "Alu"
     repeat_region   7226. . 7359
                /note= "SVA"
     repeat_region   complement(7505. . 7695)
                /note= "Alu"
     repeat_region   9832. . 10035
                /note= "MIR"
     repeat_region   11545. . 11781
                /note= "Alu"
     repeat_region   16395. . 18126
                /note= "TIGGER1-1"
     repeat_region   17634. . 18317
                /note= "TIGGER1-1"
     repeat_region   18318. . 18583
                /note= "TIGGER1-2"
     repeat_region   23367. . 23652
                /note= "Alu"
     repeat_region   complement(23506. . 23627)
                /note= "SVA"
LOCUS       0. 002     23937 bp
DEFINITION
     repeat_region   4922. . 5254
                /note= "MALR-1"
     repeat_region   9815. . 9930
                /note= "FRAM"
     repeat_region   complement(9796. . 10086)
                /note= "Alu"
     repeat_region   11181. . 11468
                /note= "Alu"
     repeat_region   11675. . 11941
                /note= "MLT1B"
     repeat_region   13885. . 14096
                /note= "Alu"
     repeat_region   complement(13941. . 14074)
                /note= "SVA"
     repeat_region   14100. . 14272
                /note= "MLT1D"
     repeat_region   14125. . 14272
                /note= "MLT1B"
     repeat_region   17813. . 18105
                /note= "Alu"
     repeat_region   19224. . 19450
                /note= "L1-3"
     repeat_region   19456. . 20072
                /note= "L1-4"
LOCUS       0. 003     23937 bp
DEFINITION
     repeat_region   5131. . 5388
                /note= "Alu"
     repeat_region   complement(8635. . 8927)
                /note= "Alu"
     repeat_region   8657. . 8781
                /note= "SVA"
     repeat_region   complement(9258. . 9558)
                /note= "MER33"
     repeat_region   11082. . 11371
                /note= "Alu"
     repeat_region   complement(11076. . 11359)
                /note= "SVA"
     repeat_region   21180. . 21418
                /note= "SVA"
                126
               
    repeat_region   complement(21153. . 21378)
                /note= "Alu"
LOCUS       0. 004     23937 bp
DEFINITION
     repeat_region   8421. . 8503
                /note= "Alu"
     repeat_region   10865. . 10984
                /note= "MIR2"
     repeat_region   14752. . 15042
                /note= "Alu"
     repeat_region   complement(14886. . 15010)
                /note= "SVA"
     repeat_region   18728. . 19016
                /note= "Alu"
     repeat_region   complement(18862. . 18995)
                /note= "SVA"
     repeat_region   complement(19834. . 20123)
                /note= "Alu"
     repeat_region   19854. . 19993
                /note= "SVA"
     repeat_region   22097. . 22228
                /note= "Alu"
     repeat_region   complement(23102. . 23272)
                /note= "Alu"
LOCUS       0. 005     23938 bp
DEFINITION
     repeat_region   1704. . 1948
                /note= "MIR"
     repeat_region   4047. . 4344
                /note= "LTR9"
     repeat_region   5335. . 5624
                /note= "Alu"
     repeat_region   complement(10752. . 10953)
                /note= "MER33"
     repeat_region   14331. . 14600
                /note= "MSTA"
     repeat_region   14331. . 14694
                /note= "THE1B"
     repeat_region   18135. . 18303
                /note= "Alu"
     repeat_region   19589. . 19936
                /note= "MLT1F"
LOCUS       0. 006     23937 bp
DEFINITION
     repeat_region   complement(2657. . 3004)
                /note= "MLT1B"
     repeat_region   8344. . 8418
                /note= "MADE1"
     repeat_region   8463. . 8536
                /note= "MADE1"
     repeat_region   complement(9719. . 10069)
                /note= "CHARLIE2-2"
     repeat_region   11488. . 11865
                /note= "MLT1B"
     repeat_region   11488. . 11865
                /note= "MLT1A"
     repeat_region   11637. . 11865
                /note= "MLT1C"
     repeat_region   14151. . 14283
                /note= "Alu"
     repeat_region   14298. . 14473
                /note= "Alu"
     repeat_region   21162. . 21273
                /note= "MLT1A"
     repeat_region   21189. . 21512
                /note= "MLT1A"
     repeat_region   21250. . 21509
                /note= "MLT1B"
     repeat_region   21370. . 21495
                /note= "MLT1C"
     repeat_region   complement(21927. . 22216)
                /note= "Alu"
     repeat_region   21945. . 22225
                /note= "SVA"
     repeat_region   22532. . 22664
                /note= "Alu"

                127
               
     repeat_region   22674. . 22842
                /note= "Alu"
     repeat_region   complement(23672. . 23937)
                /note= "Alu"
     repeat_region   23701. . 23805
                /note= "SVA"
LOCUS       0. 007     23937 bp
DEFINITION
     repeat_region   1770. . 1916
                /note= "MIR"
     repeat_region   2615. . 2762
                /note= "MIR2"
     repeat_region   5604. . 5754
                /note= "MIR2"
     repeat_region   6774. . 7062
                /note= "Alu"
     repeat_region   8224. . 8524
                /note= "Alu"
     repeat_region   complement(8356. . 8509)
                /note= "SVA"
     repeat_region   complement(8777. . 8979)
                /note= "Alu"
     repeat_region   8707. . 8980
                /note= "SVA"
     repeat_region   9291. . 9461
                /note= "MER5A"
     repeat_region   10345. . 10504
                /note= "MIR"
     repeat_region   complement(13746. . 14037)
                /note= "Alu"
     repeat_region   14137. . 14423
                /note= "Alu"
     repeat_region   complement(17759. . 17930)
                /note= "Alu"
     repeat_region   17773. . 17911
                /note= "SVA"
     repeat_region   complement(17935. . 18066)
                /note= "Alu"
     repeat_region   complement(21832. . 22212)
                /note= "MLT1B"
LOCUS       0. 008     23937 bp
DEFINITION
     repeat_region   1300. . 1797
                /note= "MLT1D"
     repeat_region   2580. . 2706
                /note= "Alu"
     repeat_region   7313. . 7381
                /note= "L1-4"
     repeat_region   11228. . 11516
                /note= "MLT2C2"
     repeat_region   11228. . 11559
                /note= "MLT2D"
     repeat_region   11515. . 11595
                /note= "MLT2C2"
     repeat_region   11459. . 11594
                /note= "MLT2D"
     repeat_region   16764. . 16975
                /note= "MER20"
LOCUS       0. 009     23938 bp
DEFINITION
     repeat_region   384. . 683
                /note= "Alu"
     repeat_region   complement(531. . 663)
                /note= "SVA"
     repeat_region   1934. . 2433
                /note= "MLT2B2"
     repeat_region   1934. . 2112
                /note= "MLT2D"
     repeat_region   5027. . 5320
                /note= "Alu"
     repeat_region   6900. . 7110
                /note= "MER33"
     repeat_region   complement(7431. . 7714)
                /note= "Alu"
     repeat_region   complement(7958. . 8248)
                /note= "Alu"

                128

     repeat_region   8307. . 8595
                /note= "Alu"
     repeat_region   8937. . 10281
                /note= "L1-3"
     repeat_region   10282. . 10952
                /note= "L1-4"
     repeat_region   complement(13922. . 14265)
                /note= "CHARLIE2-2"
     repeat_region   complement(13488. . 13760)
                /note= "MSTC"
     repeat_region   complement(20395. . 20746)
                /note= "THE1B"
     repeat_region   complement(20515. . 20746)
                /note= "MSTA"
     repeat_region   complement(22244. . 22598)
                /note= "THE1B"
     repeat_region   complement(22364. . 22598)
                /note= "MSTA"
     repeat_region   22813. . 23101
                /note= "Alu"
LOCUS       0. 010     23937 bp
DEFINITION
     repeat_region   1139. . 1813
                /note= "L2-3"
     repeat_region   1723. . 2414
                /note= "L1-4"
     repeat_region   10662. . 10832
                /note= "MER20"
     repeat_region   complement(10964. . 11265)
                /note= "Alu"
     repeat_region   11444. . 11745
                /note= "Alu"
     repeat_region   complement(11592. . 11725)
                /note= "SVA"
     repeat_region   15533. . 16197
                /note= "L1-4"
     repeat_region   complement(16577. . 16840)
                /note= "MER33"
     repeat_region   17320. . 17556
                /note= "SVA"
     repeat_region   complement(17288. . 17577)
                /note= "Alu"
     repeat_region   17882. . 18178
                /note= "Alu"
     repeat_region   complement(21879. . 22259)
                /note= "MLT1D"
     repeat_region   complement(21879. . 22001)
                /note= "MLT1E"
     repeat_region   complement(22290. . 22580)
                /note= "Alu"
     repeat_region   22943. . 23225
                /note= "Alu"
LOCUS       0. 011     23937 bp
DEFINITION
     repeat_region   complement(4079. . 5031)
                /note= "L1-3"
     repeat_region   7550. . 7838
                /note= "Alu"
     repeat_region   21465. . 21605
                /note= "MER46"
     repeat_region   21825. . 22108
                /note= "Alu"
LOCUS       0. 012     23938 bp
DEFINITION
     repeat_region   1171. . 1398
                /note= "L1-3"
     repeat_region   1403. . 2065
                /note= "L1-4"
     repeat_region   3465. . 4299
                /note= "TIGGER1-1"
     repeat_region   3733. . 5087
                /note= "TIGGER1-1"
     repeat_region   5106. . 5496
                /note= "TIGGER1-2"
     repeat_region   7180. . 7350
                /note= "Alu"

                129

     repeat_region   15054. . 15271
                /note= "L1-2"
     repeat_region   15272. . 17082
                /note= "L1-3"
     repeat_region   17083. . 17752
                /note= "L1-4"
LOCUS       0. 013     23937 bp
DEFINITION
     repeat_region   394. . 562
                /note= "MER3"
     repeat_region   4532. . 4743
                /note= "MIR"
     repeat_region   5307. . 5549
                /note= "MIR"
     repeat_region   5574. . 5903
                /note= "MLT2C2"
     repeat_region   5574. . 6056
                /note= "MLT2B2"
     repeat_region   5835. . 6056
                /note= "MLT2C2"
     repeat_region   5911. . 6056
                /note= "MLT2D"
     repeat_region   9536. . 9825
                /note= "Alu"
     repeat_region   11802. . 12221
                /note= "L1-3"
     repeat_region   12226. . 12731
                /note= "L1-4"
     repeat_region   13402. . 13903
                /note= "L1-4"
     repeat_region   complement(14787. . 14949)
                /note= "MLT1A"
     repeat_region   20784. . 20866
                /note= "MIR"
LOCUS       0. 014     23937 bp
DEFINITION
     repeat_region   complement(853. . 1289)
                /note= "THE1BR"
     repeat_region   complement(183. . 1289)
                /note= "MSTAR"
     repeat_region   complement(1792. . 2082)
                /note= "Alu"
     repeat_region   complement(2184. . 2396)
                /note= "Alu"
     repeat_region   2533. . 2895
                /note= "MLT1A"
     repeat_region   2533. . 2666
                /note= "MSTC"
     repeat_region   2625. . 2886
                /note= "MLT1B"
     repeat_region   3485. . 3855
                /note= "MLT2D"
     repeat_region   3485. . 3738
                /note= "MLT2C2"
     repeat_region   complement(4974. . 5283)
                /note= "MER2"
     repeat_region   7946. . 8234
                /note= "Alu"
     repeat_region   complement(8080. . 8209)
                /note= "SVA"
     repeat_region   complement(9084. . 9373)
                /note= "Alu"
     repeat_region   9104. . 9236
                /note= "SVA"
     repeat_region   complement(9510. . 9738)
                /note= "MER33"
     repeat_region   10566. . 10854
                /note= "Alu"
     repeat_region   complement(10700. . 10833)
                /note= "SVA"
     repeat_region   11655. . 11875
                /note= "MER20"

LOCUS       0. 015     11907 bp
DEFINITION


                130

     repeat_region   1270. . 1641
                /note= "THE1B"
     repeat_region   1462. . 1641
                /note= "MSTA"
     repeat_region   1522. . 1641
                /note= "MSTC"
     repeat_region   5407. . 5694
                /note= "Alu"


Приложение 7. Примеры участков, которые сразу бросаются в глаза,
визуально-особые участки генома. Примеры цитированы из генома
человека от http://ncbi.nlm.nih.gov.

Хромосома 1 человека , просмотр начальных 2.500.000 нуклеотидов, визуально
особые участки.
1
2
3

4

                131
5
6
7

                132
8
9
10
11
11
12
13



                133
14
15
16
17
18
19
20




                134
21
22
23
24
25
Хромосома 1 Данио, просмотр начальных 1. 000. 000 нуклеотидов, визуально
особые участки.
1
2



                135
3
4
5
6
7
8

                136

9
10
11
12
13

                137

14
15
16
17
18
19

                138
20
21
22
23
24
25

                139
26
27
28
29
30
31


                140
32
33

Приложение 8. Примеры участков генома микоплазмы гениталиум G37, подобные
повторам и транспозонам человека.Сравнение сделал Курносов М.Н.2009 год.
Repeat:  "CHARLIE2-2"- неавтономный транспозон типа MER1.
Нижняя цепь соответствует геному M. genitalium - регион 371 - 729.
Верхняя цепь соответствует повтору из генома человека.
Участок подобный повтору CHARLIE2 расположен вначале хромосомы
микоплазмы и частично заходит на первый ген dnaN - ДНК
полимераза 3, бета цепь.
Число соответствий 229 из 359 нуклеотидов, мутировало 36,2 процента.

Query        381        390        400        408        416        426
      atgatcacag gaaaaaaa t ttatttcaac t t acataa ct at tttt gttacagatc
      || |||| |   ||||||| | |||||| | | |   |||||   | ||   || |  || ||| 
      ataatcagat taaaaaaatt ttattt atc tgaaacatat ttaatcaatt g aactgatt
Repeat        12         22         31         41         51         60

Query        435        444        454        463        473        483
      agtataag a ct atcaata aaagtttcaa ccata aaaa taaaatatat tctgataaaa
      | | | || |  | || |||  | | | |  |  ||||  | | | |  || |  | | ||  ||
      attttcagca gtaat aatt aca tatgta  catagtaca t atgtaaaa tatcat taa
Repeat        70         79         88         97        106        115

Query        493        502        512        522        529        538
      ttctatggta  acatgaaaa ataaatatta gtcgaagcag  a aaaaga  aacaat ata
      || | || ||  | || || |  ||  ||||   | | || ||  |  ||  |   || || || 
      tt tctgtta tatat aata gtatctatt  ttag ag ag tattaattat tactataatt
Repeat       124        133        142        150        160        170

Query        547        556        565        572        581        591
      aaacattca  actttgtca  aaggac agt t tg cc at ttttta aaa tgaacaatgg
      || |||| |   |||  | |  || | |   | | ||  | |   || || | | |    | |   
      aagcatttat gcttaattat aa g ctttt tatgaacaaa attatagaca t tttagttc
Repeat       180        190        198        208        218        227



                141
Query        601        610        619        629        639        647
      ttgacaacaa attagt gtt att tagatt cctttgaata tatttaaata taata aa a
      || | || || | || | | | |||  |||       | || |  ||  |||||  ||||  | |
      tt ataataa a taatagat attaaaga a  a ataaaaa aatagaaata  aatatcata
Repeat       236        245        254        262        272        281

Query        657        664        673        680        690        699
      acactttatt ta a ag aa ttaatactt  a g a aatg ccagagatta tacct ttgg
      || ||| | |  |   || || |||||||||  |   | ||||   | | ||||  |  |  |   
      acccttga t aacccagaaa ttaatactta atcaaaaatg  aaaatatta  a ttaataa
Repeat       290        300        310        320        329        337

Query        709        718        728
      tatttatatt  catgacaat ttttaa
       | | | |||   || | ||| ||| ||
      aagtga att gaat aaaat tttgaa
Repeat       346        355        365
Repeat:  "L2-3" - транспозон типа LINE.
Нижняя цепь - M. genitalium регион 448298-448642.
Верхняя цепь - человек.
Участок подобный транспозону L2 человека расположен внутри гена
MG350  - гипотетический белок.
Число соответствий - 229 из 340 нуклеотидов, мутировало 32,7 процента.

Query       1473       1483       1493       1503       1513       1523
      aaagaagact gagttttttt attttaagtt tttaaagttt ttataatttt taagaattat
      |||||| |   || | |||||  ||| || || |  |||       ||||   | ||| || |||
      aaagaa aag ga tattttt  tttcaa tt tacaaa a g  aataa cat taacaa tat
Repeat       315        324        332        340        348        357

Query       1533       1543       1550       1559       1568       1578
      catcccaact gcttctatga tt a t gtg acaa aactg ccaacaaca  aaaagcaaaa
           | |   |||| ||||  || | | ||| | || | ||    || || |  |||||      
       g g c a   gcttgtatg  ttaacttgtg a aatagcta agaaaaatat aaaagttgct
Repeat       361        370        380        389        399        409

Query       1586       1595       1603       1611       1618       1628
      ataa a agc tgttatag g ttct tt tc ata at cca gaa t a tg gatgataaat
       |||   |   ||| | ||   || | ||  | | | ||  ||  || | | ||  | | || ||
      ttaattta t tgtga agaa tt tgttagc agatatgaca aaagttattg aaaggtagat
Repeat       418        427        436        446        456        466

Query       1636       1645       1654       1664       1673       1679
      g  gcttgta cctgga tgg a gacggcaa taagtaatca tattctat a  ttt g t a
      |  | || ||   |  | | | | || |||||  ||||||||| ||||| ||    ||| | | |
      gatgatt ta aatttacttg atga ggcaa  aagtaatca tattc attg gtttaggtca
Repeat       475        485        494        503        512        522

Query       1687       1696       1703       1713       1722       1732
      tttaca t t t atagccac ataa t t t gctggtacac tga atatga tttactagaa
         | | | | | |||  ||  | || | | |  || ||  |  ||| | | |  |||  || ||
       ggaaagttt tcata aca  aaaactatat  cttgttta  tgaca aggc ttt ttataa
Repeat       531        539        549        557        566        575

Query       1742       1752       1761       1769       1778       1786
      accaaagggt gtcaagaaag actaaagat  t tt tggct t gaacaact tat g aatg
      |     |  |  |  | |||| |  ||||||  | || |   | | | || ||| ||| |  |||
      a t t gttt tttga aaag a  aaagatg ttttcttttt tagcactact tatagtgatg
Repeat       582        591        599        609        619        629

Query       1794       1804       1814
      g agattg t ctagtgtgat ac
      | | || | |  || | | |  ||
      gta atggat  taat tcaa ac
Repeat       638        646        656
Repeat:  "RETROVIRAL2" - участок эндогенного ретровируса человека.

Нижняя цепь - микоплазма гениталиум локус 576244-576656.
Верхняя цепь - участок, выделенный из хромосомы человека.
Последовательность подобная участку ретровируса человека
расположена на конце гена MG468 ABC-транспортер-пермеаза
и на начале гена MG526 ABC-транспортер-АТФ-связывающий.
Число соответствий 214 из 413 нуклеотидов, мутировало 48,2
процента.

                142

Query       1753       1762       1772       1781       1791       1801
      tgtcttctta tattaataa  ggaaaataaa acaaa atag tggtaaagtg ttgggttcgt
      ||| |||  |     |||||  |  ||||||| ||||| |||  |   ||| |   |         
      tgt ttc aa ggaaaataat gctaaataaa acaaagataa ttccaaa ta at a a aaa
Repeat        11         21         31         41         50         57

Query       1811       1821       1831       1841       1851       1859
      gaaaaatttt gtgggtgata tggaaagata atgggcaatt ttctcagggc t tc tttga
      ||| || |||  |  | |||  |  ||| ||   ||   ||        |     | ||  || |
      gaagaacttt ttaagcgat  t taaatat  ctgtttaaaa aaagaaaaca tctcaattaa
Repeat        67         76         84         94        104        114

Query       1868       1878       1888       1897       1907       1917
      gc aagatta tgggtcacat gggaaactag agtggga ga gattaagctg aaggaagatt
       |  || | | |  ||   ||  ||    | | | |  ||     | |||  |  || ||  || 
      actcagttaa tttgttcgat  ggtttttgg attctgattt aaataa  tc aacgattatc
Repeat       124        134        143        153        161        171

Query       1926       1936       1945       1955       1964       1971
      ttgtggt aa gcagtgatat tttgggatt  gttagaagga gtat ttgtc  atat a aa
      |||   | |  | | |   || |    | ||  | ||     |  ||| || ||   | |    |
      ttgccatcat ggattttaat tacccgttta gctaattcca ctatcttttc gttgtgggta
Repeat       181        191        201        211        221        231

Query       1981       1991       2001       2011       2021       2030
      atgattggta aaggcctaga tatggctttg taagaattga gaaactaaat ggaaga cac
      |  |||  ||  ||   ||   | || |     | | | |  |  |||  || | | || |    
      actattacta tagtagtacc tttgtcacga ttatattcca caaa aaatt gcaatatttt
Repeat       241        251        261        271        280        290

Query       2040       2048       2058       2066       2076       2086
      aaggtccaaa t aaga gaa gtagaaaaag  agg tattc aaggactaag aattgtgagg
         |   | | | || |  ||  | |    ||  ||| |  || |   |  ||  |||| | |||
      tttggaaata tcaatattaa ct gctccag taggttcatc accaaacaa  aatt ttagg
Repeat       300        310        319        329        338        347

Query       2096       2105       2112       2122       2132       2142
      acccagtaca tcaaa ttag ag agt gc  ccaaggggat tcagtttggg tggtgagttt
         |  || | | |||    | || | | ||   || |  | | |    |       | ||||||
       ttcttta a ttaaagcccg agcaatagca acacgttg t tgttgtccac cagagagttt
Repeat       355        365        375        384        394        404

Query       2152       2161
      tttggctcta
       |   || | 
      atgaactttc
Repeat       414        423
Приложение 9.Примеры сравнения двух геномов - Mycoplasma genitalium и HERVK.
Сравнение произведено с помощью программы BLAST. Всего обнаружено 111
участков соответствия, они имеют разную длину и процент идентичности.
Query - это HERVK, а Sbjct - микоплазма. Сделал Курносов М.Н.
Range 31: 474214 to 474266 Graphics
Alignment statistics Expect Identities Gaps     Strand
31. 2 bits(68)      1. 7 37/53(70%) 0/53(0%) Plus/Plus

Query  192     AGCTTTATTAAAATTCTTTTAAAAAGAGGGGGAGTTAAAGTATCTACAAAAAA
       244     ||||| || ||| || |||||| || ||    |||||||   ||||   ||||
Sbjct  474214  AGCTTAATAAAACTTTTTTTAATAAAAGTTAAAGTTAAATCTTCTATTCAAAA
       474266

Range 74: 545394 to 545443 Graphics
Alignment statistics Expect Identities Gaps     Strand
29. 9 bits(65)         4. 2 35/50(70%) 0/50(0%) Plus/Minus

Query  7036    TGATCAAAAATTGGCAAATCAAATTAATGATCTTAGACAAACTGTCATTT
       7085    ||||||||| ||   | |||||| ||  ||||||  || |  |||  |||
Sbjct  545443  TGATCAAAACTTCCAAGATCAAACTATCGATCTTTTACCATATGTGCTTT
       545394



                143
Range 111: 555834 to 555851 Graphics
Alignment statistics Expect Identities Gaps Strand
29. 1 bits(63)      7. 7 17/18(94%) 0/18(0%) Plus/Plus

Query  6256    ATTTGGAACTATTATAGA  6273
               ||||||||||||||| ||
Sbjct  555834  ATTTGGAACTATTATTGA  555851

Примеры сравнения двух участков ДНК - Mycoplasma genitalium и LINE 1.
Сравнение сделал Курносов М.Н.
Всего обнаружено 110 участков.

Range 12: 100623 to 100642 Graphics
Alignment statistics Expect Identities Gaps Strand
32. 5 bits(71)      0. 56 19/20(95%) 0/20(0%) Plus/Plus

Query  4145    AAGCTGATAAGCAACTTCAG  4164
               ||||||||||||||||| ||
Sbjct  100623  AAGCTGATAAGCAACTTAAG  100642

Range 24: 159048 to 159064 Graphics
Alignment statistics Expect Identities Gaps Strand
31. 2 bits(68)      1. 4 17/17(100%) 0/17(0%) Plus/Plus

Query  3596    AACATTGATGCAAAAAT  3612
               |||||||||||||||||
Sbjct  159048  AACATTGATGCAAAAAT  159064

Range 39: 305560 to 305594 Graphics
Alignment statistics Expect Identities Gaps Strand
30. 4 bits(66)      2. 5 29/36(81%) 1/36(2%) Plus/Minus

Query  3124    ACTAATAAAGaaaaaaaGAGAGAAGAATCAAATAGA  3159
               ||||||| | ||||| |||||  | ||||||| |||
Sbjct  305594  ACTAATAGA-AAAAACAGAGAAGATAATCAAAAAGA  305560

Range 102: 416250 to 416284 Graphics
Alignment statistics Expect Identities Gaps Strand
28. 6 bits(62)        8. 4 28/35(80%) 1/35(2%) Plus/Minus

Query  2963    AAGCAAGAGCAAA-CACATTCAAAAGCTAGCAGAA  2996
               || |||| ||||| ||  ||||||| |||||| ||
Sbjct  416284  AAACAAGTGCAAAACAACTTCAAAAACTAGCAAAA  416250
Приложение 10. Пример использования программы CODONS.
Разбивка гена PUSHKIN на отдельные кодоны. Сделал Курносов М.Н.
       PUSHKIN            
 AAA AAA AAA AAA AAA AAA AAA AAA AAA CAT AGG GAG CAG CGA ATC GGC GAG AAC CAT AAA
 AAT AAA CAA CAT ATA AAA GAA AGA GAG CAA TAC CGT TGG TAG ATA AAA AGT CAT AAC GAA
 ACA AAA CAG GAG AAA AAT GGG CAT GAA TAG AGT AAA AGC CAA ATC AAA AAA AAA AAA AAA
 AAA AAA AAA AAA GAA GAG AGA GAC ACA AAT TAG CAG ATC CAT TAT AGT GGC AAG AGA CGA
 AAA AGC GAC AAA CAG ACA AGG AGT AGC CAC TAG TAC AAA ACT AAA AGC GAC AAA AGA CAT
 TGG ACA AAA CAT AGT AGA GGC GGG ACA GAG AGT CAC CAT AGG TAC GAG GAA CAG TAG GAG
 AAA TAC TAG AGG AGT TGC AAA AGG AAA CAG ACA AAC TAG GGG AAA AGG AAT CAT TAG GGG
 AAA AAT GAG AGT AAT GAG ATA ATC GAA CAT GGG CAG AGC TAC AAA CAT AGG GAG CAG CAG
 TAG ATA AAA GGG TAC ACA GAA AAA ACT AAA GAA CAT AGA CAT AAC ACA AAA CAC AGA CAT
 CAA GAG AGA TAA ACA GAG AGT ATC GAC AGC AGA GGC ACA AAA GAG TGG GAG AAA AAG GAG
 GAC TAG AGT AAA TAA ACA AAA CAA GAG TAC CGA CAG TAG GGT AGC AAA AGA AGC GGC GAG
 ATA ATT CAG CAT AAA CAC AGA AGC GAA AAA AGC GAC GAG AAA TAA ACA AGG AGT TGC TAC
 ATT AAA AGG CAT AGG GAG GAA AAA CAA CAT ATA AAA CAC CAT AGG CAC GAG TGA ACA GAG
 AGT AAT AAA CAT AGT TGT GAG TAA GAC TAG GAG AAA CAC CAT TAC GGC AAA AGG AAA CAT
 GGG CAT AGT CAT CGT AAA AGG AAT CAT GAG ATA ATT TAG AAA AGG AGT AGA ACA GAC GAA
 AGC AGT AAA CAT TAA TAG CAA TAG AAA CAT AGT AAA AAG GAG TGA GAG CAG CAT ATA AAA


                144
 TAA ACA AAG ACA AAT TGC ATT TAG AAA AAG AGC GAA TAG AGT AAA TAC ACA ATA AAA AGG
 CAT AAG ACA TAT AAA AGC AGG CAG AGC AAT TGA TAG GAG AAA GAA AGC AAG AGA ACA AAT
 TGC ATC AGT GAG CAC GAG AGA CGA AAA CAA CAT GGC AAA CAC CAT AGA ACA ATT AAA GGC
 AAA CAG GAG AAA TAC CGT AAG TAC CGT AAA AAT GAG AGG CAG TGC ATT AGG TAT AGC GGC
 CAG ACA AAA CAA CAG GAG AAA CAT AGT AGT GAG CAC GAG TAC CGA ATT AAA AAT CAT CAG
 CGA ATT AAA AAC AGA GGC TAA CGA AAA ACT AAA AAT GAG AGG CAG CAT ATA AAA GGC AAA
 AAG CAT TAC GAG CAG ATT TAT AGA CAT AAT CGA AAA AAG AGA CAT GAA TAG AGT ATT AAA
 GGC AGC AAT AGG AGT AAT ACA ATT AAA AGC CAA AAA AGT CAT AGG TAT CAT CGT AAA AGG
 AGT GAG AGG CAG GAG CAG TGC ATC AGG AGC AGA CAT AAT CAT CGT AAA TAA TAG CAA CAT
 ATA AAA GGC AAA AAG CAT TAC GAG GAG AAA GAA CAT AAT CAT TAC GAG CAG ATT TAC CGT
 AAG TAC CGT AAA GAG GAG AAA AGG CAG GAG AAC ACA ATT AAA AAT AAA CAC AGA TAG AGG

 Количество различных кодонов в гене PUSHKIN.
 Вместо нуклеотида T программа подсчитала U.Сделал Курносов М.Н.

  CODON USAGE TABLE
        PUSHKIN       has   3420 codons
          RSCU            RSCU            RSCU            RSCU
  UUU   0 1. 00    UCU   0  . 00    UAU  84  . 83    UGU   2  . 06
  UUC   0 1. 00    UCC   0  . 00    UAC 119 1. 17    UGC  65 1. 94
  UUA   0 1. 00    UCA   0  . 00    UAA  50  . 00    UGA  15  . 00
  UUG   0 1. 00    UCG   0  . 00    UAG 183  . 00    UGG  12 1. 00
 
  CUU   0 1. 00    CCU   0 1. 00    CAU 275 1. 62    CGU  33  . 56
  CUC   0 1. 00    CCC   0 1. 00    CAC  64  . 38    CGC   0  . 00
  CUA   0 1. 00    CCA   0 1. 00    CAA 105  . 72    CGA  58  . 98
  CUG   0 1. 00    CCG   0 1. 00    CAG 187 1. 28    CGG   3  . 05
 
  AUU  92 1. 46    ACU  14  . 27    AAU 136 1. 45    AGU 161 4. 15
  AUC  44  . 70    ACC   0  . 00    AAC  52  . 55    AGC  72 1. 85
  AUA  53  . 84    ACA 193 3. 73    AAA 513 1. 81    AGA 122 2. 07
  AUG   0  . 00    ACG   0  . 00    AAG  55  . 19    AGG 138 2. 34
 
  GUU   0 1. 00    GCU   0 1. 00    GAU   0  . 00    GGU  12  . 36
  GUC   0 1. 00    GCC   0 1. 00    GAC  31 2. 00    GGC  92 2. 75
  GUA   0 1. 00    GCA   0 1. 00    GAA 102  . 57    GGA   1  . 03
  GUG   0 1. 00    GCG   0 1. 00    GAG 253 1. 43    GGG  29  . 87

Приложение 11. Пример трансляции гена PUSHKIN. Для примера приведен только транслят с краю. Сделал Курносов М.Н.

Translation in forward direction:
 frame +1 - 3424 codons
KKKKKKKKKHREQRIGENHKNKQHIKEREQYRW*IKSHNETKQEKNGHE*SKSQIK












                145

Translation in reverse direction:
frame -1 -3424 codons













                146

Приложение 12.Промилле кодонов для человека.
Цитировано с www. kazusa. or. jp.
 
Gly GGG 16, 47 Trp TGG 13, 17
Gly GGA 16, 47 End TGA 1, 56
Gly GGT 10, 75 Cys TGT 10, 58
Gly GGC 22, 22 Cys TGC 12, 62

Glu GAG 39, 59 End TAG 0, 79
Glu GAA 28, 96 End TAA 0, 99
Asp GAT 21, 78 Tyr TAT 12, 19
Asp GAC 25, 1 Tyr TAC 15, 31

Val GTG 28, 12 Leu TTG 12, 93
Val GTA 7, 08 Leu TTA 7, 67
Val GTT 11, 03 Phe TTT 17, 57
Val GTC 14, 46 Phe TTC 20, 28

Ala GCG 7, 37 Ser TCG 4, 41
Ala GCA 15, 82 Ser TCA 12, 21
Ala GCT 18, 45 Ser TCT 15, 22
Ala GCC 27, 73 Ser TCC 17, 68

Arg AGG 11, 96 Arg CGG 11, 42
Arg AGA 12, 17 Arg CGA 6, 17
Ser AGT 12, 13 Arg CGT 4, 54
Ser AGC 19, 46 Arg CGC 10, 42

Lys AAG 31, 86 Gln CAG 34, 23
Lys AAA 24, 44 Gln CAA 12, 34
Asn AAT 16, 96 His CAT 10, 86
Asn AAC 19, 1 His CAC 15, 09

Met ATG 22, 04 Leu CTG 39, 64
Ile ATA 7, 49 Leu CTA 7, 15
Ile ATT 16 Leu CTT 13, 19
Ile ATC 20, 82 Leu CTC 19, 59

Thr ACG 6, 05 Pro CCG 6, 92
Thr ACA 15, 11 Pro CCA 16, 92
Thr ACT 13, 12 Pro CCT 17, 54
Thr ACC 18, 89 Pro CCC 19, 79

Программа Countcodon - 3420 кодонов в гене PUSHKIN. Кодон-промилле-число.

UUU  0. 0(     0)  UCU  0. 0(     0)  UAU 24. 6(    84)  UGU  0. 6(     2)
UUC  0. 0(     0)  UCC  0. 0(     0)  UAC 34. 8(   119)  UGC 19. 0(    65)
UUA  0. 0(     0)  UCA  0. 0(     0)  UAA 14. 6(    50)  UGA  4. 4(    15)
UUG  0. 0(     0)  UCG  0. 0(     0)  UAG 53. 5(   183)  UGG  3. 5(    12)

CUU  0. 0(     0)  CCU  0. 0(     0)  CAU 80. 4(   275)  CGU  9. 6(    33)
CUC  0. 0(     0)  CCC  0. 0(     0)  CAC 18. 7(    64)  CGC  0. 0(     0)
CUA  0. 0(     0)  CCA  0. 0(     0)  CAA 30. 7(   105)  CGA 17. 0(    58)
CUG  0. 0(     0)  CCG  0. 0(     0)  CAG 54. 7(   187)  CGG  0. 9(     3)

AUU 26. 9(    92)  ACU  4. 1(    14)  AAU 39. 8(   136)  AGU 47. 1(   161)
AUC 12. 9(    44)  ACC  0. 0(     0)  AAC 15. 2(    52)  AGC 21. 1(    72)
AUA 15. 5(    53)  ACA 56. 4(   193)  AAA150. 0(   513)  AGA 35. 7(   122)
AUG  0. 0(     0)  ACG  0. 0(     0)  AAG 16. 1(    55)  AGG 40. 4(   138)

GUU  0. 0(     0)  GCU  0. 0(     0)  GAU  0. 0(     0)  GGU  3. 5(    12)
GUC  0. 0(     0)  GCC  0. 0(     0)  GAC  9. 1(    31)  GGC 26. 9(    92)
GUA  0. 0(     0)  GCA  0. 0(     0)  GAA 29. 8(   102)  GGA  0. 3(     1)
GUG  0. 0(     0)  GCG  0. 0(     0)  GAG 74. 0(   253)  GGG  8. 5(    29)


                147
                Литература.

1. M. Volgraf, P. Gorostiza, R. Numano, R. Kramer, E. Isacoff, D. Trauner.
Allosteric control of an ionotropic glutamate receptor with
an optical switch. 
Nature Chemical Biology 2006. 2. 47-52.
2. Скулачев В. П. Энергетика биологических мембран. Наука. 1989, стр. 272.
3. Лузиков В. Н. Адресованный транспорт белков в клетке. Молекулярная
биология. 1987. Том 21. Вып 5. Стр 1157-1171.
4. Биология старения. Руководство по физиологии. 1982. с. 267.
5. Trifunovic A,  Larsson NG.  Mitochondrial dysfunction as a cause of
ageing.  J Intern Med.  2008. 263. 167–178.
6. Trifunovic A,  Wredenberg A,  Falkenberg M,  Spelbrink JN,  Rovio AT, 
Bruder CE,  Bohlooly YM,  Gidlof S,  Oldfors A,  Wibom R,  Tornell J, 
Jacobs HT,  Larsson NG.  Premature aging in mice expressing defective
mitochondrial DNA polymerase.  Nature.  2004. 429. 417-423.
7. Vermulst M,  Wanagat J,  Kujoth GC,  Bielas JH,  Rabinovitch PS, 
Prolla TA,  Loeb LA.  DNA deletions and clonal mutations drive
premature aging in mitochondrial mutator mice.
Nat Genet.  2008. 40. 392-394.
8. Kraytsberg Y,  Simon DK,  Turnbull DM,  Khrapko K.  Do mtDNA
deletions drive premature aging in mtDNA mutator mice. 
Aging Cell.  2009. 4. 502-506.
9. Sato A,  Kono T,  Nakada K,  Ishikawa K,  Inoue S,  Yonekawa H,
Hayashi J.  Gene therapy for progeny of mito-mice carrying
pathogenic mtDNA by nuclear transplantation. 
Proc Natl Acad Sci U S A.  2005.
10. Edgar D,  Shabalina I,  Camara Y,  Wredenberg A,  Calvaruso MA,
Nijtmans L,  Nedergaard J,  Cannon B,  Larsson NG,  Trifunovic A.
Random point mutations with major effects on protein-coding
genes are the driving force behind premature aging in mtDNA
mutator mice.  Cell Metab.  2009. 10. 131-138.
11. Dogan S. A,  Trifunovic A. Modelling Mitochondrial Dysfunction
in Mice. Physiol.  Res. 2011. 60(Suppl. 1). 61-70.
12. Edgar D, Trifunovic A. The mtDNA mutator mouse:Dissecting 
mitochondrial involvement in aging. Aging. December 2009, Vol. 1
No. 12. 1028-1032.
13. Taylor R. W,  Turnbull D. M. Mitochondrial DNA mutations in human
disease. Nat Rev Genet. 2005 May. 6(5). 389–402.
14. Aubrey de Grey. Ending aging. 2007. N. Y.
15. Физиология речи. Руководство по физиологии. Наука. Ленинград.
1976. Чистович Л. А. и др.
16. Bedell J, Korf I, Yandell M.  BLAST. O. Reilly, 2003, p 360.
17. Злыдников Д. М. , Казанцев А. П. , Шаманова М. Г. Микоплазмоз
человека.   Медицина. 1975.
18. Репродуктивное здоровье. Под редакцией Кейта Л. Г. ,
Бергера Г. С. ,  Эдельмана Д. А. Том 1 и Том 2. Медицина. 1988.
19. Global transposone mutagenesis a minimal mycoplasma genome.
Science. 10 december 1999, v. 286, 5447, pp 2165-2169.
20. Zhang S, Tsai S, Lo S. Alteration of gene expression profiles
during mycoplasma-induced malignant cell-transformation.
BMC Cancer. 2006. 6. 116.
21. Jensen J. Mycoplasma genitalium infections. Danish Medicine
Bulletin. 2006. 1. v 53. p 1-27.
22. Rottem S. Interaction of Mycoplasmas With Host Cells.
Physiol. Rev. 83. 2003. 417-432.
23. Razin S, Yogev D, Naot Y.  Molecular Biology and Pathogenicity
of Mycoplasmas. Microbiol. Mol. Biol. Rev. 1998. v 62.
24. Гаврилов Л. А, Гаврилова Н. С. Биология продолжительности жизни. 1991.
Наука. Стр. 158.
25. Венерические болезни. Руководство. Под. ред. Шапошникова О. К. 1991.
Медицина. Стр. 416.

                148
26. D. Graur, Y. Zheng, N. Price, R. B. R. Azevedo, R. A. Zufall, E. Elhaik.
On the Immortality of Television Sets: “Function” in the
Human Genome According to the Evolution-Free Gospel of ENCODE.
Genome Biol.  Evol.  5(3):578–590. February 20,  2013.
27. L. D.  Hurst. Open questions: A logic (or lack thereof)of
genome organization. BMC Biology 2013,  11:58.
28. B. Maher . (September 2012).  ENCODE: The human encyclopaedia.
Nature.  489. (7414): 46–8.
29. Bernstein B. E, Birney E, Dunham I, Green E. D, Gunter C, Snyder M
(September 2012). An integrated encyclopedia of DNA elements
in the human genome.  Nature.  489.  (7414): 57–74.
30. Ермишин А. П. Генетически модифицированные организмы: мифы и
реальность. Минск. 2004.
31. Большакова Е. И, Клышинский Э. С, Ландэ Д. В, Носков А. А, Пескова О. В,
Ягунова Е. В. Автоматическая обработка текстов на естественном языке
и компьютерная лингвистика. МИЭМ. 2011.
32. B. Bergeron. Bioinformatics Computing. 2002.
33. Bioinformatics methods and protocols. Edited by S.  Misener,  S. A.
Krawetz.  (Methods in molecular biology v.  132). 2000.
34. Bioinformatics for Geneticists. Edited by M. R.  Barnes, I. C. Gray
2003.
35. BIOINFORMATICS. Practical Guide to the Analysis of Genes and Proteins.
METHODS OF BIOCHEMICAL ANALYSIS. Volume 43.
A. D.  Baxevanis, B. F. Ouellette. 2001.






































                149
                Оглавление.

 Предисловие.                3
 Введение в современную ДНК информатику.                4
 10 лет генома человека - все еще только начинается.        6
 Тексты ДНК. Медицина и биология будущего.                8
 Музыка генов человека.                Сообщение 1.        8
 Вопросы по музыке генов.               Сообщение 2.        9
 Музыка генов дрожжей.                Сообщение 3.        10
 Алгоритм музыки генов. Белковые домены. Сообщение 4.       11
 Дополнения по музыке генов.            Сообщение 5.        13
 Музыка генов вируса герпеса типа 2.    Сообщение 6.        14
 Методика создания музыки генов.                15
 Музыка белковых комплексов.            Сообщение 7.        16
 Геном человека и митохондрия. Часть 1.                17
 Геном человека и митохондрия. Часть 2.                18
 Управляемые наномашины - основа терапии будущего.          21
 Гены-гиганты в геноме человека. Сообщение 1.               22
 Гены-гиганты в геноме человека. Сообщение 2.               25
 Гены-гиганты в геноме человека. Интрогены. Сообщение 3.    27
 Гены-гиганты в геноме человека. Транспозоны. Сообщение 4.  27
 Гены-гиганты в геноме человека. Дефрагментация генов -
 природный феномен. Сообщение 5                30
 Дополнение по генам гигантам                31
 Где находится память у человека.                32
 Микоплазма, транспозоны, эволюция и здоровье человека.
 Часть 1.                34
 Микоплазма, транспозоны, эволюция и здоровье человека.
 Часть 2.                37
 Полезные гены животных, растений и микробов -
 в геном человека.                38
 Растения - генные контейнеры и химические лаборатории.     39
 Что же такое - разумное послание в геномах?                40
 Кодоны в ДНК и разумность последовательности.              41
 Генное программирование и ДНК говорит. Ген PUSHKIN.        44
 Стихотворение А. С. Пушкина "Осень" в виде гена.           45
 Функциональные элементы генома и ДНК информатика           50
 Биоинформатика и белки.                52
 ДНК говорит. Способы кодирования. Часть 1.                53
 ДНК говорит. Способы кодирования. Часть 2.                54
 ДНК говорит. Способы кодирования. Часть 3.                54
 ДНК говорит. Способы кодирования. Часть 4.                55
 ДНК говорит. Ввод биологической части словаря.             57
 ДНК говорит. Способы кодирования. Введение графических
 изображений с помощью ДНК.        Часть 5.                58
 ДНК говорит. Способы кодирования. Визуально-особые,
 магические участки генома.        Часть 6.                59
 ДНК говорит. Способы кодирования. Гены-маркеры.            
                Часть 7.                61
 ДНК говорит. Способы кодирования. Структура ДНК -
 возможный маркер посланий.        Часть 8.                62
 ДНК говорит. Способы кодирования. Особенности живой ДНК.
                Часть 9.                64
 ДНК говорит на языке человека.                65
 Пример искаженной информационной последовательности и ее
 коррекция.                70
 Самые большие белки, кодируемые геномом человека.          75
 Теломера хромосомы и теории старения.                77
 Гены поддержки высших психических свойств человека.        83
 Окончание.                87
 Заключение.                88
 Об авторе.                88

                150
 Гены компонентов митохондрий в хромосомах ядра человека.
                Приложение 1.             89
 Гены митохондрии человека.       Приложение 2.            100
 Список генов-гигантов человека, размером более 400 тпн и
 их функция.                Приложение 3.            101
 Гены сплайсинга.                Приложение 4.            111
 Список больших белков человека.  Приложение 5.            116
 Список повторов в изученных интронах генов-гигантов.
                Приложение 6.            123
 Примеры участков, которые сразу бросаются в глаза,
 визуально-особые участки генома. Приложение 7.            131
 Примеры участков генома микоплазмы гениталиум G37,
 подобные повторам и транспозонам
 человека.                Приложение 8.            141
 Примеры сравнения микоплазмы гениталиум с HTRVK и LINE 1
 с помощью программы BLAST.       Приложение 9.            143
 Разбика гена PUSHKIN на отдельные кодоны и количество
 различных кодонов в гене PUSHKIN.Приложение 10.           144
 Пример трансляции гена PUSHKIN.  Приложение 11.           145
 Промилле кодонов для человека. Количество различных
 кодонов в гене PUSHKIN.          Приложение 12.           147
 Литература                148
 Оглавление.                150 






































                151