Самые большие белки человека

Михаил Курносов
 САМЫЕ БОЛЬШИЕ БЕЛКИ,КОДИРУЕМЫЕ ГЕНОМОМ ЧЕЛОВЕКА.14 АПРЕЛЯ 2011.
 Глава из книги: "Новая генетика и ДНК-информатика".

 Для поиска разумных посланий в геноме человека я предпринимаю несколько новый подход. Это рассмотрение каких-то аномалий в белках человека, указывающих на
их искусственное происхождение. Одной из таких аномалий являются особо крупные белки, так как они обращают на себя внимание в первую очередь. Функциональные
домены обычных белков имеют размер от нескольких аминокислот до десятков. Конечно , вроде бы ненужные массивы аминокислот белков-гигантов нужны для конфигурации активных центров молекулы, а могут ли они быть вообще
бесполезными. Другие белки-гиганты состоят из множества небольших доменов. В любом случае, рассмотрение последовательности аминокислот выглядит более
наглядным для демонстрации необычности его и я предполагаю, что аномальные
белки могут быть как бы метками в геноме для маркирования информационных участков.
В любом случае , эти мои разработки могут пригодится в будущем, если наша цивилизация достигнет необходимости специально вводить информационные участки
в новые организмы будущего. Это может быть полезным для биологических
наномашин. Пока известны науке только естественные наномашины - это
молекулярные комплексы белков, нуклеиновых кислот и других молекул,
выполняющих определенные функции в клетке.Напрмер, ДНК-полимеразный комплекс, рибосома, РНК-полимеразный комплекс, различные помпы мембран для перекачки нужных молекул и т. п. Введение текста в ДНК может быть программой для управления искусственной наномашиной.
Для изучения и разработки биологических наномашин общее представление о
размерах имеет значение. И если особо крупные белки можно представить как
остов машины, то мелкие белки - это инструменты, подвешенные к остову для выполнения нужных работ внутри клетки. Текст ДНК или белка можно использовать для инструктирования этой наномашины. Через эти тексты, введенные в геном, возможно поддерживать обмен сигналами наномашины с внеклеточной средой или расположенными вне клетки управляющими микро- и макроустройствами.
Привожу примеры белков разного размера, это полезно для их сравнения
в приложении 4.
Если белок очень большой,то для выявления какой-то скрытой периодичности в
нем или доменов,повторов структуры,можно просматривать белок при
прокручивании его в каком-то просмотрщике файла.Будет видна псевдографика
или какие-то необычные картинки при движении файла.Чтобы это облегчить и
уловить скрытую периодичность можно часть аминокислот заменить на пробелы.
Пример ниже.У белка TITIN N2-A я произвел замену EKK на пробелы.

Трудно уловимая периодичность.


Явная периодичность.


Таким образом,просмотр псевдографики при движении файла
может дать открытие чего-то необычного.
Всего в результате длительной трудной работы, просидев за компьютером
несколько недель было просмотрено вручную 34182 белка-предшественника из этой базы, это больше , чем количество генов в геноме индивидуума. Потому, что в
базе часто есть повторы для одного белка разных изоформ, или разных аллелей одного гена.Список больших белков составлен по порядку их расположения в базе белков генома человека из NCBI - protein. gbs.

Статистика для прекурсоров белков человека , кодируемых геномом
человека следующая.
При размере белка в аминокислотах процент таких белков составил:
до 500 -- 64
500 - 1000 -- 26
1000 - 1500 -- 7
1500 - 2000 -- 2
более 2000 -- 1

Я привожу список белков-гигантов при размере их более 1500 аминокислот.
Общее количество белков гигантов составляет менее 3 процентов от общего количества белков. Самые крупные белки, как рекорды для человека будут перечислены индивидуально.
Большинство белков имеют размер 10-300 аминокислот, и поэтому размер
прекурсоров в 5000 - 8000 и выше можно назвать интересным феноменом. Конечно, эти прекурсоры модифицируются пост-трансляционно, но сам этот феномен есть.

Список рекордных размеров белков-прекурсоров,составил Курносов М.

ABCA13 - 5058 ATP BINDING CASSETE MEMBER 13
AHNAK - 5890 AHNAK NUCLEOPROTEIN ISOFORMA 1
ALMS1 - 4169 ALSTROM SYNDROME 1
ANK3 - 4377 ANKYRIN 3
APOB - 4563 APOLIPOPROTEIN B PRECURSOR
BIRC6 - 4829 BACULOVIRAL IAP REPEAT CONTAINING 6
C14ORF78- 5048 - 6287 SIMILAR AHNAK NUCLEOPROTEIN 1
CMYA5 - 4069 CARDIOMYOPATHY ASSOCIATED 5
DNAH1 - 4330 DYNEIN
DNAH11 - 4523 DYNEIN
DNAH3 - 4116 - 4427 DYNEIN
DNAH5 - 4624 DYNEIN
DNAH7 - 4024 DYNEIN
DNAH8 - 4490 DYNEIN
DNAH9 - 4486 DYNEIN
DST - 5171 - 5497 DYSTONIN
DYNC1H1 - 4646 DYNEIN
DYNC2H1 - 4307 - 4314 DYNEIN
EPPK1 - 5065 EPIPLAKIN 1
FAT - 4588 FAT TUMOR SUPRESSOR 1
FAT2 - 4349 FAT TUMOR SUPRESSOR
FAT3 - 4601 SIMILAR FAT3
FCGBP - 5405 FC-FRAGMENT OF IG-G BINDING PROTEIN
FLG - 4061 FILAGGRIN
FRAS1 - 4011 FRASER SYNDROME 1
GPR98 - 6307 VERY LARGE G-PROTEIN COUPLED RECEPTOR 1 CHR 5
HERC1 - 4861 HECT DOMAIN AND RLC1
HERC2 - 4834 HECT DOMAIN AND RLC2
HMCN1 - 5636 HEMICENTIN 1
HSPG2 - 4391 HEPARIN SULFATE PROTEOGLYCAN 2
HUWE1 - 4374 HECT UBA WWE DOMAINS CONTAINING 1
KIAA1109- 4975 - 5005 SIMILAR CG15133PA
LOC649768 5205 MUCIN 5B
LOC650412 4107 SIMILAR DYNEIN 1
LOC727897 5708 SIMILAR MUCIN 5B PRECURSOR
LOC731751 4096 SIMILAR PROTEIN KINASE DNA ACTIVATED CATALYTIC PP
LPA - 4548 LIPOPROTEIN LPA
LRP1 - 4544 LOW DENSITY LIPOPROTEIN-RELATED PROTEIN 1
LRP1B - 4599 LOW DENSITY LIPOPROTEIN-RELATED 1B
LRP2 - 4655 LOW DENSITY LIPOPROTEIN-RELATED PROTEIN 2
MACF1 - 5430 - 5938 MICROFILAMENT AND ACTIN FILAMENT
CROSS-LINKER PROTEIN 1
MDN1 - 5596 MIDASIN
MLL2 - 5262 MYELOID-LYMPHOID LEUKEMIA 2
MLL3 - 4025 - 4911 MYELOID-LYMPHOID LEUKEMIA 3
MUC16 - 14507 MUCIN 16
MUC17 - 4493 MUCIN 17
MUC19 - 4516 - 7328 MUCIN 19
MUC2 - 5179 MUCIN 2
MYCBP2 - 4640 MYC BINDING PROTEIN 2
NEB - 6669 NEBULIN
OBSCN - 6620 OBSCURIN CHR 1
PCLO - 5010 PICCALO
PCLO - 5011 - 5021 SIMILAR PICCOLO
PKD1 - 4302 POLYCYSTIN KIDNEY DISEASE 1
PKHD1 - 4074 FIBROCYSTIN 1
PKHD1L1 - 4243 SIMILAR FIBROCYSTIN 1
PLEC1 - 4515 - 4684 PLECTIN 1
PRKDC - 4128 PROTEIN KINASE DNA-ACTIVATED CATALYTIC PP
RYR1 - 5038 RYANODIN RECEPTOR
RYR2 - 4967 RYANODIN RECEPTOR 2
RYR3 - 4870 RYANODIN RECEPTOR 3
SACS - 4432 SACSIN
STARD9 - 4552 STAR- RELATED LIPID TRANSFER PROTEIN 9
SYNE1 - 8749 - 8797 NESPRIN
SYNE2 - 6883 SPECTRIN NUCLEAR ENVELOPE
TNXB - 4289 TENASCIN XB 1
TTN - 26926 TITIN ISIFORMA N2B
TTN - 27051 TITIN ISOFORMA NOVEX 1
TTN - 27118 TITIN ISOFORMA NOVEX 2
TTN - 33423 TITIN ISOFORMA N2A
TTN - 5604 TITIN NOVEX 3
USH2A - 5202 USHERIN
VPS13B - 4022 VACUOLAR PROTEIN SORTING 13B
VPS13D - 4363 - 4388 VACUOLAR PROTEIN SORTING 13 D
ZUBR1 - 5183 RETINOBLASTOMA-ASSOCIATED FACTOR 600

Итого 75 генов человека кодируют белки-прекурсоры размером более 4000 аминокислот, из них самый большой белок - титин 33423 аминокислоты,на 2 месте муцин 16 - 14507 аминокислот, на 3 месте несприн (ген SYNE1) - 8797 , на 4
месте SYNE2 - 6883, на 5 месте небулин - 6669. Белки эти имеют много доменов. Сам феномен белков-гигантов требует дальнейшего изучения, что будет
продолжено в следующих сообщениях.