Мы думали, что раскрыли все ее секреты в 2003 году, когда ученые объявили, что двойная спираль жизни полностью расшифрована и собрана. Конечно, некоторые части отсутствовали, но это были незначительные пробелы, которые отбрасывались как неважные, поскольку они, казалось, не кодировали ничего функционального (то, что в то время считалось «мусорной ДНК»).
ГЕНОМ ЧЕЛОВЕКА — ЭТО ДАР
Но даже в хламе есть спрятанные сокровища. Исследования показали, что вариации в этих непоследовательных областях неразрывно связаны со здоровьем человека, от старения до таких состояний, как рак, и нарушений развития, таких как аутизм. В 2022 году знаменательное исследование, наконец, разрешило геномную неизвестность, полностью секвенировав оставшиеся восемь процентов оставшейся нерасшифрованной ДНК.
Теперь ученые обнаруживают, что некоторые генетические последовательности кодируют белки, у которых нет очевидных предков, то, что генетики называют генами-сиротами. Исследователи предполагают, что некоторые из этих сиротских генов возникли спонтанно в ходе нашей эволюции, в отличие от других, которые мы унаследовали от наших предков-приматов. В статье, опубликованной во вторник в журнале Cell Reports, исследователи из Ирландии и Греции обнаружили, что около 155 из этих меньших версий последовательностей ДНК, называемых открытыми рамками считывания (или ORF), делают микропротеины потенциально важными для роста здоровых клеток или связаны с набором заболеваний, такими как мышечная дистрофия и пигментный ретинит, редкое генетическое заболевание, поражающее глаза.
ПРЕДЫСТОРИЯ
Большинство из нас знакомы с нашей ДНК, состоящей из четырех химических строительных блоков, называемых нуклеотидами: аденозина (А), тимина (Т), цитозина (Ц) и гуанина (Г). Конкретные последовательности, например, AATCGA, — это рецепты, которые рибосомы — наши повара по производству белков, если хотите — используют для приготовления определенного белка.

Наши хромосомы представляют собой плотно упакованные нити ДНК, состоящие из четырех нуклеотидов на основе сахара.
Когда рибосома считывает группу нуклеотидов, последовательность из трех, называемых кодонами, сообщает маленькому повару, где начать и где закончить чтение, как первая и последняя страница главы в книге рецептов. Пространство между стартовым и стоп-кодоном называется ORF, говорит Аойф МакЛисахт , профессор генетики Дублинского Тринити-колледжа в Ирландии и старший автор статьи .
«Это фрагмент ДНК, теоретически способный кодировать белок определенной длины», — объясняет она. «Как долго это [может варьироваться], и мы не знаем, является ли это геном, без дополнительного анализа».
Общее эмпирическое правило, которого придерживаются ученые, заключается в том, что чем длиннее ORF, тем выше вероятность того, что она кодирует функциональный, значимый белок.
«Когда [ORF] короткие, у нас в принципе нет возможности узнать, кодирует ли он что-то, что на самом деле имеет биологический смысл, или это просто так получилось, например, если вы вводите случайные числа, вы собираетесь придумать чью-то номер телефона», — говорит МакЛисахт.
В течение долгого времени это приводило к тому, что маленькие ОРС летали вне поля зрения генома, считаясь бессмысленным шумом. Но МакЛисахт говорит, что растет интерес к выяснению того, действительно ли малые ORF являются биологически значимыми, поскольку не все генетические вариации сводятся к тому, что обычно считается геном. Если эти небольшие ORF важны и образуют влиятельные белки, могут ли они объяснить, как развиваются новые гены и проявляются новые признаки у видов?
КАК ОНИ ЭТО СДЕЛАЛИ?
В геноме есть бесчисленное множество маленьких ORF, поэтому отсеять, какие из них функциональны, а какие нет, а затем проследить их происхождение — довольно колоссальная задача.
Вместо этого исследователи проанализировали набор данных о небольших ORF у людей, которые уже были определены как биологически функциональные, и собрали воедино филогенетическое дерево, диаграмму, которая представляет эволюционные отношения между организмами (и в буквальном смысле выглядит как дерево). Это было сделано путем сравнения последовательности небольшой ORF с такими же последовательностями у наших близких родственников человекообразных обезьян, таких как шимпанзе, орангутанг, горилла и гиббон, а также у других позвоночных. (По некоторым оценкам , современные люди и человекообразные обезьяны разошлись примерно от четырех до шести миллионов лет назад).
«Если вы можете найти [ORF] только у людей, то, похоже, он специфичен для человека», — говорит МакЛисахт. Но если это что-то, что встречается у людей и шимпанзе или у людей, шимпанзе и горилл, то оно могло произойти от общего предка.
ЧТО ОНИ ОБНАРУЖИЛИ?
Группа обнаружила, что существует около 155 небольших ORF, производящих микропротеины, которые возникли совершенно с нуля — то, что называется рождением генов de novo — в уникальных областях ДНК.
Чуть более четверти этих коротких генетических последовательностей — ровно 44 — оказались специфичными для человека и вызывали дефекты роста в иммортализованных клеточных линиях (это клетки, которые обычно не имеют проблем с ростом, поскольку у них есть мутация, которая заставляет их размножаться), согласно набору данных, который использовали исследователи.
Три других ORF, по-видимому, связаны с такими заболеваниями, как мышечная дистрофия, пигментный ретинит и редкое генетическое состояние, влияющее на развитие, называемое синдромом Алазами, которое связано с геном LARP7. Другой ORF, по-видимому, тесно связан с сердечной тканью и является общим для людей с шимпанзе, но не для горилл, орангутангов или макак. Это говорит о том, что как только происходит эволюционный разрыв, гены могут довольно быстро эволюционировать внутри вида.
ЧТО ДАЛЬШЕ?
МакЛисагт и Вакирилис говорят, что это только начало понимания того, как ORF участвуют в создании новых генов, эволюции человека и их роли в здоровье и болезнях. Некоторые недавние исследования показали, что эти генетические последовательности связаны с риском развития болезни Альцгеймера.
«Предстоит еще много работы и еще много [ORF] для изучения», — говорит Вакирлис. Например, не каждый новый ген дает биологическую пользу. Многие могут нанести вред и причинить вред организму. Они не передаются из поколения в поколение, потому что организм неизменно не выживает.
«Как это уравновешивается тем фактом, что мы знаем, что в долгосрочной перспективе появляются совершенно новые гены? Как они выходят из этой начальной, очень вероятной ситуации?», — говорит Вакирлис. «Это очень интересный вопрос, и я думаю, что мы сможем ответить на него с помощью имеющихся данных».
