Jeden z pěti lidských genů není „skutečný“

genetika

2021

Nový výzkum by mohl změnit tvář biomedicíny; Bylo zjištěno, že lidský genom obsahuje mnohem méně „skutečných“ nebo proteinů kódujících genů, než se dříve věřilo.

Naše DNA může obsahovat mnohem méně „skutečných“ genů, než jsme si původně mysleli.

Na počátku 90. let se vědci pustili do mapování celé sekvence DNA lidského genomu.

Cílem takzvaného projektu Human Genome Project bylo najít genetické vazby na nemoci a porozumět funkci a struktuře různých prvků genomu, jako například které geny kódují proteiny a jaké faktory regulují genovou expresi.

Počáteční výsledky projektu Human Genome Project předpovídaly, že existuje 40 000 genů, které mohou kódovat proteiny, velké molekuly, které jsou životně důležité pro dobré fungování tělesných tkání a orgánů.

Jak se však tento projekt chýlil ke konci v roce 2003, odhady tohoto počtu klesly na přibližně 20 000–25 000 genů kódujících proteiny.

Od tohoto bodu se vědci snaží přijít s konečným proteomem - tedy s celkovým počtem proteinů, které mohou být exprimovány geny - a zaměřují se na pochopení toho, jak je genetická exprese těchto proteinů mutována u několika nemocí.

Za tímto účelem nyní mezinárodní tým vědců vedený Michaelem Tressem ze španělského oddělení pro bioinformatiku ve středisku pro výzkum rakoviny v Madridu ve Španělsku prozkoumal geny považované za kódující proteiny pomocí hlavních dostupných databází proteomu.

Tress a kolegové zveřejnili výsledky svého výzkumu v časopise Výzkum nukleových kyselin. Federico Abascal z Wellcome Trust Sanger Institute v Hinxtonu ve Velké Británii je prvním autorem článku.

Nejméně 2 000 genů je „pseudogenů“

Vědci porovnali proteomy ze tří sbírek proteinových sekvencí a genetických anotací: GENCODE / Ensembl, RefSeq a UniProtKB.

Tress a tým zjistili, že z celkového počtu 22 210 genů uvedených jako kódující proteiny se ve všech třech sbírkách objevilo pouze 19 446 genů.

Poté přiblížili rozdíl 2764 genů a prozkoumali experimentální důkazy a informace dostupné z anotací.

Důkazy naznačují, že většina těchto genů byly „nekódující geny nebo pseudogeny“.

Vědci také zjistili, že dalších 1470 genů - které byly ve třech sbírkách uvedeny jako kódující proteiny - nemělo funkční vlastnosti ani typický vývoj genů kódujících proteiny.

Vědci proto „věří, že tři referenční databáze v současné době nadhodnocují počet lidských kódujících genů nejméně o 2 000, což komplikuje a přidává šum k velkým biomedicínským experimentům.“

"Určení, které potenciální nekódující geny nekódují proteiny, je obtížný, ale životně důležitý úkol, protože lidský referenční proteom je základním pilířem nejzákladnějšího výzkumu a podporuje téměř všechny rozsáhlé biomedicínské projekty."

Pokyny pro budoucí výzkum

Tress sdílí, jak vědci posouvají svá zjištění dále. "Byli jsme schopni podrobně analyzovat mnoho z těchto genů," vysvětluje, "a více než 300 genů již bylo překlasifikováno jako nekódující."

„Překvapivě,“ říká spoluautor studie David Juan, „některé z těchto neobvyklých genů byly dobře prostudovány a mají více než 100 vědeckých publikací založených na předpokladu, že gen produkuje protein.“

Výsledky by proto mohly změnit pole biomedicíny, jak ji známe. Je však zapotřebí dalšího výzkumu.

„Naše důkazy,“ dodává Abascal, „naznačují, že lidé mohou mít pouze 19 000 kódujících genů, ale stále nevíme, které [ty] 19 000 geny jsou.“

!-- GDPR -->