Exxtend Biotecnologia
22/8/2023

O Pangenoma humano e tudo que você precisa saber sobre genomas de referência

2 minutos
Link para o Linkedin da Exxtend
Link para o Facebook da Exxtend
Armazenamento de Dados Digitais em DNA: A Próxima Fronteira da Tecnologia de Armazenamento



O genoma de referência desempenha um papel essencial nas pesquisas genômicas, fornecendo uma estrutura e um ponto de referência para a análise comparativa de sequências genéticas. Neste artigo, exploramos em detalhes o conceito do genoma de referência, seu desenvolvimento, as principais tecnologias empregadas, desafios associados e sua importância nas pesquisas genômicas. Por fim, destacamos a necessidade contínua de atualização e refinamento do genoma de referência para melhorar a precisão das análises genômicas, utilizando para isso o exemplo do Pangenoma Humano, a recente atualização do nosso genoma de referência, que inaugura uma nova era de possibilidades na genômica


O que é Genoma de Referência?


O genoma de referência é uma sequência de DNA que representa uma determinada espécie ou população em um estado genômico padrão. É construído a partir de várias amostras genéticas, visando estabelecer uma sequência consenso que representa a estrutura genômica típica da espécie em questão. O genoma de referência atua como uma base comparativa para a análise de variações genéticas em amostras individuais.


Desenvolvimento do Genoma de Referência


a. Coleta de Amostras

A primeira etapa na construção de um genoma de referência é a coleta de amostras representativas da espécie em estudo. Essas amostras podem ser obtidas de indivíduos saudáveis, representantes de uma população ou de indivíduos que são considerados "padrão" para a espécie.

b. Sequenciamento Genômico

Após a coleta das amostras, o DNA é extraído e passa por um processo de sequenciamento genômico. Existem várias técnicas disponíveis para sequenciamento, como sequenciamento de nova geração (NGS) e sequenciamento de terceira geração (TGS), cada uma com suas vantagens e limitações. O sequenciamento é realizado em larga escala, resultando em uma grande quantidade de dados brutos.

c. Montagem e Anotação Genômica

Os dados brutos do sequenciamento são processados e montados usando algoritmos bioinformáticos para criar uma sequência contígua, conhecida como montagem genômica. Esse processo envolve a sobreposição de fragmentos de DNA para reconstruir a sequência original. Em seguida, a montagem genômica é anotada, identificando e classificando os genes, elementos regulatórios e outras características funcionais.


Desafios e Limitações


a. Variação Genômica

A existência de variação genômica, como polimorfismos de nucleotídeo único (SNPs) e variantes estruturais, apresenta um desafio significativo na construção do genoma de referência. Essas variações podem resultar em diferentes versões do genoma em uma população, exigindo esforços para representar a diversidade genética.


b. Regiões Difíceis de Montar

Algumas regiões genômicas são intrinsecamente difíceis de montar devido à repetitividade ou complexidade estrutural, conhecidas como "lacunas" genômicas. Essas regiões podem ser deixadas de fora ou mal representadas no genoma de referência, afetando a precisão das análises nessas regiões.


Importância do Genoma de Referência


a. Análise de Variantes

O genoma de referência é usado como uma base para a identificação e classificação de variantes genéticas em amostras individuais. A comparação das sequências genômicas com o genoma de referência permite detectar mutações, polimorfismos e outras variações que podem estar associadas a doenças ou características fenotípicas.


b. Estudos de Expressão Gênica

O genoma de referência também é fundamental para estudos de expressão gênica, pois fornece informações sobre a localização dos genes e seus elementos regulatórios. Isso permite a análise do transcriptoma e a compreensão dos padrões de expressão gênica em diferentes tecidos e condições.

c. Melhoria de Tecnologias Genômicas

O genoma de referência serve como uma base para o desenvolvimento e aprimoramento de tecnologias genômicas, como sondas de DNA, microarranjos e técnicas de sequenciamento. Essas tecnologias dependem da referência genômica para mapear e interpretar os dados gerados experimentalmente.


Atualizações do Genoma de Referência


Devido à natureza dinâmica das informações genômicas, o genoma de referência está em constante evolução. Novas versões do genoma de referência são lançadas periodicamente para incorporar novas descobertas, preencher lacunas genômicas e melhorar a precisão das análises genômicas. Essas atualizações são alcançadas por meio da colaboração entre cientistas e esforços coordenados em projetos genômicos.



Pangenoma: o genoma de referência humano


Pelos últimos 20 anos, o GRCh38 (Genome Reference Consortium human genome build 38) vinha sendo o genoma de referência humano. É uma sequência de DNA compilada por um consórcio de pesquisadores que visa fornecer uma representação precisa do genoma humano. O GRCh38 substituiu o genoma de referência anterior, o GRCh37, em 2013, trazendo diversas atualizações e melhorias, como a correção de erros e lacunas, e a adição de novas sequências genômicas, regiões anteriormente não mapeadas no GRCh37.


Contudo, 70% do GRCh38 veio de um único indivíduo, um americano com ascendência europeia e africana. Por isso, em maio de 2023, os cientistas do Consórcio de Referência do Pangenoma Humano publicaram o primeiro rascunho de um pangenoma humano, que contempla, até o momento, genoma de 47 pessoas, com ascendência da África subsaariana, das Américas, China e Europa, com representação de indígenas.

Fonte: https://www.flickr.com/photos/genomegov/albums/72177720308178253

Assim, o Pangenoma, mesmo em sua versão inicial, inaugura uma nova era para o diagnóstico genético. Mas isso ainda é só o começo. O objetivo é aumentar a amostragem para 350 pessoas para a versão “final”. Em seguida, uma possível fase dois do Projeto Genoma Humano prevê colaborações com organizações de outros países para aumentar ainda mais a amostragem e a diversidade do Pangenoma.


Isso é muito importante, pois um genoma de referência de um único genoma humano não representa adequadamente toda a humanidade. Por exemplo, nesses primeiros esforços para a versão atual do Pangenoma, os pesquisadores já identificaram novos 119 milhões de pares de bases de sequências polimórficas em relação GRCh38, o que permite aumentar a precisão da detecção de mudanças genéticas em aproximadamente 34%.


Expandir a diversidade e a representatividade no genoma humano de referência permite reduzir um viés implícito de longa data, trazendo novas perspectivas sobre a identidade genética das diferentes populações humanas, e permitirá elevar a medicina de precisão a um novo patamar, viabilizando novos estudos e, principalmente, viabilizando que a comunidade científica produza uma ciência mais inclusiva, resultando em cuidados médicos mais equitativos e abrangentes no futuro.


Conclusão


O genoma de referência desempenha um papel fundamental nas pesquisas genômicas, fornecendo uma base comparativa para análise de variantes genéticas e estudos de expressão gênica em amostras individuais. No entanto, sua construção enfrenta desafios, como a representação precisa da diversidade genética e a montagem de regiões difíceis. O recente desenvolvimento do Pangenoma Humano, que incorpora sequências genômicas de diferentes populações, inaugura uma nova era na genômica, possibilitando a medicina de precisão mais inclusiva e avançada. À medida que o Pangenoma evolui, espera-se que as atualizações contínuas melhorem ainda mais a precisão das análises genômicas, levando a avanços significativos na pesquisa e no atendimento médico, tornando-o mais equitativo e abrangente para todas as populações.




Referência


Utsunomiya, A. T. H. (2015). Análise ampla do genoma para detecção de erros de montagem no genoma de referência bovino e para detecção de locos relacionados a características de produção e reprodução da raça GIR.


Ballouz S, Dobin A, Gillis JA. Is it time to change the reference genome?. Genome Biol. 2019;20(1):159. Published 2019 Aug 9. doi:10.1186/s13059-019-1774-4


Schneider VA et al. Evaluation of GRCh38 and de novo haploid genome assemblies demonstrates the enduring quality of the reference assembly. Genome Res 27, 849–864, doi:10.1101/gr.213611.116 (2017).


Kaye AM, Wasserman WW. The genome atlas: navigating a new era of reference genomes. Trends Genet. 2021;37(9):807-818. doi:10.1016/j.tig.2020.12.002

Curiosidades
Pesquisa

Mais conteúdos

Curiosidades

Feromônios: o código invisível da atração

Exxtend Biotecnologia
12/6/2023
Pesquisa

Hemocromatose Hereditária - A luta silenciosa contra o excesso do ferro!

Exxtend Biotecnologia
4/7/2023
Pesquisa

Ciência e tecnologia: O match perfeito da Bioinformática

Exxtend Biotecnologia
1/8/2023