Em formação

10.6: Atribuição - qual tem mais DNA? - Biologia


Pergunta: Um kiwi e um morango que têm aproximadamente o mesmo tamanho também teriam aproximadamente a mesma quantidade de DNA?

Fundo: Você aprendeu que o DNA é transportado pelos cromossomos. Todos os mamíferos são diplóides; no entanto, nem todas as plantas são diplóides. O morango comum é o octoplóide (8n) e o kiwi cultivado é hexaplóide (6n) Pesquise o número total de cromossomos nas células de cada uma dessas frutas e pense em como isso pode corresponder à quantidade de DNA nos núcleos das células dessas frutas.

Hipótese: Imagine se você seria capaz de detectar uma diferença na quantidade de DNA de morangos e kiwis de tamanhos semelhantes. Qual fruta você acha que renderia mais DNA?

Teste sua hipótese. Realize o experimento de extração de DNA.

Registre suas observações: Como você não está medindo quantitativamente o volume de DNA, pode registrar para cada ensaio se as duas frutas produziram quantidades iguais ou diferentes de DNA observadas a olho nu. Se uma ou outra fruta produziu visivelmente mais DNA, registre isso também. Determine se suas observações são consistentes com vários pedaços de cada fruta.

Analise seus dados: Você notou uma diferença óbvia na quantidade de DNA produzida por cada fruta? Seus resultados foram reproduzíveis?

Chegar a uma conclusão: Considerando o que você sabe sobre o número de cromossomos em cada fruta, você pode concluir que o número de cromossomos necessariamente se correlaciona com a quantidade de DNA? Você pode identificar alguma desvantagem neste procedimento? Se você tivesse acesso a um laboratório, como poderia padronizar sua comparação e torná-la mais quantitativa?

Para concluir esta avaliação, aborde todos os pontos acima em uma redação do laboratório. Certifique-se de incluir imagens de seu experimento em andamento. Veja os exemplos contidos aqui.

Requisitos básicos (a tarefa não será aceita ou avaliada a menos que os seguintes critérios tenham sido atendidos):

  • O trabalho foi revisado e não contém grandes erros ortográficos ou gramaticais
  • A atribuição inclui referências apropriadas.
  • A tarefa aborda os pontos necessários anotados acima (hipótese, observações / dados, análise de dados, conclusão).

Rubrica

Qual tem mais DNA?
Resultado: Relacionar a estrutura do DNA com o processo de replicação do DNA
CritérioAvaliaçõesPts
A hipótese aborda como o DNA armazena informações genéticas e o papel do par de bases complementares no armazenamento / replicação do DNA.A hipótese é testável e aborda claramente o armazenamento e a replicação da informação genética.
5,0 pontos
A hipótese é testável e trata do armazenamento e replicação da informação genética com algumas explicações necessárias.
4,0 pontos
A hipótese não é testável ou não aborda o armazenamento de informações genéticas e a replicação de bases de DNA.
0,0 pts
5 pontos
As seções de conclusão abordam como o DNA é usado para armazenar informações genéticas.A conclusão aborda o armazenamento de informações genéticas em detalhes e faz referência a resultados experimentais diretamente e em detalhes.
5,0 pontos
A conclusão aborda o armazenamento de informações genéticas em alto nível e menciona achados experimentais.
4,0 pontos
A conclusão não aborda ou aborda incorretamente o armazenamento de informações genéticas.
0,0 pts
5 pontos
Total de pontos: 10

DNA: Tipos, Estrutura e Função do DNA

Os ácidos nucleicos foram isolados pela primeira vez por Friedrich Miescher (1869) a partir de células de pus.

Eles foram chamados de nucleína. Hertwig (1884) propôs a nucleína como portadora de traços hereditários. Por causa de sua natureza ácida, eles foram chamados de ácidos nucléicos e depois ácidos nucléicos (Altmann, 1899).

Fisher (1880) descobriu a presença de bases de purina e pirimidina em ácidos nucléicos. Levene (1910) descobriu que o ácido nucleico desoxirribose contém ácido fosfórico, bem como açúcar desoxirribose.

Ele caracterizou quatro tipos de nucleotídeos presentes no DNA. Em 1950, Chargaff descobriu que o conteúdo de purina e pirimidina no DNA era igual. Nessa época, W.T. Astbury descobriu, por meio de difração de raios-X, que o DNA é um polinucleotídeo com nucleotídeos dispostos perpendicularmente ao longo eixo da molécula e separados uns dos outros por uma distância de 0,34 nm.

Em 1953, Wilkins e Franklin obtiveram excelentes fotografias de raios-X de DNA. As fotografias mostraram que o DNA era uma hélice com largura de 2,0 nm. Uma volta da hélice era de 3,4 nm com 10 camadas de bases empilhadas nela. Watson e Crick (1953) elaboraram o primeiro modelo de dupla hélice correto a partir das fotografias de raios X de Wilkins e Franklin. Wilkins, Watson e Crick receberam o Prêmio Nobel pelo mesmo em 1962.

Watson e Crick (1953) construíram um modelo 3D molecular de DNA que satisfez todos os detalhes obtidos a partir de fotografias de raios-X. Eles propuseram que o DNA consistia em uma dupla hélice com duas cadeias tendo fosfato de açúcar no lado externo e bases de nitrogênio no lado interno.

As bases de nitrogênio das duas cadeias formaram pares complementares com purina de uma e pirimidina da outra unidas por pontes de hidrogênio (A-T, C-G). O emparelhamento de bases complementares entre as duas cadeias polinucleotídicas é considerado um marco de sua proposição. É claro que com base na descoberta inicial de Chargaff que A = T e С = G Sua segunda grande proposta era que as duas cadeias são antiparalelas com orientação 5 & # 8217 → 3 & # 8242 de uma e У → 5 & # 8217orientação da outra.

As duas correntes são torcidas helicoidalmente como uma escada de corda com degraus rígidos torcidos em espiral. Cada volta da espiral contém 10 nucleotídeos. Este modelo de dupla hélice ou duplex de DNA com cadeias polinucleotídicas antiparalelas tendo bases complementares tem um mecanismo implícito de sua replicação e cópia.

Aqui, ambas as cadeias polinucleotídicas funcionam como moldes formando duas hélices duplas, cada uma com uma cadeia parental e uma fita nova, mas complementar. O fenômeno é chamado de replicação semiconservativa. A síntese in vitro de DNA foi realizada por Kornberg em 1959.

Tipos de DNA:

O modelo duplex de DNA proposto por Watson e Crick é espiral destro e é chamado de B-DNA (DNA balanceado). No modelo, os pares de bases estão quase em ângulos retos com o eixo da hélice (Fig. 6.5 D). Outro modelo duplex destro é A-DNA (DNA alternativo). Aqui, uma única volta da hélice tem 11 pares de bases.

Os pares de bases ficam a 20 ° de distância da perpendicular ao eixo. O C-DNA tem 9 pares de bases por volta da espiral, enquanto no D-DNA o número é de apenas 8 pares de bases. Ambos são destros. Z-DNA (Zigzag DNA) é uma dupla hélice canhota com espinha dorsal em zigue-zague, bases alternadas de purina e pirimidina, volta única de 45 A de comprimento com 12 pares de bases e um único sulco.

O B-DNA é mais hidratado e o DNA mais freqüentemente encontrado em células vivas. É uma forma fisiológica e biologicamente ativa. No entanto, ele pode ser alterado para outras formas. O DNA destro é conhecido por mudar temporariamente para a forma canhota, pelo menos por uma curta distância. Essas mudanças podem causar mudanças na expressão gênica.

Circular e DNA linear:

Em muitos procariontes, as duas extremidades de um duplex de DNA estão covalentemente ligadas para formar DNA circular. O DNA circular está nu, isto é, sem associação com proteínas histonas, embora poliaminas ocorram. No DNA linear, as duas extremidades são livres. É encontrada em núcleos eucarióticos, onde está associada a proteínas histonas.

O DNA linear, sem associação com proteínas histonas, também ocorre em alguns procariotos, por exemplo, Mycoplasma. Em organelas celulares semi-autônomas (mitocôndrias, plastídios), o DNA é circular, menos comumente linear. Está sempre nu.

Regras de Chargaff:

Chargaff (1950) fez observações sobre as bases e outros componentes do DNA. Essas observações ou generalizações são chamadas de regra de equivalência de base de Chargaff.

(i) Os pares de bases de purina e pirimidina são iguais, isto é, adenina + guanina = timina + citosina. [A + G] = [T + C], ou seja, [A + G] / [T + C] = 1

(ii) A quantidade molar de adenina é sempre igual à quantidade molar de timina. Da mesma forma, a concentração molar de guanina é igualada pela concentração molar de citosina.

[A] = [T], ou seja, [A] / [T] = 1 [G] = [C], ou seja, [G] / [C] = 1

(iii) Açúcar desoxirribose e fosfato ocorrem em proporções equimolares.

(iv) Os pares de bases A-T raramente são iguais a С — G pares de bases.

(v) A razão de [A + T] / [G + C] é variável, mas constante para uma espécie (Tabela 6.2). Ele pode ser usado para identificar a origem do DNA. A proporção é baixa em organismos primitivos e maior em organismos avançados.

Tabela 6.2. Composição de base de DNA de várias fontes:

Espécies UMA G С T A + T / C + G
1. Homem 30.4 19.0 19.9 30.1 1.55
2. Bezerro 29.0 21.2 21.2 28.5 1.35
3. Germe de trigo 28.1 21.8 22.7 27.4 1.25
4. Ervilha 30.8 19.2 18.5 30.5 1.62
5. Euglena 22.6 27.7 25.8 24.4 0.88
6 Escherichia coli 24.7 26.0 25.7 23.6 0.93

Estrutura do DNA:

O DNA ou ácido desoxirribonucleico é uma macromolécula de polidesoxirribonucleotídeo de cadeia dupla torcida helicoidalmente que constitui o material genético de todos os organismos, com exceção dos rinovírus. Em procariotos, ocorre em nucleóides e plasmídeos. Esse DNA geralmente é circular. Em eucariotos, a maior parte do DNA é encontrada na cromatina do núcleo.

É linear. Quantidades menores de DNA circular de fita dupla são encontradas em mitocôndrias e plastídios (DNA de organela). Os DNAs de tamanho pequeno ocorrem em vírus, o bacteriófago ф x 174 tem 5386 nucleotídeos. O bacteriófago lambda (Fago X) possui 48.502 pares de bases (bp), enquanto o número de pares de bases em Escherichia coli é 4,6 x 10 6. Um único genoma (conjunto haplóide de 23 cromossomos) tem cerca de 3,3 x 10 9 bp em seres humanos. O DNA de fita simples ocorre como um material genético em alguns vírus (por exemplo, fago ф x 174, colifago fd, M13) O DNA é a maior macromolécula com um diâmetro de 2 nm (20Å ou 2 x 10 -9 m) e geralmente tem 3 comprimentos em milímetros.

É 15 negativamente carregado devido aos grupos fosfato. É um polímero de cadeia longa de geralmente várias centenas de milhares de desoxirribonucleotídeos. Uma molécula de DNA possui duas fitas complementares não ramificadas. Eles são enrolados em espiral. As duas fitas espirais de DNA são chamadas coletivamente de duplex de DNA (Fig. 6.5).

As duas fitas não estão enroladas uma na outra, mas a fita dupla inteira (duplex de DNA) é enrolada sobre si mesma em torno de um eixo comum, como uma escada de corda com degraus sólidos torcidos em espiral. Devido à torção em espiral, o duplex de DNA passa a ter dois tipos de sulcos alternados, maiores (22 Å) e menores (12 Å).

No B-DNA, uma volta da espiral tem cerca de 10 nucleotídeos em cada fita de DNA. Ocupa uma distância de cerca de 3,4 nm (34 Å ou 3,4 & # 21510 -9 m) de modo que os nucleotídeos adjacentes ou suas bases são separados por um espaço de cerca de 0,34 nm (0,34 & # 21510 -9 m ou 3,4 Å).

Um desoxirribonucleotídeo de DNA é formado por ligação cruzada de três substâncias químicas ácido orto-fosfórico (H3PO4), açúcar desoxirribose (C5H10O4) e uma base de nitrogênio. Quatro tipos de bases de nitrogênio ocorrem no DNA. Eles pertencem a dois grupos, purinas (anéis duplos de 9 membros com nitrogênio nas posições 1,3,7 e 9) e pirimidinas (anéis de seis membros com nitrogênio nas posições 1 e 3). O DNA possui dois tipos de purinas (adenina ou A e guanina ou G) e dois tipos de pirimidinas (citosina ou С e timina ou T).

Dependendo do tipo de base de nitrogênio, o DNA tem quatro tipos de desoxirribonucleotídeos - desoxi adenosina 5-monofosfato (d AMP), desoxi guaninosina 5-monofosfato (d GMP), desoxi timidina 5-monofosfato (d TMP) e desoxi citidina 5-monofosfato (d CMP).

A espinha dorsal de uma cadeia ou filamento de DNA é formada por grupos alternativos de açúcar desoxirribose e ácido fosfórico. O grupo fosfato está conectado ao carbono 5 & # 8242 do resíduo de açúcar de seu próprio nucleotídeo e ao carbono У do resíduo de açúcar do próximo nucleotídeo por (3 & # 8216-5 & # 8217) ligações fosfodiéster. -H de fosfato e -OH de açúcar são eliminados como H20 durante cada formação de éster.

O grupo fosfato fornece acidez aos ácidos nucléicos porque pelo menos um de seu grupo lateral está livre para se dissociar. As bases do nitrogênio estão em ângulos retos com o eixo longitudinal das cadeias de DNA. Eles estão ligados ao átomo de carbono 1 dos açúcares por ligações N-glicosídicas. A pirimidina (C ou T) está ligada à desoxirribose por seu átomo N na posição 1, enquanto uma purina (A ou G) o faz pelo átomo N na posição 9.

As duas cadeias de DNA são antiparalelas, ou seja, elas correm paralelas, mas em direções opostas. Em uma cadeia, a direção é 5 & # 8217 → У enquanto na outra é 3 & # 8242 → 5 & # 8242 (Fig. 6.5). As duas cadeias são mantidas juntas por ligações de hidrogênio entre suas bases. Adenina (A), uma purina de uma cadeia fica exatamente oposta à timina (T), uma piramidina da outra cadeia. Da mesma forma, a citosina (C, uma pirimidina) está oposta à guanina (G a purina). Isso permite uma espécie de arranjo de fechadura e chave entre purina de tamanho grande e pirimidina de tamanho pequeno.

É fortalecido pelo aparecimento de ligações de hidrogênio entre os dois. Três ligações de hidrogênio ocorrem entre a citosina e a guanina (C = G) nas posições 1'-1 ', 2 & # 8242- 6 & # 8242 e 6 & # 8242-2 & # 8242. Existem duas dessas ligações de hidrogênio entre a adenina e a timina (A = T) que são formadas nas posições 1'-3 & # 8242 e 6 & # 8242-4 & # 8242. As ligações de hidrogênio ocorrem entre o hidrogênio de uma base e o oxigênio ou nitrogênio da outra base. Uma vez que bases de nitrogênio específicas e diferentes ocorrem nas duas cadeias de DNA, as últimas são complementares.

Assim, a sequência de, digamos, AAGCTCAG de uma cadeia teria uma sequência complementar de TTCGAGTC na outra cadeia. Em outras palavras, as duas cadeias de DNA não são idênticas, mas complementares uma à outra. É devido ao emparelhamento específico de uma base com uma purina oposta a uma pirimidina. Isso torna as duas cadeias com 2 nm de espessura.

Um par de bases purina-purina irá torná-lo mais espesso, enquanto um par de bases pirimidina-pirimidina irá torná-lo mais estreito do que 2 nm. Além disso, A e С ou G e T não formam pares porque não conseguem formar ligações de hidrogênio entre eles. A extremidade 5 & # 8242 de cada cadeia contém o radical fosfato, enquanto a extremidade 3 & # 8242 possui um resíduo de açúcar (З & # 8217-ОН).

Características salientes do modelo В de DNA de Watson e Crick:

1. O DNA é a maior biomolécula da célula.

2. O DNA tem carga negativa e é dextrógiro.

3. A configuração molecular do DNA é 3D.

4. O DNA possui duas cadeias polinucleotídicas.

5. As duas cadeias de DNA têm polaridade antiparalela, 5 & # 8242 - & gt 3 & # 8242 em uma e 3 & # 8242 - & gt 5 & # 8242 em outra.

6. A espinha dorsal de cada cadeia polinucleotídica é feita de grupos alternativos de açúcar-fosfato. As bases de nitrogênio projetam-se para dentro.

7. As bases de nitrogênio de duas cadeias polinucleotídicas formam pares complementares, A oposto a T e С oposto a G.

8. Uma purina de grande porte sempre vem em oposição a uma pirimidina de pequeno porte. Isso gera uma distância uniforme entre duas vertentes da hélice.

9. A adenina (A) de uma cadeia polinucleotídica é mantida na timina (T) da cadeia oposta por duas ligações de hidrogênio. A citosina (C) de uma cadeia é semelhante à guanina da outra cadeia por três ligações de hidrogênio.

10. A corrente dupla é enrolada de forma helicoidal. O enrolamento é destro. Este enrolamento produz ranhuras menores e maiores alternadamente.

11. O passo da hélice é 3,4 nm (34 A) com aproximadamente 10 pares de bases em cada volta. A distância média entre dois pares de bases adjacentes chega a cerca de 0,34 nm (0,34 x 10 -9 m ou 3,4 A).

12. Planos de pares de bases adjacentes são empilhados uns sobre os outros. Junto com a ligação de hidrogênio, o empilhamento confere estabilidade à estrutura helicoidal.

13. O DNA é ácido. Para sua compactação, requer proteínas básicas (histonas). As proteínas histonas são fortemente carregadas e ocupam as principais ranhuras do DNA em um ângulo de 30 ° com o eixo da hélice.

Fios Sense e Antisense:

Ambas as fitas de DNA não participam do controle da hereditariedade e do metabolismo. Apenas um deles faz isso. A fita de DNA que funciona como molde para a síntese de RNA é conhecida como fita modelo, fita menos (-) ou fita anti-sentido.

Sua fita complementar é denominada fita não-modelo, fita mais (+), fita com sentido e codificação. O último nome é dado porque, por convenção, o código genético do DNA é escrito de acordo com sua sequência.

DNA Nontemplate, Sense (+) ou Coding Strand

Modelo de DNA, antisense ou não codificador ou (-) cadeia

O RNA é transcrito na fita 3 & # 8217 → 5 & # 8242 (-) (molde / anti-fita) do DNA na direção 5 → 3.

O termo antisense também é usado em uma perspectiva mais ampla para qualquer sequência ou fita de DNA (ou RNA) que seja complementar ao mRNA.

Desnaturação e Renaturação:

As ligações H entre as bases de nitrogênio de duas fitas de DNA podem quebrar devido à alta temperatura (82-90 ° C) ou pH baixo ou alto, de modo que as duas fitas se separam uma da outra. É chamado de desnaturação ou fusão. Uma vez que o par de bases A-T tem apenas ligações 2H, a área rica em pares de bases A-T pode sofrer desnaturação fácil (fusão). Essas áreas são chamadas de áreas de baixo ponto de fusão porque desnaturam a temperaturas comparativamente baixas. A área rica em pares de bases G-C (chamada área de fusão alta) é comparativamente mais estável e densa porque três ligações de hidrogênio conectam as bases G-C.

Essas áreas apresentam alta temperatura de fusão (Tm). Ao derreter, a viscosidade do DNA diminui. O DNA desnaturado tem a tendência de se reassociar, isto é, os filamentos de DNA separados por fusão a 82-90 ° C podem se reassociar e formar duplex no resfriamento à temperatura de 65 ° C. É denominado renaturação ou recozimento.

As fitas de DNA desnaturadas ou separadas absorvem mais energia luminosa do que a fita dupla de DNA intacta. O aumento da absorção de energia luminosa por fitas de DNA separadas ou desnaturadas é chamado de efeito hipercromático. O efeito é usado para saber se o DNA é de fita simples ou dupla.

O duplex de DNA possui áreas onde a sequência de nucleotídeos é a mesma, mas oposta nas duas fitas. Essas sequências são reconhecidas por endonucleases de restrição e são utilizadas em engenharia genética. Dada a seguir, a sequência de bases em uma fita (3 & # 8242 → 5 & # 8242) é GAATTC. É o mesmo na outra vertente quando lido na direção 5 & # 8242 → 3 & # 8242. É semelhante a palavras de palíndromo com as mesmas palavras tanto na direção para frente quanto para trás, por exemplo, NITIN, MALAYALAM.

É o DNA que possui múltiplas cópias de sequências idênticas de bases de nitrogênio. O número de cópias da mesma sequência de base varia de alguns a milhões. O DNA que possui uma única cópia de sequências de bases é denominado DNA único. É feito de genes funcionais. Os genes de rRNA são, no entanto, repetidos várias vezes. O DNA repetitivo pode ocorrer em conjunto ou intercalado com sequências únicas.

É de dois tipos, altamente repetitivo e moderadamente repetitivo. O DNA altamente repetitivo consiste em sequências curtas de menos de 10 pares de bases que são repetidas milhões de vezes. Eles ocorrem em regiões pré-entroméricas, regiões heterocromáticas dos cromossomos Y e regiões satélites. O DNA moderadamente repetitivo consiste em algumas centenas de pares de bases repetidos pelo menos 1000 vezes. Ocorre em telômeros, centrômeros e transposons.

Sequências repetidas em tandem são especialmente sujeitas a desalinhamentos durante o emparelhamento de cromossomos e, portanto, o tamanho dos agrupamentos tandem tende a ser altamente polimórfico, com grandes variações entre os indivíduos. Aglomerados menores de tais sequências podem ser usados ​​para caracterizar genomas individuais na técnica de “impressão digital de DNA”.

É aquela parte do DNA repetitivo que tem longas sequências de nucleotídeos repetitivas em tandem que forma uma fração separada na ultracentrifugação de densidade. Dependendo do número de pares de bases envolvidos nas regiões de repetição, o DNA satélite é de dois tipos, sequências de microssatélites (unidades de repetição de 1-6 bp flanqueadas por sequências conservadas) e sequências de minissatélites (11-60 bp flanqueadas por locais de restrição conservados). Estes últimos são hipervariáveis ​​e específicos para cada indivíduo. Eles estão sendo usados ​​para correspondência de DNA ou impressão digital, conforme descoberto pela primeira vez por Jeffreys et al (1985).

O arranjo das bases de nitrogênio do DNA (e seu produto mRNA) determina a sequência de grupos de aminoácidos em polipeptídeos ou proteínas formados sobre os ribossomos. Um aminoácido é especificado pela sequência de três bases de nitrogênio adjacentes. Este último é denominado códon. O segmento de DNA que determina a síntese do polipeptídeo completo é conhecido como cistron.

Em procariotos, um cistron tem uma sequência de codificação contínua do início ao fim. Nos eucariotos, um cistron contém regiões não codificantes que não produzem parte do produto do gene. Eles são chamados de íntrons. Os íntrons costumam ser variáveis. As partes codificantes são conhecidas como exons. Os cistrons com íntrons são chamados de genes divididos.

DNA codificador e não codificador:

Dependendo da capacidade de formar produtos funcionais ou não funcionais, o DNA tem dois tipos de segmentos, codificantes e não codificantes. Nos eucariotos, uma grande parte do DNA não é codificante, pois não forma nenhum produto funcional. Eles geralmente possuem sequências repetidas ou DNA repetitivo. A maioria deles tem posições fixas.

Alguns podem se deslocar de um lugar para outro. As sequências móveis são chamadas de genes saltadores ou transposons. Em procariotos, a quantidade de DNA não codificante ou não funcional é pequena. O DNA codificador consiste em sequências de DNA codificantes. Estes são de 2 tipos - sequências de codificação de proteínas que codificam todas as proteínas, exceto histonas e sequências de codificação não proteicas para tRNA, rRNA e histonas.

Funções do DNA:

1. Informações genéticas (Genetic Blue Print):

O DNA é o material genético que carrega todas as informações hereditárias. A informação genética está codificada no arranjo de suas bases de nitrogênio.

O DNA tem propriedade única de replicação ou produção de cópias de carbono (função autocatalítica). Isso é essencial para a transferência de informações genéticas de uma célula para suas filhas e de uma geração para a seguinte.

O DNA ocorre dentro dos cromossomos. Isso é essencial para a distribuição equitativa do DNA durante a divisão celular.

Durante a meiose, o crossing over dá origem a uma nova combinação de genes denominada recombinação.

Mudanças na sequência de bases de nitrogênio devido à adição, deleção ou replicação incorreta dão origem a mutações. As mutações são a fonte de todas as variações e evolução.

O DNA dá origem a RNAs por meio do processo de transcrição. É a atividade heterocatalítica do DNA.

7. Metabolismo celular:

Ele controla as reações metabólicas das células através da ajuda de RNAs específicos, síntese de proteínas, enzimas e hormônios específicos.

Devido ao funcionamento diferencial de algumas regiões específicas do DNA ou genes, diferentes partes dos organismos se diferenciam em forma, tamanho e funções.

O DNA controla o desenvolvimento de um organismo por meio do funcionamento de um relógio genético interno, com ou sem a ajuda de informações extrínsecas.

10. Impressão digital de DNA:

As sequências de microssatélites hipervariáveis ​​de DNA de cada indivíduo são distintas. Eles são usados ​​na identificação de indivíduos e na decifração de seus relacionamentos. O mecanismo é chamado de impressão digital de DNA.

A hereditariedade defeituosa pode ser corrigida pela incorporação de genes corretos no lugar dos defeituosos.

O excesso de disponibilidade de anti-mRNA ou RNAs anti-sentido não permitirá que os genes patogênicos se expressem. Por meio desta técnica, a falha da angioplastia foi verificada. Uma modificação desta técnica é a interferência de RNA (RNAi).


Conteúdo

As técnicas de codificação de DNA foram desenvolvidas a partir do trabalho inicial de sequenciamento de DNA em comunidades microbianas usando o gene 5S rRNA. [9] Em 2003, métodos específicos e terminologia do moderno código de barras do DNA foram propostos como um método padronizado para identificar espécies, bem como potencialmente alocar sequências desconhecidas para táxons superiores, como ordens e filos, em um artigo de Paul D.N. Hebert et al. da Universidade de Guelph, Ontário, Canadá. [10] Hebert e seus colegas demonstraram a utilidade do citocromo c gene oxidase I (COI), utilizado pela primeira vez por Folmer et al. em 1994, usando seus primers de DNA publicados como uma ferramenta para análises filogenéticas em níveis de espécie [10] como uma ferramenta discriminatória adequada entre invertebrados metazoários. [11] A "região de Folmer" do gene COI é comumente usada para distinção entre táxons com base em seus padrões de variação no nível do DNA. A relativa facilidade de recuperação da sequência e a variabilidade combinada com a conservação entre as espécies são alguns dos benefícios do COI. Chamando os perfis de "códigos de barras", Hebert et al. previa o desenvolvimento de um banco de dados de COI que pudesse servir de base para um "sistema de bioidentificação global".

Amostragem e preservação Editar

O código de barras pode ser feito a partir de tecido de uma amostra alvo, de uma mistura de organismos (amostra global) ou de DNA presente em amostras ambientais (por exemplo, água ou solo). Os métodos de amostragem, preservação ou análise diferem entre esses diferentes tipos de amostra.

Para fazer o código de barras de uma amostra de tecido do espécime alvo, um pequeno pedaço de pele, uma escala, uma perna ou antena é provavelmente suficiente (dependendo do tamanho do espécime). Para evitar contaminação, é necessário esterilizar as ferramentas usadas entre as amostras. Recomenda-se coletar duas amostras de um espécime, uma para arquivar e outra para o processo de código de barras. A preservação da amostra é crucial para superar o problema da degradação do DNA.

Uma amostra global é um tipo de amostra ambiental que contém vários organismos do grupo taxonômico em estudo. A diferença entre as amostras globais (no sentido usado aqui) e outras amostras ambientais é que a amostra global geralmente fornece uma grande quantidade de DNA de boa qualidade. [12] Exemplos de amostras em massa incluem amostras de macroinvertebrados aquáticos coletados por kick-net ou amostras de insetos coletadas com uma armadilha Malaise. Amostras de água filtradas ou fracionadas por tamanho contendo organismos inteiros como eucariotos unicelulares também são algumas vezes definidas como amostras em massa. Essas amostras podem ser coletadas pelas mesmas técnicas usadas para obter amostras tradicionais para identificação baseada na morfologia.

O método de DNA ambiental (eDNA) é uma abordagem não invasiva para detectar e identificar espécies de detritos celulares ou DNA extracelular presente em amostras ambientais (por exemplo, água ou solo) por meio de código de barras ou metabarcoding. A abordagem é baseada no fato de que todo organismo vivo deixa DNA no meio ambiente, e esse DNA ambiental pode ser detectado até mesmo para organismos com abundância muito baixa. Assim, para a amostragem de campo, a parte mais crucial é usar material e ferramentas sem DNA em cada local de amostragem ou amostra para evitar a contaminação, se o DNA do (s) organismo (s) alvo estiver presente em pequenas quantidades. Por outro lado, uma amostra de eDNA sempre inclui o DNA de microrganismos vivos de células inteiras, que frequentemente estão presentes em grandes quantidades. Portanto, as amostras de microrganismos coletadas no ambiente natural também são chamadas de amostras de eDNA, mas a contaminação é menos problemática neste contexto devido à grande quantidade de organismos-alvo. O método de eDNA é aplicado na maioria dos tipos de amostra, como água, sedimento, solo, fezes de animais, conteúdo estomacal ou sangue de, e. sanguessugas. [13]

Extração de DNA, amplificação e edição de sequenciamento

O código de barras do DNA requer que o DNA da amostra seja extraído. Existem vários métodos diferentes de extração de DNA e fatores como custo, tempo, tipo de amostra e rendimento afetam a seleção do método ideal.

Quando o DNA de amostras de organismo ou eDNA é amplificado usando a reação em cadeia da polimerase (PCR), a reação pode ser afetada negativamente pelas moléculas inibidoras contidas na amostra. [14] A remoção desses inibidores é crucial para garantir que o DNA de alta qualidade esteja disponível para análise subsequente.

A amplificação do DNA extraído é uma etapa necessária no código de barras do DNA. Normalmente, apenas um pequeno fragmento do material total do DNA é sequenciado (normalmente 400-800 pares de bases) [15] para obter o código de barras do DNA. A amplificação do material de eDNA é geralmente focada em fragmentos menores (& lt200 pares de bases), pois o eDNA tem mais probabilidade de ser fragmentado do que o material de DNA de outras fontes. No entanto, alguns estudos argumentam que não há relação entre o tamanho do amplicon e a taxa de detecção de eDNA. [16] [17]

Quando a região do marcador de código de barras do DNA foi amplificada, a próxima etapa é sequenciar a região do marcador usando métodos de sequenciamento de DNA. [18] Muitas plataformas de sequenciamento diferentes estão disponíveis e o desenvolvimento técnico está ocorrendo rapidamente.

Seleção de marcador Editar

Os marcadores usados ​​para o código de barras do DNA são chamados de códigos de barras. Para caracterizar com sucesso as espécies com base em códigos de barras de DNA, a seleção de regiões de DNA informativas é crucial. Um bom código de barras de DNA deve ter baixa variabilidade intraespecífica e alta interespecífica [10] e possuir locais de flanqueamento conservados para o desenvolvimento de primers de PCR universais para ampla aplicação taxonômica. O objetivo é projetar primers que irão detectar e distinguir a maioria ou todas as espécies no grupo de organismos estudado (alta resolução taxonômica). O comprimento da sequência do código de barras deve ser curto o suficiente para ser usado com a fonte de amostragem atual, extração de DNA, amplificação e métodos de sequenciamento. [19]

Idealmente, uma sequência de gene seria usada para todos os grupos taxonômicos, de vírus a plantas e animais. No entanto, nenhuma região do gene foi encontrada ainda, então códigos de barras diferentes são usados ​​para diferentes grupos de organismos, [20] ou dependendo da questão do estudo.

Para animais, o código de barras mais usado é o citocromo C oxidase I mitocondrial (COI) locus. [21] Outros genes mitocondriais, como Cytb, 12S ou 18S também são usados. Os genes mitocondriais são preferidos aos genes nucleares por causa de sua falta de íntrons, seu modo haplóide de herança e sua recombinação limitada. [21] [22] Além disso, cada célula tem várias mitocôndrias (até vários milhares) e cada uma delas contém várias moléculas circulares de DNA. As mitocôndrias podem, portanto, oferecer uma fonte abundante de DNA, mesmo quando o tecido da amostra é limitado. [20]

No plantas, no entanto, os genes mitocondriais não são apropriados para o código de barras do DNA porque exibem baixas taxas de mutação. [23] Alguns genes candidatos foram encontrados no genoma do cloroplasto, sendo o mais promissor o gene maturase K (matK) por si só ou em associação com outros genes. Marcadores multi-locus, como espaçadores ribossômicos transcritos internos (ITS DNA), juntamente com matK, rbcL, trnH ou outros genes também foram usados ​​para identificação de espécies. [20] A melhor discriminação entre as espécies de plantas foi alcançada ao usar dois ou mais códigos de barras de cloroplasto. [24]

Para bactérias, a pequena subunidade do gene do RNA ribossômico (16S) pode ser usada para diferentes táxons, pois é altamente conservada. [25] Alguns estudos sugerem COI, [26] chaperonina tipo II (cpn60) [27] ou subunidade β de RNA polimerase (rpoB) [28] também podem servir como códigos de barras de DNA bacteriano.

Código de barras fungos é mais desafiador, e mais de uma combinação de primer pode ser necessária. [29] O COI O marcador funciona bem em certos grupos de fungos, [30] mas não tão bem em outros. [31] Portanto, marcadores adicionais estão sendo usados, como ITS rDNA e a grande subunidade do RNA ribossômico nuclear (LSU). [32]

Dentro do grupo de protistas, vários códigos de barras foram propostos, como as regiões D1-D2 ou D2-D3 do rDNA 28S, sub-região V4 do gene 18S rRNA, ITS rDNA e COI. Além disso, alguns códigos de barras específicos podem ser usados ​​para protistas fotossintéticos, por exemplo, a subunidade grande do gene da ribulose-1,5-bifosfato carboxilase-oxigenase (rbcL) e o gene 23S rRNA cloroplástico. [20]

Marcadores que foram usados ​​para códigos de barras de DNA em diferentes grupos de organismos, modificados de Purty e Chatterjee. [20]
Grupo de organismo Gene / locus marcador
Animais COI, [33] Cytb, [34] 12S, [35] 16S [36]
Plantas matK, [37] rbcL, [38] psbA-trnH, [39] ESTÁ [40]
Bactérias COI, [26] rpoB, [28] 16S, [41] cpn60, [27] tufo, [42] RIF, [43] gnd [44]
Fungi ESTÁ, [2] [45] TEF1α, [46] [47] RPB1 (LSU), RPB2 (LSU), 18S (SSU) [32]
Protistas ESTÁ, [48] COI, [49] rbcL, [50] 18S, [51] 28S [50]

Reference libraries are used for the taxonomic identification, also called annotation, of sequences obtained from barcoding or metabarcoding. These databases contain the DNA barcodes assigned to previously identified taxa. Most reference libraries do not cover all species within an organism group, and new entries are continually created. In the case of macro- and many microorganisms (such as algae), these reference libraries require detailed documentation (sampling location and date, person who collected it, image, etc.) and authoritative taxonomic identification of the voucher specimen, as well as submission of sequences in a particular format. However, such standards are fulfilled for only a small number of species. The process also requires the storage of voucher specimens in museum collections, herbaria and other collaborating institutions. Both taxonomically comprehensive coverage and content quality are important for identification accuracy. [52] In the microbial world, there is no DNA information for most species names, and many DNA sequences cannot be assigned to any Linnaean binomial. [53] Several reference databases exist depending on the organism group and the genetic marker used. There are smaller, national databases (e.g. FinBOL), and large consortia like the International Barcode of Life Project (iBOL). [54]

Launched in 2007, the Barcode of Life Data System (BOLD) [55] is one of the biggest databases, containing more than 450 000 BINs (Barcode Index Numbers) in 2019. It is a freely accessible repository for the specimen and sequence records for barcode studies, and it is also a workbench aiding the management, quality assurance and analysis of barcode data. The database mainly contains BIN records for animals based on the COI genetic marker.

The UNITE database [56] was launched in 2003 and is a reference database for the molecular identification of fungal species with the internal transcribed spacer (ITS) genetic marker region. This database is based on the concept of species hypotheses: you choose the % at which you want to work, and the sequences are sorted in comparison to sequences obtained from voucher specimens identified by experts.

Diat.barcode [57] database was first published under the name R-syst::diatom [58] in 2016 starting with data from two sources: the Thonon culture collection (TCC) in the hydrobiological station of the French National Institute for Agricultural Research (INRA), and from the NCBI (National Center for Biotechnology Information) nucleotide database. Diat.barcode provides data for two genetic markers, rbcL (Ribulose-1,5-bisphosphate carboxylase/oxygenase) and 18S (18S ribosomal RNA). The database also involves additional, trait information of species, like morphological characteristics (biovolume, size dimensions, etc.), life-forms (mobility, colony-type, etc.) or ecological features (pollution sensitivity, etc.).

Bioinformatic analysis Edit

In order to obtain well structured, clean and interpretable data, raw sequencing data must be processed using bioinformatic analysis. The FASTQ file with the sequencing data contains two types of information: the sequences detected in the sample (FASTA file) and a quality file with quality scores (PHRED scores) associated with each nucleotide of each DNA sequence. The PHRED scores indicate the probability with which the associated nucleotide has been correctly scored.

PHRED quality score and the associated certainty level
10 90%
20 99%
30 99.9%
40 99.99%
50 99.999%

In general, the PHRED score decreases towards the end of each DNA sequence. Thus some bioinformatics pipelines simply cut the end of the sequences at a defined threshold.

Some sequencing technologies, like MiSeq, use paired-end sequencing during which sequencing is performed from both directions producing better quality. The overlapping sequences are then aligned into contigs and merged. Usually, several samples are pooled in one run, and each sample is characterized by a short DNA fragment, the tag. In a demultiplexing step, sequences are sorted using these tags to reassemble the separate samples. Before further analysis, tags and other adapters are removed from the barcoding sequence DNA fragment. During trimming, the bad quality sequences (low PHRED scores), or sequences that are much shorter or longer than the targeted DNA barcode, are removed. The following dereplication step is the process where all of the quality-filtered sequences are collapsed into a set of unique reads (individual sequence units ISUs) with the information of their abundance in the samples. After that, chimeras (i.e. compound sequences formed from pieces of mixed origin) are detected and removed. Finally, the sequences are clustered into OTUs (Operational Taxonomic Units), using one of many clustering strategies. The most frequently used bioinformatic software include Mothur, [59] Uparse, [60] Qiime, [61] Galaxy, [62] Obitools, [63] JAMP, [64] Barque, [65] and DADA2. [66]

Comparing the abundance of reads, i.e. sequences, between different samples is still a challenge because both the total number of reads in a sample as well as the relative amount of reads for a species can vary between samples, methods, or other variables. For comparison, one may then reduce the number of reads of each sample to the minimal number of reads of the samples to be compared – a process called rarefaction. Another way is to use the relative abundance of reads. [67]

Species identification and taxonomic assignment Edit

The taxonomic assignment of the OTUs to species is achieved by matching of sequences to reference libraries. The Basic Local Alignment Search Tool (BLAST) is commonly used to identify regions of similarity between sequences by comparing sequence reads from the sample to sequences in reference databases. [68] If the reference database contains sequences of the relevant species, then the sample sequences can be identified to species level. If a sequence cannot be matched to an existing reference library entry, DNA barcoding can be used to create a new entry.

In some cases, due to the incompleteness of reference databases, identification can only be achieved at higher taxonomic levels, such as assignment to a family or class. In some organism groups such as bacteria, taxonomic assignment to species level is often not possible. In such cases, a sample may be assigned to a particular operational taxonomic unit (OTU).

Applications of DNA barcoding include identification of new species, safety assessment of food, identification and assessment of cryptic species, detection of alien species, identification of endangered and threatened species, [69] linking egg and larval stages to adult species, securing intellectual property rights for bioresources, framing global management plans for conservation strategies and elucidate feeding niches. [70] DNA barcode markers can be applied to address basic questions in systematics, ecology, evolutionary biology and conservation, including community assembly, species interaction networks, taxonomic discovery, and assessing priority areas for environmental protection.

Identification of species Edit

Specific short DNA sequences or markers from a standardized region of the genome can provide a DNA barcode for identifying species. [71] Molecular methods are especially useful when traditional methods are not applicable. DNA barcoding has great applicability in identification of larvae for which there are generally few diagnostic characters available, and in association of different life stages (e.g. larval and adult) in many animals. [72] Identification of species listed in the Convention of the International Trade of Endangered Species (CITES) appendixes using barcoding techniques is used in monitoring of illegal trade. [73]

Detection of invasive species Edit

Alien species can be detected via barcoding. [74] [75] Barcoding can be suitable for detection of species in e.g. border control, where rapid and accurate morphological identification is often not possible due to similarities between different species, lack of sufficient diagnostic characteristics [74] and/or lack of taxonomic expertise. Barcoding and metabarcoding can also be used to screen ecosystems for invasive species, and to distinguish between an invasive species and native, morphologically similar, species. [76]

Delimiting cryptic species Edit

DNA barcoding enables the identification and recognition of cryptic species. [77] The results of DNA barcoding analyses depend however upon the choice of analytical methods, so the process of delimiting cryptic species using DNA barcodes can be as subjective as any other form of taxonomy. Hebert et al. (2004) concluded that the butterfly Astraptes fulgerator in north-western Costa Rica actually consists of 10 different species. [78] These results, however, were subsequently challenged by Brower (2006), who pointed out numerous serious flaws in the analysis, and concluded that the original data could support no more than the possibility of three to seven cryptic taxa rather than ten cryptic species. [79] Smith et al. (2007) used cytochrome c oxidase I DNA barcodes for species identification of the 20 morphospecies of Belvosia parasitoid flies (Diptera: Tachinidae) reared from caterpillars (Lepidoptera) in Area de Conservación Guanacaste (ACG), northwestern Costa Rica. These authors discovered that barcoding raises the species count to 32, by revealing that each of the three parasitoid species, previously considered as generalists, actually are arrays of highly host-specific cryptic species. [80] For 15 morphospecies of polychaetes within the deep Antarctic benthos studied through DNA barcoding, cryptic diversity was found in 50% of the cases. Furthermore, 10 previously overlooked morphospecies were detected, increasing the total species richness in the sample by 233%. [81]

Diet analysis and food web application Edit

DNA barcoding and metabarcoding can be useful in diet analysis studies, [82] and is typically used if prey specimens cannot be identified based on morphological characters. [83] [84] There is a range of sampling approaches in diet analysis: DNA metabarcoding can be conducted on stomach contents, [85] feces, [84] [86] saliva [87] or whole body analysis. [69] [88] In fecal samples or highly digested stomach contents, it is often not possible to distinguish tissue from single species, and therefore metabarcoding can be applied instead. [84] [89] Feces or saliva represent non-invasive sampling approaches, while whole body analysis often means that the individual needs to be killed first. For smaller organisms, sequencing for stomach content is then often done by sequencing the entire animal.

Barcoding for food safety Edit

DNA barcoding represents an essential tool to evaluate the quality of food products. The purpose is to guarantee food traceability, to minimize food piracy, and to valuate local and typical agro-food production. Another purpose is to safeguard public health for example, metabarcoding offers the possibility to identify groupers causing Ciguatera fish poisoning from meal remnants, [90] or to separate poisonous mushrooms from edible ones (Ref).

Biomonitoring and ecological assessment Edit

DNA barcoding can be used to assess the presence of endangered species for conservation efforts (Ref), or the presence of indicator species reflective to specific ecological conditions (Ref), for example excess nutrients or low oxygen levels.

Potentials Edit

Traditional bioassessment methods are well established internationally, and serve biomonitoring well, as for example for aquatic bioassessment within the EU Directives WFD and MSFD. However, DNA barcoding could improve traditional methods for the following reasons DNA barcoding (i) can increase taxonomic resolution and harmonize the identification of taxa which are difficult to identify or lack experts, (ii) can more accurately/precisely relate environmental factors to specific taxa (iii) can increase comparability among regions, (iv) allows for the inclusion of early life stages and fragmented specimens, (v) allows delimitation of cryptic/rare species (vi) allows for development of new indices e.g. rare/cryptic species which may be sensitive/tolerant to stressors, (vii) increases the number of samples which can be processed and reduces processing time resulting in increased knowledge of species ecology, (viii) is a non-invasive way of monitoring when using eDNA methods. [91]

Time and cost Edit

DNA barcoding is faster than traditional morphological methods all the way from training through to taxonomic assignment. It takes less time to gain expertise in DNA methods than becoming an expert in taxonomy. In addition, the DNA barcoding workflow (i.e. from sample to result) is generally quicker than traditional morphological workflow and allows the processing of more samples.

Taxonomic resolution Edit

DNA barcoding allows the resolution of taxa from higher (e.g. family) to lower (e.g. species) taxonomic levels, that are otherwise too difficult to identify using traditional morphological methods, like e.g. identification via microscopy. For example, Chironomidae (the non-biting midge) are widely distributed in both terrestrial and freshwater ecosystems. Their richness and abundance make them important for ecological processes and networks, and they are one of many invertebrate groups used in biomonitoring. Invertebrate samples can contain as many as 100 species of chironomids which often make up as much as 50% of a sample. Despite this, they are usually not identified below the family level because of the taxonomic expertise and time required. [92] This may result in different chironomid species with different ecological preferences grouped together, resulting in inaccurate assessment of water quality.

DNA barcoding provides the opportunity to resolve taxa, and directly relate stressor effects to specific taxa such as individual chironomid species. For example, Beermann et al. (2018) DNA barcoded Chironomidae to investigate their response to multiple stressors reduced flow, increased fine-sediment and increased salinity. [93] After barcoding, it was found that the chironomid sample consisted of 183 Operational Taxonomic Units (OTUs), i.e. barcodes (sequences) that are often equivalent to morphological species. These 183 OTUs displayed 15 response types rather than the previously reported [94] two response types recorded when all chironomids were grouped together in the same multiple stressor study. A similar trend was discovered in a study by Macher et al. (2016) which discovered cryptic diversity within the New Zealand mayfly species Deleatidium sp. This study found different response patterns of 12 molecular distinct OTUs to stressors which may change the consensus that this mayfly is sensitive to pollution. [95]

Shortcomings Edit

Despite the advantages offered by DNA barcoding, it has also been suggested that DNA barcoding is best used as a complement to traditional morphological methods. [91] This recommendation is based on multiple perceived challenges.

Physical parameters Edit

It is not completely straightforward to connect DNA barcodes with ecological preferences of the barcoded taxon in question, as is needed if barcoding is to be used for biomonitoring. For example, detecting target DNA in aquatic systems depends on the concentration of DNA molecules at a site, which in turn can be affected by many factors. The presence of DNA molecules also depends on dispersion at a site, e.g. direction or strength of currents. It is not really known how DNA moves around in streams and lakes, which makes sampling difficult. Another factor might be the behavior of the target species, e.g. fish can have seasonal changes of movements, crayfish or mussels will release DNA in larger amounts just at certain times of their life (moulting, spawning). For DNA in soil, even less is known about distribution, quantity or quality. The major limitation of the barcoding method is that it relies on barcode reference libraries for the taxonomic identification of the sequences. The taxonomic identification is accurate only if a reliable reference is available. However, most databases are still incomplete, especially for smaller organisms e.g. fungi, phytoplankton, nematoda etc. In addition, current databases contain misidentifications, spelling mistakes and other errors. There is massive curation and completion effort around the databases for all organisms necessary, involving large barcoding projects (for example the iBOL project for the Barcode of Life Data Systems (BOLD) reference database). [96] [97] However, completion and curation are difficult and time-consuming. Without vouchered specimens, there can be no certainty about whether the sequence used as a reference is correct. DNA sequence databases like GenBank contain many sequences that are not tied to vouchered specimens (for example, herbarium specimens, cultured cell lines, or sometimes images). This is problematic in the face of taxonomic issues such as whether several species should be split or combined, or whether past identifications were sound. Reusing sequences, not tied to vouchered specimens, of initially misidentified organism may support incorrect conclusions and must be avoided. [98] Therefore, best practice for DNA barcoding is to sequence vouchered specimens. [99] [100] For many taxa, it can be however difficult to obtain reference specimens, for example with specimens that are difficult to catch, available specimens are poorly conserved, or adequate taxonomic expertise is lacking. [98] Importantly, DNA barcodes can also be used to create interim taxonomy, in which case OTUs can be used as substitutes for traditional Latin binomials – thus significantly reducing dependency on fully populated reference databases. [101]

Technological bias Edit

DNA barcoding also carries methodological bias, from sampling to bioinformatics data analysis. Beside the risk of contamination of the DNA sample by PCR inhibitors, primer bias is one of the major sources of errors in DNA barcoding. [102] [103] The isolation of an efficient DNA marker and the design of primers is a complex process and considerable effort has been made to develop primers for DNA barcoding in different taxonomic groups. [104] However, primers will often bind preferentially to some sequences, leading to differential primer efficiency and specificity and unrepresentative communities’ assessment and richness inflation. [105] Thus, the composition of the sample's communities sequences is mainly altered at the PCR step. Besides, PCR replication is often required, but leads to an exponential increase in the risk of contamination. Several studies have highlighted the possibility to use mitochondria-enriched samples [106] [107] or PCR-free approaches to avoid these biases, but as of today, the DNA metabarcoding technique is still based on the sequencing of amplicons. [104] Other bias enter the picture during the sequencing and during the bioinformatic processing of the sequences, like the creation of chimeras.

Lack of standardization Edit

Even as DNA barcoding is more widely used and applied, there is no agreement concerning the methods for DNA preservation or extraction, the choices of DNA markers and primers set, or PCR protocols. The parameters of bioinformatics pipelines (for example OTU clustering, taxonomic assignment algorithms or thresholds etc.) are at the origin of much debate among DNA barcoding users. [104] Sequencing technologies are also rapidly evolving, together with the tools for the analysis of the massive amounts of DNA data generated, and standardization of the methods is urgently needed to enable collaboration and data sharing at greater spatial and time-scale. This standardisation of barcoding methods at the European scale is part of the objectives of the European COST Action DNAqua-net [108] and is also addressed by CEN (the European Committee for Standardization). [109]

Another criticism of DNA barcoding is its limited efficiency for accurate discrimination below species level (for example, to distinguish between varieties), for hybrid detection, and that it can be affected by evolutionary rates (Ref needed).

Mismatches between conventional (morphological) and barcode based identification Edit

It is important to know that taxa lists derived by conventional (morphological) identification are not, and maybe never will be, directly comparable to taxa lists derived from barcode based identification because of several reasons. The most important cause is probably the incompleteness and lack of accuracy of the molecular reference databases preventing a correct taxonomic assignment of eDNA sequences. Taxa not present in reference databases will not be found by eDNA, and sequences linked to a wrong name will lead to incorrect identification. [91] Other known causes are a different sampling scale and size between a traditional and a molecular sample, the possible analysis of dead organisms, which can happen in different ways for both methods depending on organism group, and the specific selection of identification in either method, i.e. varying taxonomical expertise or possibility to identify certain organism groups, respectively primer bias leading also to a potential biased analysis of taxa. [91]

Estimates of richness/diversity Edit

DNA Barcoding can result in an over or underestimate of species richness and diversity. Some studies suggest that artifacts (identification of species not present in a community) are a major cause of inflated biodiversity. [110] [111] The most problematic issue are taxa represented by low numbers of sequencing reads. These reads are usually removed during the data filtering process, since different studies suggest that most of these low-frequency reads may be artifacts. [112] However, real rare taxa may exist among these low-abundance reads. [113] Rare sequences can reflect unique lineages in communities which make them informative and valuable sequences. Thus, there is a strong need for more robust bioinformatics algorithms that allow the differentiation between informative reads and artifacts. Complete reference libraries would also allow a better testing of bioinformatics algorithms, by permitting a better filtering of artifacts (i.e. the removal of sequences lacking a counterpart among extant species) and therefore, it would be possible obtain a more accurate species assignment. [114] Cryptic diversity can also result in inflated biodiversity as one morphological species may actually split into many distinct molecular sequences. [91]

Metabarcoding is defined as the barcoding of DNA or eDNA (environmental DNA) that allows for simultaneous identification of many taxa within the same (environmental) sample, however often within the same organism group. The main difference between the approaches is that metabarcoding, in contrast to barcoding, does not focus on one specific organism, but instead aims to determine species composition within a sample.

Methodology Edit

The metabarcoding procedure, like general barcoding, covers the steps of DNA extraction, PCR amplification, sequencing and data analysis. A barcode consists of a short variable gene region (for example, see different markers/barcodes) which is useful for taxonomic assignment flanked by highly conserved gene regions which can be used for primer design. [12] Different genes are used depending if the aim is to barcode single species or metabarcoding several species. In the latter case, a more universal gene is used. Metabarcoding does not use single species DNA/RNA as a starting point, but DNA/RNA from several different organisms derived from one environmental or bulk sample.

Applications Edit

Metabarcoding has the potential to complement biodiversity measures, and even replace them in some instances, especially as the technology advances and procedures gradually become cheaper, more optimized and widespread. [115] [116]


Assista o vídeo: Jak zbudowane jest DNA? (Novembro 2021).