Em formação

Por que as células não duplicam a expressão gênica após a fase S?


No ciclo celular (G1-S-G2-M), todo o DNA é replicado durante a fase S ou Síntese. A célula pode então passar algum tempo considerável na fase G2 antes de se dividir na fase M. Uma vez que há o dobro da quantidade de material genético na fase G2, qual mecanismo, se houver, impede que a quantidade de expressão gênica também dobre?


Quando a fita dupla é duplicada, o fio velho (ou, em outros termos, o template) é metilado: essa modificação é suficiente para evitar a ligação pelo sistema RNApol e, com isso, a transcrição. Por metilação, os sistemas de reparo de DNA são capazes de detectar qual é a fita mais recente, para descobrir e corrigir erros de replicação.

Aqui você pode encontrar informações adicionais


A engenharia genética ou tecnologia de DNA tem sido útil para a produção de grandes quantidades de uma proteína específica para o tratamento de doenças humanas. Por exemplo, pacientes com diabetes, hemofilia ou anemia requerem tratamentos com insulina, fator de coagulação e proteínas do fator de crescimento. Genes direcionados (DNA) podem ser cortados com enzimas de restrição e unidos a outro DNA com a enzima ligase. Um vetor de clonagem é usado para transportar o DNA recombinante para as células vivas, de modo que as células possam sintetizar as proteínas codificadas. Os melhores vetores de clonagem são pequenos em tamanho, capazes de replicar seu DNA, contêm locais de reconhecimento de enzimas de restrição e possuem um gene marcador (geralmente um gene de resistência a antibióticos). Neste laboratório, usaremos um plasmídeo recombinante como vetor de clonagem. Este plasmídeo recombinante contém (1) um promotor que permite transcrição do gene desejado, (2) uma sequência para o início da replicação do DNA (ori local) e (3) um gene de resistência a antibióticos.

Transformando Bactérias com Plasmídeo Recombinante

A inserção de um gene em um vetor plasmídeo é um primeiro passo importante no processo de clonagem de genes. No entanto, se o objetivo final é produzir uma grande quantidade de uma determinada proteína, o plasmídeo deve se replicar para garantir que haja muitas cópias do gene e o gene de interesse deve ser expresso, o que significa que o gene é utilizado para produzir a proteína codificada. Ambas as atividades só podem ocorrer dentro de uma célula. Portanto, neste laboratório, colocaremos um recombinante plasmídeo em E. coli bactérias através de um processo que é chamado transformação, assim chamado porque muda o conteúdo de DNA da bactéria.

O plasmídeo será absorvido por bactérias, onde se replica, e seus genes serão expressos por meio da maquinaria celular bacteriana. Se um gene de interesse foi inserido no vetor plasmídeo, a bactéria produz o produto codificado por esse gene.

Neste exercício, você realizará a transformação de E. colibactérias usando um plasmídeo recombinante que contém um gene que produz proteínas coloridas.

Transformação Bacteriana

Uma vez que é feito um plasmídeo recombinante que contém um gene de interesse, como a insulina, o plasmídeo pode entrar nas células bacterianas por um processo denominado transformação. Figura 13.1 ilustra a transformação. A captação de DNA do ambiente de uma célula bacteriana ocorre com uma eficiência muito baixa na natureza. E. coli as bactérias têm membranas plasmáticas complexas que separam o ambiente externo do ambiente interno da célula e regulam cuidadosamente quais substâncias podem entrar e sair da célula. Além disso, a parede celular é carregada negativamente e repele moléculas de DNA carregadas negativamente.

Células que foram tratadas para se tornarem competente são mais eficientes em absorver DNA de seu ambiente circundante. As células competentes podem ser feitas tratando a bactéria com uma solução de cálcio. Os íons de cálcio são carregados positivamente e irão neutralizar a membrana externa carregada negativamente no E. coli bactérias. Com a carga positiva agora revestindo a membrana, as moléculas de DNA inerentemente carregadas negativamente se moverão através das membranas plasmáticas e entrarão na célula. A eficiência da transformação pode ser aumentada ainda mais estressando as células em um choque térmico. Ao alterar drasticamente a temperatura das células de frio para quente, as membranas plasmáticas tornam-se mais fluidas e criam poros nelas. O DNA do plasmídeo pode viajar do ambiente através desses poros e entrar na célula. As células são então mergulhadas de volta em uma temperatura fria, o que faz com que os poros se fechem e o DNA do plasmídeo permaneça dentro da célula.

No entanto, mesmo as células competentes nem sempre captam o plasmídeo. Para algumas moléculas de DNA de plasmídeo, apenas cerca de 1 em 10.000 células serão transformadas. Quando tão poucas células incorporaram o plasmídeo, como você será capaz de identificar as células transformadas? Ao projetar um plasmídeo recombinante, um dos requisitos é adicionar um gene para resistência a antibióticos. Dessa forma, a bactéria pode crescer no meio com um antibiótico adicionado, e apenas as células que possuem o gene de resistência, como as que expressam o plasmídeo recombinante, poderão crescer.

Figura 1. Transformação bacteriana.

Do DNA do plasmídeo à proteína

Depois que um plasmídeo recombinante entra em uma célula bacteriana, a célula começa a expressar os genes nele. A DNA polimerase localiza o ori- a origem da replicação, e começa a replicar o plasmídeo usando a máquina bacteriana e rsquos. Múltiplas cópias do plasmídeo recombinante podem permitir que a célula bacteriana expresse grandes quantidades de uma proteína. Normalmente, uma célula bacteriana só produzirá a proteína de interesse, após ser induzida a fazê-lo pela adição de uma substância química que promoverá a transcrição do gene. Lembre-se de que, para expressar o gene que codifica a proteína no plasmídeo recombinante, o DNA é transcrito em mRNA, que é então traduzido em proteína (Figura 13.2). As proteínas expressas podem afetar os traços visíveis ao observar as colônias de bactérias.

Figura 2. Expressão gênica de um plasmídeo na célula bacteriana

Plasmídeos recombinantes e outras formas de engenharia genética são possíveis porque todos os organismos vivos usam o DNA como uma plataforma para codificar a informação genética. Genes de diferentes organismos podem ser expressos em outros organismos, como bactérias, uma vez que são codificados no DNA. As instruções do DNA podem ser transferidas e outros organismos podem expressar características estranhas.

As proteínas têm muitas funções diferentes no interior das células. Eles são compostos de subunidades menores, aminoácidos, que são codificados por DNA nucleotídeos. Uma sequência específica de três nucleotídeos que codifica um único aminoácido é chamada de códon. Por exemplo, o códon TTG codifica para o aminoácido triptofano, enquanto o códon AAG codifica para o aminoácido lisina. Em muitos casos, mais de um códon pode codificar o mesmo aminoácido. Por exemplo, AAA também é um códon para a lisina. Além disso, existem códons informativos, como o códon de início (ATG) e o parar códon (TTA), que mostram onde na sequência de DNA o código para a proteína começa e termina.

Transformando Bactérias com Plasmídeos

Neste experimento de laboratório, você transformará E. coli células de bactérias com plasmídeos. Você estará usando E. coli que se tornou competente com um tratamento com cloreto de cálcio, e formam dois grupos de teste diferentes: um grupo de células de controle negativo que não tem plasmídeos adicionados a ele, e o grupo experimental que tem os plasmídeos adicionados. Depois que as células são submetidas a choque térmico, elas serão cultivadas sob várias condições de teste:

  • O grupo de controle em ágar nutriente (um tipo de meio de crescimento em que as bactérias se desenvolvem).
  • O grupo de controle recebeu ágar nutritivo com um antibiótico adicionado.
  • O grupo experimental em ágar nutriente.
  • O grupo experimental em ágar nutriente com um antibiótico.
  • O grupo experimental em ágar nutriente, antibiótico e um indutor (como IPTG).

Ao examinar o crescimento de bactérias nessas condições, você pode verificar se o procedimento funcionou e identificar as bactérias transformadas com o plasmídeo adicionado. Como você saberá se foi bem-sucedido? Nos exemplos de plasmídeos que recomendamos para este exercício, a bactéria recombinante terá uma característica nova e altamente visível: ela agora produzirá proteína colorida, que torna as próprias células coloridas! À medida que as bactérias se multiplicam na mídia, elas formam coleções visíveis de células chamadas colônias. Cada colônia representa os descendentes da célula bacteriana original que pousou naquele ponto do meio e começou a se replicar. Assim, as colônias são clones (cópias exatas) da célula que iniciou o processo de replicação. & # 8232

Os componentes relevantes do seu plasmídeo são o gene para a proteína colorida, o promotor induzível e o gene de resistência à ampicilina (ampR) o ampR gene confere resistência ao antibiótico ampicilina. (Os biotecnologistas chamam esses genes marcadores selecionáveis porque apenas as bactérias com o gene sobreviverão na presença de um antibiótico.) Se o indutor estiver presente na bactéria, o promotor será "ativado" para que a RNA polimerase possa transcrever o gene de interesse. Isso permitirá que a proteína seja produzida.


Biologia TESTE 2

__3__
A replicação do DNA ou fase S ocorre antes desse tipo de divisão.

__2__
Usado para produzir células durante o crescimento e a cicatrização do tecido.

__2__
Produz células-filhas com o mesmo número de cromossomos da célula-mãe.

__1__
Produz células-filhas com metade dos cromossomos da célula-mãe.

Separação de cromossomos homólogos em células-filhas diferentes.

Proporção de 1: 2: 1 de genótipos homozigotos dominantes, heterozigotos e homozigotos recessivos

__1__
Transcrição de DNA para mRNA

__2__
Tradução de mRNA para polipeptídeo

__2__
Enrolamento e processamento de proteínas

__2__
A molécula que se liga ao mRNA e traz monômeros de aminoácidos para construir o polipeptídeo

__5__
Os monômeros usados ​​para construir o polipeptídeo ou proteína

__3__
A molécula que carrega a informação genética para fora do núcleo e interage com o tRNA

__4__
A molécula no núcleo que contém a informação genética


Introdução

As células T são componentes essenciais do sistema imunológico adaptativo. Geralmente, considera-se que as células T maduras expressam o co-receptor CD4 ou CD8, além de seu TCR e, consequentemente, o pool de células T é comumente dividido em dois subconjuntos, com base na expressão de CD4 ou CD8. A molécula CD4, um membro da família IgR, é codificada por um único gene e expressa na superfície como um monômero transmembrana [1, 2]. CD4 interage com o βO domínio 2 das moléculas de MHC de classe II e também demonstrou atuar como um importante receptor quimiotático para IL-16 [3]. Em contraste com o monômero CD4, o co-receptor CD8 existe como um CD8αα homodímero ou um CD8αβ heterodímero ainda, em ambos os casos, os domínios de Ig da molécula CD8 ligam MHC classe I [4]. Nenhuma diferença substancial na ligação de afinidade ao MHC de classe I foi observada entre o CD8 murinoαα e CD8αβ moléculas [5], apesar de as sequências para o homo- e heterodímero de CD8 serem & lt20% idênticas [4]. As regiões intracelulares de CD4 e CD8 interagem com a tirosina quinase, lck [6]. Ao induzir a sinalização intracelular por meio de lck, o co-receptor CD8 é um fator importante que afeta a ativação de células T mediada por TCR e a modulação das respostas imunes, tanto em termos de imunossupressão quanto de citotoxicidade [7, 8].


Discussão

Neste estudo, investigamos sistematicamente a dinâmica transcricional e epigenética durante o ciclo celular, analisando os dados de GRO-seq, RNA-seq e marcas de histona ChIP-seq nas fases G0 / G1, G1 / S e M na mama MCF-7 linhagem de células cancerosas. Nosso estudo revelou (eu) um atraso entre a transcrição e a expressão de RNA em estado estacionário no nível do ciclo celular (ii) uma grande quantidade de transcrição ativa durante a mitose inicial (iii) um aumento global nas modificações ativas de histonas na mitose (4) milhares de eRNAs regulados pelo ciclo celular e (v) eRNAs dinâmicos ligados por fatores de transcrição, como KLF4, que regulam a progressão do ciclo celular.

A abundância de mRNA em estado estacionário é influenciada por alguns fatores, incluindo transcrição, processamento de RNA, maturação e degradação. Portanto, medir os níveis de mRNA em estado estacionário por técnicas de microarray ou RNA-seq pode não refletir com precisão a transcrição ativa. De fato, a marcação metabólica de GRO-seq e 4-tiouridina seguida por análise de sequenciamento (4sU-seq) que medem a transcrição nascente revelaram uma ampla inconsistência entre a taxa de transcrição e os níveis de mRNA (25, 28, 61, 62). Especificamente, há um atraso na expressão em estado estacionário refletindo a transcrição e produção em massa de transcritos rapidamente degradados que não são detectáveis ​​no nível de expressão em estado estacionário. A maioria das análises de transcrição nascentes anteriores foram realizadas com células não sincronizadas ou com células sincronizadas dentro de uma janela de tempo curta que foi insuficiente para cobrir vários estágios do ciclo celular (26, 28, 29, 32, 35, 36, 62). É importante ressaltar que nossa análise de GRO-seq e RNA-seq em diferentes estágios do ciclo celular revelou um atraso entre a transcrição ativa e a expressão em estado estacionário durante o ciclo celular. A taxa de degradação do RNA tem sido considerada o fator mensurável mais importante que contribui para a defasagem entre a transcrição e os níveis de RNA acumulados. Estudos recentes demonstraram que as meias-vidas dos genes de mamíferos variam de menos de 1 minuto a mais de 3 horas (61, 62). De acordo com essas observações, nossos dados mostraram que os genes mitóticos são mais altamente transcritos em G1 / S, e os genes mais altamente transcritos na fase M são mais abundantes em G0 / G1, sugerindo que esses genes têm uma meia-vida extremamente longa.

A cromatina mitótica é transcricionalmente inativa em geral, e mesmo as transcrições em andamento são abortadas para garantir a integridade dos cromossomos em separação (63). No entanto, foram encontradas exceções nas quais o promotor do gene da ciclina B1 mantém uma configuração de cromatina aberta e o gene é transcrito ativamente durante a mitose (64). Recentemente, estudos adicionais em grande escala revelaram que parte da cromatina mitótica permanece acessível a Pol II e fatores de transcrição como MLL, BRD4, GATA1, FOXA1 e AR (43 ⇓ ⇓ –46, 65). Nossos dados de GRO-seq mostraram que, embora a transcrição de CCNB1 tenha picos em G1 / S, uma forte transcrição nascente foi observada na fase M. Mais interessante, identificamos um grupo de genes com um pico de transcrição na fase M. A observação de que esse grupo foi enriquecido por genes incomumente longos nos fez supor que o sinal GRO-seq era da transcrição incompleta de estágios anteriores (66). Portanto, comparamos o sinal GRO-seq ao longo do corpo do gene para identificar o quarto mais longo dos genes com o sinal GRO-seq mais alto na fase M. Se a hipótese estiver correta, devemos ser capazes de observar um padrão de sinal GRO-seq deslocado do TSS em direção ao local CPA durante a progressão do ciclo celular da fase G0 / G1 para a fase M. Nossa análise revelou uma distribuição uniforme de sinal ao longo do corpo do gene para a maioria dos genes. Além disso, a reanálise de dados de Pol II ChIP-seq disponíveis publicamente em células mitóticas precoces pré-tratadas com e sem flavopiridol (47) confirmou que Pol II está ativamente engajado no TSS desses genes. Juntos, os resultados sugeriram que o alto sinal de GRO-seq desses genes surgiu da transcrição ativa na fase M inicial, em vez da transcrição incompleta nas fases G0 / G1 e G1 / S. É importante ressaltar que Liang et al. (47) relataram recentemente a ativação da transcrição mitótica como um mecanismo para limpar a Pol II ativamente engajada da cromatina mitótica. Esse mecanismo é consistente com nossa observação de transcrição ativa nas células mitóticas iniciais.

Em apoio à transcrição ativa na fase M, observamos estados de cromatina extremamente estáveis ​​marcados por modificações de histonas ativas H3K4me2 e H3K27ac em diferentes estágios do ciclo celular. Além disso, os níveis totais de H3K4me2 e H3K27ac aumentaram significativamente na fase M. Estudos anteriores identificaram metilação de H4K20 mitótico-específica e a dinâmica de metilação de H3K36 e H3K27 ao longo do ciclo celular (67 ⇓ -69). O papel funcional das modificações pós-transcricionais das histonas no ciclo celular ainda é amplamente desconhecido e requer análises posteriores. É importante notar que essas observações foram feitas em células cancerosas com divisão celular descontrolada - essas células podem diferir das células normais com regulação do ciclo celular mais rigorosa (70). Estudos futuros são necessários para explorar os mecanismos subjacentes à transcrição ativa durante a mitose em células normais e cancerosas.

Juntos, nossas análises identificaram milhares de eRNAs e fatores de transcrição relacionados que são altamente correlacionados com a transcrição regulada pelo ciclo celular, mas não com a expressão em estado estacionário, destacando assim a importância da dinâmica transcricional e epigenética durante a progressão do ciclo celular. No geral, nosso estudo fornece uma visão abrangente da paisagem transcricional ao longo do ciclo celular e aprofunda nossa compreensão da dinâmica transcricional durante o ciclo celular. Estudos futuros combinando transcrição, expressão e dados de proteômica em cursos de tempo mais detalhados são necessários para fornecer uma visão mais abrangente da regulação do ciclo celular.


Genes 'zumbis'? A pesquisa mostra que alguns genes ganham vida no cérebro após a morte

Algumas horas depois de morrermos, certas células do cérebro humano ainda estão ativas. Algumas células até aumentam sua atividade e crescem em proporções gigantescas, de acordo com uma nova pesquisa da Universidade de Illinois em Chicago.

Em um estudo recém-publicado na revista Relatórios Científicos, os pesquisadores da UIC analisaram a expressão do gene em tecido cerebral fresco - que foi coletado durante uma cirurgia cerebral de rotina - em vários momentos após a remoção para simular o intervalo post-mortem e a morte. Eles descobriram que a expressão do gene em algumas células realmente aumentou após a morte.

Esses 'genes zumbis' - aqueles que aumentaram a expressão após o intervalo post-mortem - eram específicos para um tipo de célula: células inflamatórias chamadas células gliais. Os pesquisadores observaram que as células gliais crescem e germinam longos apêndices semelhantes a braços por muitas horas após a morte.

"O aumento das células gliais após a morte não é muito surpreendente, visto que são inflamatórias e seu trabalho é limpar as coisas após lesões cerebrais, como privação de oxigênio ou derrame", disse o Dr. Jeffrey Loeb, professor da John S. Garvin e chefe da neurologia e reabilitação na UIC College of Medicine e autor correspondente no artigo.

O que é significativo, disse Loeb, são as implicações desta descoberta - a maioria dos estudos de pesquisa que usam tecidos cerebrais humanos post-mortem para encontrar tratamentos e curas potenciais para doenças como autismo, esquizofrenia e doença de Alzheimer, não são responsáveis ​​pela expressão do gene post-mortem ou atividade celular.

"A maioria dos estudos pressupõe que tudo no cérebro para quando o coração para de bater, mas não é assim", disse Loeb. "Nossas descobertas serão necessárias para interpretar a pesquisa em tecidos cerebrais humanos. Nós apenas não quantificamos essas mudanças até agora."

Loeb e sua equipe notaram que o padrão global de expressão gênica em tecido cerebral humano fresco não correspondia a nenhum dos relatórios publicados de expressão gênica cerebral post-mortem de pessoas sem distúrbios neurológicos ou de pessoas com uma ampla variedade de distúrbios neurológicos, variando de autismo para Alzheimer.

"Decidimos realizar um experimento de morte simulada observando a expressão de todos os genes humanos, em pontos de tempo de 0 a 24 horas, a partir de um grande bloco de tecidos cerebrais coletados recentemente, que foram deixados em temperatura ambiente para replicar a pós-morte intervalo ", disse Loeb.

Loeb e seus colegas têm uma vantagem especial quando se trata de estudar o tecido cerebral. Loeb é diretor do UI NeuroRepository, um banco de tecidos cerebrais humanos de pacientes com distúrbios neurológicos que consentiram em ter tecido coletado e armazenado para pesquisa depois de morrer ou durante cirurgia padrão para tratar distúrbios como a epilepsia. Por exemplo, durante certas cirurgias para tratar a epilepsia, o tecido cerebral epiléptico é removido para ajudar a eliminar as convulsões. Nem todo o tecido é necessário para o diagnóstico patológico, portanto, alguns podem ser usados ​​para pesquisas. Este é o tecido que Loeb e colegas analisaram em sua pesquisa.

Eles descobriram que cerca de 80% dos genes analisados ​​permaneceram relativamente estáveis ​​por 24 horas - sua expressão não mudou muito. Esses genes incluídos frequentemente referidos como genes de manutenção que fornecem funções celulares básicas e são comumente usados ​​em estudos de pesquisa para mostrar a qualidade do tecido. Outro grupo de genes, conhecido por estar presente em neurônios e por estar intrinsecamente envolvido na atividade do cérebro humano, como memória, pensamento e atividade convulsiva, degradou-se rapidamente nas horas após a morte. Esses genes são importantes para pesquisadores que estudam doenças como esquizofrenia e doença de Alzheimer, disse Loeb.

Um terceiro grupo de genes - os 'genes zumbis' - aumentou sua atividade ao mesmo tempo em que os genes neuronais estavam diminuindo. O padrão de mudanças post-mortem atingiu o pico em cerca de 12 horas.

"Nossas descobertas não significam que devemos descartar programas de pesquisa de tecidos humanos, apenas significa que os pesquisadores precisam levar em consideração essas mudanças genéticas e celulares e reduzir o intervalo post-mortem tanto quanto possível para reduzir a magnitude dessas mudanças ", disse Loeb. "A boa notícia de nossas descobertas é que agora sabemos quais genes e tipos de células são estáveis, quais se degradam e quais aumentam com o tempo para que os resultados dos estudos cerebrais post-mortem possam ser melhor compreendidos."

Fabien Dachet, Tibor Valyi-Nagy, Kunwar Narayan, Anna Serafini e Gayatry Mohapatra da UIC James Brown e Susan Celniker do Laboratório Nacional Lawrence Berkeley Nathan Boley da Universidade da Califórnia, Berkeley e Thomas Gingeras do Laboratório Cold Spring Harbor são co-autores em o papel.

Esta pesquisa foi financiada por doações do National Institutes of Health (R01NS109515, R56NS083527 e UL1TR002003).


Conteúdo

Barbara McClintock descobriu os primeiros TEs em milho (Zea mays) no Cold Spring Harbor Laboratory em Nova York. McClintock estava fazendo experiências com plantas de milho que tinham cromossomos quebrados. [5]

No inverno de 1944-1945, McClintock plantou grãos de milho que foram autopolinizados, o que significa que a seda (estilo) da flor recebeu pólen de sua própria antera. [5] Esses grãos vieram de uma longa linha de plantas que foram autopolinizadas, causando a quebra de braços na extremidade de seus nove cromossomos. [5] À medida que as plantas de milho começaram a crescer, McClintock notou padrões de cores incomuns nas folhas. [5] Por exemplo, uma folha tinha duas manchas albinas de tamanho quase idêntico, localizadas lado a lado na folha. [5] McClintock levantou a hipótese de que, durante a divisão celular, certas células perderam material genético, enquanto outras ganharam o que haviam perdido. [6] No entanto, ao comparar os cromossomos da geração atual de plantas com a geração dos pais, ela descobriu que certas partes do cromossomo mudaram de posição. [6] Isso refutou a teoria genética popular da época que os genes eram fixados em suas posições em um cromossomo. McClintock descobriu que os genes não só podiam se mover, mas também podiam ser ligados ou desligados devido a certas condições ambientais ou durante diferentes estágios de desenvolvimento celular. [6]

McClintock também mostrou que as mutações genéticas podem ser revertidas. [7] Ela apresentou seu relatório sobre suas descobertas em 1951 e publicou um artigo sobre suas descobertas em Genética em novembro de 1953, intitulado "Indução de instabilidade em locais selecionados no milho". [8]

No Simpósio Cold Spring Harbor de 1951, onde ela divulgou suas descobertas pela primeira vez, sua palestra foi recebida com um silêncio mortal. [9] Seu trabalho foi amplamente rejeitado e ignorado até o final dos anos 1960-1970, quando, depois que os TEs foram encontrados em bactérias, foram redescobertos. [10] Ela recebeu o Prêmio Nobel de Fisiologia ou Medicina em 1983 por sua descoberta de TEs, mais de trinta anos após sua pesquisa inicial. [11]

Aproximadamente 64% do genoma do milho é composto de TEs, [12] [13] assim como 44% do genoma humano. [14]

Os elementos transponíveis representam um dos vários tipos de elementos genéticos móveis. Os TEs são atribuídos a uma de duas classes de acordo com seu mecanismo de transposição, que pode ser descrito como copiar e colar (TEs Classe I) ou copiar e colar (TEs Classe II). [15]

Edição de retrotransposão

Os TEs de classe I são copiados em dois estágios: primeiro, eles são transcritos de DNA para RNA, e o RNA produzido é então transcrito reversamente para DNA. Este DNA copiado é então inserido de volta no genoma em uma nova posição. A etapa de transcrição reversa é catalisada por uma transcriptase reversa, que muitas vezes é codificada pelo próprio TE. As características dos retrotransposons são semelhantes às dos retrovírus, como o HIV.

Os retrotransposons são comumente agrupados em três ordens principais:

  • Retrotransposons, com repetições terminais longas (LTRs), que codificam a transcriptase reversa, semelhante aos retrovírus
  • Retroposons, elementos nucleares intercalados longos (LINEs, LINE-1s ou L1s), que codificam a transcriptase reversa, mas não possuem LTRs, e são transcritos pela RNA polimerase II (SINEs), não codificam a transcriptase reversa e são transcritos pela RNA polimerase III

(Os retrovírus também podem ser considerados TEs. Por exemplo, após a conversão do RNA retroviral em DNA dentro de uma célula hospedeira, o DNA retroviral recém-produzido é integrado ao genoma da célula hospedeira. Esses DNAs integrados são denominados provírus. O provírus é uma forma especializada de retrotransposon eucariótico, que pode produzir intermediários de RNA que podem deixar a célula hospedeira e infectar outras células. O ciclo de transposição dos retrovírus tem semelhanças com o dos TEs procarióticos, sugerindo uma relação distante entre os dois.)

Transposons de DNA Editar

O mecanismo de transposição cortar e colar de TEs de classe II não envolve um intermediário de RNA. As transposições são catalisadas por várias enzimas transposase. Algumas transposases se ligam não especificamente a qualquer sítio alvo no DNA, enquanto outras se ligam a sequências alvo específicas. A transposase faz um corte escalonado no local alvo, produzindo extremidades pegajosas, corta o transposon de DNA e o liga ao local alvo. A DNA polimerase preenche as lacunas resultantes das extremidades pegajosas e a DNA ligase fecha o esqueleto açúcar-fosfato. Isso resulta na duplicação do local alvo e os locais de inserção de transposons de DNA podem ser identificados por repetições diretas curtas (um corte escalonado no DNA alvo preenchido por DNA polimerase) seguido por repetições invertidas (que são importantes para a excisão TE pela transposase).

Cortar e colar TEs podem ser duplicados se sua transposição ocorrer durante a fase S do ciclo celular, quando um local doador já foi replicado, mas um local alvo ainda não foi replicado. [17] Essas duplicações no local alvo podem resultar na duplicação de genes, que desempenha um papel importante na evolução genômica. [18]: 284

Nem todos os transposons de DNA transpõem pelo mecanismo de cortar e colar. Em alguns casos, uma transposição replicativa é observada em que um transposon se replica para um novo local alvo (por exemplo, helitron).

Os TEs da Classe II compreendem menos de 2% do genoma humano, tornando o restante da Classe I. [19]

Editar autônomo e não autônomo

A transposição pode ser classificada como "autônoma" ou "não autônoma" em TEs de Classe I e Classe II. TEs autônomos podem se mover por si próprios, enquanto TEs não autônomos exigem a presença de outro TE para se mover. Isso geralmente ocorre porque os TEs dependentes carecem de transposase (para Classe II) ou transcriptase reversa (para Classe I).

Elemento ativador (Ac) é um exemplo de um TE autônomo e elementos de dissociação (Ds) é um exemplo de um TE não autônomo. Sem Ac, Ds não é capaz de transpor.

Novas descobertas de elementos transponíveis mostraram a distribuição exata de TEs em relação aos seus locais de início de transcrição (TSSs) e potenciadores. Um estudo recente descobriu que um promotor contém 25% das regiões que abrigam TEs. Sabe-se que TEs mais antigos não são encontrados em locais de TSS porque a frequência de TEs começa como uma função quando há uma distância do TSS. Uma teoria possível para isso é que os TEs podem interferir na pausa da transcrição ou no splicing da primeira introdução. [20] Também como mencionado antes, a presença de TEs fechados pelos locais de TSS está correlacionada à sua idade evolutiva (número de mutações diferentes que os TEs podem desenvolver durante o tempo).

  • Os primeiros TEs foram descobertos no milho (Zea mays) por Barbara McClintock em 1948, pelo qual ela mais tarde recebeu o Prêmio Nobel. Ela notou inserções, deleções e translocações cromossômicas causadas por esses elementos. Essas mudanças no genoma podem, por exemplo, levar a uma mudança na cor dos grãos de milho. Cerca de 85% do genoma do milho consiste em TEs. [21] O sistema Ac / Ds descrito por McClintock são TEs de Classe II. A transposição de Ac no tabaco foi demonstrada por B. Baker (Plant Transposable Elements, pp 161-174, 1988, Plenum Publishing Corp., ed. Nelson).
  • No microorganismo da lagoa, Oxytricha, Os TEs desempenham um papel tão crítico que, quando removidos, o organismo deixa de se desenvolver. [22]
  • Uma família de TEs na mosca da fruta Drosophila melanogaster são chamados Elementos P. Eles parecem ter aparecido pela primeira vez na espécie apenas em meados do século XX, nos últimos 50 anos, eles se espalharam por todas as populações da espécie. Gerald M. Rubin e Allan C. Spradling foram pioneiros na tecnologia de usar elementos P artificiais para inserir genes em Drosófila injetando o embrião. [23] [24] [25]
  • Em bactérias, os TEs geralmente carregam um gene adicional para outras funções além da transposição, geralmente para resistência a antibióticos. Em bactérias, os transposons podem saltar do DNA cromossômico para o DNA plasmidial e vice-versa, permitindo a transferência e adição permanente de genes como os que codificam a resistência a antibióticos (cepas bacterianas multirresistentes a antibióticos podem ser geradas dessa forma). Os transposões bacterianos deste tipo pertencem à família Tn. Quando os elementos transponíveis carecem de genes adicionais, eles são conhecidos como sequências de inserção.
  • Em humanos, o TE mais comum é a sequência Alu. Tem aproximadamente 300 bases de comprimento e pode ser encontrado entre 300.000 e um milhão de vezes no genoma humano. Alu por si só, estima-se que constitua de 15 a 17% do genoma humano. [19] são outra classe proeminente de transposons encontrados em várias espécies, incluindo humanos. O transposon Mariner foi descoberto pela primeira vez por Jacobson e Hartl em Drosófila. [26] Este elemento transponível Classe II é conhecido por sua incrível capacidade de ser transmitido horizontalmente em muitas espécies. [27] [28] Existem cerca de 14.000 cópias do Mariner no genoma humano, compreendendo 2,6 milhões de pares de bases. [29] Os primeiros transposons do elemento marinheiro fora dos animais foram encontrados em Trichomonas vaginalis. [30] Essas características do transposon Mariner inspiraram o romance de ficção científica The Mariner Project por Bob Marr. a transposição é o exemplo mais conhecido de transposição replicativa.
  • Em genomas de levedura, (Saccharomyces cerevisiae), existem cinco famílias distintas de retrotransposões: Ty1, Ty2, Ty3, Ty4 e Ty5. [31]
  • Um helitron é um TE encontrado em eucariotos que se acredita se replicar por um mecanismo de círculo rolante.
  • Em embriões humanos, dois tipos de transposons se combinam para formar RNA não codificador que catalisa o desenvolvimento de células-tronco. Durante os primeiros estágios do crescimento do feto, a massa celular interna do embrião se expande à medida que essas células-tronco são enumeradas. O aumento deste tipo de células é fundamental, uma vez que as células-tronco posteriormente mudam de forma e dão origem a todas as células do corpo.
  • Nas mariposas salpicadas, um transposon em um gene chamado córtex fazia com que as asas das mariposas ficassem completamente pretas. Essa mudança na coloração ajudou as mariposas a se misturarem às cinzas e áreas cobertas de fuligem durante a Revolução Industrial.

Os transposons coexistiram com os eucariotos por milhares de anos e, por meio de sua coexistência, foram integrados nos genomas de muitos organismos. Conhecidos coloquialmente como 'genes saltadores', os transposons podem se mover dentro e entre os genomas, permitindo essa integração.

Embora existam muitos efeitos positivos dos transposons em seus genomas eucarióticos hospedeiros, existem alguns casos de efeitos mutagênicos que os TEs têm nos genomas, levando a doenças e alterações genéticas malignas. [32]

Mecanismos de mutagênese Editar

TEs are mutagens and due to the contribution to the formation of new cis-regulatory DNA elements that are connected to many transcription factors that are found in living cells TEs can undergo many evolutionary mutations and alterations. These are often the causes of genetic disease, and gives the potential lethal effects of ectopic expression. [33]

TEs can damage the genome of their host cell in different ways: [32]

  • A transposon or a retrotransposon that inserts itself into a functional gene can disable that gene.
  • After a DNA transposon leaves a gene, the resulting gap may not be repaired correctly
  • Multiple copies of the same sequence, such as Alu sequences, can hinder precise chromosomal pairing during mitosis and meiosis, resulting in unequal crossovers, one of the main reasons for chromosome duplication.

TEs use a number of different mechanisms to cause genetic instability and disease in their host genomes.

  • Expression of disease causing, damaging proteins that inhibit normal cellular function.
    • Many TEs contain promoters which drive transcription of their own transposase. These promoters can cause aberrant expression of linked genes, causing disease or mutantphenotypes. [34]

    Diseases often caused by TEs include

      A e B
      • LINE1 (L1) TEs that land on the human Factor VIII have been shown to cause haemophilia [35]
      • Insertion of L1 into the APC gene causes colon cancer, confirming that TEs play an important role in disease development. [36]
      • Insertion of Alu element into the PBGD gene leads to interference with the coding region and leads to acute intermittent porphyria [37] (AIP).
      • LINE1(L1) TE's and other retrotransposons have been linked to cancer because they cause genomic instability. [35]
      • Caused by SVA transposable element insertion in the fukutin (FKTN) gene which renders the gene inactive. [35]
      • Transposable element dysregulation can cause neuronal death, leading to neurodegenerative disorders [40]

      One study estimated the rate of transposition of a particular retrotransposon, the Ty1 element in Saccharomyces cerevisiae. Using several assumptions, the rate of successful transposition event per single Ty1 element came out to be about once every few months to once every few years. [41] Some TEs contain heat-shock like promoters and their rate of transposition increases if the cell is subjected to stress, [42] thus increasing the mutation rate under these conditions, which might be beneficial to the cell.

      Cells defend against the proliferation of TEs in a number of ways. These include piRNAs and siRNAs, [43] which silence TEs after they have been transcribed.

      If organisms are mostly composed of TEs, one might assume that disease caused by misplaced TEs is very common, but in most cases TEs are silenced through epigenetic mechanisms like DNA methylation, chromatin remodeling and piRNA, such that little to no phenotypic effects nor movements of TEs occur as in some wild-type plant TEs. Certain mutated plants have been found to have defects in methylation-related enzymes (methyl transferase) which cause the transcription of TEs, thus affecting the phenotype. [4] [44]

      One hypothesis suggests that only approximately 100 LINE1 related sequences are active, despite their sequences making up 17% of the human genome. In human cells, silencing of LINE1 sequences is triggered by an RNA interference (RNAi) mechanism. Surprisingly, the RNAi sequences are derived from the 5' untranslated region (UTR) of the LINE1, a long terminal which repeats itself. Supposedly, the 5' LINE1 UTR that codes for the sense promoter for LINE1 transcription also encodes the antisense promoter for the miRNA that becomes the substrate for siRNA production. Inhibition of the RNAi silencing mechanism in this region showed an increase in LINE1 transcription. [4] [45]

      TEs are found in almost all life forms, and the scientific community is still exploring their evolution and their effect on genome evolution. It is unclear whether TEs originated in the last universal common ancestor, arose independently multiple times, or arose once and then spread to other kingdoms by horizontal gene transfer. [46] While some TEs confer benefits on their hosts, most are regarded as selfish DNA parasites. In this way, they are similar to viruses. Various viruses and TEs also share features in their genome structures and biochemical abilities, leading to speculation that they share a common ancestor. [47]

      Because excessive TE activity can damage exons, many organisms have acquired mechanisms to inhibit their activity. Bacteria may undergo high rates of gene deletion as part of a mechanism to remove TEs and viruses from their genomes, while eukaryotic organisms typically use RNA interference to inhibit TE activity. Nevertheless, some TEs generate large families often associated with speciation events. Evolution often deactivates DNA transposons, leaving them as introns (inactive gene sequences). In vertebrate animal cells, nearly all 100,000+ DNA transposons per genome have genes that encode inactive transposase polypeptides. [48] The first synthetic transposon designed for use in vertebrate (including human) cells, the Sleeping Beauty transposon system, is a Tc1/mariner-like transposon. Its dead ("fossil") versions are spread widely in the salmonid genome and a functional version was engineered by comparing those versions. [49] Human Tc1-like transposons are divided into Hsmar1 and Hsmar2 subfamilies. Although both types are inactive, one copy of Hsmar1 found in the SETMAR gene is under selection as it provides DNA-binding for the histone-modifying protein. [50] Many other human genes are similarly derived from transposons. [51] Hsmar2 has been reconstructed multiple times from the fossil sequences. [52]

      Large quantities of TEs within genomes may still present evolutionary advantages, however. Interspersed repeats within genomes are created by transposition events accumulating over evolutionary time. Because interspersed repeats block gene conversion, they protect novel gene sequences from being overwritten by similar gene sequences and thereby facilitate the development of new genes. TEs may also have been co-opted by the vertebrate immune system as a means of producing antibody diversity. The V(D)J recombination system operates by a mechanism similar to that of some TEs. TEs also serve to generate repeating sequences that can form dsRNA to act as a substrate for the action of ADAR in RNA editing. [53]

      TEs can contain many types of genes, including those conferring antibiotic resistance and ability to transpose to conjugative plasmids. Some TEs also contain integrons, genetic elements that can capture and express genes from other sources. These contain integrase, which can integrate gene cassettes. There are over 40 antibiotic resistance genes identified on cassettes, as well as virulence genes.

      Transposons do not always excise their elements precisely, sometimes removing the adjacent base pairs this phenomenon is called exon shuffling. Shuffling two unrelated exons can create a novel gene product or, more likely, an intron. [54]

      Evolutionary drive for TEs on the genomic context Edit

      There is a hypothesis that states that TEs might provide a ready source of DNA that could be co-opted by the cell to help regulate gene expression. Research showed that many diverse modes of TEs co-evolution along with some transcription factors targeting TE-associated genomic elements and chromatin are evolving from TE sequences. Most of the time, these particular modes do not follow the simple model of TEs and regulating host gene expression. [55]

      Transposable elements can be harnessed in laboratory and research settings to study genomes of organisms and even engineer genetic sequences. Use of transposable elements can be split into two categories: for genetic engineering and as a genetic tool.

      Genetic engineering Edit

      • Insertional mutagenesis uses the features of a TE to insert a sequence. In most cases this is used to remove a DNA sequence or cause a frameshift mutation.
        • In some cases the insertion of a TE into a gene can disrupt that gene's function in a reversible manner where transposase-mediated excision of the DNA transposon restores gene function.
        • This produces plants in which neighboring cells have different genotypes.
        • This feature allows researchers to distinguish between genes that must be present inside of a cell in order to function (cell-autonomous) and genes that produce observable effects in cells other than those where the gene is expressed.

        Genetic tool Edit

        In addition to the qualities mentioned for Genetic engineering, a Genetic tool also:-

        • Used for analysis of gene expression and protein functioning in signature-tagging mutagenesis.
          • This analytical tool allows researchers the ability to determine phenotypic expression of gene sequences. Also, this analytic technique mutates the desired locus of interest so that the phenotypes of the original and the mutated gene can be compared.

          Specific applications Edit

          • TEs are also a widely used tool for mutagenesis of most experimentally tractable organisms. The Sleeping Beauty transposon system has been used extensively as an insertional tag for identifying cancer genes. [56]
          • The Tc1/mariner-class of TEs Sleeping Beauty transposon system, awarded Molecule of the Year in 2009, [57] is active in mammalian cells and is being investigated for use in human gene therapy. [58][59][60]
          • TEs are used for the reconstruction of phylogenies by the means of presence/absence analyses. [61] Transposons can act as biological mutagen in bacteria.
          • Common organisms which the use of Transposons has been well developed are:
            • Drosófila[62]
            • Arabidopsis thaliana[44]
            • Escherichia coli

            De novo repeat identification is an initial scan of sequence data that seeks to find the repetitive regions of the genome, and to classify these repeats. Many computer programs exist to perform de novo repeat identification, all operating under the same general principles. [57] As short tandem repeats are generally 1–6 base pairs in length and are often consecutive, their identification is relatively simple. [56] Dispersed repetitive elements, on the other hand, are more challenging to identify, due to the fact that they are longer and have often acquired mutations. However, it is important to identify these repeats as they are often found to be transposable elements (TEs). [57]

            De novo identification of transposons involves three steps: 1) find all repeats within the genome, 2) build a consensus of each family of sequences, and 3) classify these repeats. There are three groups of algorithms for the first step. One group is referred to as the k-mer approach, where a k-mer is a sequence of length k. In this approach, the genome is scanned for overrepresented k-mers that is, k-mers that occur more often than is likely based on probability alone. The length k is determined by the type of transposon being searched for. The k-mer approach also allows mismatches, the number of which is determined by the analyst. Some k-mer approach programs use the k-mer as a base, and extend both ends of each repeated k-mer until there is no more similarity between them, indicating the ends of the repeats. [57] Another group of algorithms employs a method called sequence self-comparison. Sequence self-comparison programs use databases such as AB-BLAST to conduct an initial sequence alignment. As these programs find groups of elements that partially overlap, they are useful for finding highly diverged transposons, or transposons with only a small region copied into other parts of the genome. [58] Another group of algorithms follows the periodicity approach. These algorithms perform a Fourier transformation on the sequence data, identifying periodicities, regions that are repeated periodically, and are able to use peaks in the resultant spectrum to find candidate repetitive elements. This method works best for tandem repeats, but can be used for dispersed repeats as well. However, it is a slow process, making it an unlikely choice for genome scale analysis. [57]

            The second step of de novo repeat identification involves building a consensus of each family of sequences. A consensus sequence is a sequence that is created based on the repeats that comprise a TE family. A base pair in a consensus is the one that occurred most often in the sequences being compared to make the consensus. For example, in a family of 50 repeats where 42 have a T base pair in the same position, the consensus sequence would have a T at this position as well, as the base pair is representative of the family as a whole at that particular position, and is most likely the base pair found in the family's ancestor at that position. [57] Once a consensus sequence has been made for each family, it is then possible to move on to further analysis, such as TE classification and genome masking in order to quantify the overall TE content of the genome.

            Transposable elements have been recognized as good candidates for stimulating gene adaptation, through their ability to regulate the expression levels of nearby genes. [59] Combined with their "mobility", transposable elements can be relocated adjacent to their targeted genes, and control the expression levels of the gene, dependent upon the circumstances.

            The study conducted in 2008, "High Rate of Recent Transposable Element–Induced Adaptation in Drosophila melanogaster", used D. melanogaster that had recently migrated from Africa to other parts of the world, as a basis for studying adaptations caused by transposable elements. Although most of the TEs were located on introns, the experiment showed the significant difference on gene expressions between the population in Africa and other parts of the world. The four TEs that caused the selective sweep were more prevalent in D. melanogaster from temperate climates, leading the researchers to conclude that the selective pressures of the climate prompted genetic adaptation. [60] From this experiment, it has been confirmed that adaptive TEs are prevalent in nature, by enabling organisms to adapt gene expression as a result of new selective pressures.

            However, not all effects of adaptive TEs are beneficial to the population. In the research conducted in 2009, "A Recent Adaptive Transposable Element Insertion Near Highly Conserved Developmental Loci in Drosophila melanogaster", a TE, inserted between Jheh 2 and Jheh 3, revealed a downgrade in the expression level of both of the genes. Down regulation of such genes has caused Drosófila to exhibit extended developmental time and reduced egg to adult viability. Although this adaptation was observed in high frequency in all non-African populations, it was not fixed in any of them. [61] This is not hard to believe, since it is logical for a population to favor higher egg to adult viability, therefore trying to purge the trait caused by this specific TE adaptation.

            At the same time, there have been several reports showing the advantageous adaptation caused by TEs. In the research done with silkworms, "An Adaptive Transposable Element insertion in the Regulatory Region of the EO Gene in the Domesticated Silkworm", a TE insertion was observed in the cis-regulatory region of the EO gene, which regulates molting hormone 20E, and enhanced expression was recorded. While populations without the TE insert are often unable to effectively regulate hormone 20E under starvation conditions, those with the insert had a more stable development, which resulted in higher developmental uniformity. [63]

            These three experiments all demonstrated different ways in which TE insertions can be advantageous or disadvantageous, through means of regulating the expression level of adjacent genes. The field of adaptive TE research is still under development and more findings can be expected in the future.

            Recent studies have confirmed that TEs can contribute to the generation of transcription factors. However, how this process of contribution can have an impact on the participation of genome control networks. TEs are more common in many regions of the DNA and it makes up 45% of total human DNA. Also, TEs contributed to 16% of transcription factor binding sites. A larger number of motifs are also found in non-TE-derived DNA, and the number is larger than TE-derived DNA. All these factors correlate to the direct participation of TEs in many ways of gene control networks. [64]


            Referências

            Morris, K. V. & Mattick, J. S. The rise of regulatory RNA. Nat. Rev. Genet. 15, 423–437 (2014).

            Santos-Pereira, J. M. & Aguilera, A. R loops: new modulators of genome dynamics and function. Nat. Rev. Genet. 16, 583–597 (2015).

            Garcia-Muse, T. & Aguilera, A. R. Loops: from physiological to pathological roles. Célula 179, 604–618 (2019).

            Sollier, J. & Cimprich, K. A. Breaking bad: R-loops and genome integrity. Trends Cell Biol. 25, 514–522 (2015).

            Crossley, M. P., Bocek, M. & Cimprich, K. A. R-loops as cellular regulators and genomic threats. Mol. Célula 73, 398–411 (2019).

            Aguilera, A. & Garcia-Muse, T. R loops: from transcription byproducts to threats to genome stability. Mol. Célula 46, 115–124 (2012).

            Hamperl, S. & Cimprich, K. A. Conflict resolution in the genome: how transcription and replication make it work. Célula 167, 1455–1467 (2016).

            Lang, K. S. et al. Replication–transcription conflicts generate R-loops that orchestrate bacterial stress survival and pathogenesis. Célula 170, 787–799.e18 (2017).

            Hamperl, S., Bocek, M. J., Saldivar, J. C., Swigut, T. & Cimprich, K. A. Transcription–replication conflict orientation modulates R-loop levels and activates distinct DNA damage responses. Célula 170, 774–786.e19 (2017).

            Huertas, P. & Aguilera, A. Cotranscriptionally formed DNA:RNA hybrids mediate transcription elongation impairment and transcription-associated recombination. Mol. Célula 12, 711–721 (2003).

            Cristini, A. et al. Dual processing of R-loops and topoisomerase I induces transcription-dependent DNA double-strand breaks. Cell Rep. 28, 3167–3181.e6 (2019).

            Sanz, L. A. et al. Prevalent, dynamic, and conserved R-loop structures associate with specific epigenomic signatures in mammals. Mol. Célula 63, 167–178 (2016).

            Belotserkovskii, B. P., Tornaletti, S., D'Souza, A. D. & Hanawalt, P. C. R-loop generation during transcription: formation, processing and cellular outcomes. Reparo de DNA 71, 69–81 (2018).

            Freudenreich, C. H. R-loops: targets for nuclease cleavage and repeat instability. Curr. Genet. 64, 789–794 (2018).

            Richard, P. & Manley, J. L. R loops and links to human disease. J. Mol. Biol. 429, 3168–3180 (2017).

            Skourti-Stathaki, K. & Proudfoot, N. J. A double-edged sword: R loops as threats to genome integrity and powerful regulators of gene expression. Genes Dev. 28, 1384–1396 (2014).

            Costantino, L. & Koshland, D. The Yin and Yang of R-loop biology. Curr. Opiniões Cell Biol. 34, 39–45 (2015).

            Aguilera, A. & Gomez-Gonzalez, B. DNA–RNA hybrids: the risks of DNA breakage during transcription. Nat. Struct. Mol. Biol. 24, 439–443 (2017).

            Stodola, J. L. & Burgers, P. M. Mechanism of lagging-strand DNA replication in eukaryotes. Adv. Exp. Med. Biol. 1042, 117–133 (2017).

            Burgers, P. M. Solution to the 50-year-old Okazaki-fragment problem. Proc. Natl Acad. Sci. EUA 116, 3358–3360 (2019).

            Sugino, A., Hirose, S. & Okazaki, R. RNA-linked nascent DNA fragments in Escherichia coli. Proc. Natl Acad. Sci. EUA 69, 1863–1867 (1972).

            Greider, C. W. & Blackburn, E. H. A telomeric sequence in the RNA of Tetrahymena telomerase required for telomere repeat synthesis. Natureza 337, 331–337 (1989).

            Williams, J. S. & Kunkel, T. A. Ribonucleotides in DNA: origins, repair and consequences. Reparo de DNA 19, 27–37 (2014).

            Lujan, S. A., Williams, J. S., Clausen, A. R., Clark, A. B. & Kunkel, T. A. Ribonucleotides are signals for mismatch repair of leading-strand replication errors. Mol. Célula 50, 437–443 (2013).

            Ghodgaonkar, M. M. et al. Ribonucleotides misincorporated into DNA act as strand-discrimination signals in eukaryotic mismatch repair. Mol. Célula 50, 323–332 (2013).

            Pryor, J. M. et al. Ribonucleotide incorporation enables repair of chromosome breaks by nonhomologous end joining. Ciência 361, 1126–1129 (2018).

            Nick McElhinny, S. A. et al. Abundant ribonucleotide incorporation into DNA by yeast replicative polymerases. Proc. Natl Acad. Sci. EUA 107, 4949–4954 (2010).

            Westover, K. D., Bushnell, D. A. & Kornberg, R. D. Structural basis of transcription: nucleotide selection by rotation in the RNA polymerase II active center. Célula 119, 481–489 (2004).

            Chen, L. et al. R-ChIP using inactive RNase H reveals dynamic coupling of R-loops with transcriptional pausing at gene promoters. Mol. Célula 68, 745–757.e5 (2017).

            Wahba, L., Gore, S. K. & Koshland, D. The homologous recombination machinery modulates the formation of RNA–DNA hybrids and associated chromosome instability. eLife 2, e00505 (2013).

            Boguslawski, S. J. et al. Characterization of monoclonal antibody to DNA.RNA and its application to immunodetection of hybrids. J. Immunolo. Métodos 89, 123–130 (1986).

            Ginno, P. A., Lott, P. L., Christensen, H. C., Korf, I. & Chedin, F. R-loop formation is a distinctive characteristic of unmethylated human CpG island promoters. Mol. Célula 45, 814–825 (2012).

            Bhatia, V. et al. BRCA2 prevents R-loop accumulation and associates with TREX-2 mRNA export factor PCID2. Natureza 511, 362–365 (2014).

            Vanoosthuyse, V. Strengths and weaknesses of the current strategies to map and characterize R-loops. RNA não codificador 4, 9 (2018).

            Wahba, L., Amon, J. D., Koshland, D. & Vuica-Ross, M. RNase H and multiple RNA biogenesis factors cooperate to prevent RNA:DNA hybrids from generating genome instability. Mol. Célula 44, 978–988 (2011).

            Chan, Y. A. et al. Genome-wide profiling of yeast DNA:RNA hybrid prone sites with DRIP-chip. PLOS Genet. 10, e1004288 (2014).

            Wahba, L., Costantino, L., Tan, F. J., Zimmer, A. & Koshland, D. S1-DRIP-seq identifies high expression and polyA tracts as major contributors to R-loop formation. Genes Dev. 30, 1327–1338 (2016).

            El Hage, A., Webb, S., Kerr, A. & Tollervey, D. Genome-wide distribution of RNA–DNA hybrids identifies RNase H targets in tRNA genes, retrotransposons and mitochondria. PLOS Genet. 10, e1004716 (2014).

            Xu, W. et al. The R-loop is a common chromatin feature of the Arabidopsis genome. Nat. Plantas 3, 704–714 (2017).

            Arora, R. et al. RNaseH1 regulates TERRA–telomeric DNA hybrids and telomere maintenance in ALT tumour cells. Nat. Comum. 5, 5220 (2014).

            Nadel, J. et al. RNA:DNA hybrids in the human genome have distinctive nucleotide characteristics, chromatin composition, and transcriptional relationships. Epigenetics Chromatin 8, 46 (2015).

            Ginno, P. A., Lim, Y. W., Lott, P. L., Korf, I. & Chedin, F. GC skew at the 5’ and 3’ ends of human genes links R-loop formation to epigenetic regulation and transcription termination. Genome Res. 23, 1590–1600 (2013).

            Dumelie, J. G. & Jaffrey, S. R. Defining the location of promoter-associated R-loops at near-nucleotide resolution using bisDRIP-seq. eLife 6, e28306 (2017).

            Ratmeyer, L., Vinayak, R., Zhong, Y. Y., Zon, G. & Wilson, W. D. Sequence specific thermodynamic and structural properties for DNA.RNA duplexes. Bioquímica 33, 5298–5304 (1994).

            Roberts, R. W. & Crothers, D. M. Stability and properties of double and triple helices: dramatic effects of RNA or DNA backbone composition. Ciência 258, 1463–1466 (1992).

            De Magis, A. et al. DNA damage and genome instability by G-quadruplex ligands are mediated by R loops in human cancer cells. Proc. Natl Acad. Sci. EUA 116, 816–825 (2019).

            Carrasco-Salas, Y. et al. The extruded non-template strand determines the architecture of R-loops. Nucleic Acids Res. 47, 6783–6795 (2019).

            Skourti-Stathaki, K., Proudfoot, N. J. & Gromak, N. Human senataxin resolves RNA/DNA hybrids formed at transcriptional pause sites to promote Xrn2-dependent termination. Mol. Célula 42, 794–805 (2011).

            Zhao, D. Y. et al. SMN and symmetric arginine dimethylation of RNA polymerase II C-terminal domain control termination. Natureza 529, 48–53 (2016).

            Wiedenheft, B., Sternberg, S. H. & Doudna, J. A. RNA-guided genetic silencing systems in bacteria and archaea. Natureza 482, 331–338 (2012).

            Horvath, P. & Barrangou, R. CRISPR/Cas, the immune system of bacteria and archaea. Ciência 327, 167–170 (2010).

            Knott, G. J. & Doudna, J. A. CRISPR–Cas guides the future of genetic engineering. Ciência 361, 866–869 (2018).

            Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Ciência 337, 816–821 (2012).

            Yu, K., Chedin, F., Hsieh, C. L., Wilson, T. E. & Lieber, M. R. R-loops at immunoglobulin class switch regions in the chromosomes of stimulated B cells. Nat. Immunol. 4, 442–451 (2003).

            Reaban, M. E. & Griffin, J. A. Induction of RNA-stabilized DNA conformers by transcription of an immunoglobulin switch region. Natureza 348, 342–344 (1990).

            Chaudhuri, J. et al. Transcription-targeted DNA deamination by the AID antibody diversification enzyme. Natureza 422, 726–730 (2003).

            Briggs, E., Crouch, K., Lemgruber, L., Lapsley, C. & McCulloch, R. Ribonuclease H1-targeted R-loops in surface antigen gene expression sites can direct trypanosome immune evasion. PLOS Genet. 14, e1007729 (2018).

            El Hage, A., French, S. L., Beyer, A. L. & Tollervey, D. Loss of Topoisomerase I leads to R-loop-mediated transcriptional blocks during ribosomal RNA synthesis. Genes Dev. 24, 1546–1558 (2010).

            Sun, Q., Csorba, T., Skourti-Stathaki, K., Proudfoot, N. J. & Dean, C. R-loop stabilization represses antisense transcription at the Arabidopsis FLC locus. Ciência 340, 619–621 (2013).

            Conn, V. M. et al. A circRNA from SEPALLATA3 regulates splicing of its cognate mRNA through R-loop formation. Nat. Plantas 3, 17053 (2017).

            Powell, W. T. et al. R-loop formation at Snord116 mediates topotecan inhibition of Ube3a-antisense and allele-specific chromatin decondensation. Proc. Natl Acad. Sci. EUA 110, 13938–13943 (2013).

            Nakama, M., Kawakami, K., Kajitani, T., Urano, T. & Murakami, Y. DNA–RNA hybrid formation mediates RNAi-directed heterochromatin formation. Genes Cell 17, 218–233 (2012).

            Groh, M., Lufino, M. M., Wade-Martins, R. & Gromak, N. R-loops associated with triplet repeat expansions promote gene silencing in Friedreich ataxia and fragile X syndrome. PLOS Genet. 10, e1004318 (2014).

            Skourti-Stathaki, K., Kamieniarz-Gdula, K. & Proudfoot, N. J. R-loops induce repressive chromatin marks over mammalian gene terminators. Natureza 516, 436–439 (2014).

            Castellano-Pozo, M. et al. R loops are linked to histone H3 S10 phosphorylation and chromatin condensation. Mol. Célula 52, 583–590 (2013).

            Beckedorff, F. C. et al. The intronic long noncoding RNA ANRASSF1 recruits PRC2 to the RASSF1A promoter, reducing the expression of RASSF1A and increasing cell proliferation. PLOS Genet. 9, e1003705 (2013).

            Boque-Sastre, R. et al. Head-to-head antisense transcription and R-loop formation promotes transcriptional activation. Proc. Natl Acad. Sci. EUA 112, 5785–5790 (2015).

            Cloutier, S. C. et al. Regulated formation of lncRNA–DNA hybrids enables faster transcriptional induction and environmental adaptation. Mol. Célula 61, 393–404 (2016).

            Gibbons, H. R. et al. Divergent lncRNA GATA3–AS1 regulates GATA3 transcription in T-helper 2. Cells. Frente. Immunol. 9, 2512 (2018).

            Tan-Wong, S. M., Dhir, S. & Proudfoot, N. J. R-loops promote antisense transcription across the mammalian genome. Mol. Célula 76, 600–616.e6 (2019).

            Arab, K. et al. GADD45A binds R-loops and recruits TET1 to CpG island promoters. Nat. Genet. 51, 217–223 (2019).

            Grunseich, C. et al. Senataxin mutation reveals how R-loops promote transcription by blocking DNA methylation at gene promoters. Mol. Célula 69, 426–437 (2018).

            Chen, P. B., Chen, H. V., Acharya, D., Rando, O. J. & Fazzio, T. G. R loops regulate promoter-proximal chromatin architecture and cellular differentiation. Nat. Struct. Mol. Biol. 22, 999–1007 (2015).

            Skourti-Stathaki, K. et al. R-loops enhance polycomb repression at a subset of developmental regulator genes. Mol. Célula 73, 930–945 (2019).

            Cristini, A., Groh, M., Kristiansen, M. S. & Gromak, N. RNA/DNA hybrid interactome identifies DXH9 as a molecular player in transcriptional termination and R-loop-associated DNA damage. Cell Rep. 23, 1891–1905 (2018).

            Wang, I. X. et al. Human proteins that interact with RNA/DNA hybrids. Genome Res. 28, 1405–1414 (2018).

            Nguyen, H. D. et al. Functions of replication protein A as a sensor of R loops and a regulator of RNaseH1. Mol. Célula 65, 832–847.e4 (2017).

            Yuan, W. et al. ALBA protein complex reads genic R-loops to maintain genome stability in Arabidopsis. Sci. Adv. 5, eaav9040 (2019).

            Arab, K. et al. Long noncoding RNA TARID directs demethylation and activation of the tumor suppressor TCF21 via GADD45A. Mol. Célula 55, 604–614 (2014).

            Kienhofer, S. et al. GADD45a physically and functionally interacts with TET1. Differentiation 90, 59–68 (2015).

            Li, Z. et al. Gadd45a promotes DNA demethylation through TDG. Nucleic Acids Res. 43, 3986–3997 (2015).

            Proudfoot, N. J. Transcriptional termination in mammals: stopping the RNA polymerase II juggernaut. Ciência 352, aad9926 (2016).

            Kireeva, M. L., Komissarova, N. & Kashlev, M. Overextended RNA:DNA hybrid as a negative regulator of RNA polymerase II processivity. J. Mol. Biol. 299, 325–335 (2000).

            Belotserkovskii, B. P. et al. Mechanisms and implications of transcription blockage by guanine-rich DNA sequences. Proc. Natl Acad. Sci. EUA 107, 12816–12821 (2010).

            Yang, X. et al. m 6 A promotes R-loop formation to facilitate transcription termination. Cell Res. 29, 1035–1038 (2019).

            Abakir, A. et al. N 6 -methyladenosine regulates the stability of RNA:DNA hybrids in human cells. Nat. Genet. 52, 48–55 (2019).

            Morales, J. C. et al. XRN2 links transcription termination to DNA damage and replication stress. PLOS Genet. 12, e1006107 (2016).

            Mersaoui, S. Y. et al. Arginine methylation of the DDX5 helicase RGG/RG motif by PRMT5 regulates resolution of RNA:DNA hybrids. EMBO J. 38, e100986 (2019).

            Rivosecchi, J. et al. Senataxin homologue Sen1 is required for efficient termination of RNA polymerase III transcription. EMBO J. 38, e101955 (2019).

            Li, X. & Manley, J. L. Inactivation of the SR protein splicing factor ASF/SF2 results in genomic instability. Célula 122, 365–378 (2005).

            Stirling, P. C. et al. R-loop-mediated genome instability in mRNA cleavage and polyadenylation mutants. Genes Dev. 26, 163–175 (2012).

            Costantino, L. & Koshland, D. Genome-wide map of R-loop-induced damage reveals how a subset of R-loops contributes to genomic instability. Mol. Célula 71, 487–497.e3 (2018).

            Mischo, H. E. et al. Yeast Sen1 helicase protects the genome from transcription-associated instability. Mol. Célula 41, 21–32 (2011).

            Pankotai, T., Bonhomme, C., Chen, D. & Soutoglou, E. DNAPKcs-dependent arrest of RNA polymerase II transcription in the presence of DNA breaks. Nat. Struct. Mol. Biol. 19, 276–282 (2012).

            Awwad, S. W., Abu-Zhayia, E. R., Guttmann-Raviv, N. & Ayoub, N. NELF-E is recruited to DNA double-strand break sites to promote transcriptional repression and repair. EMBO Rep. 18, 745–764 (2017).

            Shanbhag, N. M., Rafalska-Metcalf, I. U., Balane-Bolivar, C., Janicki, S. M. & Greenberg, R. A. ATM-dependent chromatin changes silence transcription in cis to DNA double-strand breaks. Célula 141, 970–981 (2010).

            Gong, F., Clouaire, T., Aguirrebengoa, M., Legube, G. & Miller, K. M. Histone demethylase KDM5A regulates the ZMYND8-NuRD chromatin remodeler to promote DNA repair. J. Cell Biol. 216, 1959–1974 (2017).

            Savitsky, P. et al. Multivalent histone and DNA engagement by a PHD/BRD/PWWP triple reader cassette recruits ZMYND8 to K14ac-rich chromatin. Cell Rep. 17, 2724–2737 (2016).

            Rona, G. et al. PARP1-dependent recruitment of the FBXL10–RNF68–RNF2 ubiquitin ligase to sites of DNA damage controls H2A.Z loading. eLife 7, e38771 (2018).

            Campbell, S., Ismail, I. H., Young, L. C., Poirier, G. G. & Hendzel, M. J. Polycomb repressive complex 2 contributes to DNA double-strand break repair. Ciclo de célula 12, 2675–2683 (2013).

            Ginjala, V. et al. BMI1 is recruited to DNA breaks and contributes to DNA damage-induced H2A ubiquitination and repair. Mol. Célula. Biol. 31, 1972–1982 (2011).

            Ismail, I. H., Andrin, C., McDonald, D. & Hendzel, M. J. BMI1-mediated histone ubiquitylation promotes DNA double-strand break repair. J. Cell Biol. 191, 45–60 (2010).

            Yasuhara, T. et al. Human Rad52 promotes XPG-mediated R-loop processing to initiate transcription-associated homologous recombination repair. Célula 175, 558–570.e11 (2018).

            Teng, Y. et al. ROS-induced R loops trigger a transcription-coupled but BRCA1/2-independent homologous recombination pathway through CSB. Nat. Comum. 9, 4115 (2018).

            Ohle, C. et al. Transient RNA–DNA hybrids are required for efficient double-strand break repair. Célula 167, 1001–1013.e7 (2016).

            Li, L. et al. DEAD Box 1 facilitates removal of RNA and homologous recombination at DNA double-strand breaks. Mol. Célula. Biol. 36, 2794–2810 (2016).

            Cohen, S. et al. Senataxin resolves RNA:DNA hybrids forming at DNA double-strand breaks to prevent translocations. Nat. Comum. 9, 533 (2018).

            D’Alessandro, G. et al. BRCA2 controls DNA:RNA hybrid level at DSBs by mediating RNase H2 recruitment. Nat. Comum. 9, 5376 (2018).

            Allison, D. F. & Wang, G. G. R-loops: formation, function, and relevance to cell stress. Cell Stress 3, 38–46 (2019).

            Michelini, F. et al. Damage-induced lncRNAs control the DNA damage response through interaction with DDRNAs at individual double-strand breaks. Nat. Cell Biol. 19, 1400–1411 (2017).

            Puget, N., Miller, K. M. & Legube, G. Non-canonical DNA/RNA structures during transcription-coupled double-strand break repair: roadblocks or bona fide repair intermediates? Reparo de DNA 81, 102661 (2019).

            Zhao, H., Zhu, M., Limbo, O. & Russell, P. RNase H eliminates R-loops that disrupt DNA replication but is nonessential for efficient DSB repair. EMBO Rep. 19, e45335 (2018).

            Britton, S. et al. DNA damage triggers SAF-A and RNA biogenesis factors exclusion from chromatin coupled to R-loops removal. Nucleic Acids Res. 42, 9047–9062 (2014).

            Balk, B. et al. Telomeric RNA–DNA hybrids affect telomere-length dynamics and senescence. Nat. Struct. Mol. Biol. 20, 1199–1205 (2013).

            Arora, R. & Azzalin, C. M. Telomere elongation chooses TERRA ALTernatives. RNA Biol. 12, 938–941 (2015).

            Pfeiffer, V., Crittin, J., Grolimund, L. & Lingner, J. The THO complex component Thp2 counteracts telomeric R-loops and telomere shortening. EMBO J. 32, 2861–2871 (2013).

            Rippe, K. & Luke, B. TERRA and the state of the telomere. Nat. Struct. Mol. Biol. 22, 853–858 (2015).

            Graf, M. et al. Telomere length determines TERRA and R-loop regulation through the cell cycle. Célula 170, 72–85.e14 (2017).

            Porro, A., Feuerhahn, S., Reichenbach, P. & Lingner, J. Molecular dissection of telomeric repeat-containing RNA biogenesis unveils the presence of distinct and multiple regulatory pathways. Mol. Célula. Biol. 30, 4808–4817 (2010).

            Cusanelli, E., Romero, C. A. & Chartrand, P. Telomeric noncoding RNA TERRA is induced by telomere shortening to nucleate telomerase molecules at short telomeres. Mol. Célula 51, 780–791 (2013).

            Garcia-Rubio, M. et al. Yra1-bound RNA–DNA hybrids cause orientation-independent transcription–replication collisions and telomere instability. Genes Dev. 32, 965–977 (2018).

            Kabeche, L., Nguyen, H. D., Buisson, R. & Zou, L. A mitosis-specific and R loop-driven ATR pathway promotes faithful chromosome segregation. Ciência 359, 108–114 (2018).

            Chen, C. F., Pohl, T. J., Chan, A., Slocum, J. S. & Zakian, V. A. Saccharomyces cerevisiae centromere RNA is negatively regulated by Cbf1 and its unscheduled synthesis impacts CenH3 binding. Genética 213, 465–479 (2019).

            Verdun, R. E. & Karlseder, J. The DNA damage machinery and homologous recombination pathway act consecutively to protect human telomeres. Célula 127, 709–720 (2006).

            Herrera-Moyano, E., Mergui, X., Garcia-Rubio, M. L., Barroso, S. & Aguilera, A. The yeast and human FACT chromatin-reorganizing complexes solve R-loop-mediated transcription–replication conflicts. Genes Dev. 28, 735–748 (2014).

            Lockhart, A. et al. RNase H1 and H2 are differentially regulated to process RNA–DNA hybrids. Cell Rep. 29, 2890–2900.e5 (2019).

            Xiao, Y. et al. Structure basis for directional R-loop formation and substrate handover mechanisms in type I CRISPR–Cas system. Célula 170, 48–60 (2017).

            Kasahara, M., Clikeman, J. A., Bates, D. B. & Kogoma, T. RecA protein-dependent R-loop formation in vitro. Genes Dev. 14, 360–365 (2000).

            Zaitsev, E. N. & Kowalczykowski, S. C. A novel pairing process promoted by Escherichia coli RecA protein: inverse DNA and RNA strand exchange. Genes Dev. 14, 740–749 (2000).

            Stolz, R. et al. Interplay between DNA sequence and negative superhelicity drives R-loop structures. Proc. Natl Acad. Sci. EUA 116, 6260–6269 (2019).

            Kuznetsov, V. A., Bondarenko, V., Wongsurawat, T., Yenamandra, S. P. & Jenjaroenpun, P. Toward predictive R-loop computational biology: genome-scale prediction of R-loops reveals their association with complex promoter structures, G-quadruplexes and transcriptionally active enhancers. Nucleic Acids Res. 46, 7566–7585 (2018).


            Reconhecimentos

            The authors are grateful to Monica Romero for help with the imaging in the LLUSM Advanced Imaging and Microscopy Core with support of NSF Grant MRI-DBI 0923559 and the Loma Linda University School of Medicine.

            Financiamento

            This work was supported by the Ministry of Science and Technology of China (2015CB964902, 2013CB966902, and 2012CB966601), the National Natural Science Foundation of China (81500148, 81570164, and 81421002), the Loma Linda University School of Medicine GCAT grant (2015), and Telemedicine and Advanced Technology Research Center (W81XWH-08-1-0697).

            Disponibilidade de dados e materiais

            Authors’ contributions

            XBZ conceived of and supervised the study. JPZ, XLL, GHL, WC, CA, LZ, WW, YWF, JX, and XBZ conducted the experiments. JPZ, XLL, DB, GDB, WY, TC, and XBZ analyzed the results. JPZ, XLL, TC, and XBZ wrote the paper. All authors reviewed the manuscript. Todos os autores leram e aprovaram o manuscrito final.

            Interesses competitivos

            Os autores declaram não ter interesses conflitantes.

            Ethics approval and consent to participate

            This study did not require ethics approval.


            Knock-in By Numbers

            Researcher: Greg Findlay, MD/PhD candidate in the lab of Jay Shendure, University of Washington

            Project: Findlay and his colleagues were aiming to improve how clinicians interpret mutations in the breast and ovarian cancer gene BRCA1. That gene has thousands of variants, but researchers don’t know how most of them affect its function. To study the impact of these variants, they used a knock-in technique they developed called saturation genome editing (Natureza, 562:217–22, 2018).

            In an immortalized haploid human cell line, they used CRISPR-Cas9 to knock in 4,000 tiny variants in millions of cells at once in vitro. The genome is cut at the same spot in each cell, but each cell’s genome receives a different variant. To promote HDR, they also knocked out the ligase4 gene, disabling the NHEJ repair pathway—a step that yielded a threefold gain in efficiency, Findlay says. Finally, since all the cells’ knock-ins are different, they sequenced the cells deeply, covering the same genomic region millions of times, to make sure they actually knocked in the 4,000 variants they wanted to study. They sequenced at two time points, and deduced that the knock-ins that didn’t come up in the sequencing at the second time point were ones that interfered with the gene’s function, because the cells carrying them must have died.

            Try It: Findlay’s team had the DNA oligos for the 4,000 variants manufactured for them on a microarray. You can buy arrays of 6,000 to 250,000 oligos, so consider getting more bang for your buck by combining multiple experiments on the same array, says Findlay. Their lab pays about $5,000 for 100,000 oligos.

            This strategy comes with limitations: it has so far only been used to knock in single-nucleotide variants, and all the edits need to be in the same gene. The method works best when editing a fairly narrow region of DNA, about 110–120 base pairs, because longer DNA oligos would have too many errors, Findlay says. It’s also important to sequence very deeply to make sure that you account for the full number of variants you intended to knock in.