Em formação

Por que a desaminação na fita retardada leva a um aumento no número relativo de guanina e timina em relação à citosina e adenina?


Minha pergunta surgiu a partir deste artigo na Wikipedia sobre o GC-skew em genomas bacterianos: https://en.wikipedia.org/wiki/GC_skew Pelo que eu entendi, a fita atrasada (a fita modelo), durante a replicação, é mais frequentemente de fita única do que a fita principal (molde), por isso é mais sujeito a mutações como desaminação. Portanto, na fita atrasada (aqui, aquele que é o modelo para a fita formada pelos fragmentos de Okazaki), deve-se esperar mais Ts e menos Cs. Por outro lado, a fita sintetizada por fragmentos de Okazaki deve ter um enriquecimento de As e uma depleção de Gs. Por que o artigo da Wikipedia menciona um aumento na proporção de (G + T) / (C + A)? Eu esperaria um aumento na razão de (T) / (C). Não recebo o link com Gs e As.


Acho que você está se referindo a esta frase do seu link da wikipedia:

Há uma riqueza de guanina em relação à citosina e timina em relação à adenina na fita principal e vice-versa na fita retardada.

Observe que isso não está dizendo (G + T)> (C + A). Em vez disso, está dizendo (G)> (C) e (T)> (A). Eu acho que isso não é o mesmo que dizer (G + T)> (C + A), embora isso também seja verdade, provavelmente?

Então eu acho que não há contradição nisso - é apenas, como você diz, mais Ts (em relação à igualdade esperada com As) e menos Cs (em relação à igualdade esperada com Gs).

Se bem entendi, a importância da distorção GC, e a razão pela qual é interessante, é que ela atua como um desvio das regras de paridade de Chargaff (conforme explicado no artigo). Essas regras estabelecem que, para qualquer dado pedaço de DNA, (G) ~ (C) e (T) ~ (A), que é a composição esperada para (por exemplo) DNA de fita dupla, por causa do par de bases.

Edit: para obter mais informações sobre as regras de Chargaff, consulte esta outra pergunta que (por pura coincidência) respondi aqui. Observe que a segunda "regra" de paridade é uma fenômeno estatístico, ao invés de uma regra logicamente necessária. A página da Wikipedia sobre as regras de Chargaff também é informativa.

Espero que ajude.


DNA para o MCAT: tudo o que você precisa saber

(Observação: este guia faz parte de nossa série de bioquímica MCAT.)

Parte 1: Introdução

Parte 2: Estrutura do DNA

a) Bases nitrogênicas

b) Estrutura de fosfato

c) conteúdo G-C

d) síntese de DNA

Parte 3: O Dogma Central

a) Transcrição

b) Tradução

c) Exceções ao dogma central

Parte 4: Epigenética e impressão

a) Estrutura e função da histona

b) X inativação

Parte 5: Distúrbios e cânceres

a) Oncogenes e genes supressores de tumor

b) Defeitos cromossômicos

Parte 6: Termos de alto rendimento

Parte 7: perguntas e respostas baseadas em passagens

Parte 8: perguntas e respostas independentes


B. O que causa danos ao DNA

O DNA está mais exposto e, portanto, mais vulnerável a danos, especialmente em eucariotos. O dano mais simples ao DNA durante a replicação é a mutação pontual, a inserção acidental de um nucleotídeo & lsquowrong & rsquo em uma fita de DNA em crescimento. Outras mutações, igualmente acidentais, incluem deleções, duplicações, inversões, etc. de DNA, qualquer uma das quais pode escapar do reparo. As causas do dano ao DNA podem ser químicas ou físicas e incluem eventos intracelulares espontâneos (por exemplo, reações oxidativas) e fatores ambientais (radiação, produtos químicos exógenos, etc.). Com base em estudos de diferentes tipos de danos ao DNA, Thomas Lindahl estimou que eventos que causam danos ao DNA podem estar ocorrendo a uma taxa de 10.000 por dia! Lindahl percebeu que deve haver alguns "mecanismos de reparo de DNAquofundamentais" em ação para proteger as células contra uma taxa tão alta de danos ao DNA. A descoberta do reparo de excisão de base mecanismo rendeu a Thomas Lindahl uma participação no Prêmio Nobel de Química de 2015. Os fatores ambientais que podem danificar o DNA incluem luz ultravioleta, raios-X e outras radiações, bem como produtos químicos (por exemplo, toxinas, carcinógenos e até mesmo drogas, etc.). Tanto a linha germinativa quanto as células somáticas podem ser afetadas. Embora as mutações possam causar e de fato causem doenças frequentemente debilitantes, é instrutivo manter o impacto das mutações em perspectiva. A maioria das mutações são na verdade silencioso eles não causam doenças. Além disso, muitos danos ao DNA são reparados. As células corrigem mais de 99,9% das alterações de base equivocadas antes de terem a chance de se tornarem mutações. É por isso que pensamos na replicação como um processo & ldquofaithful & rdquo. Vejamos alguns tipos comuns de danos ao DNA que geralmente são reparados:

  • Dímeros de pirimidina, típico de timas adjacentes (menos frequentemente citosinas) em uma única fita de DNA, causada pela exposição aos raios ultravioleta
  • Depurinação a hidrolítico remoção de guanina ou adenina do # 1 C (carbono) de desoxirribose em uma fita de DNA
  • Desaminação: remoção hidrolítica de grupos amino (-NH2) da guanina (mais comum), citosina ou adenina
  • Dano oxidativo de desoxirribose com qualquer base, mas mais comumente purinas
  • Inapropriado metilação de qualquer base, mas mais comumente purinas
  • Quebra de fita de DNA durante a replicação ou de radiação ou exposição química

Resultados e discussão

Metodologia

Para determinar a taxa de formação e desaminação de C e m C em dímeros de cis-sin ciclobutano, desenvolvemos um ensaio que tira vantagem da especificidade de E. coli fotoliase para reverter esta classe de fotoproduto. A ideia era marcar com 32 P o C ou m C de interesse e, após fotodimerização e desaminação, degradar especificamente o fotodímero cis-syn junto com o DNA não danificado em mononucleotídeos com E. coli fotoliase e nuclease P1 (Fig. 2). A extensão da desaminação pode então ser quantificada por análise da quantidade de nucleotídeo marcado com 32 P desaminado em não desaminado por eletroforese em gel (Fig. 3). Para garantir que o substrato estava na forma duplex e para minimizar os efeitos finais na desaminação, projetamos um 42-mer, contendo duas pirimidinas localizadas centralmente (X & # x00026 Y) flanqueadas por bases variáveis ​​de interesse (N & # x00026 M) ( Tabela 1 ). As outras bases na vizinhança imediata (n) foram escolhidas para minimizar a formação de estrutura secundária indesejada na fita simples que pode resultar da escolha de N, X, Y e M.

Esquema para preparação de substrato e análise da taxa de desaminação de dímeros de ciclobutano contendo mC em DNA duplex. 1) 21-mer marcado com 5'- 32P com um mC terminal é ligado ao segundo ODN 21-mer na presença de uma estrutura de ligação de 20 nt. 2) O produto de ligação de 42-mer de fita simples é separado dos produtos não ligados por eletroforese em gel desnaturante. 3) O substrato de fita dupla é preparado por recozimento do substrato 42-mer radiomarcado com o ODN 42-mer complementar. 4) O duplex é irradiado com 302 nm em gelo para gerar o CPD. 5) O produto irradiado é desaminado várias vezes a 37 & # x000b0C. 6) A mistura de desaminação é tratada com fotoliase e luz para fotorevertir o CPD. 7) A nuclease P1 degrada o DNA não danificado e fotorevertido em mononucleotídeos. 8) A eletroforese de acrilamida bidimensional dos produtos de nuclease P1 separa o mC não desaminado de seu produto de desaminação T.

Eletroforese em gel 2D e análise da reação de desaminação. A) Gel de acrilamida 2D dos produtos de digestão da Nuclease P1 do duplex tGT = m CGtc que foi desaminado por 0, 59, 120, 171, 218, 330, 456, 536 min a 37 & # x000b0 C (Pistas 1 e # x020138, respectivamente) em Tris / Mes / HCl 10 mM pH 7,0 contendo NaCl aproximadamente 5 mM, e então fotorevertido. A pista 9 contém os produtos após 16 h de incubação a 67 & # x000b0C a pH 6,3. A primeira dimensão foi realizada no sentido descendente em 10% de acrilamida com ureia 7 M, tampão TBE para dar uma mistura não resolvida dos mononucleotídeos marcados com 32 P p m dC e pT que migram como uma única banda intensa mostrada na caixa. A segunda dimensão foi realizada no sentido ascendente em direção ao eletrodo positivo em 28% de acrilamida / citrato. A segunda dimensão separa pT (banda de migração mais rápida) de p m dC (banda de migração mais lenta). As bandas no meio (& # x0003c 5%) são devidas a produtos de digestão incompleta da nuclease P1 e trinucleotídeos contendo fotoprodutos não fotorevertíveis. B) Gráficos da fração dímero não desaminado vs tempo: dados para duplex tGT = CGtc em 0 mM adicionado NaCl (& # x025a1) mostrado no painel A, e em 400 mM adicionado NaCl (& # x025a0) e para duplex tAT m CAtc em 0 mM (& # x025ca), e 400 mM adicionado NaCl (& # x02666).

Tabela 1

Rendimento de fotoproduto de dímero de cis-sin ciclobutano e meia-vida de desaminação.

Para preparar o 42-mer marcado internamente, um ODN contendo um mC do terminal 5 & # x02019 foi marcado na extremidade com [& # x003b3- 32 P] e depois ligado a um segundo ODN usando uma estrutura de 20-mer. O produto ligado foi então separado do andaime de ligação por eletroforese em gel desnaturante na presença de um excesso de seis vezes de um ODN que era complementar ao andaime para garantir que obtivéssemos apenas a forma de fita simples do 42-mer. A forma duplex foi então preparada por emparelhamento do 42-mer marcado com 32P ao 42-mer complementar. A irradiação de fita simples ou duplex 42-mer foi realizada a 302 nm (luz UVB) durante uma hora a 4 & # x000b0C e pH 8,3 para minimizar a quantidade de desaminação. 14 Nessas condições, dímeros cis-syn, (6 & # x020134) fotoprodutos e seus isômeros Dewar são os produtos principais, enquanto os fotoprodutos trans-syn e TA * são muito menores. Após a irradiação, as amostras foram ajustadas para pH 7 e desaminadas a 37 & # x000b0C por tempos específicos e, em seguida, os dímeros cis-syn foram especificamente fotorevertidos com excesso de 100 vezes de E. coli fotoliase. 33

Após a fotorreversão, o DNA foi degradado em 5 & # x02019-mononucleotídeo fosfatos com nuclease P1 para gerar 32 p m C / C e 32 pT / U, que foram separados por um sistema de gel de acrilamida 2D (Fig. 3A). Todos os fotoprodutos de dipirimidina não fotorevertíveis são digeridos em trinucleotídeos, pPyPyN. 34 A nuclease P1 interferiu na migração dos nucleotídeos no gel de citrato e não pôde ser usada para separar 32 pmC/C e 32pT / U diretamente por uma única dimensão. Portanto, executamos um gel de acrilamida a 10% contendo TBE e uréia 7 M para separar 32 pm C / C e 32 pT / U como uma única banda intensa como uma primeira etapa de dimensão (mostrado no retângulo). Por causa da baixa porcentagem de acrilamida, esta banda também continha alguns produtos de di- e tri-nucleotídeos digeridos de forma incompleta, bem como trinucleotídeos contendo fotoprodutos, conforme discutido abaixo.

A segunda dimensão com tampão citrato 35 foi usada para separar 32 pT / U de 32 p m C / C, que aparecem como bandas distintas e reproduzíveis de alta e baixa mobilidade, respectivamente. Os oligonucleotídeos em um gel de citrato se movem principalmente de acordo com a composição da base e não são muito sensíveis ao tamanho, com a mobilidade eletroforética aumentando na ordem C & # x0003eA & # x0003e & # x0003eG & # x0003eT. Também foram observadas várias bandas intermediárias de quantidade variável (& # x0003c5%), que correspondem a dímeros, trímeros e possivelmente superiores de oligodesoxinucleotídeos, com composição de base variável que foram digeridas de forma incompleta pela nuclease P1. Experimentos de controle com DNA não irradiado sugeriram que os produtos digeridos incompletamente podem ter surgido de uma pequena fração de substrato marcado que estava em contato ruim com NP1 e porque cada ponto de tempo foi digerido separadamente, são de quantidade variável. Como o NP1 não pode discriminar entre DNA não danificado e DNA fotorevertido, o cálculo da porcentagem de produto desaminado não é afetado pela presença de produtos parcialmente digeridos.

Outro contribuinte para as bandas intermediárias são os trímeros resultantes da digestão de fotoprodutos de DNA não fotorevertíveis. Experimentos com e sem fotoreversal por fotoliase mostraram que o cis-syn fotoprodutos de trinucleotídeos contendo dímero também migraram com essas bandas, mas são completamente eliminados por condições fotoreversais usadas em nosso experimento. Outras experiências com T4 endo V para quantificar cis-syn dímeros em substrato marcado na extremidade 5 'também mostraram que, nas condições utilizadas, a fotoliase reverteu & # x0003e95% de TT e T m C cis-syn dímeros. Os produtos digeridos incompletamente e os fotoprodutos não reversíveis não interferem na quantificação da banda pT / U, pois muito pouco produto foi observado na posição desta banda no tempo de desaminação zero, e qualquer atividade de fundo neste ponto de tempo foi subtraída do outro pistas.

Para determinar a taxa de desaminação, o rendimento do fotodímero cis-syn foi primeiro determinado pelo aquecimento do DNA irradiado a 67 & # x000b0C a pH 6,3 por 16 h para desaminar completamente o dímero antes das etapas de fotoliase e nuclease P1 e calcular a proporção da banda pT / U para a banda pm C / C + pT / U. As meias-vidas foram obtidas a partir de um gráfico do logaritmo natural da fração do dímero não desaminado em função do tempo. A Fig. 3B mostra gráficos típicos dos dados de diferentes géis 2-D a partir dos quais as meias-vidas foram calculadas.

A desaminação de m C em T = m C é mais rápida do que em m C = T

Em nossos primeiros experimentos, comparamos as taxas de desaminação de 5-metil C dentro de dímeros m C = T e T = m C flanqueados por A & # x02019s ou G & # x02019s. Comparando a mesma base flanqueadora, o 3'-m C no dímero desamina cerca de 3 & # x020134 vezes mais rápido do que o 5'-m C tanto no DNA de fita simples quanto no duplex. (Tabela 1, Fig. 4). Isso contrasta com a desaminação de C nos dímeros cis-syn dos dinucleotídeos TpdC e dCpT, que têm meias-vidas semelhantes de 1,3 e 1,2 horas, respectivamente, a pH 7 a 50 & # x000b0C. 22 Isso sugeriu inicialmente que a desaminação mais lenta do 5'-m C se deve à interferência estérica da base 5'-flanqueadora, o que pode impedir o ataque da água em C4 de um 5'-C. Na estrutura cristalina de um dímero de timina cis-syn flanqueado por A's (Fig. 5 A & # x00026 B) 36, a base de flanco 3 'é movida muito para o lado e não representaria o mesmo grau de interferência estérica para o ataque de água em C4 de 3'-m C. O DNA de fita simples também está parcialmente empilhado e pode conferir um grau semelhante de interferência estérica. Por outro lado, m C parece desaminar quase 200 vezes mais rápido no dímero do dinucleotídeo Tpd m C (5,6 h, pH 7,4 50 & # x000b0C) 27 do que no dímero de dm CpT (48 d, 1152 h, pH 7 25 e # x000b0C). 23 Salvo algum erro experimental, esta grande diferença na taxa sugere que o grupo metil interfere mais com a abordagem do hidróxido do lado 5 'do que do lado 3' devido à conformação do anel de ciclobutano, que deve ser diferente no dinucleotídeo em comparação com DNA de fita simples ou duplex. Em apoio a essa ideia, a conformação do anel de ciclobutano de um dímero TT mostrou ser significativamente diferente no DNA duplex em comparação com o dinucleotídeo. 37

Efeito do contexto de sequência e formação de duplex na taxa de desaminação. As sequências em itálico e vermelho na face posterior do cubo referem-se à forma de fita simples. As sequências em negrito e azul na face frontal do cubo referem-se à forma de fita dupla. Os números em itálico representam as meias-vidas de desaminação em horas.

Influência do empilhamento de bases no ataque nucleofílico e formação de exciplex em DNA duplex. A) Veja o eixo da hélice para baixo da extremidade 3 ', e B) uma vista lateral de um dímero de ciclobutano AT = TA (Arquivo PDB 1NE4) 36 mostrando que o 5'-A pode empilhar no topo do 5'-T do dímero e bloqueia o ataque da água, enquanto o 3'-A não se acumula no 3'-T e não pode bloquear o ataque da água. C) Vista da extremidade 3 'de um sítio ATTA no DNA duplex (Arquivo PDB 1D49) 49 mostrando significativamente mais empilhamento de base entre o 5'-A e o 5'-T do que para o 3'-A com o 3'- T.

A desaminação de m C = T e T = m C é mais rápida quando m C é flanqueado por G

As meias-vidas de desaminação de m C em um CPD flanqueado por A ou G são muito semelhantes no DNA de fita simples com valores de 3,5 e 4,2 h para GT = m CG e AT = m CA respectivamente, e 10,7 e 12,1 h para G m C = TG e A m C = TA (Tabela I, Fig. 4). Em contraste, a desaminação de mC no DNA duplex foi mais rápida quando flanqueada por G & # x02019s. O t& # x000bd para m C foi 22 vezes menor para GT = m CG (5,8 h) do que para AT = m CA (134 h), e se aproximou do observado no DNA de fita simples. Da mesma forma, o t1/2 para desaminação em G m C = TG (26,6 h) foi 19 vezes mais curto do que para A m C = TA (& # x0003e500 h).

Para determinar o efeito de um flanqueador C ou T na desaminação, determinamos as taxas de desaminação de m C dentro das sequências TT m CTT e CC m CCC no DNA duplex. A irradiação dessas sequências produz uma mistura de dois dímeros de dipirimidina com mC localizados nas posições 5 & # x02019 ou 3 & # x02019. Usando a endonuclease V específica do dímero cis-syn V, descobrimos que TT = m CT e T m C = TT foram produzidos em uma proporção de 2: 1, e que CC = m CC e C m C = CC foram produzidos em 3: Proporção de 4. A taxa de desaminação observada é, portanto, um composto das taxas de desaminação para m C nas posições 5 'e 3', que podem diferir em 4 vezes com base no que foi observado para a desaminação de m C flanqueado por A ou G. A meia-vida de desaminação observada de 300 h para m C em dímeros flanqueados por C's é cerca de 2 & # x020133 vezes do que 107 & # x02013160 h determinada para desaminação dos dois Cs centrais em CCCC de DNA de plasmídeo em vitro 25 como seria de esperar do efeito de retardamento da taxa de metilação. A meia-vida de desaminação também é semelhante às 160 h calculadas a partir dos dados de% de desaminação para C C C no códon 300 do gene p53 em células humanas irradiadas. 26 Nesse mesmo estudo, a meia-vida de desaminação de seis locais T C T no gene p53 também foi cerca de 160 he comparável àquela de 385 h que encontramos para m C em um dímero flanqueado por T's. Essas taxas de desaminação são muito diferentes, no entanto, daquelas de 3,9 h relatadas para um gene supressor de tRNA de sequência C em TCT em E. coli. 21, 38 Este site em E. coli é transcrito ativamente, o que tornaria o site mais de fita única e, conseqüentemente, mais sujeito a desaminação. Como as meias-vidas de desaminação eram muito longas para dímeros flanqueados por T e C em nossos substratos e semelhantes aos dímeros flanqueados por A & # x02019s, concluímos que G é único em sua capacidade de acelerar a desaminação de C. Somente o G imediatamente flanqueando am C teve este efeito com AT = m CG desaminando muito mais rapidamente do que GT = m CA (t & # x000bd & # x02019s de 6,6 e 170 h respectivamente) (Tabela 1).

O6 de guanina implicado no mecanismo de desaminação

A desaminação espontânea de C ou m C dentro de um fotoproduto de dinucleotídeo é uma reação catalisada por ácido geral. 22 A reação é iniciada pela protonação da citosina em N3, que induz carga positiva em C4. O ataque de hidróxido ou água em C4 então produz um intermediário aminal tetraédrico que entra em colapso para liberar amônia ou íon amônio. Para determinar se um determinado grupo funcional em G pode ou não estar envolvido no mecanismo, substituímos o G & # x02019s que flanqueia o fotodímero por vários análogos sem grupos funcionais específicos de G (Fig. 6). Quando G foi substituído por 2-aminopurina, que não possui o grupo C6-carbonil, mas retém o grupo C2-amino, a taxa de desaminação de m C em T = m C diminuiu 8 vezes. Quando G foi substituído por inosina, que não tem o grupo C2-amino, mas retém o grupo carbonila, a taxa diminuiu apenas 2 vezes. Com base nesses resultados, concluímos que O6 e possivelmente N7 da guanina estão de alguma forma envolvidos no direcionamento ou ativação da água para o ataque em C4. Guaninas consecutivas como em GT = m CGGG não aumentaram o efeito (Tabela 1) e sugere que não há efeito cooperativo entre guaninas adjacentes.

Influência de grupos funcionais individuais de um 3'-G na taxa de desaminação do 3'-C do dímero em tGT = m CGtc. Os valores em itálico são as meias-vidas em horas a 37 & # x000b0C.

O grupo O6 carbonil de G junto com N7 pode formar uma região de alto potencial eletrostático negativo 39 que estabiliza o C protonado carregado positivamente efetivamente aumentando o pKa para acelerar a reação. Esta explicação é semelhante à usada para explicar por que o cis-syn dímero de TpdC desamina mais rapidamente do que o trans-syn-I dímero. 22 Nesse caso, verificou-se que o pKa do C protonado no trans-syn dímero foi menor (2,9 vs 4,2), e atribuído a um alinhamento favorável do carbonil C4 de T com o íon imínio de C localizado no mesmo lado do anel ciclobutano. No trans-syn-I dímero, o O4 carbonil do T está no lado oposto do anel de ciclobutano e não pode interagir tão efetivamente. Embora a diferença na taxa seja substancial em pH 4 (24 vezes), é muito menor em pH 7 (3 vezes) do que a diferença de 22 vezes observada para desaminação de m C flanqueado por G em comparação com A, C ou T .G pode chegar mais perto na estrutura para atingir melhor alinhamento de seu grupo O4 carbonil (Fig. 5) em comparação com o O4 carbonil de flanqueamento T, enquanto A e C possuem um grupo amino com um dipolo menos favorável.

Efeito do sal na desaminação

Testamos o efeito do sal na desaminação, uma vez que cátions mono e divalentes são conhecidos por interagir com N7 e O6 da guanina por interações mediadas por esfera interna e água 40 e estabilizar a forma duplex. 41 A desaminação foi realizada em 0 & # x02013400 mM adicionado NaCl com duplex GT = m CG e AT = m CA (Fig. S1). Na concentração mais alta de NaCl, a taxa de desaminação diminuiu em um fator de 3,8 para a sequência G, mas também diminuiu em um fator semelhante de 3,3 para a sequência flanqueada por A & # x02019s. Surpreendentemente, a sequência flanqueada por G desaminou 20 vezes mais rápido do que a sequência flanqueada por A em toda a faixa de concentrações de sal. Consistente com a observação de que cátions mono e divalentes competem pelos mesmos locais no DNA, 42 descobrimos que a taxa de desaminação de GT = m CG diminuiu por um fator de 4,3 em MgCl 10 mM2. A partir desses resultados, parece que o sal pode retardar a desaminação ao estabilizar a forma duplex da hélice de uma maneira não específica para a sequência, inibindo assim a protonação do C e a adição de água. Esses resultados também indicam que, embora o sal possa não afetar as taxas relativas de desaminação entre diferentes sequências, a desaminação pode ser bastante lenta na Vivo, onde as concentrações de sal monovalente são cerca de 150 mM.

Efeito da metilação na desaminação de C

Embora seja conhecido que a metilação de C aumenta muito a formação de CPD à luz do sol em cerca de 15 vezes, 9 o efeito da metilação na taxa de desaminação de fotodímeros no DNA duplex não está bem estabelecido. Descobrimos que a metilação do C em GT = CG, AT = CG e AT = CA retardou a desaminação por fatores de 1,2, 1,3 e 3,8, respectivamente (Tabela 1). Parece que a taxa de desaminação de um 3'-C é mais afetada pela metilação quando flanqueado por um A adjacente do que por um G. A desaminação de um 5'-C flanqueado por A também foi desacelerada por um fator de 3,8 após a metilação ( compare t1/2 de 500 h para A m CTA (Tabela 1) com 131 h para ACTG (Tabela 2)).

Mesa 2

Formação e desaminação de dímeros C m C. 32 C rotulado com P em negrito. As incompatibilidades estão sublinhadas.

EntradaAbrev.seqüência% Produçãot1 / 2
1AC m CUMAAC m CNo3.4WL
TG GTa
2GC m CGGC m CGt1.4WL
CG GCa
3UMAC m CGUMAC m CGt2.8320 e # x000b1 12
TG GCa
4AC m CGAC m CGt3.0256 e # x000b1 16
TG GCa
5A U m CGA U m CGt0.84.7 e # x000b1 1
T G GCa
6UMAC T GUMAC T Gg3.928 e # x000b1 2.6
TG G Cc
7UMACTGUMACTGg0.8131 e # x000b1 12
TGACc

Comparando a taxa de desaminação estimada para C no dímero cis-syn TpdC em 25 & # x000b0C em pH 7 (meia-vida de 7,7 h) 22 com C metilado em pH 7,4 (69 h) 27 indica que a metilação de um 3'-C diminui desaminação em 9 vezes. O efeito parece ser ainda maior (172 vezes) para 5'-C comparando as taxas de desaminação de dCpT (6,7 h) e dmCpT (48 dias). Uma possível explicação pode envolver a conformação do anel de ciclobutano conforme discutido acima (ver A desaminação de m C em T = m C é mais rápida do que em m C = T) Nossos resultados com DNA duplex estão mais de acordo com um em vitro Experiência de PCR com DNA de plasmídeo irradiado que indica pouco efeito de metilação na desaminação de C m CG no códon 248 ou 282. 26

Desaminação dupla de C = m C a U = T

Ambos os resíduos C em um dímero de ciclobutano C = C podem desaminar individualmente para produzir U = U e, assim, resultar em uma mutação CC & # x02192TT após a replicação. 25, 26 Para dissecar o mecanismo da dupla desaminação, primeiro tentamos medir as taxas de desaminação de C e m C na sequência GC = m CG, mas o rendimento desse produto não foi ideal (Tabela 2). Descobrimos que substituir o 5'-G por A aumentou o rendimento, e que tanto o C quanto o m C desaminam muito lentamente e quase nas mesmas taxas (t & # x000bd vidas foram 320 e 256 h, respectivamente) (Tabela 2) .

A desaminação lenta do m C flanqueado por G foi surpreendente, uma vez que descobrimos que G acelera muito a desaminação dos dímeros de T m C. Em AC = m CG, a desaminação de C levará a AU = m CG, enquanto a desaminação de m C levará a AC = TG, onde as bases sublinhadas são pareadas incorretamente para G. acelerar a desaminação da base restante, uma vez que uma incompatibilidade de par de bases deve aumentar a acessibilidade do C aos prótons e à água por meio da desestabilização do duplex. Na verdade, descobrimos que as meias-vidas de desaminação de AC = TG e dA U = m CG com uma incompatibilidade G oposta à base desaminada foram 28 e 4,7 h, respectivamente, e 11,4 e 54 vezes mais rápido do que os locais correspondentes em AC = m CG (Tabela 2). A incompatibilidade U & # x02022G contribuiu muito pouco para o aumento de 54 vezes na taxa de desaminação do 3'-m C, conforme avaliado por apenas um aumento de 1,5 vezes na taxa de desaminação de UA = m CG incompatível em comparação com AT = m compatível CG (Tabela 1). A incompatibilidade T & # x02022G, no entanto, pareceu ser o principal fator para o aumento de 11,4 na taxa de desaminação do 5'-C, conforme avaliado a partir do aumento de 4,7 vezes na taxa de desaminação de AC = TG em comparação com AC = TG. Assim, pareceria que o 5'-C em AC = m CG exerce um efeito inibitório muito maior na desaminação do 3'-m C do que o 3'-m C no 5'-C. A lenta taxa de desaminação geral de AC = m CG pode, portanto, ser explicada por uma taxa que limita a primeira etapa de desaminação que é de taxa semelhante para o 5'-C e o 3'-m C seguida por uma segunda etapa de desaminação rápida.

Nossos resultados são consistentes com o em vitro taxa de desaminação de dímeros de CC em uma sequência de CCCC em um DNA de plasmídeo por um ensaio de reversão, 25 Uma primeira etapa de desaminação de limitação de taxa com meia-vida de 107 & # x02013160 h foi inferida uma vez que mutações C & # x02192T únicas estabilizaram em cerca de 10% , enquanto a frequência das mutações CC & # x02192TT aumentou para cerca de 90% ao longo do tempo. Um mecanismo de desaminação de duas etapas com uma primeira desaminação que limita a taxa também se ajusta às frequências de reversão observadas induzidas por um dímero CC em uma sequência CCC em E. coli. 29 Ajustando a frequência de mutação a uma expressão analítica para duas etapas sequenciais de primeira ordem, a segunda etapa de desaminação foi calculada como 7,6 vezes mais rápida do que a primeira etapa. Em contraste com os resultados do em vitro Nos estudos de desaminação, a meia-vida para a primeira e segunda etapas de desaminação foram calculadas em 2,7 he 21 min, respectivamente, o que é indicativo de algum outro processo, como a transcrição, que interromperia a natureza duplex do DNA.

A desaminação mais lenta de um dímero CC foi prevista pela primeira vez por Lemaire e Ruzsicska a partir de seus estudos de dímeros cis-syn e trans-syn-I TpdC. 22 Como discutido acima, (ver O6 de guanina implicado no mecanismo de desaminação), esses pesquisadores descobriram que o dímero trans-syn-I desamina mais lentamente do que o dímero cis-syn, o que eles atribuíram a uma interação dipolar favorável entre o O4 carbonil de T com o íon iminino do C protonado. Com base nisso, eles argumentaram que um dímero cis-syn CC deve desaminar mais lentamente do que um dímero TC porque o grupo amino do C ligado não teria uma interação dipolo favorável com o íon imínio do C protonado. O que é intrigante, no entanto, é por que m C em dímeros de CC m CC que são flanqueados por C está desaminando aproximadamente à mesma taxa que o dímero em AC m CG, que deve ser acelerado pelo flanqueador 3 'G (Tabela 1). Igualmente intrigante é por que m C em dímeros de CC m CC, que deveria ter um dipolo desfavorável, está desaminando aproximadamente na mesma taxa que em dímeros de T m CT. Pode ser que o trato G complementar possa deslizar e se desalinhar com o trato C contendo dímero, interrompendo assim a estrutura duplex e acelerando a desaminação. Também é possível que um C de flanco, ao contrário de um C fixado em uma posição particular dentro do dímero, possa ajudar a catalisar a desaminação, ajudando a direcionar o ataque do hidróxido no C protonado por ligação H com o grupo amino C4 do C de flanco.

Efeitos de sequência e metilação no rendimento do fotoproduto

Na preparação de CPDs para estudos de desaminação, descobrimos que o rendimento do fotoproduto em 302 nm era altamente sensível à sequência de flanqueamento (Tabela 1). Observamos rendimentos de fotoprodutos mais elevados quando as dipirimidinas foram flanqueadas por A & # x02019s em comparação com G's e que isso foi independente da posição do m C na sequência da dipirimidina. Observou-se um rendimento de 17% da formação de CPD para ATm CA em comparação com 5,4% para GT m CG e um rendimento de 7,8% de formação de CPD para A m CTA em comparação com 3,4% para G m CTG. O rendimento também foi alto para um m C flanqueado por T's conforme avaliado pelo rendimento combinado de 15,7% para T = m C e m C = T CPDs em TT m CTT. O rendimento de C m C CPD & # x02019s foi menor (1,4%) quando a sequência foi flanqueada por G's em GC m CG, intermediário (2,9%) quando flanqueado por A e G, maior (3,4%) quando flanqueado por A's em AC m CA, e mais alto (rendimento combinado de 6%) quando flanqueado por C's em CC m CCC. A metilação não aumentou o rendimento do fotoproduto com luz de 302 nm tanto quanto o aumento de 15 vezes relatado para luz solar simulada, apenas aumentando o rendimento para GT = CG, AT = CA, AT = CG e AC = TG em 5,4, 2,4, 2,4 e 8 vezes, respectivamente (Tabelas 1 e # x00026 2).

Experimentos recentes mostraram que um dímero de timina é produzido em & # x0003c 1 ps após a excitação UV, que é mais rápida do que o DNA pode mudar a conformação, sugerindo que o rendimento do dímero está relacionado à proporção de conformações fotorreativas. 43 Esta proposta foi apoiada por cálculos de dinâmica molecular correlacionando o rendimento do dímero de timina com a conformação. 44 Outros fatores também podem aumentar ou diminuir o rendimento da formação de dímero de ciclobutano pirimidina pela luz, incluindo fotossensibilização e fotoreversal direta e mediada por transferência de elétrons do dímero. Por causa dos muitos fatores potenciais, é difícil atribuir o rendimento do dímero observado a uma única causa. Alguns fatores, no entanto, não devem contribuir muito em 302 nm, como a fotorreversão direta, devido à baixa absortividade dos dímeros de pirimidina. 22 Da mesma forma, a transferência de elétrons fotoinduzida mediada por base também é ineficiente neste comprimento de onda, exceto no caso especial de uma DNAzyme com quadruplex. 45 Quanto à fotossensibilização, A é pelo menos 10 vezes mais eficiente na transferência de energia de estado excitado do que C, G ou T a 256 nm. 46 Se a fotossensibilização representa um mecanismo dominante em 302 nm, o rendimento dos CPDs deve ser menor com T & # x02019s de flanco em comparação com A's, o que não é o caso.

Correlação do potencial de oxidação com o rendimento do fotoproduto

The observed yields are more consistent, however, with an electron-transfer mediated mechanism as revealed by CPD formation in the sequence NT m CN where N = G, A, and inosine (I). When G is replaced by A, which has a higher oxidation potential, the yield increased from 5.4% to 17%. When the A's are replaced with inosine (I), which has an even a higher oxidation potential, 47 the yield further increased from 17% to 29%. We also found that consecutive G’s, which have a lower oxidation potential than a single G, 48 decreased photoproduct yield. Dimer formation in ggGT m CG and GT m CGgg was lower (3.9 and 3.4% yields respectively) compared with GT m CG (5.4%). One possible explanation for these results is quenching by electron-transfer of the pyrimidine excited state by the flanking base. This would result in the formation of an exciplex that would deactivate by back electron transfer. When the flanking G's in GT m CG are replaced with 2-aminopurine (AP), which has a similar oxidation potential to A and therefore expected to increase the yield, the yield dropped from 5.4 % to 2.8 %. We attribute this drop in yield to competitive absorption of the 302 nm light by AP which has a red-shifted absorption maximum at about 320 nm.

In further support of an exciplex mechanism, we observe a lower photodimer yield when G is located in the 5’ position relative to the dipyrimidine site. When the 5'-A in the sequence AT m CA is replaced by G, the yield drops about 50% from 17% to 8.8%, but if the 3'-A is replaced by G, the yield only drops by about 30% to 12%. This is consistent with better stacking at Pu-Py sequences compared to Py-Pu sequences ( Fig. 5C ), 49 that would facilitate electron transfer and exciplex formation. Interestingly, the effect of flanking A, C, G and T on the yield of photoproduct induced at 302 nm parallels the yield observed at 254 nm, which has been explained by a competition between dimer formation and photoinduced electron transfer-mediated reversion. 50

Implications for the origin of sunlight-induced C to T mutations

In our study, we found that a 3'-flanking G has the unique ability to increase the deamination rate of m C in a T m C cyclobutane pyrimidine dimer, but not in a C m C dimer, which occurs about 50 times slower. If one accepts the deamination bypass mechanism as the principal pathway for C to T mutations, we would then expect that these mutations would occur more frequently at T m C sites than at C m CG sites as has been observed in a SupF system. 30 On the other hand, C m CG and not T m CG are the major mutation hotspots in the p53 gene of skin cancers. Of 86 C → T mutations at 8 methylated CCG and 3 TCG sites in non-XP squamous and basal skin cancers, 81 (97%) were at C m CG sites ( Table 3 ). 51 The lower than expected frequency of TCG → TTG mutations can be explained, in part, by the very low frequency observed for this mutation at two of the these three T m CG sites in the p53 gene in all cancers, indicating that they are not as tumor promoting as those at the C m CG sites..

Tabela 3

Analysis of mutation spectra of non-XP, squamous cell and basal cell carcinomas of the skin at 11 Py m CG sites from the p53 database. uma

m CG codonnon-transcribed
/transcribed b
CC→TCCC𡤬TCC→TTTC→TTXPC
152CCG/na8/na
158CCG/na 1/na1/na
196CCG/TCG 13/02/0 2/0
213TCG/TCG 3/0
245na/CCGna/2na/5na/2
248CCG/CCG 12/99/1 6/0
282CCG/CCG 913 6/0
Total11 sites104528314

The high frequency of C→T mutations at C m CG in the p53 gene of skin cancers also suggests that dimers at these sites must be repaired slowly enough to allow deamination to occur prior to pol η replication. In support of this notion, it has been found that only 20% of dimers in CHO cells were repaired in 6 h, and only 25�% after 24 h. 52 The initial rapid removal of 20% of the dimers is likely due to transcription coupled repair, which has been shown to remove 70% of CPDs within 24 h. 53 Transcription-coupled repair is known to preferentially remove dimers from the transcribed strand of the p53 gene, 54 which would explain why 71/84 mutations at the 8 C m CG sites are in the non-transcribed strand. It has also been found that 25�% of cis-syn dimers at two C m CG sites in exon 8 of the mouse p53 gene remain after 48 hours. 7 Thus it is likely that some fraction of dimers may persist for hundreds of hours in untranscribed regions as well as in untranscribed strands, giving them sufficient time to deaminate. Transcription, however, might also accelerate deamination in non-transcribed strands due to disruption of the duplex structure.

While slow repair of C= m C dimers may explain the high frequency of C→T mutations at C m CG sites, it does not explain the much higher percentage of single C→T mutations than tandem CC→TT mutations at these sites. Of 83 C→T and CC→TT mutations at the 8 C m CG sites, 8 are CC → TC and 45 are CC𡤬T single base mutations (66%), whereas only 28 are CC → TT tandem mutations (34%). Since the second deamination step in tandem deamination is much faster than the first, the doubly deaminated product is calculated from the kinetic data ( Table 2 ) to predominate after only about 5% of the dimer has deaminated (Fig. S2). Unless replication of the dimers only takes place during this first 5% of reaction, an alternative explanation for the high percentage of single C→T mutations is needed. One possibility is that excision repair of the doubly deaminated dimer (U=T•GG) is faster than the singly deaminated dimers (U= m C•GG and C=T•GG), which would suppress CC→TT mutations as shown in the scheme in Fig. 7 . We have previously found that a T=T•GA mismatched dimer destabilizes the DNA duplex by 0.7 kcal compared to a matched T=T� dimer, 55 suggesting that a double mismatch would be even more destabilizing, and hence more easily detected by the excision repair system. Indeed, a doubly mismatched dimer, T=T•GG, is repaired faster than the singly mismatched dimer T=T•GA, which is repaired at a similar rate to T=T𠈪G, both of which are repaired much faster than T=T�. 56 , 57

Proposed scheme showing the possible deamination/bypass pathways leading to C→T and CC→TT pathways at an AC m CG site. Black arrows refer to chemical steps, red arrows to excision repair steps, blue arrows to pol η bypass steps, and dotted arrows to either excision repair, or replication of the undamaged strand. The thickness of the arrows represents the relative rates of deamination (experimentally determined) or repair (proposed). Values in italics are the experimentally determined half lives in hours at 37ଌ.

In further support of our scheme ( Fig. 7 ), the frequency of CC→TT mutations is much higher in skin cancers from XPC patients than in non-XP patients (76% vs 8%) and occurs almost exclusively in the non-transcribed strand. 58 , 59 At the 8 C m CG hotspots, only CC → TT mutations were observed. Sufferers of XPC lack the DNA damage recognition component of nucleotide excision repair, and thus C=C dimers in the non-transcribed strand have enough time to completely deaminate and cause CC → TT mutations. Our scheme also would predict that CC𡤬T mutations would predominate over CC→TC mutations because while both U= m C and C=T dimers are produced at the same rate, U= m C is more rapidly depleted due to the accelerating effect of G on deamination. In accord with this, 45/53 of the C→T mutations at the 8 C m C hotspots are CC𡤬T mutations. Because these CC𡤬T mutations correspond to missense mutations, it is possible that they predominate because of some selective survival advantage conferred by the mutant protein, and not because of selective deamination


Eukaryotic RNA Processing*

C-to-U Editing

Deamination of cytosine to uracil is performed by an editing complex, sometimes referred to as the editosome, which includes the deaminase Apobec-1 ( Fig. 11.7 ). Only a small number of nuclear-encoded targets have been identified, and in these, editing generates translation termination codons, producing shorter forms of the encoded proteins. The best-characterized example of C-to-U RNA editing involves the mRNA encoding intestinal apolipoprotein B (ApoB), where CAA-to-UAA editing in the loop of a specific stem-loop structure generates a stop codon. The truncated protein, ApoB48, has an important role in lipoprotein metabolism. In other cases editing may generate mRNAs that are targets for NMD (see later), leading to downregulation of protein expression.


Informação sobre o autor

Gad Getz and Dmitry A Gordenin: These authors contributed equally to this work.

Afiliações

Laboratory of Molecular Genetics, National Institute of Environmental Health Sciences, Durham, North Carolina, USA

Steven A Roberts, Michael A Resnick & Dmitry A Gordenin

The Broad Institute of MIT and Harvard, Cambridge, Massachusetts, USA

Michael S Lawrence, Petar Stojanov, Adam Kiezun, Gregory V Kryukov, Scott L Carter, Gordon Saksena & Gad Getz

Integrative Bioinformatics, National Institute of Environmental Health Sciences, Durham, North Carolina, USA

Leszek J Klimczak, Sara A Grimm & David Fargo

Harvard Medical School, Boston, Massachusetts, USA

SRA International, Inc., Durham, North Carolina, USA

Shawn Harris & Ruchir R Shah

Massachusetts General Hospital Cancer Center, Boston, Massachusetts, USA

Department of Pathology, Massachusetts General Hospital, Boston, Massachusetts, USA

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Contribuições

S.A.R., G.G. and D.A.G. designed the study. S.A.R., M.S.L., L.J.K., S.A.G., D.F., P.S., A.K., G.V.K., S.L.C., G.S., S.H., R.R.S., M.A.R., G.G. and D.A.G. contributed to data analysis. S.A.R. and D.A.G. wrote the manuscript.

Autores correspondentes


Resultados

Positional Variation of the Nucleotide Strand Bias

To quantify the strength of the asymmetric substitution pattern, we first estimated the contribution of the replication-induced bias at third codon positions (Beu) relative to the bias caused by transcription- and translation-associated effects (BII) in 20 γ-proteobacterial genomes, including three B. aphidicola genomes ( table 1). The starting point for our comparative analysis is that B. aphidicola (Bp) shows a fourfold higher replication-induced bias (Beu = 0.408) than B. aphidicola (Sg) and (Ap) (Beu = 0.125 and 0.102, respectively) ( table 1) ( Lobry and Sueoka 2002). Taken together, as much as 89% of the total GC bias at third codon positions in this species is explained by differences in the rates and/or patterns of nucleotide substitutions between the leading and the lagging strands.

A plot of the variation in GC skew along the chromosome in B. aphidicola (Bp) shows a rather uniform increase relative to the other two species ( fig. 1A), although the GC skew is much stronger than the TA skew in each species ( fig. 1B). Local variations within and among genomes were observed, with more than 10 segments showing an altered direction of the GC skew in B. aphidicola (Sg) and (Ap) that is evident irrespectively of whether all sites ( fig. 1A) or only third codon positions are included in the analysis ( fig. 1B). Two of these segments coincide with chromosomal inversions, one of which covers six genes (ygfZ, prfB, lysS, lysA, lgt, e thyA) and the other a single gene (pyrF) (marked with arrows in fig. 1A). Because a reverse bias is observed at the longer segment compared to its flanking regions in B. aphidicola (Ap) and (Sg), we infer that the inversion probably occurred in an ancestor of these two species.

(UMA) Representation of the GC skew in B. aphidicola together with the positions of genes with significantly higher nonsynonymous substitution frequencies and the positions of genes lost in B. aphidicola (Bp) as compared with B. aphidicola (Sg). The colors in (UMA) show the chromosomal variation of the GC skew pattern in the different species: yellow (Bp), red (Sg), and green (Ap). Genes with significantly higher nonsynonymous substitution rate are all on the leading strand (blue lines). The black lines represent genes that are missing in B. aphidicola (Bp) compared to (Sg) and the red lines indicate the position of priA, topA, dnaT, hinA, himD, e fis. The arrows represent the location of the two inversions. (B) Representation of the GC skew and TA skew in B. aphidicola (Bp), (Ap), and (Sg) including third codon positions only.

(UMA) Representation of the GC skew in B. aphidicola together with the positions of genes with significantly higher nonsynonymous substitution frequencies and the positions of genes lost in B. aphidicola (Bp) as compared with B. aphidicola (Sg). The colors in (UMA) show the chromosomal variation of the GC skew pattern in the different species: yellow (Bp), red (Sg), and green (Ap). Genes with significantly higher nonsynonymous substitution rate are all on the leading strand (blue lines). The black lines represent genes that are missing in B. aphidicola (Bp) compared to (Sg) and the red lines indicate the position of priA, topA, dnaT, hinA, himD, e fis. The arrows represent the location of the two inversions. (B) Representation of the GC skew and TA skew in B. aphidicola (Bp), (Ap), and (Sg) including third codon positions only.

Relative Rates of Nonsynonymous Substitutions

To test the hypothesis that B. aphidicola (Bp) evolves more rapidly than the other two species, we estimated the relative rates of sequence evolution for a set of orthologous genes present in all three B. aphidicola espécies. The tests were performed as implemented in RRTree ( Robinson-Rechavi and Huchon 2000), using W. glossinidia (330 orthologs) and B. floridanus (337 orthologs) as outgroups. The motivation for using these species as outgroups is that they, despite being closely related to B. aphidicola and having similar genomic GC contents (W. glossinidia G + C = 22.5% B. floridanus G + C = 27.4%), display different levels of GC skew. The magnitude of the strand-specific DNA asymmetry in B. floridanus is even stronger than in B. aphidicola (Bp) ( table 1), whereas there are no signs of such a bias in W. glossinidia and the origin of replication has as yet not been identified in this species.

The relative rate tests indicated that only three genes (hflC, hflK, e rne) evolve with a significantly (P < 0.05 with Bonferroni-Holm correction) elevated frequency of nonsynonymous nucleotide substitutions in B. aphidicola (Bp) relative to B. aphidicola (Sg) and (Ap). All three of these were found to evolve significantly faster in all of the four possible tests (P & lt 0,05). No gene was identified as evolving faster in B. aphidicola (Sg) or B. aphidicola (Ap).

Patterns of Strand-Specific Nucleotide Substitutions

To explore other reasons for the different magnitudes of the GC skew in the three B. aphidicola lineages, we recorded the spectrum of nucleotide substitutions for each codon position individually in each lineage, again using W. glossinidia ou B. floridanus as the outgroups. As expected, we found that the overall distributions of the substitution frequencies differed significantly for the leading and lagging strand genes within each genome (multinomial test, P & lt 0,0001). Most importantly, we noted that the distributions differed significantly for the three B. aphidicola genomes on both the leading and lagging strands (multinomial test, P & lt 0,0001). The variance and the SD were estimated for genes longer than 750 bp (supplementary table 1).

Transitions were observed to be the most frequent type of substitutions in B. aphidicola (Bp), with a relative predominance of C → T (C:G → T:A) on the leading strand genes (which might arise through C → T on the leading strand as well as through G → A substitutions on the lagging strand) ( figs. 2 and 3). The bias was consistently observed at second codon positions, which are the least likely to be saturated ( fig. 2A) as well as for all codon positions combined ( fig. 2B). The strand bias of the C:G → T:A substitutions in B. aphidicola (Bp) was equal or slightly higher than the strand bias of the A:T → G:C substitutions in the same species ( fig. 2A).

Differences in substitution patterns for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the strand-specific difference in substitution frequencies for (UMA) only second codon positions and (B) all three codon positions. C:G → T:A = (C → T(Leading) + G → A(Lagging))−(C → T(Lagging) + G → A(Leading)) and so on. Values above and below 0 refer to the substitution frequencies that are higher on the leading and the lagging strands, respectively. Estimates including the whole branch from the divergence of B. aphidicola (Ap) or (Sg) from B. aphidicola (Bp) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. Each species is represented by two bars of the same color, representing the two outgroups used for the analysis, B. floridanus e W. glossinidia in that order.

Differences in substitution patterns for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the strand-specific difference in substitution frequencies for (UMA) only second codon positions and (B) all three codon positions. C:G → T:A = (C → T(Leading) + G → A(Lagging))−(C → T(Lagging) + G → A(Leading)) and so on. Values above and below 0 refer to the substitution frequencies that are higher on the leading and the lagging strands, respectively. Estimates including the whole branch from the divergence of B. aphidicola (Ap) or (Sg) from B. aphidicola (Bp) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. Each species is represented by two bars of the same color, representing the two outgroups used for the analysis, B. floridanus e W. glossinidia in that order.

The estimated substitution frequencies for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the frequency of substitutions at second codon positions. Each bar shows the sum of the equivalent substitutions at the leading and lagging strands. Estimates including the whole branch leading to B. aphidicola (Ap) or (Sg) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. B. floridanus was used as the outgroup in the analysis.

The estimated substitution frequencies for genes located on the leading and lagging strands of B. aphidicola (Bp), (Ap), and (Sg). The values refer to the frequency of substitutions at second codon positions. Each bar shows the sum of the equivalent substitutions at the leading and lagging strands. Estimates including the whole branch leading to B. aphidicola (Ap) or (Sg) are indicated as Ap/Sg followed by either (Ap) or (Sg), respectively. B. floridanus was used as the outgroup in the analysis.

The substitution patterns in B. aphidicola (Ap) and (Sg) was different, with C → T substitutions being equally frequent on both strands or slightly more frequent on lagging strand genes ( figs. 2 and 3). However, this pattern is reversed if B. aphidicola (Bp) is excluded from the analysis, but even so the predominance of C → T substitutions on the leading strand is much lower in B. aphidicola (Ap) and (Sg) compared to B. aphidicola (Bp) (data not shown). A similar substitution pattern was also observed for the ancestral lineage to B. aphidicola (Sg) and (Ap) ( figs. 2 and 3). Thus, to the extent that C → T deaminations contribute to the strand bias of the C:G → T:A substitutions at second codon positions, we infer that these occur at a higher frequency on the leading strand in B. aphidicola (Bp) as compared to the lagging strand (Mann-Whitney, P < 0.001). No such relative increase on the leading strand was observed in either of the other two species ( figs. 2 and 3).

Even for divergences as low as 10%, the use of parsimony may infer an excess of common to rare changes if the sequences are highly biased ( Eyre-Walker 1998). In our comparisons, the substitution frequencies were in the range of 0.15 (for B. aphidicola (Ap) and (Sg)) to 0.30 (for B. aphidicola (Bp) relative to (Ap) or (Sg)) nonsynonymous substitutions per site and the frequencies of T/(T + C) at second codon positions were 67% on the leading strand and 64% on the lagging strand. Hence, it is conceivable that we have slightly underestimated the total amount of substitutions from C → T. However, this is expected to neither influence the inferred relative differences between strands nor between species.


Reconhecimentos

We thank Dr. Mary Muers for comments on the manuscript.

Financiamento

S.K. and B.S.-B. are funded by Ludwig Cancer Research. S.K. received funding from BBSRC grant BB/M001873/1. M.T. and J.T. are funded by EPSRC (EP/F500394/1).

Disponibilidade de dados e materiais

All data used in this study were downloaded from public repositories. A complete list of whole-genome sequencing data sets and their accession information can be found in Additional file 1: Table S1 and the list of all whole-genome sequencing samples and signature exposures are in Additional file 5: Table S4. The replication direction [11] was taken from http://software.broadinstitute.org/cancer/cga/AsymTools, table per_base_territories_20kb.mat. The replication origins measured by SNS-seq [13] were based on the supplementary files of National Center for Biotechnology Information Gene Expression Omnibus accession GSE37757. The strand-specific signatures are in Additional file 6: Table S5. The code is available at https://bitbucket.org/bsblabludwig/replicationasymmetry [71] and Figshare (https://figshare.com/s/21174d60d594ddb9b83d, DOI https://doi.org/10.6084/m9.figshare.6941456) [72] under GPL3 license.


De novo mutations in clinical practice

The recent recognition of the importance of de novo mutations in human disease has many implications for routine genetic testing and clinical practice. De novo mutations are now established as the cause of disease in a large fraction of patients with severe early-onset disorders, ranging from rare congenital malformation syndromes [185, 186] to more-common neurodevelopmental disorders, such as severe forms of intellectual disability [33], epilepsy [31], and autism [29]. Together, these disorders represent a substantial proportion of all patients seen at neuropediatric and clinical genetics departments around the world.

Pinpointing the genetic cause of a disorder caused by a de novo mutation in an individual can be challenging from the clinical point of view because of pleiotropy as well as genetic heterogeneity underlying a single phenotype. For instance, intellectual disability can be caused by de novo point mutations, indels, or CNVs in any of hundreds of genes [117]. This obstacle to providing a clinical diagnosis strongly argues for a reliable and affordable genomics approach that can be used to detect these de novo mutations in large groups of patients. Exome and genome sequencing (which additionally offers the possibility of accurate detection of structural variation) of patient–parent trios is ideal for this and will soon become the first-tier diagnostic approach for these disorders. A key advantage of this trio-based sequencing approach is that it helps prioritize candidates by de novo occurrence, allowing clinical laboratories to focus on the most likely candidate mutations for follow-up and interpretation (Box 3) [187]. The interpretation of candidate de novo mutations can be guided by the use of different scores, such as the “residual variation intolerance score” (RVIS), based on the comparison of rare versus common missense human variation per gene [188]. Alternatively, “selective constraint scores” can be used, based on the observed versus expected rare functional variation per gene within humans [126].

The identification of a de novo mutation as the cause of disease in a patient has several implications for the patient and his or her family. First, the detection of the genetic defect underlying the phenotype establishes a genetic diagnosis that can be used to provide a prognosis based on data from other patients with similar mutations [189] and information about current treatment options [190] and, in the future, for the development and application of personalized therapeutic interventions [191]. Furthermore, the identification of a de novo mutation offers the parents of the affected patient an explanation as to why the disorder occurred and might help deal with feelings of guilt [192, 193]. In terms of family planning, the identification of a de novo mutation as the cause of disease in a child can be positive news with regard to recurrence risk, as it is much lower than for recessive or dominant inherited disorders (slightly above 1% versus 25 and 50%, respectively) [11, 158]. However, the recurrence risk is strongly dependent on the timing of the mutation as parental mosaicism for the mutation increases the risk of recurrence [158]. Approximately 4% of seemingly de novo mutations originate from parental mosaicism detectable in blood [11], and recent work suggests that transmission of parental mosaicism could explain up to 10% of de novo mutations in autism spectrum disorder [194]. This entails that a fraction of de novo mutations have an estimated recurrence risk above 5% [158]. Furthermore, close to 7% of seemingly de novo mutations arise as postzygotic events in the offspring [88, 89, 91]. Parents of an individual with a postzygotic mutation have a low risk for recurrence of the mutation in an additional child, estimated as being the same as the population risk [90]. Targeted deep sequencing of a disease-causing mutation can be performed to test for its presence in parental blood and detect mosaicism in the offspring. Although it is not yet offered on a routine basis, this kind of testing can provide a personalized and stratified estimate of the recurrence risk based on the presence or absence of mosaicism in the parents or in the offspring.

Finally, it is impossible to prevent de novo mutations from arising in the germline of each new generation, but attention must be brought to the factors that increase the number of de novo mutations in the offspring. The single most important risk factor is advanced paternal age at conception [15], which is of great importance from an epidemiological perspective since most couples in Western countries are having children at later ages. In fact, this increase in de novo mutations with paternal age at conception might explain epidemiological studies that link increased paternal age to increased risk of neurodevelopmental disorders in offspring [195]. A recent population-genetic modeling study, however, indicated that de novo mutations might not explain much of the increased risk of psychiatric disorders in children born to older fathers [122]. While this might be the case for relatively mild and later-onset phenotypes such as schizophrenia, de novo mutations are responsible for the majority of the most severe pediatric disorders arising in outbred populations [10, 196]. At present, most attention, advice, and guidelines are focused on advanced maternal age as a public health issue. It is evident from current work on de novo mutations that advising the public, including policy makers, on potential risks of advanced paternal age and the burden it might bring on society is crucial. An extreme “solution” if reproduction is to be postponed might be to promote cryopreservation of oocytes and sperm [197], a measure under much debate that has been termed “social freezing”.


Causes of Gene Mutation

Gene mutations are most commonly caused as a result of two types of occurrences. Environmental factors such as chemicals, radiation, and ultraviolet light from the sun can cause mutations. These mutagens alter DNA by changing nucleotide bases and can even change the shape of DNA. These changes result in errors in DNA replication and transcription.

Other mutations are caused by errors made during mitosis and meiosis. Common errors that occur during cell division can result in point mutations and frameshift mutations. Mutations during cell division can lead to replication errors which can result in the deletion of genes, translocation of portions of chromosomes, missing chromosomes, and extra copies of chromosomes.


Assista o vídeo: Enlace Peptídico. Formación de Dipéptido y Tripéptido. Aminoácidos. Bioquímica. Mecanismo (Janeiro 2022).