Em formação

Qual é a diferença entre genes expressos diferencialmente e genes desregulados?


Alguém pode explicar claramente qual é a diferença entre genes expressos diferencialmente e genes desregulados?


Qualquer gene cuja expressão gênica difira significativamente de alguma referência é considerado expresso diferencialmente. Acho que a representação mais comum da expressão diferencial é o gráfico de vulcão, onde você está traçando a mudança de dobra ou a mudança de log2 dobra em relação ao valor -log10 p atribuído a esse gene.

Isso significa algumas coisas: primeiro, você precisa de um tamanho de amostra suficientemente grande para que possa realmente pegue estatísticas, e dois, você precisa de uma amostra de referência suficiente que funcionará como sua linha de base.

Se um gene é degregado, no entanto, a expressão é aberrante. A fim de caracterizar a expressão aberrante, você precisa de um normal amostra ou amostra de referência aceita e a amostra de interesse. Isso pode ser tão simples quanto um tumor versus tecido normal do mesmo paciente.


Genes expressos diferencialmente no câncer de bexiga egípcio avançado metastático

Fundo: O câncer de bexiga é um dos cânceres mais comuns em todo o mundo. O perfil de expressão gênica usando tecnologias de microarray melhora a compreensão da biologia do câncer. O objetivo deste estudo foi determinar o perfil de expressão gênica em pacientes egípcios com câncer de bexiga.

Materiais e métodos: Amostras de 29 cânceres de bexiga humana e tecidos não neoplásicos adjacentes foram analisadas por cDNA microarray, com agrupamento hierárquico e análise multidimensional.

Resultados: Quinhentos e dezesseis genes foram expressos diferencialmente, dos quais os genes SOS1, HDAC2, PLXNC1, GTSE1, ULK2, IRS2, ABCA12, TOP3A, HES1 e SRP68 estavam envolvidos em 33 vias diferentes. Os genes mais frequentemente detectados foram: SOS1 em 20 vias diferentes HDAC2 em 5 vias diferentes IRS2 em 3 vias diferentes. Havia 388 genes regulados negativamente. PLCB2 estava envolvido em 11 vias diferentes, MDM2 em 9 vias, FZD4 em 5 vias, p15 e FGF12 em 4 vias, POLE2 em 3 vias e MCM4 e POLR2E em 2 vias. Trinta genes mostraram diferenças significativas entre as amostras de câncer de células transicionais (TCC) e de células escamosas (SCC). A análise de agrupamento não supervisionado de dados de microarray de DNA revelou uma distinção clara entre tumores de baixo e alto grau. Além disso, 26 genes mostraram diferenças significativas entre estágios de tumor baixo e alto, incluindo tríade de histidina frágil, Ras e sialiltransferase 8 (alfa) e 16 mostraram diferenças significativas entre graus de tumor baixo e alto, como metionina adenosil transferase II, beta.

Conclusões: O presente estudo identificou alguns genes que podem ser usados ​​como biomarcadores moleculares ou genes-alvo em pacientes egípcios com câncer de bexiga.


Material e métodos

Dados de microarray

Os conjuntos de dados microarray, GSE68004, GSE73464 e GSE18606, foram baixados do Gene Expression Omnibus (GEO, http://www.ncbi.nlm.nih.gov/geo/) em agosto de 2020. O conjunto de dados GSE68004 (GPL10558, Illumina HumanHT −12 V4.0 expression beadchip) continha 89 amostras de sangue coletadas de 76 pacientes pediátricos com KD completa, 13 pacientes pediátricos com KD incompleta e 37 amostras de sangue de controles saudáveis ​​pareados por idade e sexo. O conjunto de dados GSE73464 consistiu em 839 amostras, incluindo 55 amostras de controles saudáveis ​​e 78 amostras de pacientes com KD. O conjunto de dados GSE18606 foi baixado e 48 amostras de sangue de nove controles saudáveis ​​e 20 pacientes com KD (oito pacientes sem resposta de IVIG e 12 pacientes com resposta de IVIG) nos estágios agudo e convalescente. Os conjuntos de dados GSE68004 e GSE73464 foram usados ​​para rastrear DElncRNAs e DEGs e o conjunto de dados GSE18606 foi usado para validar o perfil de expressão.

Processamento de dados

Os dados brutos não normalizados foram baixados e processados ​​usando o pacote Limma (Smyth, 2005). Os níveis de expressão de sondas corrigidas de fundo e normalizadas foram calculados. As sondas mapeadas para mRNAs humanos e lncRNAs no genoma de referência humano GRCh38 foram retidas, caso contrário, elas foram removidas. No caso de múltiplas sondas mapeadas para um mRNA ou lncRNA, o valor médio de expressão das sondas foi calculado e considerado como o nível de expressão desse mRNA ou lncRNA.

Análise de expressão diferencial

Os DEGs e DElncRNAs nas amostras KD foram selecionados usando a ferramenta de análise GEO2R (http://www.ncbi.nlm.nih.gov/geo/geo2r/). DEGs e DElncRNAs significativos foram identificados usando os critérios de p valor & lt0,05 e —log2(mudança de dobra, FC) —≥1. DEGs e DElncRNAs com log2FC ≥1 foram regulados positivamente, e log2FC ≤ -1 foram regulados para baixo, respectivamente. DEGs comuns entre os conjuntos de dados GSE68004 e GSE73464 foram retidos e usados ​​para análises posteriores.

Identificação de bancos de dados de genes relacionados a KD

O Comparative Toxicogenomics Database (CTD, atualização 2019 http://ctdbase.org/) é um recurso público importante que consiste em associações baseadas na literatura e curadas manualmente entre doenças, genes, vias e produtos químicos (Davis et al., 2019). Genes relacionados a KD e as vias da Enciclopédia de Genes e Genomas de Kyoto (KEGG) foram identificados no banco de dados CTD usando a palavra-chave de pesquisa “síndrome do linfonodo mucocutâneo”. Os genes e caminhos que se sobrepuseram entre DEGs e itens no banco de dados CTD foram mantidos.

Construção da rede de interação proteína-proteína (PPI)

Os pares de interação de proteínas foram identificados no banco de dados STRING (versão 11.0, https://string-db.org/cgi/input.pl) com uma pontuação & gt0,4. A rede PPI foi construída usando o software Cytoscape (versão 3.8.0 https://cytoscape.org/) e os módulos de rede foram identificados usando o plugin Molecular Complex Detection (MCODE) do Cytoscape.

Análise de enriquecimento funcional

A anotação dos processos biológicos da Ontologia Genética e das vias KEGG apresenta as propriedades biológicas dos DEGs. Os processos biológicos da ontologia genética e as vias KEGG relacionadas aos DEGs foram identificados usando o banco de dados para anotação, visualização e descoberta integrada (DAVID, versão 6.7 https://david.ncifcrf.gov/) neste estudo. Enriquecimento significativo foi identificado quando ajustado (correção de BH) p o valor era & lt0,05.

Identificação de miRNAs relacionados a KD

miRNAs relacionados a DEGs em KD foram pesquisados ​​no miRWalk (http://mirwalk.umm.uni-heidelberg.de/), miRTarbase (http://mirtarbase.cuhk.edu.cn/php/index.php), e bancos de dados starBase (versão 2.0 https://www.starbaserobins.org/our-programs/starbase-2-0/). Os pares miRNA-mRNA identificados a partir de pelo menos dois bancos de dados foram retidos e usados ​​para construir a rede regulatória miRNA-mRNA.

Construção da rede lncRNA-miRNA-mRNA ceRNA

Os pares miRNA-lncRNA foram obtidos no miRcode (http://www.mircode.org/), DIANA-LncBase v2 (http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php? r = lncbasev2% 2Findex-experimental) e bancos de dados starBase (versão 2.0 https://www.starbaserobins.org/our-programs/starbase-2-0/). Os pares LncRNA-miRNA incluídos em pelo menos dois bancos de dados foram retidos e usados ​​para a construção da rede lncRNA-miRNA. As redes ceRNA foram posteriormente construídas usando o software Cytoscape.

Agrupamento funcional dos principais itens

GeneCLiP 3.0 (http://ci.smu.edu.cn/genclip3/analysis.php) é um banco de dados de mineração de literatura baseado na web que fornece o agrupamento funcional de candidatos em potencial. O hub DEGs e DElncRNAs nas redes ceRNA foram submetidos a GeneCLiP3.0. O mapa de calor do agrupamento funcional foi obtido com os critérios de p & lt 0,01 e atingiu ≥ 4.


Knockdown do gene expresso diferencialmente TNFRSF12A inibe a proliferação e migração de células de carcinoma hepatocelular in vitro

Foi relatado que o carcinoma hepatocelular humano (CHC) é altamente insensível à quimioterapia convencional. No estudo atual, o Agilent Whole Human Genome Oligo Microarray (4x44 K) foi usado para identificar os genes diferencialmente expressos entre HCC e tecidos adjacentes, e os 22 principais genes diferencialmente expressos foram confirmados por meio da reação em cadeia da polimerase quantitativa por transcrição reversa. Entre as diferenças identificadas na expressão gênica, a expressão do membro da superfamília do receptor do fator de necrose tumoral 12A (TNFRSF12A) foi marcadamente maior no tecido de CHC do que no tecido adjacente. Estudos anteriores sugeriram que TNFRSF12A pode desempenhar um papel no crescimento tumoral e metástase, portanto, no estudo atual, TNFRSF12A foi derrubado na linha celular SMMC7721 por meio de siRNA. Isso demonstrou que as células exibiram redução da capacidade reprodutiva e metastática ex vivo. Assim, os resultados do presente estudo sugerem que TNFRSF12A pode ser um alvo terapêutico candidato para câncer, incluindo HCC, e genes adicionais que exibiram expressão significativamente diferente de tecidos normais adjacentes requerem um estudo mais aprofundado.

Figuras

O mapa de calor e a análise GO ...

O mapa de calor e a análise de GO entre o HCC e o tecido adjacente. (A) Resultados do cluster ...

Níveis de expressão gênica entre HCC ...

Níveis de expressão gênica entre HCC e tecido adjacente. (A) Clustering hierárquico e calor ...

O knockdown TNFRSF12A pode reduzir SMMC7721…

O knockdown de TNFRSF12A pode reduzir a viabilidade das células SMMC7721. (A) Expressão TNFRSF12A detectada em SMMC7721 ...

Efeito do knockdown de TNFRSF12A em ...

Efeito do knockdown de TNFRSF12A na migração e invasão de células SMMC7721. (A) Quantitativo ...


Discussão

Apesar dos grandes avanços terapêuticos, a LLC ainda é uma doença incurável. As células CLL são dependentes de crosstalk microambiental para sua sobrevivência prolongada na Vivo, que é evidente pela indução de apoptose espontânea quando as células CLL são cultivadas em vitro sem suporte microambiental (Collins et al, 1989). Portanto, a caracterização da interação entre as células CLL e seu microambiente é imprescindível para identificar pontos potenciais de intervenção terapêutica.

Evidências crescentes sugerem que diferentes tipos de células de suporte contribuem para a sobrevivência estendida e quimiorresistência de células CLL, um tipo sendo NLCs (Burger et al, 2000 Kurtova et al, 2009). As células CLL induzem CD14 + PBMCs a se diferenciarem em NLCs quando cultivadas em vitro, com células CD14 + não malignas originárias de pacientes com CLL ou de probandos saudáveis. O presente estudo teve como objetivo identificar os efeitos especificamente induzidos por células CLL, tanto de pacientes com mutação ou não. IGHV status, que se correlacionou com a expressão da proteína ZAP70 (Tabela S1). CD14CLL-células e NLCs foram comparados com células decorrentes da cocultura com células B não malignas (CD14B-células). Curiosamente, descobrimos recentemente que o CD14B-células também ajudaram as células B não malignas a sobreviver e não mostraram diferenças significativas nos níveis de expressão dos genes de sobrevivência TNFSF13, TNFSF13B, e PECAM1 (Bhattacharya et al, 2011). Isso sugere que as principais diferenças específicas de CLL não são necessariamente encontradas no suporte anti-apoptótico, mas sim em vias celulares distintas.

A fim de identificar essas diferenças específicas de CLL, perfis de expressão gênica global de NLCs, CD14CLL-células e CD14B-células foram comparadas. CD14CLL-células / NLCs mostraram expressão gênica específica de CLL em comparação com CD14B-células, mais significativamente na via de apresentação do antígeno (Tabela S3). Além disso, os genes desregulados participam da regulação da imunidade inata e adquirida (Fig. 4). A imunidade inata fornece uma primeira linha de defesa contra microorganismos. Esses microrganismos são cobertos por imunoglobulinas semelhantes à opsonina que interagem com receptores específicos na superfície dos fagócitos. Uma família importante desses receptores são os receptores Fc (FcRs) que se ligam à porção Fc das imunoglobulinas, induzindo a formação do fagossomo (García-García & Rosales, 2002). FCGR2B (receptor da região Fc de imunoglobulina gama de baixa afinidade Iib, FCGR2B) é um importante receptor Fc-gama inibitório presente em macrófagos e células dendríticas imaturas que desregula o processo de internalização (Joshi et al, 2006). Níveis de expressão gênica de FCGR2B foram significativamente regulados positivamente em NLCs em comparação com CD14B-células, o que pode sugerir que a capacidade fagocitótica dos NLCs está prejudicada. Patógenos internalizados são então degradados em lisossomas contendo lisozima. Em comparação com CD14B-células, NLCs tiveram níveis de expressão mais baixos do gene da lisozima LYZ, indicando uma funcionalidade prejudicada de lisossomos após interação com células CLL.

Esquema que mostra o papel funcional de genes desregulados especificamente em células CD14 + após cultura com células CLL em comparação com a cultura com células B não malignas. Partículas patogênicas exógenas a serem endocitadas são opsonizadas com IgGs. Essas partículas opsonizadas interagem com os receptores Fc para iniciar o processo de internalização. FCGR2B é um receptor Fc inibitório que regula negativamente o processo de endocitose. Os antígenos exógenos são então processados ​​em séries de vesículas endocíticas com enzimas, incluindo a lisozima, que digerem o patógeno e processam as partículas patogênicas em peptídeos, que entram na via HLA de classe II. As moléculas HLA de classe II são carregadas com o antígeno após a substituição do CLIP (CD74). Os complexos peptídeo-HLA II são então apresentados na superfície da célula para as células T. Setas pretas sólidas mostram desregulação em NLCs em comparação com células CD14 + cultivadas com células B não malignas.

O processamento de antígenos pela via HLA de classe II começa pela ligação da cadeia invariante (CD74) às moléculas HLA recém-sintetizadas no retículo endoplasmático. O CD74 bloqueia a ligação de peptídeos durante o transporte da molécula HLA de classe II em vesículas endocíticas acidificadas, onde peptídeos derivados de patógenos podem se ligar. HLA-DRA, que é o gene HLA classe II mais altamente expresso em humanos (Schwiebert et al, 1997), e o gene da cadeia invariante CD74 foram menores na expressão em NLCs em comparação com CD14B-células, o que pode sugerir uma capacidade reduzida de apresentar antígeno. Curiosamente, os pacientes com CLL tratados com regimes baseados em fludarabina são propensos a infecções bacterianas, incluindo patógenos oportunistas como micobactérias (Puccio et al, 1991). As micobactérias sobrevivem em vesículas intracelulares ligadas à membrana, que não se fundem com os lisossomas e, portanto, não são degradadas por enzimas lisossomais. Nestes casos, os macrófagos apresentam peptídeos antigênicos ao T-helper tipo 1 (TH1) células pela via de apresentação do antígeno HLA classe II, e essas células ativam macrófagos para permitir a fusão de vesículas intracelulares contendo micobactérias com lisossomos. Da mesma forma, quando um patógeno é ingerido por células dendríticas imaturas, essas células amadurecem em células apresentadoras de antígenos altamente eficazes que ativam linfócitos T virgens pela apresentação de peptídeos antigênicos através da via HLA de classe II.

Portanto, nosso em vitro estudos sugerem que as células CLL desregulam especificamente genes em NLCs que estão envolvidos na imunocompetência. Embora os experimentos tenham sido realizados em um conjunto limitado de pacientes, os efeitos observados foram quantitativamente substanciais e, portanto, de significância estatística. Além disso, os efeitos estavam presentes em pacientes com mutação e não mutação IGHV status. Desregulação desses genes, se encontrados na Vivo, poderia resultar em uma redução na competência imunológica dos NLCs. Levando em consideração que aproximadamente 60% das mortes em pacientes com LLC são causadas por infecções bacterianas ou virais devido a uma deficiência imunológica adquirida (Molica, 1994 Rozman & Montserrat, 1995 Bartik et al, 1998), nossos achados são relevantes e somam-se aos dados anteriores sobre fatores que contribuem para a imunodeficiência adquirida de pacientes com CLL: as próprias células CLL são conhecidas por serem células apresentadoras de antígenos pobres (Ranheim & Kipps, 1993 Dazzi et al, 1995), o número de células Natural Killer é reduzido no sangue periférico de pacientes com CLL (Foa et al, 1986) e foram mostrados para ter defeitos funcionais e fenotípicos (Foa et al, 1984). Além disso, as células T de pacientes com CLL mostram uma formação de sinapse imunológica prejudicada com células apresentadoras de antígeno (Ramsay et al, 2008), têm uma função de célula T auxiliar defeituosa (Kunicka & Platsoucas, 1988) e um complexo receptor de célula T aberrante (Rossi et al, 1996). Finalmente, células T CD8 + observadoras de pacientes com CLL exibem desregulação de genes envolvidos na produção e armazenamento de moléculas citolíticas em lisossomas, bem como transporte de vesículas secretoras intracelulares, que estão relacionadas à apresentação de antígenos e vigilância imunológica contra vírus e células tumorais (Gorgun et al, 2005). Essas deficiências são muito semelhantes aos defeitos que observamos no CD14CLL-células / NLCs. Tendo em mente que os números absolutos de NLCs em pacientes com CLL são baixos, uma funcionalidade reduzida dos NLCs poderia ser uma contribuição adicional para a imunodeficiência adquirida em pacientes com CLL. Embora esta funcionalidade reduzida precise ser validada na Vivo, é muito provável que a caracterização da interação entre as células CLL e seu microambiente ajude a identificar pontos potenciais de intervenção terapêutica. Na verdade, os compostos terapêuticos que têm como alvo o microambiente provaram ser eficazes na CLL, independentemente dos subgrupos de risco genético (Ferrajoli et al, 2008 Giannopoulos et al, 2009 ).


Resultados

SF3B1 knockdown inibe o crescimento celular, induz a parada do ciclo celular e prejudica a diferenciação eritróide

SF3B1 foi derrubado usando tecnologia de siRNA em quatro linhas de células mieloides (TF1, K562, HEL e SKM1) que descobrimos ser do tipo selvagem para SF3B1 (Informações Complementares), resultando em uma diminuição significativa da expressão variando entre 50 e 60% (Figura 1a).

Efeitos de SF3B1 knockdown em linhas de células mieloides. Cada linha celular transfectada com o direcionamento de siRNA SF3B1 foi comparado com a linha celular correspondente transfectada com o controle codificado. (uma) SF3B1 Expressão de mRNA medida 3 dias após knockdown. (b) Curvas de crescimento de células com SF3B1 knockdown, em comparação com as células transfectadas com o controle scramble, conforme avaliado por exclusão de azul de tripano. (c) Análise do ciclo celular de linhas celulares a seguir SF3B1 Derrubar. (d) Diferenciação eritróide em linhas de células mieloides com SF3B1 knockdown tratado com 50 μ m hemin, conforme medido por HBG1 e KLF1 expressões relativas ao controle de embaralhamento. (e) Porcentagem de populações CD36 + CD71 + e CD71 + CD235a + em células K562 com SF3B1 knockdown em comparação com o controle scramble. Resultados em subpainéis umad foram obtidos a partir de scramble n= 2 e SF3B1 siRNA da seguinte forma: uma, n=3 b, n=3 c, n= 3 para SKM1 e TF1, n= 6 para HEL e n= 9 para K562 d, n= 3 para TF1 e HEL, n= 6 para K562. Resultados no subpainel e foram obtidos a partir do embaralhamento n= 4 e SF3B1 siRNA n=4. *P& lt0.05.

O crescimento celular foi inibido em todas as quatro linhas celulares com SF3B1 knockdown em comparação com o controle scramble (Figura 1b). A parada do ciclo celular em diferentes fases foi detectada em diferentes linhas de células mielóides com SF3B1 knockdown (Figura 1c). As células K562 mostraram uma parada significativa do ciclo celular G2M com uma redução concomitante na porcentagem de células nas fases G1 e S. As células TF1 mostraram uma diminuição significativa na porcentagem de células na fase S. As células HEL mostraram uma diminuição significativa na porcentagem de células na fase G1 e um aumento significativo na população de células sub-G1, indicando aumento da apoptose. Da mesma forma, as células SKM1 mostraram uma diminuição significativa na porcentagem de células na fase S e G2M com um aumento concomitante na porcentagem de células na fase sub-G1 e G1, indicando parada do ciclo celular na fase G1 e um aumento na apoptose ( Figura 1c).

Três linhas celulares (TF1, K562 e HEL) com SF3B1 knockdown foram cultivadas com hemina para induzir a diferenciação eritróide. Avaliamos a expressão dos marcadores de diferenciação eritróide HBG1 e KLF1 usando qRT-PCR. Uma redução significativa na expressão de HBG1 e KLF1 foi observada em linhas celulares TF1 e K562 com SF3B1 knockdown (Figura 1d). Além disso, observamos uma redução na porcentagem de populações eritroides CD36 + CD71 + e CD71 + CD235a + (significativa para a população CD36 + CD71 +) em células K562 com SF3B1 knockdown em comparação com o controle de embaralhamento (Figura 1e), sugerindo que normal SF3B1 função é necessária para a diferenciação eritróide. 17

RARS é caracterizado por FTMT acúmulo e baixos níveis de expressão do transportador de ferro ABCB7. 17, 29 Já mostramos que SF3B1 knockdown leva à diminuição ABCB7 expressão e aumentada FTMT expressão em células K562. 17 Neste estudo, estendemos essas observações às outras três linhagens de células mieloides investigadas (Figura 2a). Além disso, a restauração de SF3B1 expressão para níveis normais após 10 dias de cultura foi seguida pela restauração de ABCB7 níveis de expressão ao normal (Figura Suplementar S2).

Efeitos de SF3B1 knockdown na expressão gênica e splicing. (uma) ABCB7 e FTMT níveis de expressão em células TF1, K562, HEL e SKM1 com SF3B1 knockdown, conforme medido por qRT-PCR 48 h pós-transfecção. Cada linha celular transfectada com o direcionamento de siRNA SF3B1 foi comparado com a linha celular correspondente transfectada com o controle codificado. (b) PCR de transcrição reversa de TP53 exões 5-7 mostrando splicing aberrante em células K562 com SF3B1 knockdown (siRNA) em comparação com scramble (SCR). (c, d) Análise de qRT-PCR usando primers que monitoram a expressão gênica geral (GE) em um exon constitutivo (Ex4 de CCNA2 e Ex3 de STK6) ou primers específicos para junções de splice correspondentes à inclusão ou salto de exon na ciclina A2 (CCNA2) e Aurora Kinase A (STK6) genes em células K562. Células com SF3B1 knockdown (siRNA) mostra eventos de splicing alternativos. Resultados no subpainel uma foram obtidos a partir do embaralhamento n= 3 e SF3B1 siRNA n= 4. Resultados no subpainel cd foram obtidos a partir de scramble n= 2 e SF3B1 siRNA n=3. *P& lt0.05.

Juntos, esses dados mostram que SF3B1 o knockdown resulta na inibição do crescimento celular, na indução da parada do ciclo celular e no comprometimento da diferenciação eritróide em linhas de células mielóides.

SF3B1 knockdown altera a expressão do gene

Para avaliar os efeitos de SF3B1 knockdown na expressão gênica global, o perfil de expressão gênica foi realizado nas quatro linhas de células mieloides. Para cada linha celular, comparamos os perfis de expressão de células tratadas com dois diferentes siRNAs direcionados SF3B1 com as de células tratadas com um controle scramble, 48 h após a transfecção.

Identificamos muitos genes que foram regulados para cima ou para baixo por & gt2-vezes em cada linha celular tratada com SF3B1 siRNAs (Figura Suplementar S3A e S3B). Quatro genes foram regulados positivamente (TFDP1, LOC100505759, MKRN1 e WRNIP1) e cinco genes foram regulados para baixo (ZC3H7A, CREBZF, SGK494, WSB1 e dois conjuntos de sondas para SF3B1) em todas as quatro linhas celulares com SF3B1 Derrubar.

A análise do caminho foi realizada nos genes regulados para cima e para baixo em cada linha celular com SF3B1 knockdown usando IPA. Desregulação significativa das vias relacionadas à regulação do ciclo celular foi observada em todas as linhas de células e das vias de sinalização de mTOR e AMPK em três linhas de células (Tabela 1). Realizamos a análise de enriquecimento do conjunto de genes para identificar caminhos e processos que mostram a regulação para cima ou para baixo coordenada. Conjuntos de genes regulados positivamente incluem sinalização de p53 em células K562 e SKM1 e vários conjuntos de genes associados à regulação da transcrição, spliceossomo e splicing em células K562 (Tabela Suplementar S4). Conjuntos de genes regulados negativamente associados à função mitocondrial foram encontrados nas células K562 e TF1, e com a regulação do ciclo celular nas células SKM1 e HEL (Tabela Suplementar S4). Esses dados mostram que SF3B1 o knockdown nas linhas celulares estudadas resulta na desregulação de muitos genes e vias, incluindo o ciclo celular e o processamento de RNA.

SF3B1 impacto de derrubada na emenda

Os efeitos de todo o genoma de SF3B1 knockdown no splicing foram investigados em duas linhas de células mielóides (K562 e TF1) usando matrizes de junção de exon do genoma humano. O perfil de splicing de células com SF3B1 knockdown (usando dois siRNAs diferentes por linha celular) foi comparado com o de células transfectadas com o controle scramble.

Observamos 2027 exons expressos diferencialmente de 1419 genes e 507 variantes de splicing diferencialmente reguladas significativas (incluindo salto de exon, retenção de íntron e sítios de splice alternativos) de 384 genes em células com SF3B1 Derrubar. Por exemplo, observamos o uso diferencial de exon de CDC7 e SRSF11 nos dados de ambas as linhas de células e de TP53 em células TF1. Encontramos uma super-representação significativa de locais de splice de aceitador 3 ′ afetados por eventos de splicing alternativo em comparação com locais de splice de doador 5 ′ (proporção de 5: 1, P=0.0027, χ 2 teste com correção de Yates), consistente com o papel conhecido de SF3B1 no reconhecimento de locais de splice 3 ′. A análise da ontologia gênica foi realizada usando DAVID (http://david.abcc.ncifcrf.gov/), e muitos temas mostraram enriquecimento significativo de genes afetados no nível de uso de exon e variantes de splice (Tabela 2). O ciclo celular e a degradação do RNA foram desregulados de forma consistente em ambos os níveis (Tabela 2). Nós investigamos TP53 uso diferencial de exon por amplificação por PCR e sequenciamento Sanger de bandas extraídas de gel. Observamos o salto de exon que estava presente no SF3B1 células knockdown apenas (Figura 2b).

Também investigamos se dois genes do ciclo celular (CCNA2 e STK6) anteriormente demonstrado ser spliced ​​de forma aberrante em células HeLa com SF3B1 knockdown, 25 também foram spliced ​​de forma aberrante em células K562 com SF3B1 knockdown em nosso estudo. Consistente com o achado em células HeLa, observamos splicing aberrante desses genes usando uma estratégia de qRT-PCR, conforme descrito anteriormente (Figura 2c e d). 25

RNA-Seq em HSPC de pacientes com MDS com SF3B1 mutações

Para obter uma visão sobre o espectro de genes que são desregulados ou unidos de forma aberrante em associação com SF3B1 mutação nas células-tronco hematopoéticas e progenitoras (HSPC) de pacientes com SMD, usamos RNA-Seq profundo para comparar o transcriptoma de células CD34 + da medula óssea de oito pacientes com SMD SF3B1 mutaçãoSF3B1 mutantes), quatro pacientes com MDS sem mutação de splicing conhecida (tipo selvagem) e cinco controles saudáveis ​​(controle) (Tabela Suplementar S3). Usando IGV, avaliamos a expressão do SF3B1 alelos em SF3B1 casos mutantes e observaram uma faixa de 45-52% da frequência do alelo mutante, indicando que ambos os alelos de tipo selvagem e mutante foram igualmente expressos (Tabela Suplementar S3, Figura Suplementar S4).

Usamos o edgeR para realizar a análise diferencial da expressão gênica de SF3B1 mutantes versus tipo selvagem e controle. Em todo o nível de transcrição, observamos um total de 526 genes (253 regulados positivamente e 273 regulados negativamente) significativamente diferencialmente expressos em SF3B1 mutantes em comparação com o tipo selvagem (Tabela Suplementar S5). Na comparação de SF3B1 mutantes com controle, encontramos 1823 genes significativamente diferencialmente expressos (646 regulados positivamente e 1177 regulados negativamente) (Tabela Suplementar S6). Genes ligados à patogênese de RARS e RCMD-RS, como ALAS2 e ABCB7, foram desregulados (ALAS2 regulado e ABCB7 regulado para baixo) em ambas as comparações de SF3B1 mutante com tipo selvagem e controle. Também observamos a regulação positiva dos genes mitocondriais SLC25A37 ao comparar SF3B1 mutante com controle e GLRX5 em ambas as comparações de SF3B1 mutante com tipo selvagem e controle.

Realizamos uma análise usando 121 genes conhecidos por serem expressos em células eritróides 30 ou descritos como fatores de transcrição eritróide na literatura. Encontramos 42 genes diferencialmente expressos (37 regulados positivamente e 5 regulados negativamente) ao comparar SF3B1 mutante com controle. Estes incluíram enzimas biossintéticas heme (por exemplo, ALAS2, ALAD, FECH e UROD), genes de globina (por exemplo, HBQ1, HBA2, HBB e HBA1) e fatores de transcrição (por exemplo, GATA1, GATA2 e KLF1) Na comparação de SF3B1 mutante com o tipo selvagem, encontramos um total de 32 genes expressos diferencialmente (31 regulados positivamente e 1 regulado negativamente), dos quais 28 estavam sobrepostos aos genes expressos diferencialmente encontrados na comparação SF3B1 mutante com controle.

Em seguida, realizamos a análise da via nos genes expressos significativamente diferencialmente usando IPA. Muitas vias, incluindo a biossíntese de heme, papéis mitóticos de polo-like quinase e sinalização de TNFR2, foram significativamente desregulados na comparação de SF3B1 mutante com tipo selvagem (Tabela 3). Ao comparar SF3B1 mutante com controle, vias significativamente desreguladas incluíram sinalização de apoptose, sinalização de p53, regulação do ciclo celular e degradação de heme (Tabela Suplementar S7). Em seguida, realizamos a análise de enriquecimento de conjunto de genes e muitos conjuntos de genes que mostram enriquecimento significativo foram identificados em SF3B1 mutante versus tipo selvagem e controle. Conjuntos de genes regulados positivamente incluíam vários que estavam relacionados à função mitocondrial, pontos de verificação do ciclo celular e processamento de mRNA. Na comparação de SF3B1 mutantes com casos de controle, os conjuntos de genes regulados para baixo incluíram vários que estavam relacionados à diferenciação celular e apoptose (Tabela Suplementar S8). Muitas dessas vias desreguladas e conjuntos de genes são relevantes para a fisiopatologia conhecida de MDS e, em particular, de RARS e RCMD-RS.

DEXSeq foi usado para realizar análise diferencial de uso de exon dos dados de RNAseq para avaliar genes splicados de forma aberrante. No nível do exon, observamos um total de 3506 exons (correspondendo a 1924 genes) expressos de forma significativamente diferencial em SF3B1 mutante em comparação com o controle (Tabela 4, Figura 3, Tabela Suplementar S9). O uso diferencial de exon foi observado em pelo menos um exon de genes conhecidos por estarem envolvidos na fisiopatologia de MDS (TP53 e EZH1), genes eritróides (ALAD, UROD e EPB42) e genes associados ao ciclo celular (AURKB e CRNDE) e processamento de RNA (RBM5, RBM25, PRPF40A e HNRNPD) Ao comparar SF3B1 mutante com casos de tipo selvagem, encontramos 3097 exons expressos significativamente diferencialmente (correspondendo a 2022 genes) (Tabela 5, Figura 4, Tabela Suplementar S10). Encontramos o uso diferencial de exon em pelo menos um exon de genes envolvidos na fisiopatologia da SMD (CBL, ASXL1 e DNMT3A), função mitocondrial (ALAS2, NDUFAF6), diferenciação eritróide (NFE2L2, PPOX e HMBS) e processamento de mRNA (HNRNPD, U2AF2 e PRPF8) Interessantemente, UQCC1, um gene envolvido na biogênese mitocondrial 31 e mostrando splicing anormal em SF3B1 casos mutantes em melanoma uveal, 32 mostraram uso diferencial de exon e regulação positiva em SF3B1 casos mutantes comparados com o tipo selvagem e controle em nosso estudo.

Exemplos de genes que mostram o uso diferencial significativo de exon entre pacientes com MDS com SF3B1 mutação em comparação com o controle, obtido a partir da análise de dados de RNA-Seq usando DEXSeq. Os gráficos mostram alguns dos genes mais bem classificados com uso diferencial significativo de exon. Os exons destacados em roxo representam o uso diferencial significativo do exon.

Exemplos de genes que mostram o uso diferencial significativo de exon em pacientes com MDS com SF3B1 mutação em comparação com o tipo selvagem, obtido a partir da análise de dados de RNA-Seq usando DEXSeq. Os gráficos mostram alguns dos genes mais bem classificados com uso diferencial significativo de exon. Os exons destacados em roxo representam o uso diferencial significativo do exon.

Para identificar as vias afetadas pelo uso diferencial do exon, realizamos a análise da via nos genes que mostram exons expressos de forma significativa diferencial usando IPA. Na comparação de SF3B1 mutante com tipo selvagem e controle, observamos muitas vias a serem afetadas, incluindo ciclo celular, biossíntese de heme, resposta a danos no DNA, via de células progenitoras mitocondriais e hematopoiéticas (Tabela Suplementar S11 e S12). Usando a ferramenta de anotação funcional DAVID, observamos um enriquecimento significativo de temas biológicos, incluindo splicing alternativo, ligação de RNA, mitocôndria, spliceossomo e ciclo celular.

Recentemente, um papel para SF3B1 na manutenção da estabilidade genômica também foi relatado, onde ele funciona em um complexo de splicing de mRNA induzido por danos ao DNA com BRCA1 e BCLAF1. 33 Dado que a desregulação da via de resposta ao dano ao DNA foi destacada pela análise da via IPA, realizamos uma análise usando genes regulados pelo complexo BRCA1 – BCLAF1 – SF3B1. Several genes regulated by this complex showed differential exon usage in SF3B1 mutant compared with control (including NUMA1, RB1, CHUK e ABL1) and compared with wild type (NUMA1, PIAS1, SMAD4, BIRC2 e PTK2) (Supplementary Table S13). The overrepresentation of genes regulated by the BRCA1–BCLAF1–SF3B1 complex was significant in SF3B1 mutant compared with control (P<0.001) and compared with wild type (P=0.0498, hypergeometric test). We also found many genes to be affected at the transcript level, including BIRC3, BCL2A1, GYPB, HBB e HBBP1 when comparing SF3B1 mutant with wild type and control (Supplementary Table S13).


Identification of differentially expressed genes in trabecular bone from the iliac crest of osteoarthritic patients

Osteoarthritis (OA) is clinically characterized by degeneration of the joints and has been traditionally considered a primary disorder of articular cartilage, with secondary changes in the subchondral bone. The increased bone mass and generalized changes in bone quality observed in osteoarthritic patients suggest that OA may be a primary systemic bone disorder with secondary articular cartilage damage. The iliac crest is a skeletal site distant from the affected joint, with a minimal load-bearing function. To provide evidence that OA is a systemic disorder, we searched for differentially expressed genes in the iliac crest bone of patients suffering from hip OA.

Material e métodos

Gene expression levels between bone samples collected at surgery from the iliac crest of patients undergoing total hip arthroplasty for primary OA and younger donors, who were undergoing spinal arthrodesis, were investigated by means of oligonucleotide microarrays. To verify data detected by microarrays technology, Real Time Reverse Transcription-Polymerase Chain Reaction (RT-PCR) assays were performed with specimens from osteoarthritic patients and donors, as well as from elderly donors who were undergoing arthroplasty for subcapital femoral neck fracture.

Resultados

The microarray analysis surveyed 8327 genes and identified 83 whose expression levels differed at least 1.5-fold in the OA group (P < 0.005). Comparisons between Real Time RT-PCR data from OA and the two donor groups indicated differential expression of genes involved in bone cell functions in the group of OA patients. The genes identified, including CCL2, FOS, PRSS11, DVL2, AKT1, CA2, BMP6, OMD, MMP2, TGFBR3, FLT1, BMP1 e TNFRS11B, have known roles in osteoblast or osteoclast activities.

Conclusões

The data from this study identify a set of genes, closely related to bone cell functions, in which differential regulation in osteoarthritic bone distant from the diseased subchondral bone might underlie the etiopathogenesis of OA as a generalized bone disease.


Conteúdo

Expression profiling is a logical next step after sequencing a genome: the sequence tells us what the cell could possibly do, while the expression profile tells us what it is actually doing at a point in time. Genes contain the instructions for making messenger RNA (mRNA), but at any moment each cell makes mRNA from only a fraction of the genes it carries. If a gene is used to produce mRNA, it is considered "on", otherwise "off". Many factors determine whether a gene is on or off, such as the time of day, whether or not the cell is actively dividing, its local environment, and chemical signals from other cells. For instance, skin cells, liver cells and nerve cells turn on (express) somewhat different genes and that is in large part what makes them different. Therefore, an expression profile allows one to deduce a cell's type, state, environment, and so forth.

Expression profiling experiments often involve measuring the relative amount of mRNA expressed in two or more experimental conditions. This is because altered levels of a specific sequence of mRNA suggest a changed need for the protein coded by the mRNA, perhaps indicating a homeostatic response or a pathological condition. For example, higher levels of mRNA coding for alcohol dehydrogenase suggest that the cells or tissues under study are responding to increased levels of ethanol in their environment. Similarly, if breast cancer cells express higher levels of mRNA associated with a particular transmembrane receptor than normal cells do, it might be that this receptor plays a role in breast cancer. A drug that interferes with this receptor may prevent or treat breast cancer. In developing a drug, one may perform gene expression profiling experiments to help assess the drug's toxicity, perhaps by looking for changing levels in the expression of cytochrome P450 genes, which may be a biomarker of drug metabolism. [2] Gene expression profiling may become an important diagnostic test. [3] [4]

The human genome contains on the order of 25,000 genes which work in concert to produce on the order of 1,000,000 distinct proteins. This is due to alternative splicing, and also because cells make important changes to proteins through posttranslational modification after they first construct them, so a given gene serves as the basis for many possible versions of a particular protein. In any case, a single mass spectrometry experiment can identify about 2,000 proteins [5] or 0.2% of the total. While knowledge of the precise proteins a cell makes (proteomics) is more relevant than knowing how much messenger RNA is made from each gene, gene expression profiling provides the most global picture possible in a single experiment. However, proteomics methodology is improving. In other species, such as yeast, it is possible to identify over 4,000 proteins in just over one hour. [6]

Sometimes, a scientist already has an idea of what is going on, a hypothesis, and he or she performs an expression profiling experiment with the idea of potentially disproving this hypothesis. In other words, the scientist is making a specific prediction about levels of expression that could turn out to be false.

More commonly, expression profiling takes place before enough is known about how genes interact with experimental conditions for a testable hypothesis to exist. With no hypothesis, there is nothing to disprove, but expression profiling can help to identify a candidate hypothesis for future experiments. Most early expression profiling experiments, and many current ones, have this form [7] which is known as class discovery. A popular approach to class discovery involves grouping similar genes or samples together using one of the many existing clustering methods such the traditional k-means or hierarchical clustering, or the more recent MCL. [8] Apart from selecting a clustering algorithm, user usually has to choose an appropriate proximity measure (distance or similarity) between data objects. [9] The figure above represents the output of a two dimensional cluster, in which similar samples (rows, above) and similar gene probes (columns) were organized so that they would lie close together. The simplest form of class discovery would be to list all the genes that changed by more than a certain amount between two experimental conditions.

Class prediction is more difficult than class discovery, but it allows one to answer questions of direct clinical significance such as, given this profile, what is the probability that this patient will respond to this drug? This requires many examples of profiles that responded and did not respond, as well as cross-validation techniques to discriminate between them.

In general, expression profiling studies report those genes that showed statistically significant differences under changed experimental conditions. This is typically a small fraction of the genome for several reasons. First, different cells and tissues express a subset of genes as a direct consequence of cellular differentiation so many genes are turned off. Second, many of the genes code for proteins that are required for survival in very specific amounts so many genes do not change. Third, cells use many other mechanisms to regulate proteins in addition to altering the amount of mRNA, so these genes may stay consistently expressed even when protein concentrations are rising and falling. Fourth, financial constraints limit expression profiling experiments to a small number of observations of the same gene under identical conditions, reducing the statistical power of the experiment, making it impossible for the experiment to identify important but subtle changes. Finally, it takes a great amount of effort to discuss the biological significance of each regulated gene, so scientists often limit their discussion to a subset. Newer microarray analysis techniques automate certain aspects of attaching biological significance to expression profiling results, but this remains a very difficult problem.

The relatively short length of gene lists published from expression profiling experiments limits the extent to which experiments performed in different laboratories appear to agree. Placing expression profiling results in a publicly accessible microarray database makes it possible for researchers to assess expression patterns beyond the scope of published results, perhaps identifying similarity with their own work.

Both DNA microarrays and quantitative PCR exploit the preferential binding or "base pairing" of complementary nucleic acid sequences, and both are used in gene expression profiling, often in a serial fashion. While high throughput DNA microarrays lack the quantitative accuracy of qPCR, it takes about the same time to measure the gene expression of a few dozen genes via qPCR as it would to measure an entire genome using DNA microarrays. So it often makes sense to perform semi-quantitative DNA microarray analysis experiments to identify candidate genes, then perform qPCR on some of the most interesting candidate genes to validate the microarray results. Other experiments, such as a Western blot of some of the protein products of differentially expressed genes, make conclusions based on the expression profile more persuasive, since the mRNA levels do not necessarily correlate to the amount of expressed protein.

Data analysis of microarrays has become an area of intense research. [10] Simply stating that a group of genes were regulated by at least twofold, once a common practice, lacks a solid statistical footing. With five or fewer replicates in each group, typical for microarrays, a single outlier observation can create an apparent difference greater than two-fold. In addition, arbitrarily setting the bar at two-fold is not biologically sound, as it eliminates from consideration many genes with obvious biological significance.

Rather than identify differentially expressed genes using a fold change cutoff, one can use a variety of statistical tests or omnibus tests such as ANOVA, all of which consider both fold change and variability to create a p-value, an estimate of how often we would observe the data by chance alone. Applying p-values to microarrays is complicated by the large number of multiple comparisons (genes) involved. For example, a p-value of 0.05 is typically thought to indicate significance, since it estimates a 5% probability of observing the data by chance. But with 10,000 genes on a microarray, 500 genes would be identified as significant at p < 0.05 even if there were no difference between the experimental groups. One obvious solution is to consider significant only those genes meeting a much more stringent p value criterion, e.g., one could perform a Bonferroni correction on the p-values, or use a false discovery rate calculation to adjust p-values in proportion to the number of parallel tests involved. Unfortunately, these approaches may reduce the number of significant genes to zero, even when genes are in fact differentially expressed. Current statistics such as Rank products aim to strike a balance between false discovery of genes due to chance variation and non-discovery of differentially expressed genes. Commonly cited methods include the Significance Analysis of Microarrays (SAM) [11] and a wide variety of methods are available from Bioconductor and a variety of analysis packages from bioinformatics companies.

Selecting a different test usually identifies a different list of significant genes [12] since each test operates under a specific set of assumptions, and places a different emphasis on certain features in the data. Many tests begin with the assumption of a normal distribution in the data, because that seems like a sensible starting point and often produces results that appear more significant. Some tests consider the joint distribution of all gene observations to estimate general variability in measurements, [13] while others look at each gene in isolation. Many modern microarray analysis techniques involve bootstrapping (statistics), machine learning or Monte Carlo methods. [14]

As the number of replicate measurements in a microarray experiment increases, various statistical approaches yield increasingly similar results, but lack of concordance between different statistical methods makes array results appear less trustworthy. The MAQC Project [15] makes recommendations to guide researchers in selecting more standard methods (e.g. using p-value and fold-change together for selecting the differentially expressed genes) so that experiments performed in different laboratories will agree better.

Different from the analysis on differentially expressed individual genes, another type of analysis focuses on differential expression or perturbation of pre-defined gene sets and is called gene set analysis. [16] [17] Gene set analysis demonstrated several major advantages over individual gene differential expression analysis. [16] [17] Gene sets are groups of genes that are functionally related according to current knowledge. Therefore, gene set analysis is considered a knowledge based analysis approach. [16] Commonly used gene sets include those derived from KEGG pathways, Gene Ontology terms, gene groups that share some other functional annotations, such as common transcriptional regulators etc. Representative gene set analysis methods include Gene Set Enrichment Analysis (GSEA), [16] which estimates significance of gene sets based on permutation of sample labels, and Generally Applicable Gene-set Enrichment (GAGE), [17] which tests the significance of gene sets based on permutation of gene labels or a parametric distribution.

While the statistics may identify which gene products change under experimental conditions, making biological sense of expression profiling rests on knowing which protein each gene product makes and what function this protein performs. Gene annotation provides functional and other information, for example the location of each gene within a particular chromosome. Some functional annotations are more reliable than others some are absent. Gene annotation databases change regularly, and various databases refer to the same protein by different names, reflecting a changing understanding of protein function. Use of standardized gene nomenclature helps address the naming aspect of the problem, but exact matching of transcripts to genes [18] [19] remains an important consideration.

Having identified some set of regulated genes, the next step in expression profiling involves looking for patterns within the regulated set. Do the proteins made from these genes perform similar functions? Are they chemically similar? Do they reside in similar parts of the cell? Gene ontology analysis provides a standard way to define these relationships. Gene ontologies start with very broad categories, e.g., "metabolic process" and break them down into smaller categories, e.g., "carbohydrate metabolic process" and finally into quite restrictive categories like "inositol and derivative phosphorylation".

Genes have other attributes beside biological function, chemical properties and cellular location. One can compose sets of genes based on proximity to other genes, association with a disease, and relationships with drugs or toxins. The Molecular Signatures Database [20] and the Comparative Toxicogenomics Database [21] are examples of resources to categorize genes in numerous ways.

Regulated genes are categorized in terms of what they are and what they do, important relationships between genes may emerge. [23] For example, we might see evidence that a certain gene creates a protein to make an enzyme that activates a protein to turn on a second gene on our list. This second gene may be a transcription factor that regulates yet another gene from our list. Observing these links we may begin to suspect that they represent much more than chance associations in the results, and that they are all on our list because of an underlying biological process. On the other hand, it could be that if one selected genes at random, one might find many that seem to have something in common. In this sense, we need rigorous statistical procedures to test whether the emerging biological themes is significant or not. That is where gene set analysis [16] [17] comes in.

Cause and effect relationships Edit

Fairly straightforward statistics provide estimates of whether associations between genes on lists are greater than what one would expect by chance. These statistics are interesting, even if they represent a substantial oversimplification of what is really going on. Aqui está um exemplo. Suppose there are 10,000 genes in an experiment, only 50 (0.5%) of which play a known role in making cholesterol. The experiment identifies 200 regulated genes. Of those, 40 (20%) turn out to be on a list of cholesterol genes as well. Based on the overall prevalence of the cholesterol genes (0.5%) one expects an average of 1 cholesterol gene for every 200 regulated genes, that is, 0.005 times 200. This expectation is an average, so one expects to see more than one some of the time. The question becomes how often we would see 40 instead of 1 due to pure chance.

According to the hypergeometric distribution, one would expect to try about 10^57 times (10 followed by 56 zeroes) before picking 39 or more of the cholesterol genes from a pool of 10,000 by drawing 200 genes at random. Whether one pays much attention to how infinitesimally small the probability of observing this by chance is, one would conclude that the regulated gene list is enriched [24] in genes with a known cholesterol association.

One might further hypothesize that the experimental treatment regulates cholesterol, because the treatment seems to selectively regulate genes associated with cholesterol. While this may be true, there are a number of reasons why making this a firm conclusion based on enrichment alone represents an unwarranted leap of faith. One previously mentioned issue has to do with the observation that gene regulation may have no direct impact on protein regulation: even if the proteins coded for by these genes do nothing other than make cholesterol, showing that their mRNA is altered does not directly tell us what is happening at the protein level. It is quite possible that the amount of these cholesterol-related proteins remains constant under the experimental conditions. Second, even if protein levels do change, perhaps there is always enough of them around to make cholesterol as fast as it can be possibly made, that is, another protein, not on our list, is the rate determining step in the process of making cholesterol. Finally, proteins typically play many roles, so these genes may be regulated not because of their shared association with making cholesterol but because of a shared role in a completely independent process.

Bearing the foregoing caveats in mind, while gene profiles do not in themselves prove causal relationships between treatments and biological effects, they do offer unique biological insights that would often be very difficult to arrive at in other ways.

Using patterns to find regulated genes Edit

As described above, one can identify significantly regulated genes first and then find patterns by comparing the list of significant genes to sets of genes known to share certain associations. One can also work the problem in reverse order. Here is a very simple example. Suppose there are 40 genes associated with a known process, for example, a predisposition to diabetes. Looking at two groups of expression profiles, one for mice fed a high carbohydrate diet and one for mice fed a low carbohydrate diet, one observes that all 40 diabetes genes are expressed at a higher level in the high carbohydrate group than the low carbohydrate group. Regardless of whether any of these genes would have made it to a list of significantly altered genes, observing all 40 up, and none down appears unlikely to be the result of pure chance: flipping 40 heads in a row is predicted to occur about one time in a trillion attempts using a fair coin.

For a type of cell, the group of genes whose combined expression pattern is uniquely characteristic to a given condition constitutes the gene signature of this condition. Ideally, the gene signature can be used to select a group of patients at a specific state of a disease with accuracy that facilitates selection of treatments. [25] [26] Gene Set Enrichment Analysis (GSEA) [16] and similar methods [17] take advantage of this kind of logic but uses more sophisticated statistics, because component genes in real processes display more complex behavior than simply moving up or down as a group, and the amount the genes move up and down is meaningful, not just the direction. In any case, these statistics measure how different the behavior of some small set of genes is compared to genes not in that small set.

GSEA uses a Kolmogorov Smirnov style statistic to see whether any previously defined gene sets exhibited unusual behavior in the current expression profile. This leads to a multiple hypothesis testing challenge, but reasonable methods exist to address it. [27]

Expression profiling provides new information about what genes do under various conditions. Overall, microarray technology produces reliable expression profiles. [28] From this information one can generate new hypotheses about biology or test existing ones. However, the size and complexity of these experiments often results in a wide variety of possible interpretations. In many cases, analyzing expression profiling results takes far more effort than performing the initial experiments.

Most researchers use multiple statistical methods and exploratory data analysis before publishing their expression profiling results, coordinating their efforts with a bioinformatician or other expert in DNA microarrays. Good experimental design, adequate biological replication and follow up experiments play key roles in successful expression profiling experiments.


Identification of Differentially Expressed Genes and Elucidation of Pathophysiological Relevance of ABCA1 in HaCaT Cells Induced by PM2.5

Objetivo. In order to investigate the effects of PM2.5 on proliferation, cell cycle, apoptosis, and potential mechanism of human keratinocyte cell line HaCaT. Métodos. HaCaT cells were treated with different concentrations of PM2.5 suspension for 24 hours. Cell viability was detected by the CCK-8 method. Cell cycle distribution and apoptosis were detected by flow cytometry. Microarray analyses were used to find out the microarray gene expression profiling data processing included gene enrichment and pathway analysis. Western blot was conducted to validate the key pathways and regulators in the microarray analysis. Resultados. The cell activity decreased, and the cell cycle was significantly inhibited with the increase in PM2.5 concentration. Also, by conducting the gene expression microarray assay, we identified 541 upregulated genes and 935 downregulated genes in PM2.5-treated HaCaT cells. Real-time qPCR and western blot confirmed that PM2.5 treatment could induce the expression of ABCA1 while inhibiting that of END1 and CLDN1. Conclusão. Our results showed that PM2.5 could potentially regulate cell apoptosis and cell cycle arrest via ABCA1-, END1-, ID1-, and CLDN1-mediated pathways in human HaCaT cells, which laid a good foundation for follow-up drug intervention and drug development against skin damage caused by PM2.5 exposure.

1. Introdução

The World Health Organization (WHO) reported that air pollution was one of the world’s largest environmental health risk factors. Air pollution is a heterogeneous mixture of chemicals and solid particles. Ambient particulate matters (PMs) are one major component of air pollutants. PMs, especially particles on the nanosized range, are the main cause of risk factors [1]. Ambient particulate matter 2.5 (PM2.5) was one of the main components of air pollutants, which can absorb many polycyclic aromatic hydrocarbons and metals [2].

Air pollution-related mortality and morbidity from respiratory and cardiovascular diseases could be traced back to the 1950s. Long-term exposure to PM2.5 is a potential risk factor for various diseases including cancer and cardiovascular and respiratory diseases [3–7]. The skin provides a major defense against air pollutants [8, 9], which can cause human skin damage and exacerbate preexistent skin diseases, such as erythema, hyperplasia, skin aging, atopic dermatitis, and carcinogenesis [10–12]. However, the effects of PM2.5 on the function of human skin and its biological significance in skin homeostasis remain inconclusively understood. Previously, we have demonstrated exposure to PM2.5 is associated with skin damages like senile lentigo [13]. In this study, we focused on the HaCaT cell proliferation and apoptosis under PM2.5 challenge and employed gene microarray analysis to identify upstream regulators and found out that genes associated with an inflammatory response were engaged in PM2.5-stimulated HaCaT apoptosis.

2. Methods and Materials

2.1. Main Reagents and Equipment

HaCaT cells (Dermatology, Peking University People’s Hospital, The second clinical academy of Peking University medicine school), PMI1640 medium (Sigma, USA), trypsin (Gibco, USA), fetal bovine serum (Shanghai Enzyme-linked Biotechnology Co., Ltd.), Rabbit anti-human IL-1 and IL-6 monoclonal antibodies, horseradish peroxidase-labeled goat anti-rabbit IgG (CST, USA), TRIzol reagent, and RT-PCR kit were used (Invitrogen, USA). High-speed refrigerated centrifugation (Beckman, USA), constant temperature CO2 incubator, and ABI7900 real-time PCR instrument (ABI, USA) were used.

2.2. Métodos
2.2.1. Preparation of PM2.5 Turbid Liquid and Particle Treatment

At the junction of the East Second Ring Road and the East Third Ring Road in Beijing, we collected air samples which were 20 m above the top of buildings during the heating period of winter (from December to January). HY-1000 intelligent large-flow TSP sampler (optional PM2.5 cutter, Qingdao Hengyuan Technology Development Co., Ltd.) was used for quartz filter sampling. The average flow rate was set at 1000 L/min, and each sample was continuously collected for 24 hours. The quartz membrane was equilibrated under constant temperature and humidity conditions for 24 hours. Then, the filter was cut into approximately 1 cm 2 with sterilized surgical scissors and immersed in 75% ethanol, followed by ultrasonic shaking for 60 minutes in a water bath to elute the particles, after which ice was added in to keep the water temperature below 20°C. In the biological safety cabinet, the eluate was filtered into a plurality of glass dishes with 70 µm filters, and the UV lamp was utilized for total sterilization. After most of the ethanol was volatilized, the eluate was vacuum dried for 24 hours, after which samples were weighed. Sterile water was used to prepare a high concentration stock solution which was stored at −20°C. All of the above procedures were processed in the Toxicology Room of the Environmental and Health-Related Product Safety Institute of the Chinese Center for Disease Control and Prevention.

2.2.2. Cell Culture and Cell Counting Kit-8 (CCK-8)

HaCaT cells were cultured in 5% CO2 at 37°C in regular Dulbecco’s Modified Eagle’s Medium (DMEM) (Invitrogen Co. Ltd) containing 1.8 mM Ca 2+ or with DMEM (Gibco, Life Technologies, Carlsbad, CA, USA) at a low concentration of Ca 2+ (0.07 mM). Both media were supplemented with 10% heat-inactivated fetal bovine serum, glutamine (2 mM), penicillin (100 U/ml) (Euroclone), and streptomycin (100 mg/ml) (Euroclone). Cells were stimulated with different concentrations of PM2.5 (50 µg/ml, 100 µg/ml, 200 µg/ml, and 400 µg/ml) in HaCaT cells at 24 h and 48 h. Cells were seeded in 96-well plates at a density of 2.0 × 10 3 cells per well. Each sample was repeated five times. Then, cell proliferation was determined using CCK-8 (Sigma-Aldrich, St. Louis, MO, USA) for five days after seeding. In brief, CCK-8 solution was added to each well and incubated at 37°C for 4 h according to the manufacturer’s protocol. Following this, the optical density (OD) value at 450 nm was determined using a microplate reader (Tecan Infinite, Männedorf, Switzerland).

2.2.3. Microarray Analysis

HaCaT cells were treated by 200 ug/ml PM2.5, and untreated HaCaT cells were collected for microarray analysis, microarray gene expression profiling, and data processing.

(1) RNA Preparation and Quality Control. Total RNA from cultured HaCaT cells was extracted by TRIzol and purified using RNeasy RNA extraction kit. Quality control of extracted RNA was subsequently validated by both Thermo Nanodrop 3000 and Agilent 2100 bioanalyzer with utilization of Agilent RNA 6000 Nano Kit. Total RNA will be subjected to microarray analysis until it meets the following standards: 1.8 <A260/A280 <2.0 by Thermo Nanodrop 3000 and RIN> = 7.0 and 28S/18S >0.75 by Agilent 2100 bioanalyzer.

(2) Microarray Processing and Data Analysis. 6 GeneChip microarrays (Affymetrix 901838) were hybridized with three pairs of samples to determine gene expression profiles of the control and treatment samples according to the manufacturer’s instructions. Finally, raw data were imported to R (http://www.r-project.org) and analyzed by the Bioconductor affy package (http://www.bioconductor.org). Logarithmic (base 2) intensity measures were obtained by RMA. The intensity was converted to nonlogarithmic values and rescaled by adjusting mean intensity on each array to 400. Cell files and RMA values were deposited on Gene Expression Omnibus (http://www.ncibi.nih.gov/geo/).

(3) Identification of Differential Expressed Genes (DEGs). Limma package was used to normalize the microarray raw data, and genes with (log2fold change) > = 2 and

indicated that there is a statistically significant difference between the groups.

(4) Enrichment Analysis of DEGs. The online functional annotation tool, DAVID (http://www.abcc.ncifcrf.gov), was then used to perform the GO-BP functional enrichment analysis for DEGs, with the threshold of

. Pathway enrichment analysis was done using both KEGG (http://www.kegg.jp/Kegg/pathway.html) and Reactome (http://www.reactome.org) databases. was selected as the threshold value.

(5) Pathway and Network Analysis. The list of significantly overexpressed or downregulated genes identified by Affymetrix probe set IDs, fold changes, and p values were uploaded into the Ingenuity Pathway Analysis (IPA) tool (http://www.ingenuity.com). Each clone identifier was mapped to its corresponding gene object in the Ingenuity Pathway Knowledge Base (IPKB). These focus genes were then used for constructing biological networks, using the “IPA” core analysis function. To start building networks, the application queries the IPKB for interactions between focus genes and all other gene objects stored in the knowledge base and generates a set of networks. Every resulting gene interaction has supporting literature findings available online. IPA then computes a score for each network according to the fit of the user’s set of significant genes. The score is derived from value and indicates the likelihood of the focus genes in a network being found together as a result of random chance. A score of 2 indicates that there is a 1-in-100 chance that the focus genes are together in a network as a result of random chance. Therefore, scores of 2 or higher have at least 99.5% confidence of not being generated by random chance alone.

2.2.4. Western Blot

Total protein was extracted from cells and quantified. Transmembrane was performed after electrophoresis. After blocking with 5% skim milk for 1.5 h, membranes were incubated with primary rabbit anti-human monoclonal antibodies of IL-1, IL-6, and GAPDH (1 : 1000 Cat nos: #12703, #12153, #8884 Cell Signaling Technology, Danvers, MA, USA) overnight at 4°C. After washing with TBST three times, 5 min each time, membranes were incubated with Horseradish peroxidase-labeled goat anti-rabbit IgG secondary polyclonal antibody (1 : 2000 Cat nos: A0208, Beyotime Biotechnology, Shanghai, China) at 37°C for 2 h. After washing with TBST three times, 10–15 min each time, color development was performed, and the signal was detected. GAPDH was used as endogenous control.

2.2.5. PCR em tempo real

PCR reactions were performed using real-time PCR kit with a reaction system of 10 µeu. PCR reaction conditions were as follows: 95°C for 10 min, followed by 35 cycles of 95°C for 30 s, 59°C for 30 s, and 72°C for 25 s. In this study, Roche 384 real-time PCR amplification instrument was used to carry out real-time fluorescence quantitative PCR reactions with GAPDH as endogenous control. Data were processed using the ΔΔCt method, and three replicates were set for each sample.

2.2.6. Flow Cytometry

Cell cycle and apoptosis were determined using flow cytometry. In brief, cells were seeded in 6 cm dish overnight to a confluency of 80%. Then, cells were trypsinized, washed with precooled D-Hanks (pH = 7.2–7.4) buffer, and fixed with 75% ethanol at 4°C for 1 h. Following this, cells were stained with propidium iodide (PI) solution (PI 50 µg/mL and RNase A 200 µg/mL, Sigma-Aldrich, St. Louis, MO, USA) at RT for 30 min in the dark and then analyzed using a Guava®easyCyte flow cytometer (Millipore, Billerica, MA, USA). Each experiment was performed in triplicate, and the average value was calculated as the final result.

3. Resultados

3.1. Effect of PM2.5 on Cell Viability, Cell Cycle, and Cytokine Secretion

Stimulated with different concentrations of PM2.5 (50 ug/ml, 100 ug/ml, 200 ug/ml, and 400 ug/ml) in HaCaT cells at 24 h and 48 h, the cell activity decreased with the increase in PM2.5 concentration (Figure 1(a)). Stimulated with different concentrations of PM2.5 (50 ug/ml, 100 ug/ml, 200 ug/ml, and 400 ug/ml) in HaCaT cells at 24 h and 48 h, the cell cycle was significantly inhibited with the increase in PM2.5 concentration (Figures 1(b) and 1(c)). Cell apoptosis HaCaT cells after 24 h and 48 h PM2.5 treatment were observed under microscope (Figures 1(d) and 1(e)).


Assista o vídeo: #50 prof. Joachim Cieślik - Ludzki genom: scenariusz życia. Środowisko: jego reżyserem (Janeiro 2022).