材料与方法 综合数据挖掘工具BRB-Array Tools(v4.1)、DAVID(Database for Annotation. Visualization, and Integrated Discovery, v6.7、GSEA(Gene Set Enrichment Analysis,v3.7),分别对ALK融合型NSCLC和非ALK融合型NSTI571SCLC表达谱芯片数据集进行数据挖掘,参考数据库为GO、KEGG等,并应用文献自主挖掘系统对pubmed上可检索到的文献(仅针对摘要内容)进行了初步的挖掘与筛选,以寻找组间差异表达基因,并对其生物学行为过程、分子生物功能、信号转导通路等领域进行了基因集富集和聚类分析。 结果 EML4-ALK融合型与野生型NSCLC相比存在8无3个差异表达基因,其中30个基因出现表达水平的显著上调;53个基因出现显著下调。这些差异表达基因经注释和富集分析,涉及5个生物学过程和4条信号转导通路。 结论 差异表达基因间具有一定的“相关性”,很少出现单个或是几个基因参与某个生物过程。EML4-ALK融合型肺癌形成并非某个分子的生物学行为,上述这些基因功能和信号转导通路的许多变化相互交错、互相影响,最终构成了EML4-ALK融合型NSCLC区别其他肺癌的分子基础。 第二部分EML4-ALK信号通路关键基因STAT3的初步功能验证 第一章STAT3表达产物的蛋白质相互作用网络构建 目的 将与STAT3基因产物相互作用的蛋白质构建相互作用网络,以此为依托探索其中的核心蛋白STAT3在EML4-ALK融合型肺癌中的作用。以期从蛋白质相互作用水平阐述STAT3勺异常与该型肺癌的联系。