GEO数据库转录组数据的挖掘与分析

 2025-09-23  
 1364  

作者:魏雨城

魏雨城同学最近正在系统学习生物信息分析,并整理了一份关于GEO数据库转录组数据挖掘与分析的详细笔记。希望可以分享出来,帮助到正在学习相关内容的同学。

本篇笔记以一个来自GEO数据库的肺鳞癌真实数据集(GSE3268)为例,使用R语言,从头到尾完整地展示了一套标准的转录组数据分析流程。内容涵盖:

  • 数据获取与预处理:如何使用GEOquery包下载数据,并进行探针ID到基因Symbol的转换。

  • 数据可视化与质控:通过箱线图、PCA分析等方法评估样本质量和一致性。

  • 差异表达分析:采用t-test和功能更强大的limma包两种方法,筛选肿瘤与正常样本间的差异表达基因。

  • 结果的可视化:绘制火山图和热图,直观地展示差异表达基因的分布和聚类情况。