在上一期的《生信教学课堂第一讲(手把手教你如何查找和下载GEO表达数据)》 文章中主要讲了获取与自己研究相关的GEO数据的方法,这一期我们主要讲如何用在线软件GEO2R和OmicsBean进行GEO数据差异基因的重新计算。
一.使用在线软件GEO2R分析差异基因
1.进入GEO2R计算平台
通过GEO主页检索上一期课堂中找到的和移植手术相关的GEO ID GSE4386,见图1,可直接进入GEO数据的信息页面,见图2,页面上有GEO2R软件按钮“Analyze with GEO2R”,点击可以进入GEO2R 计算平台。
图1 检索GSE4386数据集
图2 进入GEO2R 计算平台
2.设计GEO样本分组
通过分析平台上样本的描述对样本进行分组,这里GSE4386数据集中样本共分为两个组,BeforeSurgery(手术前)和AfterSurgery(手术后),见图3。设置好分组后就可以设置计算参数。
图3 GEO数据样本进行分组设置
3.设置参数进行差异计算
GEO2R 可设置参数比较少,主要是Pvalue的校对方法,是否进行log转换,注释平台。这些参数一般都选择默认,如果需要修改pvalue cutoff, Foldchange阈值则需要修改Rscript 程序,这操作起来就比较复杂了,见图4。设置参数后可以点击图5Save all results获取差异计算的全部结果,也可以点击Top250 获取差异计算的前250个结果。图6为分析结果。
图4 设置参数
图5 点击进行计算
图6 分析结果
分析结果中第一列为探针ID,第二列为adj.P.Val,第三列为P.Value,第六列为logFC,第七列为gene symbol。
二.使用OmicsBean计算差异基因
1.下载GEO SOFT文件用于转换矩阵
按图1所示点击下载SOFT压缩文件用于矩阵转换,SOFT文件中包含样本的表达谱数据和探针的注释信息。
图7 下载GEO SOFT文件
2.SOFT文件进行格式转换
将下载好的GEO SOFT文件通过OmicsBean(www.omicsbean.cn)平台GEO2matrix APP进行格式转换,操作步骤见图8.计算完成后见图9点击show result 下载结果文件。文件见图11是带有探针的表达数据。
图8 GEO SOFT文件格式转换
图9 计算完成
图10 下载计算结果
图11 转换后的带探针ID的表达数据
3.探针表达矩阵进行基因名字注释
将转换好的探针矩阵文件使用omicsbean GEOFormat App进行基因名字注释,见图11,选择用来注释探针的那一列,这里选Gene Symbol。运行成功后点击show result 进入结果文件下载页面,可下载到图12的基因表达矩阵。
图11 GEOFormat 进行基因名字注释
图12 基因表达矩阵
3.构建表达分组文件进行差异计算
根据前面GEO样本信息对样本进行分组设置,制作出样本的分组文件。将上一步得到的表达文件和制作好的分组文件通过omicsbean的limma App进行差异分析,可以设置参数Foldchange 和 Pvalue。计算结果会得到火山图和差异基因列表。
图13 样本分组文件
图14 Limma App计算差异基因
图15 设置比较分组
图16 分析完成
图17 计算出的火山图
三.软件比较
通过使用两个不同软件进行GEO数据重新计算差异基因,发现两个软件的一些区别,omicsbean 和 GEO2R 使用同样的包进行分析,结果差异很小,但从可用性上看omicsbean 思路比较清楚,可操作,可扩展。
软件 | GEO2R | OmicsBean |
结果准确性 | 使用包相同结果差异很小 | 使用包相同结果差异很小 |
可操作性 | 修改参数较难 | 可以根据结果调整参数 |
扩展性 | 获取不到原始表达矩阵 | 可以得到原始矩阵进行其他分析 |
图表 | 没有图 | 有火山图和差异基因表 |
对文章有疑问或者对生物信息分析数据感兴趣都可以通过下面的微信联系我们。
金弗康科研团队专注于生物信息分析,科研外包服务,自主研发的omicsbean 生物云平台上线近两年时间,已经有30多家高校和研究所使用该软件平台发表SCI文章,总影响因子达到124.147,其中最高影响因子26.9,包括多篇发表在Nature,Science等杂志的文章。
金弗康生物科技致力于大数据产业自动化和智能化解决方案,是上海市科创板挂牌企业(300151),高新技术企业以及大数据专项建设承担企业,依托自主研发的基因检测工业化系统,整合上下游优质基因检测和健康干预管理产品,成为国内基因检测和精准医疗配套服务商。公司专利储备56个,其中发明专利42个,软件著作权专利14个。具有自主知识产权的智能化基因检测系统目前覆盖病理检测,医学普检,癌症和遗传病检测已深入多家三甲医院和医学检验机构,用以实现检测数据精准解读从而提高医疗服务品质。
公司未来将致力于大数据技术在遗传病检测方向的应用,涉及检测试剂盒,癌症早筛(ctDNA检测)的精准检测,临检、病理、特检相结合的区域一体化检测中心实现云端化数据传输,靶向中医药用于临床癌症治疗等方面。
我们承接各组学、临床数据的单独、整合分析;疾病模型预测;蛋白结构预测及功能模拟;纯数据库信息挖掘等生物信息分析服务。提供各类测序;验证实验等科研外包的服务。欢迎有兴趣的小伙伴,免费注册体验omicsbeans一站式的生物信息分析系统。详细情况,欢迎添加微信号询问,或者在文章下面留言,谢谢关注!自主或定制生物信息分析找金弗康;做各类测序,验证实验找金弗康;因为我们是专业的!
上海细胞治疗集团有限公司是以细胞治疗为核心,打造“细胞储存、卓越细 胞药物研发及精准细胞临床转化”三位一体闭环产业链的细胞健康综合体平台型公司,以“让细胞改变生命的长度和丰度”为使命,以“白泽计划”的实现为根本目标,致力于研发疗效达到国际领先、且中国人能够用得起的癌症免疫治疗技术及产品。
约惠春天—客户回馈方案
活动时间:2019年3月8日至3月31日。
活动对象:在细胞中心购买产品的客户。
活动内容:
一、 活动期间内,客户任意消费均享9折优惠。
二、 活动期间内,客户消费满9.98万元赠送肿瘤标志物,循环肿瘤细胞和免疫功能检测各一次(市场价值6800元
三、 活动期间内,客户消费满12.8万元除享活动一、二外,额外赠送苹果X系列手机一台。
注:活动期间未采血的消费不参加以上活动。