做RNA-seq实验,大家在拿到数据后总会碰到一堆疑问。小编整理了后台高频问题,一次性给大家答疑!建议先收藏再慢慢看。比如这次做分析为什么报告里基础的火山图都没了?原因是这种图只能做两组比较,多组比较没法算FC值,所以依赖FC值的图表全部都没了!不仅是火山图,上下调基因的结果也会消失,所以转录组和代谢组实验都不推荐多组比较。 另外,在基因表达模式聚类热图上为什么看不到基因名字?可能是基因太多了,名字会挤在一起看不清楚。如果想保留名字,可以在云平台选部分基因绘图。 大家还常问的问题是,结果里的基因名称全是代码编号而不是我们熟悉的符号(Symbol)。其实这些编号就是基因名,只有有参项目才有常见名字,无参项目肯定没有。这串代码实际上和参考基因组里的叫法是一样的,发文章的时候这些命名也是被认可的。如果你非要找常见的符号名,可以去看看05文件夹里的anon后缀文件。 再来说说KEGG富集分析遇到的问题:分析出来的通路不是你想要的怎么办?比如植物研究居然跑出来动物的通路?这是正常现象。KEGG软件用的是全库数据库,没有区分物种。这说明这些基因在别的物种里也存在并且参与代谢过程。老师直接把这些不相关的通路忽略掉就可以了。 还有就是别人都能跑出几千个差异基因,自己的只有几百个怎么办?其实几百个差异基因已经够用了,不可能全部去验证的。如果你觉得少了可以适当放宽阈值筛选更多基因出来。 对于PCA图里有离群样本或者分不出来怎么办?PCA是一种无监督的降维统计方法,完全看基因表达值本身的变异。如果实在介意离群点的话可以考虑剔除它们。 最后说说为什么关注的通路没富集到?富集分析主要是看差异物质在某个功能类别里的比例是否显著高于背景数据集。如果没富集到可能是样本量或背景数据集的问题。 总之转录组分析不是玄学,多结合自己的生物学背景回归原始数据看看就能解决很多问题啦!你在做转录组时遇到过什么奇葩问题吗?欢迎在评论区留言讨论!