16s RNA分析的众多建议

admin 12 2025-01-31 编辑

1、关于数据的质量控制,根据数据量,建议将数据的最低标准提高到30(或者是25),最短序列长度提高到75,上次是50,这要看一下fastqc的结果,之后应该去除嵌合体序列,推荐使用UCHIME《UCHIME improves sensitivity and speed of chimera detection》-----bioinformatics

2、多样性中,距离选择现在包括两种,一种是物种距离(Jaccard\Bray-Curtis);另一种是基于进化的距离(Unifrac),基于进化的距离还包含权重和非权重两种,虽然含有进化信息但是,进化信息并不是越多越好,在结果呈现上,这两种我们都应该删除结果,距离一般分为离散和连续两种,由于物种的分布上,主要是离散的量,所以我们这里选择离散的结果。三维展示PCoA,还需要进行Performing Procrustes Analysis,,《Phylogenetic Beta Diversity Metrics, Trait Evolution and Inferring the Functional Beta Diversity of Communities》------PLoS ONE

3、检验样本之间的异同,可以借助OTU的表达量矩阵,做出表达分析图,再用假设检验中的均值检验,注意此过程中可以对数据进行标准化。

4、在样本过程中要找出差异性表达,这一点要体现对物种的比较上,也就是多样性分析(P-value)

5、比较差异性,可以通过神经网络的方法成呈现,先看看物种分布是由地点影响的多,还是时间影响的多,然后做出相关的神经网络图,具体的一篇文章可参考文献《Using network analysis to explore co-occurrence patterns in soil microbial communities》,来自ISME J杂志

6、将分类群以进化树的形式呈现,将比对与进化树相结合主要用的是tax2tree这个软件,,这个软件已经集成到QIIME中了,需要在align_seqs.py这一步设置参数--tree_fp、-m,参考文献见:《An improved Greengenes taxonomy with explicit ranks for ecological and evolutionary analyses of bacteria and archaea》,来自ISME J杂志

7、《Impact of training sets on classification of high-throughput bacterial 16s rRNA gene surveys》-ISME该篇文献探讨了目前基于三个16s rRNA参考数据库所提炼出来的快速分类参考数据集合,在快速分类过程中的准确性。来自ISME J杂志

8、《Illumina-based analysis of microbial community diversity》---ISME该篇文献论述了Illumina测序方法在识别微生物16s rRNA中的应用,涉及到的内容包括barcode序列的设计等相关内容,以及一些测序的数据量。来自ISME J杂志

9、在文献《Global patterns of 16S rRNA diversity at a depth of millions of sequences per sample》--PNAS,根据真实的测序数据量,提到OTU的过滤参数是10000,才模拟到真实的数据,当然也要根据自己真实的数据量,实际上QIIME在找寻OTU的时候,使用的是比较通用的uclust,里面默认的设置的过滤参数为4.由于我们不能确定到底环境中到底有多少的物种,所以再这里我们可以用箱线图做出关于OTU的信息,参见文献《Microbiome Profiling by Illumina Sequencing of Combinatorial Sequence-Tagged PCR Products》---PLoS ONE中的

10、《The diversity and biogeography of soil bacterial communities》--PNAS该文献探讨了PH值与物种风度和多样性之间的之间,-A phylotype diversity(使用香农指数)与PH值之间的关系;-Bphylotype richness(defined as the number of unique phylotypes),期间文献中做了一个线性回归和二次回归,这个我们可以在探讨完环境因子的突出因素,再来做这个。

11、期刊投稿指南可选的有:《Appl Environ Microbiol》命中率30%,影响因子3.678,一般1.8月;《BMC Microbiology》较容易一般3-6周, 影响因子3.1;《applied microbiology and biotechnology》平均1.5个月影响因子3.689,《ISME J》影响因子7.375,一审周期2.6个月,命中率为20%;<</span>BMC Microbiology >影响因子3.1

12、《Archaea in Yellowstone Lake》,这篇文献主要研究的对象是水,使用454测序了4个水体样本,总的测序数据51,000条 reads,关于理化指标的选取,可以从这里来做(Table1)。

13、应该给出每个样本含有OTU的数量。

14、此外,在建立fast_map文件的时候,除了包含以前的信息外,还可以设置一项,将一年分为四个部分。  参考文献《太湖蓝藻水华的预防、预测和预警的理论与实践》

12-2 下沉休眠

3-4      上游复苏

5-7 大量生长

8-11 上游积聚

15、分析水体的理化指标,建议可以选取以下指标:分析水样中的pH、溶解氧( D0) 、透明度( SD) 、总磷(TP) 、溶解性总磷(TDP) 、溶解性磷酸盐( DP) 、总氮(TN) 、氨氮、Chla(叶绿素a),可以参考文献《滇池水体理化环境状况时空分布格局研究》、《滇池藻类生物量时空分布及其影响因子》

16、检验一下物种分布是否有差异性,使用方差检验,具体见,不需要借助DEseq

17、挑选微生物群去与环境因子做RDA分析,挑选的命令建议使用:compute_core_microbiome.py

18、实现样本与样本之间的比较,可以使用make_distance_boxplots.py 

19、鉴别某一分类是否有用,使用 otu_category_significance.py(方差分析)

20、按时间和地点画分布图,首先要sort_otu_table.py、summarize_taxa.py、plot_taxa_summary.py

21、关于fast_map.txt的设置内容可以添置地点的南北,时间上四阶段的分化,整个96个样本看成一个。

原文转自:http://blog.sina.com.cn/s/blog_83f77c940102ven5.html

欢迎大家前往支持博主。

欢迎关注

16s RNA分析的众多建议

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 10X Genomics V(D)J测序:免疫分析从零起步学(二)
相关文章