凤凰彩票平台手机版_凤凰彩票官方版app下载|唯一官方网站

来自 凤凰彩票唯一官方网站科学 2019-08-24 14:36 的文章
当前位置: 凤凰彩票平台手机版 > 凤凰彩票唯一官方网站科学 > 正文

【凤凰彩票唯一官方网站】扩大与扩充子解析流

深入分析前计划

剖判前准备

扩大与扩张子解析解读6进化树 Alpha Beta多样性,阿尔法beta

分析前计划

# 进入工作目录
cd example_PE250

上一节回看:大家的OTU获得了物种注释,并就学OTU表的各样操作————增多消息,格式转变,筛选音信。   接下来大家上学对OTU类别的升华深入分析、同时计算Alpha和Beta各类性值。   16. 前进树营造进化树是基于多类别比对的结果,可显示丰硕的新闻,大家就要凯雷德绘图中详细解读。此处只是建树,用于Alpha, Beta多种性分析的输入文件。

# clustalo多序列比对,如果没有请安装Clustal Omega
clustalo -i result/rep_seqs4.fa -o temp/rep_seqs_align.fa --seqtype=DNA --full --force --threads=30
# 筛选结果中保守序列和保守区
filter_alignment.py -i temp/rep_seqs_align.fa -o temp/  # rep_seqs_align_pfiltered.fa, only very short conserved region saved
# 基于fasttree建树
make_phylogeny.py -i temp/rep_seqs_align_pfiltered.fasta -o result/rep_seqs.tree # generate tree by FastTree
  1. Alpha各个性 Alpha三种性是一个钱打二十五个结样品内物种组成,包罗数据和丰度两维音信。具体表达可知:扩大与扩展子图表解读1箱线图:Alpha三种性   Alpha各类性总括前须求对OTU表进行标准化,因为区别测序深度,检查评定到的物种数量会分歧。大家将OTU表重抽样至同样数据量,以公正比较各种品的物种数量。方法如下:

    # 查看样品的数据量最小值 biom summarize-table -i result/otu_table4.biom # 基于最小值实行重抽样法规single_rarefaction.py -i result/otu_table4.biom -o temp/otu_table_rare.biom -d 2797 # 总结常用的种种Alpha各类性指数 阿尔法_diversity.py -i temp/otu_table_rare.biom -o result/alpha.txt -t result/rep_seqs.tree -m shannon,chao1,observed_otus,PD_whole_tree

  2. Beta四种性 Beta各种性是一个钱打二17个结各类品间的同样或分歧,OTU表也亟需规范。接纳重抽样形式错失的消息太多,不便于总结。此步大家采取CSS规范化方法。

    # CSS标准化OTU表 normalize_table.py -i result/otu_table4.biom -o temp/otu_table_css.biom -a CSS # 调换规范化OTU表为文本,用于中期绘图 biom convert -i temp/otu_table_css.biom -o result/otu_table_css.txt --table-type="OTU table" --to-tsv # 删除表格多余音信,方便本田UR-V读取 sed -i '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table_css.txt # 计算Beta多样性 beta_diversity.py -i temp/otu_table_css.biom -o result/beta/ -t result/rep_seqs.tree -m bray_curtis,weighted_unifrac,unweighted_unifrac # Beta多样性距离文件整治,方便福特Explorer读取 sed -i 's/^t//g' result/beta/*

Alpha Beta二种性,阿尔法beta 剖析前计划 # 步向专门的工作目录cd example_PE250 上一节回想:大家的OTU得到了物种注释,并就学...

扩大与扩张子剖析解读5物种注释 OTU表操作,物种otu

本节课程,需求先达成《扩大与扩张子剖判解读》系列此前的操作 1质量控制 实验设计 双端种类合併 2提取barcode 质量控制及样品拆分 切除扩大与扩张引物 3格式调换 去冗余 聚类 4去嵌合体 非细菌类别 生成代表性系列和OTU表 深入分析前策画

# 进入工作目录
cd example_PE250

上一节回看:我们上学了嵌合体的朝四暮三,以及依据参照他事他说加以考察数据库去嵌合体;也学习了依照数据库比对来筛选细菌或细菌;最终依据最分明的OTU,大家转换代表性连串和OTU表,那是各个MTK量测序都有个别结果,后续的结果将一切依据那四个文本。   接下来大家学习对OTU进行物种注释;OTU的操作,包涵格式调换、筛选增添物种音讯、数据量筛选样品、筛选高丰度的OTU、物种筛选等。   OTU表常用的BIOM格式 主页: 。BIOM是斯洛伐克语The Biological Observation Matrix的缩写,汉语翻译为生物观测矩阵,是一种通过格式,用于生物学样品对应观测值的报表。它最首要选拔json/HD5F文件格式标准,即多维散列结构,保存表格结构数据结果。近来主流的宏基因组软件均帮衬此格式文件,如QIIME、MG-RAST、PICRUSt、Mothur、phyloseq、MEGAN、VAMPS、metagenomeSeq、Phinch、LX570DP Classifier、USEARCH、PhyloToAST、EBI Metagenomics、GCModeller、MetaPhlAn 2。知道它有多种要了啊。   Biom文件管理系统biom程序是QIIME的必装包,若无安装好,可尝试下边步骤重装

# 安装依赖包
pip install numpy
# 安装biom格式转换包
pip install biom-format
# 安装2.0格式支持
pip install h5py
# 测序程序是否安装成功
biom
  1. 物种注释 对于扩大与扩展子解析,最要害的就是物种音信。我们依照上节解析获得的代表性系列,采纳上次一度下载的greengene的参照类别和物种注释消息,比对软件采用rdp方法,举办讲明。

    # 物种注释 assign_taxonomy.py -i result/rep_seqs.fa -r gg_13_8_otus/rep_set/97_otus.fasta -t gg_13_8_otus/taxonomy/97_otu_taxonomy.txt -m rdp -o result

注:假诺是ITS/18S多少,提议数据库更动为UNITE,方法改为blast。详细使用验证,请读官方文书档案   14. OTU表总计、格式转变、增多音信将OTU表转变为Biom格式,那样有助于另外软件对其操作。可增进上面获得的物种音信,那样表格的新闻就更拉长了,再转移为文本,便于人类可读,同临时间使用summarize-table查看OTU表的主导音讯。

# 文本OTU表转换为BIOM:方便操作
biom convert -i temp/otu_table.txt 
 -o result/otu_table.biom 
 --table-type="OTU table" --to-json
# 添加物种信息至OTU表最后一列,命名为taxonomy
biom add-metadata -i result/otu_table.biom 
 --observation-metadata-fp result/rep_seqs_tax_assignments.txt 
 -o result/otu_table_tax.biom 
 --sc-separated taxonomy --observation-header OTUID,taxonomy 
# 转换biom为txt格式,带有物种注释:人类可读
biom convert -i result/otu_table_tax.biom -o result/otu_table_tax.txt --to-tsv --header-key taxonomy
# 查看OTU表的基本信息:样品,OUT数量统计
biom summarize-table -i result/otu_table_tax.biom -o result/otu_table_tax.sum

这段日子我们获得了OTU表的骨干总括消息,用less result/otu_table_tax.sum查看一下啊,内容如下:

Num samples: 27 # 样品数据
Num observations: 975 # OTU数据
Total count: 409647 # 总数据量
Table density (fraction of non-zero values): 0.464 # 非零的单元格
 
Counts/sample summary:
 Min: 2352.0 # 样品数据量最小值
 Max: 35955.0 # 样品数据量最大值
 Median: 14851.000 # 样品数据量中位数
 Mean: 15172.111 # 样品数据量平均数
 Std. dev.: 10691.823 # 样品数据量标准变异
 Sample Metadata Categories: None provided # 样品分类信息:末提供
 Observation Metadata Categories: taxonomy # 观察值分类:物种信息
 
Counts/sample detail: # 每个样品的数据量
OE4: 2352.0
OE3: 2353.0
OE8: 3091.0
OE2: 3173.0
OE1: 3337.0
OE5: 3733.0
OE6: 4289.0
OE9: 4648.0
OE7: 5185.0
WT3: 10741.0
WT8: 12117.0
WT6: 14316.0
WT2: 14798.0
WT7: 14851.0
KO1: 14926.0
WT9: 15201.0
WT1: 15422.0
WT5: 15773.0
WT4: 16708.0
KO2: 17607.0
KO6: 23949.0
KO5: 26570.0
KO8: 27250.0
KO4: 32303.0
KO7: 33086.0
KO9: 35913.0
KO3: 35955.0

biom的详尽使用表明,能够biom查看具体的成效,如增加注释成效biom add-metadata --help可查阅详细表明。也可观察官方网站  

  1. OTU表筛选 实验中会有各样影响因素,我们要综合种种背景知识来判别什么筛选数据表,起到互通有无,去粗取粗,依此类推,有表及理的来回答准确难点。数据筛选是会运转深入分析流程和数码深入分析师的分割线。   看下边的的总结结果,样本数据量从2k-35k,大家应去除过小的数据量样本,提供更恐怕高的样品最低丰度的多少用于下游规范化剖判。这里我们选用只保留数据量大于三千的样品。

    # 按样品数据量过滤:选用counts>三千的样品 filter_samples_from_otu_table.py -i result/otu_table_tax.biom -o result/otu_table2.biom -n 3000# 查看过滤后结果:独有贰17个样品,9六十九个OTU biom summarize-table -i result/otu_table2.biom

並且还要过滤低丰度的OTU,一般低于格外之一丰度的菌,在功用研商可能依旧比较辛苦的(早期作品454测序数据量少,经常只关切丰度千分之五上述的OTU)。

# 按OTU丰度过滤:选择相对丰度均值大于万分之一的OTU
filter_otus_from_otu_table.py --min_count_fraction 0.0001 -i result/otu_table2.biom -o result/otu_table3.biom
# 查看过滤后结果:只有25个样品,346个OTU
biom summarize-table -i result/otu_table3.biom

些微商量手腕在特定有试验中留存错误,如二〇一二Nature报道V5-V7在植物中扩大与扩展会偏疼扩大与扩大Chloroflexi菌门,提议删除。

# 按物种筛选OTU表:去除p__Chloroflexi菌门
filter_taxa_from_otu_table.py -i result/otu_table3.biom -o result/otu_table4.biom -n p__Chloroflexi
# 查看过滤后结果:只有25个样品,307个OTU
biom summarize-table -i result/otu_table4.biom

上述过滤条件是基于经验、相关文献设计的,假使不明了,也并不是随意过滤,轻巧滋生假中性(neuter gender)。   得到的尾声结出,还要转变为文本格式,和领取OTU表对应的系列,用于下游深入分析。

# 转换最终biom格式OTU表为文本OTU表格
biom convert -i result/otu_table4.biom -o result/otu_table4.txt --table-type="OTU table" --to-tsv
# OTU表格式调整方便R读取
sed -i '/# Const/d;s/#OTU //g;s/ID.//g' result/otu_table4.txt
# 筛选最终OTU表中对应的OTU序列
filter_fasta.py -f result/rep_seqs.fa -b result/otu_table4.biom -o result/rep_seqs4.fa

OTU表操作,物种otu 本节课程,须要先完结《扩大与扩充子剖析解读》类别在此之前的操作1质量控制 实验设计 双端连串合併2提取...

QIIME的设想机安装

# 进入工作目录
cd example_PE250
# 进入工作目录
cd example_PE250

上一节回看:大家的OTU获得了物种注释,并学习OTU表的种种操作————加多新闻,格式调换,筛选新闻。

上一节回看:大家的OTU获得了物种注释,并学习OTU表的各样操作————增加音信,格式转变,筛选消息。

扩大与扩充子深入分析解读1质量控制,实验设计,双端系列合併

 

 

本文由凤凰彩票平台手机版发布于凤凰彩票唯一官方网站科学,转载请注明出处:【凤凰彩票唯一官方网站】扩大与扩充子解析流

关键词: