微生物组大数据分析的方法流程与发展趋势

3.0 闻远设计 2024-04-23 42 4 18.74KB 4 页 免费
侵权投诉
微生物组大数据分析的方法流程与发展趋势
“ ”微生物群落 是地球上生命基本元素(CNS等)进行生物地球化学循环的主要驱动力,
与人类健康、环境保护以及工农业生产等密切相关。近十年来,随着高通量测序的广泛应用 ,
微生物组学 成为新兴概念和热点。微生物组与不同的生存环境结合,诞生人体微生物组,宿
主相关微生物组,一般环境微生物组,建筑环境微生物组,地球微生物组,医院环境微生物组
等大量新兴的研究方向。
长期以来,研究方法一直是微生物群落研究的瓶颈。如,群落结构的阐述,即准确描述一定空
间范围内的物种数量,并定量各物种的丰度,这是所有生态学研究的基本内容。然而,对微生
物研究者而言,实现这一基本要求却绝非易事。这种困难主要源于微生物群落的如下几点特
征。
1 “ ) 微小 :宏观生物可以肉眼或者镜下观察其形态学分类特征并计数;而微生物即便在显微
镜下也难以区分,形态差异特征少,因而不能直接观察种属并计数。
2 “ ) 复杂 :微生物很少以纯种存在;但微生物群落含有极高的多样性。1 g 土壤中可能含有数
千到数万个不同种属的微生物。
3 “ ) 稠密 :1 g 土壤,1滴流水,都可能含有数以十亿计的微生物,并且它们常常来自成千上
万的种属。
4 “ ) 不均 :不同种属微生物在群落中的丰度差异极大。这种不均匀的分布特征造成优势种、
非优势种以及稀有种的计数难以同时进行。
面对如此庞大复杂的微生物生态系统,微生物组学要准确理解样品中的微生物种类,多度及其
功能,并将其与时间、空间、理化因素,宿主疾病状态等进行关联,从而探求微生物与微生物
之间,微生物与宿主之间,以及微生物与环境之间的相互关系。因此,需要恰当的技术,在广
度和精度这两个略显矛盾的角度,同时获得理想的数据。
2006 年,随着新一代高通量测序技术的成熟,不仅在人类基因组学领域带来了翻天覆地的
变化,对微生物组学的研究产生了革命性的影响。当,以 16SrRNA 高通量测序为基本
,宏基因组鸟枪法测序、宏转录组、宏蛋白组、宏代组等组学领域产生了大量的新技术,
进了微生物组学的快速
1 微生物组大数据分的方法和流
16S 的测序是近年来微生物生态领域最核心最重大的突破。通454Illumina 2代测序
高通量测定 16S 可变区序1次让人们在可行的成本下,获得面、系统、结构化的群
落结构信息[1-2].美国 WoodsHole 海洋研究实验室Mitchell Sogin 课题组于 2006 首次报道
了通过焦磷酸测序技术,测定海洋沉积物样品的 16S rRNA 基因 V6 可变区,人类1在基本
足够的测序度下,清晰展示了环境样品中微生物的组成,现了高度的多样性。
与所有统的微生物组学研究方法相方法有显着的优性。方法通测定 16S 短片
生物信息学分可以获得系统分类信息,从而可以确定性其分类元,不同实
间数据完全是可比较、可积累的。方法通量显着高,1测定 40~100 ,通过条码
技术可以对个样品测定数千到数万条短,从而可以获得广泛的、系统的结构信息
测序度大,在多个数量范围内可以进行定量。方法的诞生对微生物组学的研究产生了
大的影响,其对人体生微生物领域活跃如,肥胖肠道菌群间的相关性研究
[3];人体不同部位群结构的首次[4];生素对肠道微生物群落产生的显着影响[5]等。在
环境中,技术首次海洋沉积物中现存在极其丰、多样化的微生物群落。方法人们
得以比较大空间度下土壤微生物群落结构的差异及其主要的影响因素(如 pH[6-8].
基 于 16S 的 分 为宏分类组技术metataxonome)。16S 的数据分,其一般流
包括:列提取质控、相列聚类成 OTU,种属分类,alpha 以及 beta 多样性分,以及进
的统计分。其中都有关,并正处于方法学前沿领域。
OTU 类是 16S 的关键问题之一。在经典的分层聚法中,其运算量和所需的内存
容量,均随着序数量的增加呈几合增加。因此,贪婪算法成为目前该领域的主流。同
时,也有不少研究者开发不基于序列比对的法。但是,于序法的不同,
类中距离传递问题,以及参考数据的不领域然存在运算效率和准确性问题
目前,与参比库比对的 Open- reference [9]以及 UPARSE 为广泛的技术。
,种属的分类然存在问题目前领域主要通16S 数据库比对,
性高的参比的分类结。但是,参比数据目前存在不少问题目前
为广泛的 Greengenes 数据[10],其中不少序存在复或者错误的分类结
UniFrac 距离的计,是 beta 多样性分的关UniFrac 距离美国科罗达罗大学 Rob
Knight 课题建的一种基于序之间相度,计样品之间距离法,有加权
加权两种,在分微生物群落相性中均[11].基于 UniFrac 的工Rob
Knight 课题组进一步开发了微生物群落以及微生物生态分的主流工体系 QuantitiativeInsight
Into the Microbial EcologyQIIME)。该平台是一个流合,已经球分微生物组学
中广泛应用[12].
与之对应,Patrick Schloss 开发Mothur[13],该平台基于最初的序列聚类工DOTUR 而来。
该平台QIIME 竞争,在多地方有相者之间的区是,QIIME 开放,系统
合能力更强尊重方法的原创者,应用者多一,而 Mothur 则全部经作改写,相对
核糖体数据RDP database 课题组,也同样开发代测序数据的群落分[14].
此之MG-RAST 是一个合性的在线数据分析平台[15].
使用者需要将自的测序数据投递该网站,即可点不同的宏基因组分成数据
欧洲 MetaHIT 以及其它小组也开发了一微生物群落的分,但应用面不及上述几
平台。需要指出的是,16S ,人们还开发了一些针对特定功能基因的向测序技术,
从而测其功能多样性。其分大体与 16S ,但需要特定的数据库加对分
宏基因组技术(metagenome),又称为元基因组技术,是在 16S 的基上,通宏基因组
鸟枪法高通量测序,能同时获得群的分类信息以及功能基因的数据。并且技术未经
PCR 扩增,因此 PCR 导致少(测序建还会PCR 的影响)。因为微生物群
落中不同微生物的多度差异极大,获得足够的定量信息,需要测大量的数据。据不同的
需求,个样品宏基因组测序的数据量,在 Giga 以上 1~2 个数量。如此大的数据
量,无论是测成本,是分所需要消耗时,都相当可观。因此,人们通常在 16S
的基上,挑选少量目标样品,测基因组。当,宏基因组数据的分,通常包括如下
步骤:
列质控;将获得的高(或者不,直接与参比数据库比对);将组装后的序
与现有的微生物基因数据对,并将对上的序进行、属、种的分类和丰
度统计;进行样品间物种多样性的比较,如 PCA 类分筛选与样品分组显着相关
;进行基因组,如前噬菌测、可转坐原件、基因测;通
KEGGCAZyeggNOG 数据库比对进行功能注释,分其中的代水化合物
、同源性;生素耐药组的对分等。在宏基因组分中,对病毒单独纯化的序
序,可以获得病组数据,对微生物生态的解提供新的视野
宏基因组测序和 16S 测序尽管群分布上基本是一[17],但分辨效率显着不同。如,在
群落面,二型糖尿肠道菌群和对人群并显着的不同,但是,在宏基因组揭示的功
能基因上,两组却现显着的差异[18-19].尽管宏基因组技术非常大,技术然存在多技
术瓶颈。其一,大量序列目前尚无匹配的数据其是病,大80%甚至更
的序列无注释;其,仅仅通度,对功能的注释常常是不准确的,存在大量的
注释最后,对于大量的微生物基因组,通宏基因组难以将其进行组装拼接,其是对
度的菌株。其中两点缺陷同样用于宏转录组学。
摘要:

微生物组大数据分析的方法流程与发展趋势“”微生物群落是地球上生命基本元素(C、N和S等)进行生物地球化学循环的主要驱动力,“与人类健康、环境保护以及工农业生产等密切相关。近十年来,随着高通量测序的广泛应用,”微生物组学成为新兴概念和热点。微生物组与不同的生存环境结合,诞生人体微生物组,宿主相关微生物组,一般环境微生物组,建筑环境微生物组,地球微生物组,医院环境微生物组等大量新兴的研究方向。长期以来,研究方法一直是微生物群落研究的瓶颈。如,群落结构的阐述,即准确描述一定空间范围内的物种数量,并定量各物种的丰度,这是所有生态学研究的基本内容。然而,对微生物研究者而言,实现这一基本要求却绝非易事。这...

展开>> 收起<<
微生物组大数据分析的方法流程与发展趋势.docx

共4页,预览2页

还剩页未读, 继续阅读

相关推荐

作者:闻远设计 分类:社科文学类资料 价格:免费 属性:4 页 大小:18.74KB 格式:DOCX 时间:2024-04-23

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 4
客服
关注