03 月 14 日的《热心肠日报》,我们解读了 9 篇文献,关注:生信,宏基因组,基因组组装,高通量,聚类,机器学习,旗子暗记肽,菌群组成,可视化。
基于鸟枪法读长开展细菌菌株的打算剖析Briefings in Bioinformatics——[11.622]
① 由于菌株的主要性,作者调查了 20 种关于细菌菌株基因组剖析的工具;② 在仿照和实验数据集上评估了六种工具,包括所有关于从头细菌菌株基因组重修的工具;③ 创造只管一些工具可以很好地预测菌株的数量和丰度,但没有一个工具可以完备预测细菌菌株中的实际菌株变革;④ 细菌菌株基因组的未来重修可能会考虑在多个宏基因组样本中具有相似丰度的赞助基因和细菌菌株。

【主编评语】
确定菌株水平的微生物组成至关主要,这项研究调查了 20 种打算工具,试图从鸟枪读长中推断出细菌菌株的基因组,并第一次谈论了这些工具背后的方法。作者还在相同数据集上系统地评估了六种新型菌株靶向工具,创造 BHap、mixtureS 和 StrainFinder 的性能优于其他工具,但由于最佳工具的性能仍旧欠佳,作者谈论了可能办理这些限定的未来方向。(@刘永鑫-中科院-宏基因组)
【原文信息】
Computational analyses of bacterial strains from shotgun reads
2022-02-08, doi: 10.1093/bib/bbac013
Nature子刊:从大量宏基因组数据中对病毒基因组进行分箱Nature Communications——[14.919]
① 开拓了一个基于重叠群分箱的框架 (PHAMB),以直接从大量宏基因组数据中创造病毒基因组;② 当运用于人类微生物组操持2(HMP2) 数据集时,PHAMB 从1024个病毒群中规复了6077个高质量基因组,并确定了病毒-微生物宿主的相互浸染;③ 与现有的病毒预测工具比较,它可以从任何数据集中以非常高的准确度(93-99%)对非噬菌体分箱进行分类;④ PHAMB可以有利地运用于现有和未来的宏基因组,以用其他菌群身分阐明病毒生态动力学。
【主编评语】
人类肠道病毒组及其与胃肠道细菌的相互浸染目前尚不清楚,是由于缺少全病毒组数据集以及当前识别宏基因组数据中病毒序列的方法存在局限性。在此,作者将基于深度学习的宏基因组分箱算法与配对的宏基因组和宏病毒组数据集相结合,开拓了来自宏基因组分箱的噬菌体(PHAMB),这种方法许可直接从大量宏基因组数据等分箱数千个病毒基因组,同时能够将病毒基因组聚类成准确的病毒分类种群,PHAMB 事情流程可在 https://github.com/RasmussenLab/phamb 得到。(@刘永鑫-中科院-宏基因组)
【原文信息】
Genome binning of viral entities from bulk metagenomics data
2022-02-18, doi: 10.1038/s41467-022-28581-5
METABOLIC:对微生物基因组的功能特色、新陈代谢、生物地球化学和群落尺度功能网络进行高通量剖析Microbiome——[14.65]
① 微生物基因组在个体生物和群落尺度上的代谢功能谱对付理解生态系统过程是至关主要的,并且也是实现基于功能特色的生物地球化学建模的一个渠道;② 作者先容了一个工具:METABOLIC,可以基于微生物基因组或宏基因组组装基因组(MAGs)来剖析单个微生物或者菌群的代谢功能网络;③ METABOLIC促进了标准化,超越了目前的基因组/蛋白质注释平台框架,供应蛋白质注释和代谢路子剖析。
【主编评语】
作者展示了 METABOLIC 软件(微生物的代谢和生物地球化学剖析),它以基于基因组的微生物代谢为根本,能够对菌群生态学和生物地球化学进行同等且可重复的研究,并将推动未培养的生物体整合到代谢和生物地球化学模型中。作者估量 METABOLIC 将使从宏基因组和基因组中更随意马虎阐明微生物代谢和生物地球化学,并使菌群研究在不同领域成为可能。METABOLIC 是用 Perl 和 R 编写的,网址为 https://github.com/AnantharamanLab/METABOLIC。(@刘永鑫-中科院-宏基因组)
【原文信息】
METABOLIC: high-throughput profiling of microbial genomes for functional traits, metabolism, biogeochemistry, and community-scale functional networks
2022-02-16, doi: 10.1186/s40168-021-01213-8
BarBIQ:菌群中单菌的高通量鉴定和定量的新方法Nature Communications——[14.919]
① 开拓BarBIQ对单个细菌细胞进行分类群(cOTUs)鉴定并以高通量的办法对每个cOTU进行量化,该方法具有单碱基准确性;② 用BarBIQ准确鉴定并量化来自小鼠粪便的3.4x10^5个细菌细胞的810个cOTUs,其结果高度可重复;③ 比拟VA充足和VA缺少的小鼠创造粪便菌群cOTUs丰度在肠道不同位置均有差异,且cOTUs在近端位置比远端位置差异更大;④ 以上征象无法用传统的基于16S rRNA基因的方法(ASV和OTUs)准确识别,解释基于细胞的BarBIQ更准确且全面。
【主编评语】
BarBIQ(条形码细菌的鉴定和定量 )方法基于具有单碱基精度的细胞条形码 16S rRNA 序列,将单个细菌细胞划分为分类群——本文命名为基于细胞的可操作分类单元 (cOTU),并以高通量办法量化菌群中每个 cOTU 的细胞数。BarBIQ 是一种被开拓的高通量和准确的方法,在单细胞水平上定义了菌群,可用于与菌群干系的广泛研究领域。BarBIQ 可以准确地可视化全体菌群和单个细菌成员,将有助于有效理解菌群的功能。(@刘永鑫-中科院-宏基因组)
【原文信息】
High-throughput identification and quantification of single bacterial cells in the microbiota
2022-02-22, doi: 10.1038/s41467-022-28426-1
评测菌群数据无监督聚类方法的性能决定成分Microbiome——[14.65]
① 本研究系统地比较了来自四项已揭橥研究对菌群不雅观察结果进行聚类的方法;② 只管没有一种方法始终优于其他方法,但作者确定了某些方法可能表现不佳的关键场景;③ Bray Curtis (BC) 指标在高丰度 OTUs 相对稀少的数据集中导致聚类效果不佳,未加权的 UniFrac (UU) 指标在低丰度 OTUs 普遍存在的数据集上聚类效果不佳;④ 作者合理地结合了 BC 和 UU 来天生一个新的指标,其在所有数据集上都显示出高的性能。
【主编评语】
本体裁系地比较了菌群剖析中常用的 β 多样性和聚类方法。作者将这些运用于四个已发布的数据集,个中可以在样本组之间看到高度不同的微生物组,以及在组之间分离不太清晰的临床数据集。作者表示没有现有的聚类方法可以在所有数据集中普遍表现最佳,并提出了 BC(Bray Curtis) 和 UU (unweighted UniFrac) 的组合指标,利用了这两个指标的互补上风。(@刘永鑫-中科院-宏基因组)
【原文信息】
Performance determinants of unsupervised clustering methods for microbiome data
2022-02-05, doi: 10.1186/s40168-021-01199-3
Nature子刊:SignalP 6.0 利用蛋白措辞模型可预测全部五种类型的旗子暗记肽Nature Biotechnology——[54.908]
① 旗子暗记肽(SPs)掌握着所有生物体的蛋白质分泌和易位,可从序列数据中推测其类型;② 研究者编译了一个含5种旗子暗记肽的蛋白序列数据集,并根据SP类型定义了区域标记规则,同时采取三重嵌套交叉验证来演习和评估模型;③ 基于蛋白质措辞模型(LMs),作者升级了SignalP,与5.0版本(只能推测3种,Sec/SPIII和Tat/SPII无法预测)比较可以预测全部 5 种旗子暗记肽类型;④ 6.0新版本可适用于宏基因组数据,能够准确预测未知起源和进化迢遥的蛋白质序列。
【主编评语】
旗子暗记肽 (SPs) 是掌握所有生物体中蛋白质分泌和易位的短氨基酸序列,其可以从序列数据中被预测,但现有算法无法检测所有已知类型的SPs。本研究,作者先容 了SignalP 6.0,这是一种机器学习模型,可检测所有五种 SP 类型并适用于宏基因组数据。SignalP 6.0 可在 https://services.healthtech.dtu.dk/service.php?SignalP-6.0 上得到。(@刘永鑫-中科院-宏基因组)
【原文信息】
SignalP 6.0 predicts all five types of signal peptides using protein language models
2022-01-03, doi: 10.1038/s41587-021-01156-3
测序数据鉴别和去除rRNA序列利器RiboDetectorNucleic Acids Research——[16.971]
① RiboDetector是一款用于从宏基因组、宏转录组、ncRNA和核糖体测序数据中准确而快速地检测和去除rRNA序列的软件;② RiboDetector能抓取更长间隔的序列特色,从而具有更好的准确性;③ 在测试数据上,RiboDetector比其他软件的缺点预测率低6到2000倍;④ RiboDetector有很好的泛化能力,能预测创造新的rRNA序列;⑤ 在测试数据上它的假阳性预测序列没有显著的对某些功能的倾向性。
【主编评语】
rRNA序列污染是广泛存在于各种高通量测序数据中的。除了在实验建库过程中对文库进行去核糖体的处理,数据剖析层面也可通过一些序列比对的策略去除。本研究中,作者基于深度学习算法开拓了高效准确去除核糖体序列的工具-RiboDetector,其是基于深度学习的BiLSTM(一款双向的循环神经网络架构)开拓的软件,其可以快速准确地识别转录组、宏基因组、宏转录组、非编码 RNA 和核糖体测序数据中的 rRNA 读长,RiboDetector 可在 https://github.com/hzi-bifo/RiboDetector 得到。(@刘永鑫-中科院-宏基因组)
【原文信息】
Rapid and accurate identification of ribosomal RNA sequences via deep learning
2022-02-21, doi: 10.1093/nar/gkac112
iMeta:刘洋彧等基于物种组合的深度学习方法预测菌群构造iMeta——[N/A]
① 本研究提出了一个深度学习框架可以在菌群动力学未知的情形下仅从演习数据学习物种组合到菌群构造的映射;② 作者利用由经典生态动力学模型天生的合成数据系统地验证了其框架;③ 该框架运用于体外和体内群落的真实数据,包括海洋和土壤菌群、黑腹果蝇肠道菌群,以及人类肠道和口腔菌群;④ 仅从一小部分演习样本便可准确地预测菌群的构造组成;⑤ 研究结果证明了深度学习可以帮助我们理解和操控繁芜菌群。
【主编评语】
繁芜微生物群落的浩瀚物种和未知的种群动力学一贯是我们理解菌群构造变革(例如移除或添加物种)的根本障碍。推动这个领域向前发展可能须要失落去一些阐明机制的能力。从这个意义上说,深度学习方法可以使我们合理操控和预测繁芜微生物群落的动态变革。哈佛医学院刘洋彧团队与互助者近期在iMeta揭橥研究,开拓了一个深度学习框架来预测物种组合的群落组成,该框架不须要理解任何微生物动力学,并且各种数据的验证显示了其准确的预测能力。(@刘永鑫-中科院-宏基因组)
【原文信息】
Predicting microbiome compositions from species assemblages through deep learningt
2022-03-01, doi: 10.1002/imt2.3
iMeta:陈同等开拓高颜值高被引绘图网站imageGPiMeta——[N/A]
① ImageGP 可以在线天生常见的线图、柱状图、散点图、箱线图、凑集图、热图和直方图等;② 用户只要粘贴数据矩阵,即可一键快速出图;③ ImageGP 还支持火山图、富集剖析泡泡图、主身分剖析类图等和 4 种微生物领域的功能预测和生物标志物鉴定剖析,包括 FAPROTAX, BugBase, PICRUSt 和 LEFSe;④ 在知足方便易用的同时, ImageGP 也供应了灵巧性,可以设置多种参数、调度样式,输出发表质量的图,供应脚本实现可重复剖析和用户进一步修正。
【主编评语】
2022年2月21日,iMeta 期刊在线揭橥了中国中医科学院黄璐琦院士、陈同副研究员和中国科学院遗传与发育生物学研究所刘永鑫高等工程师互助题为“ImageGP: An easy-to-use data visualization web server for scientific researchers”的研究论文。该论文先容了一款大略易用、功能强大的在线绘图工具 ImageGP,访问地址是http://www.ehbio.com/ImageGP/ 。(@刘永鑫-中科院-宏基因组)
【原文信息】
ImageGP: An easy-to-use data visualization web server for scientific researchers
2022-02-21, doi: 10.1002/imt2.5
感谢本期日报的创作者:Yuice,刘永鑫-中科院-宏基因组,王玲玲,点点,Hairong
点击阅读过去10天的日报:
03-13 | 高脂饮食乱代谢、伤肝肠,吃啥可助改进?
03-12 | 复旦Cell子刊打破:“坏”菌群产物或助乳腺癌免疫治疗
03-11 | 欲护脑,先护肠!
Nature子刊揭示菌群影响大脑朽迈的新机制
03-10 | “癌王”早筛新打破:粪便菌群助准确检测胰腺癌
03-09 | 剖析1.3万中国人数据,浙大团队揭示“吃草”的学问
03-08 | 今日Cell:肠球菌如何毒害宿主细胞?创造关键毒素
03-07 | 于君等GUT:匆匆肠癌、乱肠菌,一种关键脂代谢酶被锁定
03-06 | 人未老,脑先衰?Cell子刊2文聚焦“补脑”新知
03-05 | 46.8分综述详解:基于肠道菌群的疾病标志物
03-04 | 牛!
王军等喜提NBT:用AI在肠道超高效“挖”抗菌肽