400-831-9099

新闻动态

盘点2016年测个基因组就发表在CNS上的文章

发布时间:2016-12-23作者:诺为尔基因浏览次数:3183

盘点2016年测个基因组就发表在CNS上的文章

 

CNS.jpg


人类基因组工作草图的发表至今已有15年了,各物种的全基因组也相继出炉。二代测序(NGS)更是让基因组测序变得易如反掌。现在测个序还能发CNS文章?是异想天开吗?回顾2016年CNS的文章,结果是肯定的。现在测序能做的不光是测基因组和转录组,基因组的数据甚至可以和蛋白组联合起来一起分析。我们就在这篇文章中盘点一下本年度通过大规模测序发表在CNS上的文章,看看最新的研究趋势是什么。


一、基因组


基因组.jpg


1. 基因组测序


能发表在CNS上的研究都是有重大科学价值的,测基因组就要看你测什么?为什么测?怎么测了。本年度单纯的全基因组测序CNS文章就有7篇,其中三篇是

封面文章,这7篇文章都有一定特点:

样本珍稀:5000多年前的冰木乃伊;

进化地位独特:从海洋到陆地又回到海洋的鳗草;特殊体型、雄性育儿的海马;

技术的里程碑:长测序完成大猩猩基因组;第三代测序发表最连续的人类基因组。

特殊环境:污染水域近400条大西洋锵的全基因组测序;

大量样本:10个不同类型生境、世界各地3,042个样本中125,000多个病毒序列。 

1). Science: 5300年前的病原体基因组

Science Nature相继报道了科研人员从距今5000多年前的冰木乃伊中提取了最古老的病原体全基因组。该研究登载在1月7日的Science上。这项研究解决了一个重要的问题是,现代欧洲人携带的混合幽门螺杆菌菌株是什么时候出现的。

2). 特殊进化地位让鳗草基因组登上Nature封面

对海洋的开花植物鳗草(Zostera marina)基因组的测序与研究,阐明了海洋藻类如何进化为陆地植物而后又如何回到大海。2月18日Nature分别以封面故事,研究报告和新闻展望三种方式报导了鳗草全基因组测序的分析结果。这项研究标志着来自世界各地35名科学家的8年工作成果,不仅帮助植物学家剖析鳗草的演变,也促进对一般开花植物进化的理解。

3). 中国科学家的成果登上Nature封面:破译海马基因组

中国科学院南海海洋研究所研究员林强课题组主导,德国、新加坡、华大基因等实验室共同完成的研究论文作为封面故事和长论文(Article)发表在2016年12月15日的Nature上。林强研究团队对虎尾海马进行了基因组测序和分析,得知海马是目前已获得全基因组鱼类中进化速率最快的物种。分析显示海马基因丢失与失去牙齿和骨盆鳍有关,其基因复制而新产生的基因让雄性怀孕成为可能,调控原件消失改变了骨架,实现以骨板保护支持身体。

4). Science封面:基因组长测序获突破性进展

Gordon等人运用长读长测序技术提高了我们的近亲大猩猩基因组数据,文章发表在4月1日的Science上。从一个单个的个体减少了装配的片断并恢复了以前遗漏的基因和非编码基因位点。长读长测序技术变得很实用,使得个别实验室产生高质量的复杂的哺乳动物基因组成为可能。

5). Nature:借助第三代测序韩国发表最连续人类基因组

国立首尔大学医学院的研究人员和美国被誉为“测序黑马”的公司——10x Genomics联合运用去年新发售的GemCodeTM测序平台以及第三代测序PacBio单分子实时测序平台在10月13日的Nature上发表了一项新的研究,对一名韩国人的基因组(AK1)进行从头组装和单倍体型定相信息分析。这是迄今为止发表的最为连续的人类基因组组装。作者填补了特异人群参考基因组的空白,并确定了结构变异。

6). Science:基因组测序显示鱼类快速进化以适应污染

12月9日发表在Science杂志上的一篇文章报道了对生活在美国四个污染的东海岸区域的近400条大西洋锵进行的全基因组测序,研究结果显示:研究小组的遗传分析表明大西洋锵的遗传多样性使它们能特别好地适应,在完全改变了的栖息地生存。在遗传水平上,耐受型群体以高度相似的方式进化。这表明这些鱼已经携带了那些让它们适应污染位点的遗传变异,并且可能已经进化出一些针对污染的解决方案。

7). Nature重大成果:揭示125000个病毒基因组

在发表于8月17日Nature上的一项研究中,美国能源部联合基因组研究院(DOE JGI)的研究人员分析了从DOE JGI综合微生物基因组与微生物组样品(Integrated Microbial Genomes with Microbiome Samples)数据管理和分析系统获得的,来自10个不同类型生境、世界各地3,042个样本的超过5万亿碱基(Tb)的序列。他们努力筛查大堆的数据集,生成了包含279万个蛋白的125,000多个病毒序列。将病毒序列数量提高了50倍,鉴别出的99%的病毒家族都与以往测序的病毒没有密切关系,构建出了第一个全球病毒分布图。


2. 基因组分析


测序技术的革新带来了测序方面的便利,当大量的基因组数据涌现时,如何分析这些数据成了首当其冲的问题。在本年度CNS上也有三篇文章对如何分析基因组的启动子突变和顺式调控元件的进化起源做出了范例: 

1). 2篇Nature:癌症基因组分析揭示启动子突变显著增加原因

最近的癌症全基因组分析,在基因启动子内识别出了无数的体细胞点突变热点。只是正向选择可能无法充分地解释在癌症基因组中启动子点突变的频率之多。4月14日Nature上的两篇论文对这一关系进行进一步探讨,发现了存在将转录启动和DNA修复联系起来的机制的证据。过千癌症基因组分析发现基因启动子上突变密度的增加与转录启动活动和核苷酸切除修复的损伤有关。

2). Cell:Capsaspora基因组的动态调控和多细胞动物起源

目前还不清楚基因组调控元件是从动物中开始起源的还是已经存在于后生生物的单细胞祖先中。所以5月19日Cell上发表的一篇文章对寄生单细胞生物Capsaspora owczarzaki进行了多功能基因组分析。分析证明动物的多细胞生物的出现与基因组中顺式调控元件复杂性的一个重大转变相关,尤其是远端增强子调控的出现。 


3. 基于基因组的进化问题


测个细菌的序列太多人会了,但大咖风范就是用简简单单的大肠杆菌基因组来诠释深奥的进化问题。Richard E. Lenski在之前的报道中是被称为“将进化史装进瓶子里的人”,他的进化学实验研究在该领域有着非凡的影响力。Lenski的工作一直给人带来惊喜,目前全基因组测序的发展也融入了他的进化学实验。

1).Nature:进化大咖用传代25年的细菌分析基因组如何进化

Richard E. Lenski从1988年就开始培养细菌并传代,他用这些细菌完成了大量令人瞩目的进化学实验。在8月1日在线发表在Nature的文章中,他和他的团队分析了来自12个大肠杆菌种群的264个完整基因组,来确认它们超过5万代的基因组进化速度和模式。他运用实验进化和基因组测序相结合的新手段,264个全基因测序支持大多数固定的突变是有益的。

二、转录组

转录组


在转录组方面,今年出现不少新技术和新概念。就CNS上发表的来说:一种叫PARIS的新方法可以对活细胞采取的转录组RNA结构分析;另一个叫做瞬时转录组测序(TT-seq)的方法可以绘制人类瞬时转录组测序图谱。免疫基因组计划(ImmGen)准确的说是小鼠免疫系统的基因表达组及其调控的研究,初步结果已发表在Cell上。研究人员还通过从人的大脑中分离单个神经元细胞核进行分析来完成了不同的单个脑神经元转录组的首次大规模评估。科学家们也用外显子组测序和转录组测序差异揭示了睾丸癌化疗敏感性不同的原因。


1. 转录组新技术


1).Cell:能对活细胞采取的转录组RNA结构分析新方法

Cell上5月19日发表的一篇文章里,美国斯坦福的研究人员开发了一种叫PARIS的新方法。这是一种在活细胞中以可逆的补骨脂素交联的方式,近乎于碱基对的分辨率整体绘制RNA双链图谱的方法。这个新方法能够直接识别活细胞的碱基对配对相互作用,确定RNA结构和RNA-RNA相互作用。PARIS和其相关方法的优势是能够促进发现高阶的lncRNA结构。

2).Science:新技术绘制人类瞬时转录组测序图谱

一个叫做瞬时转录组测序(TT-seq)高敏感的方法,可以用来捕捉和鉴定即使是非常短寿命的RNA分子。这一研究结果与6月3日发表于Science。用TT-seq技术捕获的RNA分子提供了在细胞中一定时间内所有活跃的DNA区域的快照,包含之前很难找到的位于基因之间的调节性DNA序列。TT-seq让大家有了一个合适的工具,来了解基因组不同类型的细胞是如何调控的,以及基因调控程序是如何工作的。 


2. 转录组新计划


1).Cell:免疫基因转录组技术全局分析干扰素诱导网络

免疫基因组计划(ImmGen)的目的是对小鼠免疫系统的基因表达及其调控进行深入的剖析,包括细胞因子触发的响应的系统分析。在这篇发表在1月28日Cell上的文章里,研究人员在许多造血细胞类型中,对干扰素的引起的转录反应进行了详细的和动态的B淋巴细胞分析。

2).Science:第一个不同的脑神经元大规模转录组完成

Scripps研究所、加州大学圣地亚哥分校和Illumina的团队已经完成了不同的单个脑神经元转录组的首次大规模评估。他们的研究显示了人脑细胞用来从DNA到RNA转录遗传信息和产生蛋白的分子有着惊人的多样性。研究人员通过从人的大脑中分离单个神经元细胞核进行分析来完成这一壮举。这允许了对大脑皮层中的16个神经元亚型,参与思想、认知和许多其他功能的“灰质”的分类。这项研究于6月24日发表在Science杂志上。


3. 基于转录组的病理研究


1).Nature封面:基因组揭示睾丸癌化疗敏感性差异的原因

美国Dana-Farber癌症研究所的科研人员在11月30日的Nature上报道了他们已经能够鉴定出对于睾丸癌增殖所必须的独特基因组变化,能够解释为什么它们其中有些病例不像大多数实体肿瘤那样,能够用化疗治愈。本期封面所示就为失去杂合性的恶性生殖细胞正在经历凋亡过程。为了探究生殖细胞癌化疗敏感性的基础和临床抗性的原因,他们用全外显子组/转录组测序与细胞学研究揭示了敏感性的差异。

三、蛋白基因组

 


现在的蛋白组分析可不只是意味着双向电泳,也不仅仅是各种质谱分析。最新的蛋白组分析趋势是和基因组的数据联合起来一起做,称为“蛋白基因组(proteogenomic)”。CNS上2016年发表的蛋白基因组大型研究有两篇,分别是针对乳腺癌和卵巢癌。 


Nature:乳腺癌的第一次大规模蛋白组-基因组研究成果

基于癌症基因组的Atlas (TCGA)计划的数据,美国的科学家联合小组已经完成乳腺癌的第一次大规模“蛋白基因组(proteogenomic)”研究,将DNA突变联系到蛋白信号并帮助确定癌症驱动基因。这项研究工作主要针对蛋白质,以及它们的修饰来更好地理解癌症。发表在6月2日的Nature上的相关文章表明了整合基因组和蛋白组数据获得更完整的癌症生物学图景,比任何单独的分析都要全面。 

Cell:美国大型蛋白基因组研究分析卵巢癌

169个卵巢癌患者肿瘤蛋白质的集合检测确定了他们的肿瘤中存在的关键蛋白,这被认为是同类研究中最大的一项。通过整合他们在蛋白组中的发现和已知的肿瘤基因组的数据,研究人员的报告显示了对卵巢癌潜在的新见解。相关工作6月29日在线发表在Cell上。该项进展显示了结合基因组和蛋白组学数据的强大力量。这种方法称为蛋白基因组学,让人们对卵巢癌的生物学有更全面的了解。