基因测序在现在遗传病学上起到了关键的作用,可以帮我们及时的规避风险,基因测序技术的成熟与这群年轻人的“事业”有很大关系!是他们的不懈努力才有了今天的”基因组字典“
在光谷,希望组公司是国内首家提供三代测序服务的公司,已为数千个物种绘制基因组图谱,成果用于科学研究、分子育种、疾病诊疗等各个领域。
“我们的下游客户想知道哪一段基因起到何种作用,而我们把整个基因组图谱都测定出来了。相当于他们只想认识一两个字句,而我们编制了整本字典。”武汉希望组总经理梁帆介绍。
这家企业由一群怀揣梦想的年轻人创立,创始人汪德鹏毕业于北京大学生命科学学院,2011年以4万元起家,在武汉与几位华科、华农毕业生一起创业。
如今,企业已发展至260多人,一半以上是技术人员,并将事业版图扩展至北京,先后获得了经纬中国、赛富投资、远毅资本、昌发展、京铭资本等国内知名投资机构投资。
01
光谷,花山,武汉软件新城,希望组公司的办公室占了三层楼。除了大部分生物医药公司都拥有的装满各类试管、试剂的实验室外,这家企业还拥有一个IT公司才有的巨大机房。
“这个房间里有50多台服务器,每一台都有32核CPU、256G内存。相比于普通办公用电脑,性能不是一般的强大。就这样,我们的算力还是远远不够,需要通过专线,把数据传到华为云上进行计算。有一次,我们组装一个基因组,把一台内存30T的服务器给跑爆了。”
首席生信技术官胡江介绍,生物基因组的信息量是十分庞大的。人类基因组单倍DNA数据量约为3.1Gb,23对染色体双螺旋DNA就是6.2Gb。到目前为止,动物界已知最大的基因组是肺鱼类,其中相对较小的非洲肺鱼,就有40多Gb,是人类基因组大小的15倍左右,为了解决这样的世界级难题,企业专门开发了组装软件NextDenovo,成果发表在国际顶级科学杂志Cell的封面。
基因测序行业是一个典型的BT(生物技术)+IT(信息技术)产业。在此过程中,测序仪对一个个基因片段进行测定,一台测序仪两天就可以产生100多T的数据。完成后,研究人员再使用算法和高性能计算机,将片段组装成完整的基因图谱。
相比第二代测序技术,第三代技术可读取的片段更长,可大幅减少后续基因组拼接和注释的工作难度,且经过修正的精度可达到99.9%以上。“理论上所有使用二代测序技术测序过的基因组,都可以使用第三代技术再来一遍,结果将更加完整、准确。”
希望组团队在超高分子量样品制备、长读长序列分析算法开发等方面,具有独特技术优势。胡江开发的NextDenovo等系列基因组组装软件,国内外很多测序公司及科研机构都在使用。
“在我们刚刚创业的时候,第三代测序还未兴起,存在测序成本高、单次读序错误率高等问题,备受挑战和质疑。”但希望组团队毅然坚持探索,如今已成长为世界领先的三代测序基因组公司。
02
在希望组公司展厅内有一面墙,上面挂满了使用该公司测序成果产生的科研文章,发表在《Nature》《Science》《Cell》等众多国际顶级期刊上,有的成果甚至已经写入教科书。
比如,苹果皮为什么能进化出诱人的红色?在希望组团队在给苹果基因测序时,就与合作者发现了一个Gypsy-like反转座子充当增强子控制着苹果着色,基于这个结果,育种科学家在苹果种子阶段,就能精准的进行果色预先选择,节省大量育种时间。
短串联重复序列(STR)占人类基因组序列的7%,目前人类已知有50多种神经和神经肌肉疾病是由STR扩增引起的,包括亨廷顿病、强直性肌营养不良、运动神经元病等。其中,有约5种疾病的致病变异是由希望组与合作单位联合发现,占全球该领域10%,公司甚至立下目标,要在接下来几年之内,发现全球一半的“重复扩张症“新基因。
目前,三代测序全基因组检测的成本已经可以控制在万元以内,1周内就能出报告,很快就能成为遗传病检测的重要手段。
最近,该公司正在测定一些水稻的泛基因组,共测定了两三百种水稻,希望定位一些抗旱、抗淹方面的基因。未来,还可以扩展到大麦、燕麦、西瓜等物种上。
“我们不育种,也不治病,但我们为他们提供完整的‘百科全书’。对我们来说,每一个项目,都是探索全新的未知领域。”
通过自己的努力,组建一个260多人的团队,从事基因测序,还撰写了”基因组字典“真的很酷,据说他们的公司要上市了,真的为这群有志青年感到骄傲和自豪!
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。