破解基因大数据可实现精准医疗?且看华大基因王俊 | 趋势网
趋势网
趋势网 > 文章 > 正文
破解基因大数据可实现精准医疗?且看华大基因王俊 转摘 2015-04-22 23:48:36 可可呼脱力
男子打赏女主播400万自己啃馒头 浙大通报家庭困难学生晒旅游照 贫困生一年旅游20多地引争议 旺旺三公子称明显有人在搞事 老人领喜糖跌倒去世家属索赔新人 
原来你买的都有隐藏券!快查淘宝天猫内部优惠券

趋势网(微博微信)讯:

2岁男童下楼买糖时被人拐走 浙大通报家庭困难学生晒旅游照 情侣亲密时酒店房间遭两男子闯入 王宝强被举报涉嫌欺诈 旺旺三公子称明显有人在搞事

4月21日,由中国企业家俱乐部主办的2015年中国绿公司年会在沈阳举行。华大基因CEO王俊出席大会,并作了题为“基因、大数据与人工智能”的演讲。

王俊从基因的存储原理、基因测试大数据和人工智能深度学习等角度说明了保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

他将基因组比喻为一个个程序,每个基因是程序运行的一个功能模块。因为一个基因所能完成的只是一个功能,只有将众多基因联合起来才能寻找到不同的生存策略。而优质基因的存储对于医学、美容等都有深刻意义。同时他还提到目前基因大数据的情况,虽然目前成本很高,但他有信心未来基因数据的价值会远大于产生基因数据的成本,到那时,测序就会免费了。

王俊说:“基因蕴藏着所有生老病死的规律,如果从基因谈健康,必须要学会对人的基本状况的预测及预防,而不是简单治疗。”精准医疗对于医疗行业有非常大的改变,其概念核心点把人群细分,对其治疗、诊断要精准,对其个体化的行为和数据要有非常精准的解读,以给出一个精准的、对应化的解决方案。

以下为王俊演讲实录精编:

很高兴在讲基因的相关事情,我改了一下我这个题目,原来讲基因改变世界,我改了一下题目,把它变成BGI,华大基因的缩小是BGI,给一个新的诠释,华大要做三件事,第一件事就是B,做大数据,G是做基因,I是做人工智能。

基因

先从G基因讲起。生命本身是数据化的,我们可能习惯了以硅为基础的,忘记了以碳为基础的生命运营规则,大家可能很难想象,为什么这个生命体本身也是一种计算,为什么本身也是数字化的。

如果把全世界所有的图书,我们看见的书,都用DNA的方式来存储,可以存在巴掌大小的DNA里面,所有的全世界图书管理的书,都可以放在巴掌大小的DNA里面,可以存储多少年呢?上千万年。任何一个现在的计算机,无论光盘还是硬盘介质都不可以,但现在DNA可以存储上千万年,是自然界里面最高效的最持久的存储形式。

让我们假想整个宇宙是一个大的计算机,我们每个人,每个个体只不过是在那儿运行的一个程序。我们所说的基因组,是一个完整的程序,每个基因是程序运行的一个功能模块,就像写计算机一样,写一个功能模块,这一个代码是为了执行一个功能。

再往前追溯的时候,有一本书叫《自私的基因》,追溯在最原始的十几亿年前,在原始汤的形态存在的时候,基因是以分子形式存在,这些东西要不断扩张自己。如果写出一段好的代码,会经常把这段代码用到不同的程序体系里。为什么用到不同程序,因为它好,这边要用到,那边也要用到。一个基因本身最重要的事情就是不断扩张自己。

而如果说基因本身是自私的,在往前走的时候就会发现可能需要合作。因为一个基因所能完成的只是一个功能,如果把两个基因合起来,三个基因合起来,五个基因合起来,一堆基因合起来,就可能寻找到不同的生存策略。

我们现在看见的大千世界,每个物种,事实上是各种基因的不同组合,或者反过来讲,是这些基因的组合所采取的不同的生存策略。这种生存策略是不是成功,它的判定的唯一标准就是环境,你如果适应环境,你就会有更多的机会传播后代。你有更多的机会传播后代,你的基因就得到扩张,在所谓的基因池里面就不断增加你的份额。

你的基因的一半来自于父亲,基因的另外一半来自于母亲,除了父母之间的重组交换之外,因为这个东西本来不同的组合会产生不同的个体,还有一个非常重要的东西,就是除了父母之间的重组交换,在每一代里面,这个孩子跟父母之间会有60到100个基因突变,很多人都不知道这60到100个基因突变里面到底是一些什么东西。

以肿瘤细胞为例,肿瘤细胞就像是写程序的黑客一样,只要他写变了,这个程序变成不断扩张,它的适应性比其他细胞都要强,所以他不断的往前走变成了肿瘤。我们去看最后一个肿瘤细胞,其实如果你不断往前追溯,你都可以追溯到受精卵细胞,也就是说,你的生命的起源。个体生命起源就是一个细胞——受精卵细胞,受精卵细胞在不断进行分化和变成一代一代的时候,都会累计各种各样不同的突变。

大数据

生命科学已经不再像以前在简单的在实验室里面做实验,或者是观察科学。从基因开始一直到表型,是一个巨大的海量数据的输入,这些数据的输入需要起码做到一百万人,比如身高,对身高基因的判断,身高显然是遗产,在营养均衡的情况下,显然是遗传,到底跟哪个基因有关系,现在不清楚,需要多少人弄清楚,需要一百万人,如果一百万的基因数据和他的身高数据,我们可以很准确的把他身高给预测出来。

测一百万人要花多少钱呢?我们在1999年做第一个人类基因组计划的时候,花了10亿美金,测一个人的基因图谱序列,2007年测定一个亚洲人基因图谱序列的时候花了三千万人民币。我们在今年6月份,因为我们自己的知识产权,我们可以做到三千块钱人民币,三千块钱可以把一个人的完整基因全部读出来,这个数字还会往下降,降到什么时候可以不要钱呢?五年?三年?还是今年就可以不要钱?事实上真正所谓这件事情的拐点,是在于我们如何能够转化这个数据本身的价值。如果这个数据的价值远大于产生这个数据的成本,测序就会不要钱了。

除了基因的数据之外,还要收集很多别的数据,比如说物联网数据。把所有的这些数据全部都搁在一起,和你基因合在一起的时候,我们才能得到更多答案。而且数据的可视化会成为很大的问题,这些数据都是呈EB级别的数据,怎么让老百姓看懂是非常大的问题,最终还需把基因数据全部连成网络。

人工智能

最后一个可以讲的就是人工智能,我们做了一个尝试,小米是中国饭桌上最常见的食物之一,我们做了几千株的小米,小米有各种各样刚才我讲的大型数据,用人工智能的方法训练,先把所有大数据收集,做人工智能的深度学习,最后到一种什么准确性,可以到任何一株小米。我测一下它的基因,可以准确猜出在这片地里面它长出来什么样,准确性可以达到90%。

一个孩子刚出生的时候,把脐带、胎盘各种各样干细胞存起来,那时候是最好的程序运行的状态,那些可以用来做各种各样的东西,可以用来修复干细胞,修复神经细胞,肌肉细胞,白血病各种各样的东西。

有人说皮肤干细胞保存,岁数大了,也没脐带血了,胎盘也早没了,这个时候还能不能存?越年轻的时候存越好,因为存的细胞是那个时候生命体信息,比如皮肤,皮肤细胞可以用于美容。

脂肪干细胞存起来以后,可以开始我们叫为生命保驾护航了,干细胞的注射、抗衰老,很多东西,抗衰老就是在你老年的时候,运行一个年轻程序,就抗衰老了。

保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

更多  限时  视频 
正在看美女  









某宝是什么,为什么叫某宝?对!我就是那个某宝
更多  限时  视频 
全页海量资源!周妍希 易阳 珞可可 沈梦瑶 穆菲菲 夏茉
资讯    头条  人物   盘点  爆料  花边    囧图  段子  福利
热图    绝色妹子周妍希ALICE无遮罩图集
奇闻    男子打赏女主播400万自己啃馒头 浙大通报家庭困难学生晒旅游照 贫困生一年旅游20多地引争议 旺旺三公子称明显有人在搞事 老人领喜糖跌倒去世家属索赔新人 男子打赏女主播400万自己啃馒头 浙大通报家庭困难学生晒旅游照 
专题    优衣库  iPhone8  苹果X
标签    互联网+  智能物联  增强现实  虚拟现实
感谢各大网址导航推荐本站
360导航
UC导航
Opera导航
毒霸网址
无限趋势·趋势网:关注互联网热点
www.mtrend.cn
@趋势网
趋势网
京ICP备09071216号-4