܄

元码基因联合创始人田埂:十年后,个人基因组数据就跟智能手机一样普及

【数据猿导读】 元码基因联合创始人田埂近日在贝壳社北京“抢占千亿级的精准医疗市场”主题沙龙上发表了演讲,他表示,现在一个全基因组的信息,它的价值实际上就是10块钱,它能告诉你什么?大部分的基因信息研究的还不透彻,十年后,个人基因组数据就跟智能手机一样普及

元码基因联合创始人田埂:十年后,个人基因组数据就跟智能手机一样普及

编者按:本文根据元码基因联合创始人田埂7月28日在贝壳社北京“抢占千亿级的精准医疗市场”主题沙龙上的演讲整理。

非常感谢今天有这么一个机会跟大家分享我在这个行业里的自己的一些感受。今天的主题抢占千亿级的精准医疗市场,然后郝总一上来就先进入到了消费类的基因检测市场的交流泥潭里面去了。刚才几个问题我想归结到一个本质的问题,就是任何一个你要付钱买的东西,其实你要看到的是它商品的本质,就是它能够传递给你的价值。然后这个价值怎么体现,它值多少钱。

因为从商品本质上来讲有很多很多的例子,我们身边的例子,大家现在手里拿的手机,十年以前可能就像刚才问在场的谁有自己的基因组数据的问题一样,你问问手机行业的人有几个有智能手机?其实没有几个人有,但是十年的时间别说手机行业里的人老百姓手里都有智能手机。我想再过十年你去问台下谁还没有自己的基因组信息的时候,可能举手的是寥寥的,可能啊,这个也要伴随着基因测序价格的降低。

我相信现在1000美金的时候可能是在白领阶层,有临床需求的阶层有基因检测的需求。但是如果它要到100美金的时候,到10美金的时候,甚至免费基因检测的时候,还有几个人不去进行自己的基因检测。现在基因检测的价值可能就值10块钱,而消费者要付1000美元,基因组测序就还只是少数人的奢侈品,并不是老百姓的刚需消费品。在我看来,现在一个全基因组的信息,它的价值实际上就是10块钱,它能告诉你什么?我们郝总刚才展示了半天,酒精的代谢量怎么怎么样,运动能力怎么怎么样,这些其实都是研究的比较透彻的,大部分的基因信息研究的还不透彻。特别是对老百姓的生活的指导而言,上游的科学发现还有很多路要走。

为什么美国要做100万人的基因测序,同时我们中国也把基因组测序作为精准医疗计划的一个大事儿来做。但是大家了解清楚的话,其实计划只是最近五年把100万人的人血收上来而已,真正做起来还是会很慢,但是我相信可能五年以后再做100万人的测序的时候它的速度会很快,而且像大药厂,大的机构,可能手里已经有100万数据在了。我们知道阿斯利康,前一阵公布了要测至少100万个数据,全世界四个大的基因组中心在做。民间的需求驱动比个人、政府要大的多,所以可能很快我们就会进入精准医疗的时代,速度会加快。包括我们现在能看到的一些,表面上能够看到的信息可能只是冰山一角,还有很多信息在暗流涌动中。谁知道苹果当年做PC的时候,现在它变成了手机制造商了。未来没准阿斯利康也是全世界最大的个人基因组公司也说不定,这些都是很有可能的。但是未来会怎么样,我相信也是从今天一步一步走过去的。

精准医学改变了医疗模式

今天的题目,其实前几天在英特尔的会议上讲过一次,但是那次主要是讲大数据,今天我想可能讲从每一个人需要的精准医疗,这个角度来讲。前面还是简单跟大家介绍一下精准医疗的概念。

其实精准医疗的概念非常的具体。我们知道NIH是奥巴马公布的版本,wiki是更早的版本。精准医疗其实就是把遗传和基因组信息应用到临床,这件事情已经做了很多年了。自从有细胞分子遗传学这个专业开始它就一直在做,但是到目前来看在这块的渗透还是比较少。刚才那位听众说,他们发现医生和病人对这个事情了解还比较少,这是我们这个行业的悲哀。其实并不是,为什么?因为基因测序不像感冒发烧这种做个大生化检测这么简单,它的成本太高。另外一个,它能指导临床的项目还太少,局限在几个特殊的科室。如果你去问这几个特殊的科室,我相信它的渗透率是非常高的。

我们说精准医疗是转化医学和个体化医学的基础,我们先前讲四P医学,那么今天加上了Precision Medicine,就变成了五P医学,那么其实它是在实验和临床之间的这么一个状态。

简单地回顾一下精准医疗的发展历史。从26年前的人类基因组计划的提出;到十年的时间,42亿美金,六个科学家把这个计划完成;到15年前开始确定未来基于人类基因组计划的人类社会发展的高楼大厦;五年前NHGRI(美国国家人类基因组研究所)提出未来二十年基因组学发展历程;到一年前奥巴马同志提出精准医疗计划。那么我们知道精准医疗,它是在传统医学,转化医学发展的一定时期出现的这么一种医学性态,那么经过一百年,将近两百年的发展历程,它的必要性我想可能在座的都多少有一些认识。那么从个体化医学,到药物,到治疗方案,在我们医学相关的每一个环节都能看到精准医疗的影子。那么现在只能说是影子,而未来它将是指导医学基础,从这个我们可以看出疾病是从分子病理学改变到影像学能够发现到症状的发展过程。

目前的现状是病人先有了症状然后影像学确认,最后才到分子指导用药。实际上未来我们应该回归本质从分子医学的角度出发预防和治疗疾病。特别是对肿瘤而言,人群的差异十分显著,我们能够看到,东亚人群和美洲人群肺癌EGFR突变的发生频率,这个例子也是非常有名的例子的。阿斯利康的易瑞沙在美国上市之后其实卖的非常差,后来发现治疗有效人群就是亚洲女性、非吸烟、EGFR阳性,所以这个药现在在东亚卖的非常好的,而且可以说是精准医疗最典型的一个例子。

2013年的一篇文章的图,这意味着什么呢,这个图表明现在肿瘤病人五年存活率,其实徘徊在20%到30%的比例上,为什么是这样,因为病人其实找不到一个精准的用药。因为用药的突变都是频率非常低的,传统的检测技术无法同时检测如此多的低频突变。因为我们以前的用药方式是基于人群的数据,是基于大部分有效的人的前提之下筛选出来的药物。而对肿瘤而言,可能每一个病人的突变都是不一样的。在不一样的情况下,我们就需要这种个体化的,大通量的基因检测的数据,来帮助实现个体化用药的这个目标。对肿瘤的监控而言,这两年液体活检的发展也非常快,就是通过这种突变的检测,突变频率的检测,来监控肿瘤的治疗的过程,以及愈后复发的过程。

分子诊断的市场有多大,我不知道,但是这个市场的增长是非常明显的。就像我们说几年以前大家说到肿瘤个体化用药,靶向用药的时候可能还没有多少人知道,我在十年前读博士的时候,我们跟阿斯利康开始做基因检测,那个时候我们提到靶向用药,很多人都认为是什么基因导弹,现在我相信只要是身边的人得肿瘤的情况,大家都会知道靶向治疗。基因检测技术其实是靶向治疗技术的一个伴随诊断技术。医学大数据的市场,这个可能也是现在非常热的一个市场。潜在的商业价值,是一个非常非常大的机会,但是目前大家都还不知道它具体是个什么样子,但是科研的空间会非常大。

我们知道遗传学和基因组学对整个医学界的影响,它包含了几个方面。首先从整个治疗的过程而言,从疾病的复发监控,到愈后的决策、筛查、诊断,新生儿的筛查,疾病的敏感性等这些领域里基因学都有非常非常好的应用,目前已经是临床决策的基本的基础,最典型的就是NIPT(孕妇无创产前检测)。虽然它还不是诊断金标准,但是基本上检查出来阳性都是真的,假阳性已经非常非常低了。我们知道这个基因组学是可以真正意义上伴随着一生的诊断技术。从刚才说的这些疾病相关的而言,到我们所谓的生命末期的管理,那么实际上是一个贯穿一生的信息管理和健康管理的过程。

我们要在基因组和遗传信息的基础之上,建立起来所谓的精准医疗的医疗体系。包括什么呢?首先是生物信息学,包括基因的、遗传的、分子的过程,统计分析和决策知识,结合影像学。现在美国也有一部分人在做影像和分子之间的关联的研究,希望把遗传和基因组学与影像学能够结合起来。医学信息的结合,这些信息和电子病历的结合,公立医院的医疗信息、保险等群体信息,与存储工具结合起来,跟个体的信息结合起来。包括什么呢?可穿戴设备收集的信息,家庭的信息,我们在任何的地方进行过任何一次诊断,这些信息能够结合起来。包括未来养老院,就是养老机构,康复机构,能够利用到个体信息,和这些信息结合起来。那么人群的,在个体基础之上形成人群信息。特别是融入微生物,从传染病到复杂疾病的发病率,甚至包括目前来讲我们医保在哪些疾病上应该投入多少多少钱,这些都是精准医疗未来会渗透的领域。

我们知道在精准医疗的基础之上,也要建立新的所谓的知识网络。什么叫新的知识网络和疾病分类的知识网络?就是以前我们的疾病分类是根据疾病的发生位置,疾病的病理状况来进行的分类。未来的疾病分类会基于这些组学的,包括暴露组,然后体征和症状,基因组的信息,微生物组的信息,其他典型的病人信息个体,还有结果的整合。

这个会形成一个全新的医疗系统,完成从精准医疗到个体化医疗的过渡。那么最终会形成什么呢?我们叫精准医疗系统。它包括什么,包括适应临床使用的遗传和精准数据采集系统,其实我们现在的竞争主要还是在这一块的竞争,就是实验技术平台和相关的临床项目,数据分析流程和标准。我们说还要做什么呢?一套自动化的,相互配合的与人类互动习惯健康IT环境,因为最终我们的所有的这些信息都要在IT环境实现。包括什么?电子病例,个人健康记录,个人健康信息,以及与公共信息的结合。随时任何一个有权限的人都能够获取。那么一系列的信息的数据标准和安全,包括有可穿戴设备的健康数据的整合。每一个人以IT为基础的这种健康数据的分析,相互配合健康信息交互方式,就是健康信息与医疗信息的遗传分解等等的结合。

精准医学的理想数据

精准医疗理想数据是什么?首先就是百万人的大数据,有一百万人,对一个十万分之一发病率的病来讲,那我会有多少数据?我要有几十人的数据。对于每一种疾病来讲,比如说我们都有一万人的数据,就能够对它进行非常详细的研究。对一个组织而言,我们需要一百万个细胞的数据,有一百万个细胞的遗传和基因组信息,我们可以对任何一种组织,包括肿瘤,进行非常好的分析。那么我们需要的灵敏度是多少?我们需要在万分之一,甚至百万分之一的频率上去检测一个特定的检测对象。从受精卵到癌症的组织,到这个器官,我们需要多少个数据。

对万分之一的突变频率要求,这是2015年MIT的十大科技进展谈到的排第七的液体活检技术,那么目前大家都在这儿在竞争。一个人的液体活检数据我们现在测几十个基因panel(基因分型)的数据,也要几个G的数据。如果我们放到一个比较大的功能区,可能就要上百个G的数据。如果说测到结构变异,可能目前好比他们是100倍的覆盖率,如果对于肿瘤组织而言,我们要一万倍的覆盖深度,你想想那是多少个数据。如果要在全基因组水平去看液体活检的话,那它需要多少数据。随着测序量的增加,价格在提高,它的灵敏度,它的个体化程度也在提高。而且我们希望实现的是“定性、定量、定位、定序”的液体活检,这是我提出的概念,叫“四定与四维”,四个维度上来进行液体活检,对临床提供指导,这是未来的发展方向。

我们回到精准医疗的商业模式,我把精准医疗商业模式目前的状况分成三个层次。首先是刚才郝总讲了,硬件为基础,就是测序仪和计算机的算法,以及分子生物学的相关设备。在这个层次上基本上我们被海外的品牌所垄断,国内的品牌目前还在奋斗过程中。刚才郝总也讲HiSeq2000出现的时候华大买了128台,成为全世界最大的基因检测中心。华大现在转变了它的发展方向到临床市场,但是实际上在我看来,真正能够与Illumina在个人基因组竞争的平台也只有CG这一个,很可惜的是华大放弃了与Illumina在这个层面上的竞争。那么在这个层面上来看,我们国家的国产品牌基本上是全军覆没。

在中游这一块,试剂、软件的供应商。其实是我们国产品牌逐渐跟上的一个领域。虽然说大部分的核心的技术专利还在美国的手里,但是包括我们还有核心技术专利的,后面我会讲我们的创新的技术,还有其他的华人企业,华人团队创新的技术。在这一块我觉得我们国产的品牌还是有机会的。而现在竞争的主要的战场是在所谓的服务的提供商这个层面,就是第三方医学检验所,医院,医学遗传学服务机构,生物信息学服务机构。我们新的创业公司我看基本上都是集中在这一块。

精准医疗的方向无非是这四个领域。遗传病是最简单的,实际上在临床上来看也不简单。肿瘤有靶向治疗。对复杂疾病而言,目前机制还不清晰。对传染病而言,科研的发展速度非常快,但是在临床的应用还有很多的问题。在这四个方向上面,精准医疗都会有它的发展的机会。

元码基因要做什么?

下面进入这个广告时间。我们元码要做什么?刚才我讲了很多很好的前景,我们发展的方向,但是实际上我们的医院目前的现实是非常让人不满意的。这个就是北京某大型三甲医院的HIS系统,如果我们要在中国最好的医院做一个基因检测,DNA、RNA相关的项目也只有30个,大部分是病毒检测和靶向用药相关的。如果我们要同时检测肺癌相关的这五个基因的话,如果不住院,如果你还是医保,一天只能报1500元的话,差不多要七天的时间每天都要去挂号,每天开一个检查,能把这五个基因检查全部开完。这是我们临床的一个现实。如果是住院的话还好,如果只是要做一个检查的话就是要这样操作,没有办法。

所以我对医院现实理解的是,其实医院缺乏实验技术人才。因为我们的医学院没有交给医生怎么做基因组和遗传的检测,大部分是岗位后的培训,知识系统的欠缺。既能掌握技术,又能掌握解读的医生是非常非常少的。医院整体的系统支撑也是不足的,系统性也不够,这是医院的现实。那我们是做什么呢?

我们就做精准医疗系统的提供者,从基础的实验系统到最后的几个方案。我们做什么事呢,一方面是跟医院共建实验室,建立基础的实验能力和建立分析系统,开辟收费通道,像收费标准的确认,医保系统的进入,真正进入到医院的HIS系统,把能够做的基因检测的数量增加,设置更加合理,让大夫能够用比较简单的方式下单和做检测项目的确认。并且跟医生持续互动,交流项目的信息,完成临床的反馈和随访,最后完成产品的交付,这是我们做的事情。

现在的主要领域是在肿瘤的精准医疗领域,从诊断入手,就是个体化的诊断和治疗方案的确定,到上游的遗传性的筛查,到下游的持续护理,也就是耐药的监控和肿瘤的实时动态的监控,在这几个方面。那么在遗传病领域呢,我们现在也开始跟综合性医院在做一些解决方案,还是从临床入手,到基因的发现,辅助生殖等干预,提供一整套的解决方案,不只是做一个简单的检测而已。

在传染病和感染病领域,现在我们在做一些探索,依然是从诊断入手,往上游的易感人群的筛查和下游的持续护理以及耐药的监控,和这个疾病的持续监控,这个角度去切入这个市场。我们已经建立了完整的系统的硬件支撑体系,从最早的经典的金标准的诊断技术,高通量测序的平台,以及CTC和生物信息分析的平台。以及我们的解读和临床数据支持的系统。目前我们已经跟三十家的大型医院有了科研和临床方面的合作,我们建立合作中心的医院现在有十二家。

我们的优势是什么呢?首先是对行业的整合,因为我们比较了解这个行业,我们所有的合伙人在这个行业的经验超过100年,所以我们比较清楚每家公司的优势在哪里,帮助我们整合优质的资源,帮助我们建立高水平的精准医疗中心。我们有自己的核心技术,我们还叫Ucap,就是做液体活检的一个技术。对DNA进行进行线性扩充之后进行特性扩充的一个技术。目前我们的产品已经开始进行实验。

另外一个技术叫Decap一样是进行液体活检的技术。这是三年以前,我在进行无创产前的数据分析的时候发现的一个规律,就是我们发现测序的这个位置的覆盖是像山峰一样,有起有伏的。后来才知道其实cfDNA降解是有一定规律的,在这两端降解之后,它就形成160bp峰值的一个降解的峰。当时我们的想法很简单,因为我是做实验技术出身的,利用这个降解的规律,我们可以更高效的捕获游离DNA。那时候是想做无创产前的单基因病,后来发现今年的一月份的时候,《Cell》发表了一个研究,也是利用这种降解规律进行肿瘤的组织溯源,也就是癌是长在哪个器官上,它有没有转移,通过这个方法来检测。但是它的这个检测是用的昂贵的全基因组测序的方法,最后我们追踪到这个癌症转移的蛛丝马迹。

我们的方法呢,如果利用我们的Decap技术,保持这种它的降解位置,我们可以比较廉价的方式做到肿瘤溯源。

最近我们又开发了另外一个技术,我们叫Tcap技术,就是基于转座子酶的单向扩增的测序方法。我们知道现在的单分子测序第一步就是对全基因组进行打断。那么基因组分子非常大,目前主要打断的有两种,一种是通过超声的方式,另外一个就是通过转座子酶的方式。这个转座子酶可以把DNA切开,切开之后加入两个序列。那么传统的方法就是通过插进去的序列进行扩增,对基因组进行了一个无偏向性的一个扩大。我们的方法就是结合这个插入的序列和特异性进行扩充,这样我们达到了线性扩增和特异性扩增结合的方法,由此就形成了所谓的专利池,从分子病理,到液体活检。我们都有核心专利覆盖。

所以在这个基础之上,我们成立了我们的液体活检的品牌,我们叫“10K”这样一个商标。那么这个商标代表了什么呢?10代表10毫升血,因为现在做液体活检,临床上来讲抽10毫升血已经是病人能够接受的极限的采血的量。这个10K是代表一万的意思,K是1000的意思,10K是一万的意思,我们追求的是1毫升血里面万分之一的检测灵敏度,因为实际上这也是10毫升血能够检测的一个极限,同时能够实现定性、定量、定位、定序的检测,我们把它叫做四维的液体活检,也就是真正意义上下一代液体活检技术。

我们10K产品在整个临床,在每一个阶段都有它相应的适应的范围,都有完整的产品布局目前。现在除了在早筛这一块,因为毕竟早筛的指标比较模糊。但是从技术上来讲,大家说现在好多公司在花钱做科学,我们没有花钱做科学,我们更多的是花钱做技术,把技术做到极致。技术可以应用在这些领域里面,这些领域里面都布局了合适研究的产品。我们产品的特质能够做到准确、快速、低价、标准化,易操作,以及明确临床意义。

另外我们在大数据这一块,跟北京市的计算中心合作,我们把目前已经发表了所有的肿瘤数据进行本地化。试图通过我们自己检测的结果,和已经本地化的这种别人已经发表的数据进行大数据分析,希望能够找到跟这个病人最相似的,已经发表了数据的那个病人当时的治疗状况以及治疗效果,对于目前的临床决策进行指导。

因为前面我讲测序,怎么测我们能比别人测的好;后面讲为什么我们能够分析比别人更进一步。因为其实在数据分析这一块,大家的起点都差不多,因为用软件基本上都是差不多的软件,用的数据库你拿钱也能买的到。过完这些数据库以后还能怎么办?这是很大的一个问题。这就是我们的答案,我们把全世界能够收集到的测序数据全部本地化,本地化以后用我们的数据跟发表的数据进行聚类,确认我们的数据是与哪类发表的数据类似,然后结合临床的信息,结合他们发表的这些人最后怎么治的,治疗的效果如何,进行一个临床决策的支持。

另外跟英特尔的一些合作,因为我们的商业模式是医院共建的医疗中心,我们整个IT系统和大数据的云计算,牵涉到远程数据的交互,跟intel公司紧密合作,这是我们大数据当中的一些努力。

我们还启动一个精准医疗的行动计划,乳腺癌的精准医疗的行动,这个行动也是从乳腺癌的诊断,试图到筛查和健康管理,到持续护理。因为乳腺癌是中国和美国目前来看肿瘤预后差异最大的一种肿瘤。五年生存率我们跟美国差二十个百分点。乳腺癌的五年的生存率美国大概是90%,在中国不到70%。为什么有这20个百分点的差异,在我看来就是分子诊断在其中所起到的作用,我们在中国的分子诊断的渗透率还比较低,我们就启动了这么一个行动,希望通过我们的努力能够把五年生存率提高一些。特别是在我们合作的一些医院里面。这个是我们乳腺癌精准医疗的行动参与的流程,我们在从手术前进行实时监控,遗传的咨询,到遗传的评估,因为乳腺癌是遗传基因上最明显的一个肿瘤。以及在术中、术后到监控我们做一个分析,一个系统性的方案。试图通过我们的努力能够真正实现基因行业的价值。

谢谢大家!


来源:贝壳社

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部