基因大数据的颠覆应用

推荐会员: 点金大数据 所属分类: 行业精选 发布时间: 2015-07-11 07:25

医疗健康行业将被重新定义,未来个性化诊断将成为新常态未来的医疗发展之路,会从原来粗矿的、单一的、依赖于单个医生,以治疗疾病为目的走向变成更加个性化的、有针对性的、依赖大数据分析的以预防疾病为宗旨的新型模式,所有的变革和颠覆都离不开革命性的技术:二代基因测序。

二代基因测序行业是目前增长最快的基因学研究板块,五年后接近百亿美金市场

根据 Markets&Markets 的一项研究报告显示,2014 年二代基因测序的全球市场为25 亿美金,预计 2020 年将达到 87 亿美金,复合增长率 23%, 二代基因测序是基因学领域中增长最快的子行业,超过基因芯片和 PCR 技术。

基因测序仪增速已放缓,大数据处理成为难点和瓶颈,癌症治疗占最大下游份额(超过35%)基因测序仪已被欧美企业垄断,增速放缓,根据 Markets&Markets 的预测,2014-2020 年,测序仪的复合增长率是 15.4%;基因测序生物信息学全球市场(目前测序行业最大的难点和瓶颈),2012-2018 复合增长率 23%。下游应用市场以科学研究为主,肿瘤检测占下游最大的市场份额(超过 35%)。

测序服务业将成为测序市场增长最迅速的子版块,2011-2016复合增长率达29%。根据 BCC 的预测,测序服务是测序市场增长最快的子板块,从 2011 年不超过10 亿美金到 2016 年达到 35 亿美金,复合增长率 29%;到 2016 年,测序服务的市场容量将超过测序仪器。

我国的基因测序行业:政策已破冰,扬帆起航正当时

我国基因测序行业还处于起步阶段,政策方面经历了灰色地带,全面叫停,从 2014年下半年开始,逐渐破冰。目前,仅华大基因和达安基因两家企业有产品获得CFDA 认证。

今年医药行业最火的一个词莫过于“精准医学”四个字。何为精准医学?就是利用现代化的遗传技术、分子影像技术、生物信息技术,结合患者的生活环境和临床数据,实现精准的疾病分类以及诊断,制定具有个性化的治疗方案。为什么现在大力推动精准医学?背后的大逻辑就是因为人类基因组学技术的革新和大数据分析工具的出现。

一、 癌症基因测序领头羊企业:Foundation Medicine(NASQ:FMI)

癌症是二代基因测序最大的下游应用领域(>35%),也是大家最关心的细分领域,那我们就先从全球癌症基因测序的领头羊企业 Foundation Medicine 谈起。

1、Foundation Medicine 两大主打产品:FoundationOne 和 FoundationOne Heme

Foundation Medicine(NASQ:FMI)是一家以二代基因测序技术为基础,根据癌症基因测序结果给肿瘤患者提供用药指南的公司, 2013 年纽交所上市,代码 FMI。 Foundation Medicine 目前提供两种产品:FoundationOne 和 FoundationOne Heme, 两种产品均是以二代基因测序为基础,使用的测序仪包括 Illumina HiSeq 2000 system 和 Life Technologies’ Ion Torrent 。

FoundationOne 检测 315 个癌症相关基因的编码区域以及 28 个基因的内含子重排,适用于所有固体瘤的检测,费用为$5800。FoundationOne Heme 检测 405 个基因的编码区序列和31个基因的内含子重排,以及 265 个基因的 RNA 序列来检测基因融合,费用为$7200。

2、Foundation Medicine 能为癌症患者提供怎么样的服务

Foundation Medicine 的服务需要医生订购,从提取肿瘤细胞的 DNA 到最终的报告,持续时间 14-21 天。下面两张图显示了 Foundation Medicine 的服务流程图以及一份其出示的最终检验报告,其中包含了检测出来的癌症基因突变情况,以及针对每一种突变基因给出的用药指导建议。

3、我国癌症基因检测的治疗领域市场(百亿级市场规模)

《2012 中国肿瘤登记年报》表明,我国每年新发肿瘤病例约 312 万例,市场上癌症基因测序价格 1 万-5 万,据 2015 年 4 月 21 美国癌症研究协会年(AACR)调查显示 59%癌症患者愿意接受“肿瘤基因检测”,假设其中有 1/2 患者最终可以选择基因检测,假设平均每次花费 2.5 万元,因此每年中国肿瘤基因测序的治疗市场约为 400 亿人民币。

二、 癌症基因测序(预防领域):市场更大(千亿级别),也更具争议性

Foundation Medicine 给肿瘤患者提供用药指南,那对于健康人群和癌症易感人群呢?我们先从癌症的特点说起。

1、癌症的两大特点:潜伏期长以及机理复杂

潜伏期长:癌症不是一朝一夕形成的,一个癌细胞经过 1-5 年成倍增殖 20 次之后,可以形成一万个不正常的细胞团,这时瘤体只有针尖大小。当癌细胞成倍增殖 30 次之后,瘤体形状可如豌豆大小。正常细胞通常历经十年以上的诱导、刺激才可能转化成癌细胞。例如结肠癌,有 10-20 年的病情发展期(下图所示)。

2、易感人群和健康人群的癌症基因检测:早监测早防范早治疗

肿瘤医院的病人中有 60%至 80%刚到医院时就已经进入中晚期,癌症早期的筛查可以帮助患者有针对性的改善生活习惯或者采取个体化的辅助治疗,有益于身体健康;同时将癌症扼杀在摇篮里,从而降低日后巨大的医药开支和生活困扰。例如,随着美国进行前列腺癌的筛查,被检出的患者增多了,但整体死亡率却显著下降(下图所示)。

再看一组数据:来自 American Cancer Society 的数据表明(下图所示):宫颈癌早期诊断的五年生存率的概率是 93%,而晚期诊断这个概率只有 15%,乳腺癌、肠癌和皮肤癌也都如此,早期诊断的五年生存率远高于晚期诊断。

所以对于易感人群和健康人群,预防比治疗更重要:癌症有 1/3 可预防,1/3 可治愈,1/3可缓解。前瞻性的预防疾病可以提高远离疾病诱发因素,提高患者生存率,降低医疗费用。

3、健康人群和易感人群的癌症基因测序:更大的市场(千亿级别),也面临更多的争议比治疗更大的市场

如果未来某一天,癌症基因测序可以像今天的常规体检一样普及,那么就不仅仅是百亿市场,会有千亿级别的市场(假设我国每年 1 亿人进行癌症基因检测,每次 1000 元)。

更大的争议: 但目前阶段,对于健康人群和易感人群的癌症基因测序也存在着非常大的争议,例如,我们是不是应该提前知道未来的健康状况并且进行提取干预;预测结果是一个概率,如何对阵下药;医疗手段还不能跟上检测的步伐,对于一些目前医学界还不能解决的疾病,并不能解决患者的问题,只能徒增心理负担。

三、 基因测序的另一个前景广阔的应用领域:辅助生殖

1、PGS/PGD:人工辅助生殖过程中对胚胎的遗传学筛查和基因诊断

PGS 是胚胎植入前遗传学筛查(Preimplantation Genetic Screening),用于在胚胎植入着床之前对早期胚胎进行染色体数目和结构异常的检测,主要通过检测胚胎的 23 对染色体结构、数目,通过比对来分析胚胎是否有遗传物质异常。PGD(preimplantation genetic diagnosis),即种植前基因诊断,主要用于检查胚胎是否携带有遗传缺陷的基因。

2、高龄、高危家庭需要 PGS/PGD:降低自发性流产,提高怀孕率

美国南加州生殖医学中心的研究数据表明,40 岁以上的妇女的成功受孕率还不到比 40 岁以下妇女的一半。35 岁的妇女流产率约为 25%,40 岁妇女流产率为 33%,45 岁妇女流产率上升到了 50%。而且,用羊膜穿刺的方法检测年龄为 35 岁的产妇,其胎儿存在染色体异常的概率为 1/132,40 岁的为 1/38,45 岁的为 1/12。如下图所示,试管婴儿 20 周后使用 PGS 比不使用 PGS 的受孕成功率高。胚胎遗传筛查的优势在于显著提升试管婴儿的胚胎移植成功率;降低自发性流产;提高怀孕率;确保单个胚胎的转运从而降低多胚胎的风险。

3、二代基因测序作为 PGS/PGD 的检测手段:准确+高效

PGS/PGD 的通用检测手段包括 PCR、荧光原位杂交(FISH),比较基因组杂交(array CGH)以及单核苷酸多态性(SNP)、二代测序(NGS)检测。其中 CGH、SNP 关联分析以及二代测序方法使得检测更为准确、高效。例如,仅仅使用一次切片检查,Illumina 的 24sure 微阵列芯片可以在 12 小时之内完成 24 条染色体的筛查。最新的测序技术可以达到同时检测单基因病和染色体非整倍性的诊断目的,其准确率已经超过了 99%(来自 Carolina Conceptions)。

下图,分别是比较基因组杂交和二代测序的方法在 PGD 中的应用。随着测序技术成本大幅度降低、遗传学机制研究的推进以及生物信息数据分析的深入,相信二代测序技术对试管婴儿的开展更具临床价值和更大市场空间。

4、我国二代基因测序用于 PGS/PGD 的市场:接近百亿元

据估计,试管婴儿有千亿美元的市场。国内每年出生的婴儿数量约为 1600 万,按 12.5%~15%的不孕不育发病率计算,理论上每年应该还有 200 万-240 万的婴儿因为不孕不育无法生育。

假设这部分婴儿的父母中的 60%选择试管婴儿手术,则每年进行试管婴儿手术的夫妇为 120万-144 万对。由于国内试管婴儿平均成功率不足 30%,假设每对夫妇平均采用 2.4 次试管婴儿手术,按平均每周期 PGS/PGD 收费 2500 元计算,则潜在市场规模达 80 亿元的市场。

四、 基因大数据:助力个性化医疗

生命科学已经进入“Omics”时代,生物大数据的特点:高速度、大容量、多样性。生物大数据的形式:百花齐放。建立人群特有基因库、理解基础生物学机制和转化研究成果,都迫切需要大数据分析工具和技术的提升。

1、大数据给生命科学领域带来的颠覆性效应

A) 为公共卫生提供健康趋势的预测

谷歌通过收集的大数据预测禽流感散布,反应速度超越美国疾病控制中心。谷歌公司利用 5000 万条词条以及美国疾控中心在 2003 年至 2008 年间季节性流感传播时期的数据,建立了共 4.5 亿个不同的数字模型,对流感疫情做出了精准的预测(如下图)。

B) 对疾病进行人群及区域的特异性分析

遗传病的易感基因具有人种特异性,即在一种人群中发现的风险基因在另外一个人群中未必也是风险因素。即使同是 BRCA1 和 BRCA2 基因,汉族人群在这两个基因上的常见突变位置和变异形式也与欧美人不同。

因此,中国人群遗传病的诊断和治疗是不可以依赖和照搬国外的研究成果的。而根据中国人群的基因型进行特异性、个体化的疾病风险预测、影响评估以及紧急医疗计划都离不开中国人群特有基因库的建立和完善。这正是大数据可以整合各地区、各民族、各类生物数据来长袖善舞的地方。

请看下图,测序价格降低后,各国争相建立自己的基因组资源库。

C) 加快生物医药研究成果的转化

遗传病的诊断和预测以及药靶的筛选需要大数据的支撑。复杂疾病诸如糖尿病、心血管病、精神疾病等往往是多基因的“微效”作用和环境因素共同作用的结果。例如,科研人员已经发现 2000 多种可能导致多发性硬化(multiple sclerosis)的遗传、环境和传染因子;美国的研究者会从美国国立卫生研究院(NIH)的数据库或者其它资源整合患者的各种数据包括遗传记录、患者调查、地理区域以及生活条件等。

对于开篇提到的 Foundation Medicine(NASQ:FMI),他们的数据分析结果(基因变异和癌症的机理的关系)是基于一系列的科研报告( peer-reviewed paper),随着科研数据的进一步积累,Foundation Medicine 的分析结果也会更加精确。

2、基因大数据行业:风起云涌,群雄混战(Goolge,DNAnexus,Seven Bridges Genomics 以及 BGI)

在第一篇行业报告中,我们就指出,在基因测序的产业链中,数据的分析处理是整个测序产业链中的难点和壁垒,但是和测序仪行业不同(已经形成寡头垄断),目前全球涉及基因大数据的公司成百上千,行业欣欣向荣,但竞争格局激烈,目前正处于群雄混战的阶段。

例如下面提到的 Google, DNAnexus,Seven Bridges Genomics 以及华大基因,争先加入基因大数据的行业,抢占市场份额。

A) Google 基因组:开启基因组云存储服务

下图是 Google Cloud 提供的服务,包括基因组数据的运算、存储和 APP 服务。单个人的基因组数据月为 100GB,经过谷歌特殊算法的处理后,原本 100GB 的数据可压缩至 1GB,费用从 25 美元降至 25 美分,对打开人类基因组存储市场大有裨益。

B) DNAnexus:DNA 数据库公司,基因数据管理

DNAnexus 致力于打造从原始测序文件导入到结果解读的一步式分析平台。 从 Google 获得 1500 万美元的 C 轮融资后,DNAnexus 在 2015 年 4 月 22 日又从药名康德获 D 轮融资 1500万美元,将与药名联盟推出全球首个一体化精准医学平台。

C) Seven Bridges Genomics(SBG)提供免费的工具并帮助设计数据分析流程

SBG 去年拿下了美国国家癌症中心 580 万美元的癌症基因组云计算项目。SBG 的平台上多采用开源的免费软件,如下图 SBG 提供的数据分析服务,包括外显子组、全基因组、转录组分析。

D) 华大基因 BGI Oline:发布基因组数据分析云平台服务

BGI Oline 同样为新一代测序项目的管理提供一站式解决方案,让用户可以轻松创建和运行复杂的数据分析流程。BGI的平台上兼容了开源软件之外也融入了华大自己研发的软件。

3、基因大数据的变现问题

基因数据有着非常大的价值,这点已经毋庸置疑,但如何变现一直是基因测序公司需要考虑的问题。23andMe 和世界顶级药企 Genetech的合作,给很多基因测序公司指明了一条道路。

2015 年 1 月 7 日,23andMe 宣布其获得了世界级药企 Genentech 的 6000 万美元投资,用来获得 3000 名帕金森氏病患者或者他们的一级亲属的全基因组序列信息,Genentech 此举是为了挖掘新的药物靶点。下图正反映了结合生物大数据,挖掘疾病分子机制最终可以做到更好的筛查,更好的临床指导以及更好用药的过程。

五、 投资策略与建议

本篇行业深度报告重点分析了基因测序行业在癌症和辅助生殖领域的应用,以及基因大数据给生命科学带来的颠覆性效应。

为什么今年基因测序行业,以及精准医疗这个领域会特别火,解释有如下三个:

1) 基因测序的价格以超摩尔定律下降

2) 大数据分析工具的出现和进步

3) 传统医学需要突破

分析师表示:2015 年将成为我国精准医疗的元年,基因测序行业是精准医疗的前端,未来该行业一定出现爆发性的增长,按照三个维度推荐测序行业的标的:

1)肿瘤基因测序的先行者:我们首推北陆药业、迪安诊断和达安基因,其中北陆药业可以详见我们四月初的行业深度报告。

2)基因大数据的唯一标的:荣之联。在 A 股中唯一看准基因大数据的爆发性增长趋势,已经开始布局。

3)其他涉及基因测序的公司:首推丽珠集团,双鹭药业,新开源和中源协和。

其他重点关注的品种还包括:昌红科技,东富龙,仟源医药,紫鑫药业和千山药机。

来源:http://www.biodiscover.com/news/research/119665.html

分享&收藏
关键词:

版权声明:本站原创和会员推荐转载文章,仅供学习交流使用,不会用于任何商业用途,转载本站文章请注明来源、原文链接和作者,否则产生的任何版权纠纷与本站无关,如果有文章侵犯到原作者的权益,请您与我们联系删除或者进行授权,联系邮箱:service@datagold.com.cn。