2018年医疗人工智能技术与应用白皮书

推荐会员: juny218 所属分类: 人工智能,大数据,研究报告,行业精选 发布时间: 2018-05-15 20:15

医疗人工智能的价值

医疗行业长期存在优质医生资源分配不均,诊断误诊漏诊率较 高,医疗费用成本过高,放射科、病理科等科室医生培养周期长,医生资源供需缺口大等问题。随着近些年深度学习技术的不断进步,人工智能逐步从前沿技术转变为现实应用。在医疗健康行业,人工智能的应用场景越发丰富,人工智能技术也逐渐成为影响医疗行业发展, 提升医疗服务水平的重要因素。与互联网技术在医疗行业的应用不 同,人工智能对医疗行业的改造包括生产力的提高,生产方式的改变, 底层技术的驱动,上层应用的丰富。通过人工智能在医疗领域的应用, 可以提高医疗诊断准确率与效率;提高患者自诊比例,降低患者对医生的需求量;辅助医生进行病变检测,实现疾病早期筛查;大幅提高新药研发效率,降低制药时间与成本。

(一)辅助医生诊断,缓解漏诊误诊问题

医疗数据中有超过 90%的数据来自于医学影像,但是对医学影像的诊断依赖于人工主观分析。人工分析只能凭借经验去判断,容易发生误判。据中国医学会数据资料显示,中国临床医疗每年的误诊人数约为 5700 万人,总误诊率为 27.8%,器官异位误诊率为 60%。

以心肌绞痛病症为例,其早期临床表现轻微,除胸口痛外,常会伴随出现肩部到手部内侧疼痛,精神焦虑,血压异常等寻常体征现象,对于门诊医生而言很容易发生误诊。对于病理医生而言,从众多细胞中依靠经验找到微小的癌变细胞难度较大,诊断错误现象时有发生。人工智能技术的出现已经在一定程度上缓解了以上问题。利用图像识别技术, 通过大量学习医学影像,人工智能辅助诊断产品可以辅助医生进行病灶区域定位,有效缓解漏诊误诊问题。

(二)提高诊断效率,弥补资源供需缺口

据统计,我国每千人平均医生拥有量仅为 2.1 人,医生资源缺口问题较为严重。

医生资源缺口问题在影像科、病理科方面尤为严重。目前我国医学影像数据的年增长率约为 30%,而放射科医师数量的年增长率仅为4.1%。放射科医师数量的增长远不及影像数据增长。这个现象意味着放射科医师在未来处理影像数据的压力会越来越大,甚至远远超过负荷。供需不对称的问题在病理方面表现尤甚。据统计,我国病理医生缺口达到 10 万,而培养病理医生的周期却很长,这意味着此问题短期内将无法解决。面对严重的稀缺资源缺口问题,人工智能技术或将带来解决这个难题的答案。人工智能辅助诊断技术应用在某些特定病种领域,甚至可以代替医生完成疾病筛查任务,这将大幅提高医疗机构、医生的工作效率,减少不合理的医疗支出。

(三)疾病风险预警,提供健康顾问服务

多数疾病都是可以预防的,但是由于疾病通常在发病前期表征并不明显,到病况加重之际才会被发现。虽然医生可以借助工具进行疾辅助预测,但人体的复杂性、疾病的多样性会影响预测的准确程度。人工智能技术与医疗健康可穿戴设备的结合可以实现疾病的风险预测和实际干预。风险预测包括对个人健康状况的预警,以及对流行病等公共卫生事件的监控;干预则主要指针对不同患者的个性化的健康管理和健康咨询服务。

 

(四)支持药物研发,提升制药效率

利用传统手段的药物研发需要进行大量的模拟测试,周期长、成本高。目前业界已尝试利用人工智能开发虚拟筛选技术,发现靶点、筛选药物,以取代或增强传统的高通量筛选(HTS)过程,提高潜在药物的筛选速度和成功率。通过深度学习和自然语言处理技术可以理解和分析医学文献、论文、专利、基因组数据中的信息,从中找出相应的候选药物,并筛选出针对特定疾病有效的化合物,从而大幅缩减研发时间与成本。

(五)手术机器人,提升外科手术精准度

智能手术机器人是一种计算机辅助的新型的人机外科手术平台, 主要利用空间导航控制技术,将医学影像处理辅助诊断系统、机器人以及外科医师进行了有效的结合。手术机器人不同于传统的手术概 念,外科医生可以远离手术台操纵机器进行手术,是世界微创外科领域一项革命性的突破。目前达芬奇机器人是世界上最为先进的微创外科手术系统之一,集成了三维高清视野、可转腕手术器械和直觉式动作控制三大特性,使医生将微创技术更广泛地应用于复杂的外科手 术。相比于传统手术需要输血,会带来传染疾病等危险,机器人做手术则出血很少。此外,手术机器人可以保证精准定位误差不到 1 毫米, 对于一些对精确切口要求非常高的手术实用性很高。

 

国内外医疗人工智能发展状况及分析

(一)市场规模及发展趋势

据统计,到 2025 年人工智能应用市场总值将达到 1270 亿美元, 其中医疗行业将占市场规模的五分之一。我国正处于医疗人工智能的风口:2016 年中国人工智能+医疗市场规模达到 96.61 亿元,增长37.9%;2017 年将超过 130 亿元,增长 40.7%;2018 年有望达到 200 亿元。投资方面,据 IDC 发布报告的数据显示,2017 年全球对人工智能和认知计算领域的投资将迅猛增长60%,达到125 亿美元,在2020年将进一步增加到 460 亿美元。其中,针对医疗人工智能行业的投资也呈现逐年增长的趋势。其中 2016 年总交易额为 7.48 亿美元,总交易数为 90 起,均达到历史最高值。

 

(二)国内外行业发展热点分析

国内外科技巨头均重视人工智能技术在医疗领域的布局与应用。

IBM 在2006 年启动Watson 项目,于2014 年投资10 亿美元成立Watson 事业集团。Watson 是一个通过自然语言处理和机器学习,从非结构化数据中洞察数据规律的技术平台。Watson 将散落在各处的知识片段连接起来,进行推理、分析、对比、归纳、总结和论证,获取深入的洞察以及决策的证据。2015 年,沃森健康(Watson Health)成立,专注于利用认知计算系统为医疗健康行业提供解决方案。Watson 通 过和一家癌症中心合作,对大量临床知识、基因组数据、病历信息、医学文献进行深度学习,建立了基于证据的临床辅助决策支持系统。目前该系统已应用于肿瘤、心血管疾病、糖尿病等领域的诊断和治疗, 并于 2016 年进入中国市场,在国内众多医院进行了推广。Watson 在医疗行业的成功应用标志着认知型医疗时代的到来,该解决方案不仅 可以提高诊断的准确率和效率,还可以提供个性化的癌症治疗方案。

此外,谷歌、微软等也都纷纷布局医疗 AI。

2014 年谷歌收购DeepMind 公司,后开发知名的人工智能程序 AlphaGo。在基础技术层面,谷歌的开源平台 TensorFlow 是当今应用最广泛的深度学习框架。在医疗健康领域,Google 旗下的 DeepMind Health 和英国国家医疗服务体系HS(National Health Service)展开合作,DeepMind Health 可以访问 NHS 的患者数据进行深度学习,训练有关脑部癌症的识别模型。

微软将人工智能技术用于医疗健康计划“Hanover”,寻找最有效的药物和治疗方案。此外,微软研究院有多个关于医疗健康的研究项目。Biomedical Natural Language Processing 利用机器学习从医学文献和电子病历中挖掘有效信息,结合患者基因信息研发用于辅助医生进行诊疗的推荐决策系统。

国内科技巨头也纷纷开始在医疗人工智能领域布局,各家公司均投入大量资金与资源,但各自的发展重点与发展策略并不相同。

例如, 阿里健康以云平台为依托,结合自主机器学习平台 PAI2.0 构建了坚实而完善的基础技术支撑。同时,阿里健康与浙江大学医学院附属第一医院、浙江大学第二附属医院等医院、上海交通大学医学院附属新华医院以及第三方医学影像中心建立了合作伙伴关系,重点打造医学影像智能诊断平台,提供三维影像重建、远程智能诊断等服务。此外, 阿里云联合英特尔、零氪科技联合举办了天池医疗 AI 大赛。该大赛面向全球第一高发恶性肿瘤——肺癌,以肺部小结节病变的智能识 别、诊断为课题,开展大数据与人工智能技术在肺癌早期影像诊断上的应用探索。大赛基于阿里云天池大数据平台,邀请全球生物、医疗、人工智能等众多领域的校内团队、专家学者、医疗企业参赛。参赛者使用大赛提供的数千份胸部 CT 扫描数据集进行预训练,在此基础上开发算法模型,检测 CT 影像中的肺部结节区域。准确率排名靠前的参赛者将进入决赛,决赛要求参赛者提交诊断结果的 CSV 文件,并标记检测到的结节坐标,最终根据参赛者给出的坐标信息判断结节是否检测正确,如果结节落在以参考标准为中心半径为 R 的球体中,则认为检测正确。大赛通过探索早期肺癌精确智能诊断的优秀算法,提升早期肺癌检测的准确度,降低临床上常见的假阳性的误诊发生,实现“早发现,早诊断,早治疗”。同时,本次大赛能够激发传统医学与机器学习的碰撞与融合,为整体学科发展进行探路与思辨,推动了人工智能技术在医疗影像诊断上的应用。

腾讯在人工智能领域的布局涵盖基础研究、产品研发、投资与孵化等多个方面。腾讯在 2016 年建立了人工智能实验室 AI lab,专注于AI 技术的基础研究和应用探索。2017 年 11 月,在“2017 腾讯全球合作伙伴大会”上腾讯宣布了自己的“AI生态计划”,旨在开放AI 技术,并结合资本机构孵化医疗 AI 创业项目。2017 年 4 月,腾讯向碳云智能投资 1.5 亿美元。碳云智能由原华大基因 CEO 王俊牵头组建,致力于建立人工智能的内核模型,并对健康风险进行预警、进行精准诊疗和个性化医疗。在产品研发方面,腾讯在 2017 年 8 月推出了自己首个应用在医学领域的 AI 产品腾讯觅影。腾讯觅影把图像识别、深度学习等领先的技术与医学跨界融合,可以辅助医生对食管癌进行筛查,有效提高筛查准确度,促进准确治疗。除了食管癌,腾讯觅影未来也将支持早期肺癌、糖尿病性视网膜病变、乳腺癌等病种的早期筛查。

在国际上权威的肺结节检测比赛 LUNA 中,中国企业参赛队伍阿里云 ET 和科大讯飞均取得了优异的成绩。科大讯飞医学影像团队以92.3%的召回率刷新了世界记录。召回率是指成功发现的结节数在样本数据中总节结数的占比。召回率是评测诊断准确率的重要指标,召回率低代表遗漏了患者的关键病灶信息,因此科大讯飞团队采用了多尺度、多模型集成学习的方法显著提升了召回率,同时针对假阳性导致的医生重复检测问题,创新性地使用结节分割和特征图融合的策略进行改善。在诊断效率方面,科大讯飞团队采用 3D CNN 模型来计算特征图,并在特征图上进行检测,并通过预训练大幅提升了检测效率,实现薄层 CT 的秒级别处理。

我国医疗人工智能细分领域

人工智能与医疗的结合方式较多,就医流程方面包括诊前、诊中、诊后;适用对象方面包括医院、医生、患者、药企、检验机构等;从赋能医疗行业的角度分析,包括降低医疗成本,提高诊断效率等多种模式。我国医疗人工智能企业聚焦的应用场景集中在虚拟助理、病历与文献分析、医疗影像辅助诊断、药物研发、基因测序等领域。

(一)虚拟助理

虚拟助理是指通过语音识别、自然语言处理等技术,将患者的病症描述与标准的医学指南作对比,为用户提供医疗咨询、自诊、导诊等服务的信息系统。

智能问诊在医生端和用户端均发挥了较大的作用。在医生端,智能问诊可以辅助医生诊断,尤其是受限于基层医疗机构全科医生数量、质量的不足,医疗设备条件的欠缺,基层医疗成为了我国分级诊疗发展的瓶颈。人工智能虚拟助手可以帮助基层医生进行对一些常见病的筛查,以及重大疾病的预警与监控,帮助基层医生更好地完成转诊的工作,这是人工智能问诊在医生端的价值体现。

在用户端,人工智能虚拟助手能够帮助普通用户完成健康咨询、导诊等服务。在很多情况下,用户身体只是稍感不适,并不需要进入医院进行就诊。人工智能虚拟助手可以根据用户的描述定位到用户的健康问题,提供轻问诊服务和用药指导。2017 年,康夫子、大数医达等公司研发的智能预问诊系统得到了在多家医院的落地应用。预问诊系统是基于自然语言理解、医疗知识图谱及自然语言生成等技术实现的问诊系统。患者在就诊前使用预问诊系统填写病情相关信息,由系统生成规范、详细的门诊电子病历发送给医生。预问诊系统采用层次转移的设计架构模拟医生进行问诊,既能有逻辑地像医生一样询问基本信息、疾病、症状、治疗情况、既往史等信息,同时可以围绕任一症状、病史等进行细节特征的问诊。除问诊外,预问诊系统基于自然语言生成技术自动生成规范、详细的问诊报告,主要包括:患者基本信息、主诉、现病史、既往史和过敏史五个部分。

此外,语音识别技术为医生书写病历,为普通用户在医院导诊提供了极大的便利。当放射科医生、外科医生、口腔科医生工作时双手无法空闲出来去书写病历,智能语音录入可以解放医生的双手,帮助医生通过语音输入完成查阅资料、文献精准推送等工作,并将医生口述的医嘱按照患者基本信息、检查史、病史、检查指标、检查结果等形式形成结构化的电子病历,大幅提升了医生的工作效率。科大讯飞的智能语音产品“云医声”为了应对医院科室内嘈杂的环境,达到更好的语音处理效果,开发了医生专用麦克风,可以过滤掉噪音及干扰信息,将医生口述的内容转换成文字。目前,讯飞医疗的语音转录准确率已超过 97%,同时推出了 22 种方言的版本,并已在北大口腔、瑞金医院等超过 20 家医院落地使用。科大讯飞的另一款产品“晓医” 导诊机器人利用科大讯飞的智能语音和人工智能技术,能够通过与患者进行对话理解患者的需求,实现智能地院内导诊,告诉患者科室位置、应就诊的科室,并解答患者就诊过程中遇到的其他问题,实现导医导诊,进一步助力分诊。“晓医”机器人目前已在安徽省立医院、北京 301 医院等多家医院投入使用。

(二)病历与文献分析

电子病历是在传统病历基础上,记录医生与病人的交互过程以及病情发展情况的电子化病情档案,包含病案首页、检验结果、住院记录、手术记录、医嘱等信息。其中既有结构化数据,也包括大量自由文本输入的非结构化数据。对电子病历及医学文献中的海量医疗大数据进行分析,有利于促进医学研究,同时也为医疗器械、药物的研发提供了基础。人工智能利用机器学习和自然语言处理技术可以自动抓取来源于异构系统的病历与文献数据,并形成结构化的医疗数据库。大数医达、惠每医疗、森亿智能等企业正是基于自己构建的知识图谱, 形成了供医生使用的临床决策支持产品,为医生的诊断提供辅助,包括病情评估、诊疗建议、药物禁忌等。

 

640?wx_fmt=png

医疗知识图谱构建及应用

 

构建医疗知识图谱的过程需经过医学知识抽取、医学知识融合的过程。在医学知识抽取过程中,传统的基于医学词典及规则的实体抽取方法存在诸多弊端。首先,目前没有医学词典能够完整地囊括所有类型的生物命名实体,此外同一词语根据上下文语境的不同可能会