医疗大数据技术应用及发展趋势
我国健康医疗大数据已进入了初步利好阶段,国家作为政策引导方,已出台了50余条“纲要”或“意见”,可穿戴设备、人工智能等技术的
发展也为产品研发奠定了基础,且头部资本已进入市场。下一步,各方需静待产品与市场需求相融合,共同探索具备商业化或临床价值的大数据
发现2014年起健康医疗类大数据投融资事件增多,2016年最多共66起,2017年略有下降。2018年,健康医疗大数据仅在Q1便发生了
35起投融资事件,其中12件来自医疗信息化建设,多为利用AI、语义识别、数据模型,挖掘诊疗信息,连接院内院外平台等类别的企业。
受人工智能热潮影响,2017年辅助决策类共发生17次投融资事件,2018Q1共5起,预计未来将会有更多资本进入该领域。
2017年,我国65岁以上人口占比11.4%,出生率12.43%(2016年出生率12.95%),人口结构呈现老龄化趋势。以2013年为基础,65岁以上人群两
周就诊率26.4%,且在现代生活习惯的影响下,糖尿病、高血压等慢性病发病率也在不断提升。随着诊疗人次仍将持续上升,医疗体系也将面临巨大压力。
健康医疗大数据领域涉及的相关技术范围非常广,如底层数据采集中包括信息化、物联网、5G技术,处理分析中包括深度学习、认知计算、
区块链、生物信息学及医院信息化建设等。据IBM统计,全球大健康数据正以每年48%的速度增长,在 2020 年数据量将超过
院管理信息系统整体已实施比例在70-80%之间,且集中于三级医疗机构,大量健康 医疗数据的积累为算法搭建提供了基础。在处理分析方面,
人口的增长和老龄化,发展中国家医疗市场的扩张、医学技术的进步和人力成本的不断上涨将推动支出增长。2017-2021 年全球医疗支出预计将以每年4.1%的速
慢性病发病率提升,变化的饮食习惯以及日益增加的肥胖度加剧了慢性病的上升趋势,特别是癌症、心脏病和糖尿病,目前中国糖尿病患者约有1.14 亿,而全球患
传统研发( R&D )成本上升,产品上市速度慢,2004 年至2014 年药物开发成本增加了145%。
劳动力不足,在人口结构的变化和技术的迅速发展下,熟练和半熟练医疗保健工作者将大幅减少。
供需结构失衡,2016 年我国每千人口执业(助理)医师2.31 人。2015 年我国每千人口医师数量在OECD 统计 的国家中排名处于25-30 之间。此外,我国医生PG电子网站
医疗资源发展失衡,2010-2016 年三级医院诊疗人次及机构数量复合增长率分别为10.7%和8.3%,而基层医 院仅为1.5%和0.4%。传统就医模式使得三级医
院人满为患,导致就医体验差及优质医疗资源浪费严重,因此,我国仍把推行分级诊疗作为当前首要任务。
医保透支,《中国医疗卫生事业发展报告2017 》预测,到2024 年将出现累计结余亏空7353 亿元的赤字。提升 医保控费能力,探索创新支付机制迫在眉睫。
2015 年,国家卫计委提出分级诊疗制度将在2020 年全面确立,包括基层首诊、双向转诊、急慢分诊、上下联动分诊诊疗 等。新模式的搭建
过程中,主要存在以下3 个问题。1 )数据不流通,各医疗机构间多为信息孤岛,患者信息无法进行快速 共享流通;2 )资源不流通,优质
医生多集中在各大省会的顶级医院,且三甲医院医生精力有限,每年可支援的基层医疗 更是有限;3 )利益不互通,医院之间缺乏有效的利
大数据技术的应用,将从体系搭建、机构运作、临床研发、诊断治疗、生活方式五个方面带来变革性的改善。由于我国医
疗体系的强监管性,大数据若要在行业内实现其价值,需由国家建立一套自上而下的战略方针,从而引导医院、药企、
民 办资本、保险等机构企业构建项目,相互合作,最终实现从“治疗”到“预防”的就医习惯的改变,降低从个人到
国家的 医疗费用。麦肯锡曾预测,在美国医疗大数据的应用有望减少3000-4500 亿美元/ 年的医疗费用。
• 通过区域信息化、在线问诊、远程医疗等技术连接上下级医院机构,实现医疗
• 制定更优的付费机制,将按服务收费转变为基于价值的付费机制,如DRGs 。
• 通过商业智能,优化供应链及患者管理,提升医院、诊所、药店等传统医疗机
• 通过基因测序、影像识别等技术挖掘更多维度的数据,缩短临床验证周期,提
• 通过认知计算、机器学习等技术,实现精准治疗,辅助提升医生诊断治疗效率,
• 通过可穿戴设备、在线问诊、远程医疗、人工智能等技术间的相互配合,为用
• 医学影像数据大小:15T ;平均每天增加16G ;(图像均按DICOM标准压
健康医疗大数据分为三大类,院外数据、院内数据以及基因数据。院外数据包括健康档案、智能硬件体征及环 境监测/ 检测,院内数据包括
就医行为、临床诊疗等,基因数据包括外显子、全基因等。在具体场景应用方面,多为不同 种类的数据相互交叉结合应用,如预防预警,
健康医疗大数据行业以数据规模为基础,且在政策和资本鼓励下,部分应用场景进入市场启动期,如健康管理、辅助决策(全科辅助决策、影
像病理辅助诊断等)、医疗智能化等。下一阶段,随着企业大数据/AI 技术长期的应用实践探索,产 品不断更新完善,预估2-5 年的内,产
品将首先在B 端客户中进行推广;随后,伴随软件友好度和准确度的上升,在B 端客 户使用的影响下,C 端市场将展开竞争。
健康医疗大数据产业链的上游是数据供应商(医疗机构等)或存储计算服务(云服务商。中游为产业链核心企业,多为具 有影像识别、深度学习、自然语义分析等核
心技术的技术型企业。该类企业可为聚集了大量健康医疗相关数据的机构提供 数据处理服务,在分析及可视化后赋予数据价值。下游为应用场景,分为B 端和C 端。
B 端包括医院、药企、政府、保险、 PBM等企业,其最终的目的是提升医疗服务的效率和质量,降低患者及健康人群的就医费用。
• 健康或非健康人群的就医及健康行为数据,通过物联网、信息化技术采集后将分散且噪音化的数据结构规模化。
健康医疗大数据产业链上游所提供数据的质量与样本量将决定,中游企业是否可以快速有效的进行模型训练。整体来看,院内、院外及基
1 )院内数据 在质量和规模上最具竞争力。各省市TOP 级的三级医疗机构多存有高质量的诊疗数据,且已具备一定规 模 。医院外联系统
中多存有大量就医行为数据,然而这类数据的应用将依赖政策指导,且面临隐私安 全等问题。
2 )基因数据为企业的核心资源,已具备一定规模和质量,且多由中游企业自建数据库自行 采集,或者通过与实验室合作的方式获取。
3 )健康类数据多由智能硬件或在线医疗企业采集,该类数 据增长快速,但是维度多且缺乏整合,质量参差不一。
正在进行融资的103 家创业公司分析,发现主要集中在北上广深一线城市,该现象受医疗 资源、政府态度、医生接受度三方面影响。
1 )北上广深拥有多家TOP 级三甲医院,优质医疗资源丰富且 信息化程度高,因此企业能够获得可观的高质量数据样本;
2 )初期阶段,医疗大数据技术的探索多由地 方政府拨款支持,如2018 年2 月由北京大学医学部和大数据研究院共同筹备建立北京
3 )一线城市的医生对新技术接受程度较高,因此在产 品上市后较易试运行。
平安好医生IPO 报告中公布,2017 年互联网医疗市场规模达到150 亿元人民币,在线 千万次。由此可见, 互联网医疗可
触达的用户规模将越来越大,而仅靠医生或相关从业人员在后台回答问题并不能满足日益增长的用户量。因 此,企业需依赖大数据或AI 等技
术优化问诊、健康/ 慢病管理等产品的功能,从而有效满足用户需求,最终提升付费率。 此外,对于不断扩张的企业,大数据及AI 技术辅助
提升服务效率,降低人力成本;使得在付费率低的情况下(好医生IPO 披露2017 年付费转化率为2.7%),也可以形成稳定的营收与较高
的利润率。随着企业AI 智能分诊、AI 健康管 理路径等模型成熟且全面应用后,院外数据的应用市场将进入快速成长期。
能够提供健康管理服务的企业主要分类两类。一类PG电子网站是偏健康数据收集类企业,针对健康或慢病人群提供饮食、运动等个性 化健康方案。另一类
是偏轻问诊类,提供智能分诊、轻问诊、预约、转诊等服务。目前,C 端服务盈利能力有限,部分企 业依托其健康管理或问诊能力,为企业
端客户服务。如妙健康依托其多维度健康数据及平台搭建能力,为雇主提供内部员 工的健康管理服务,为疾控慢病中心搭建健康信息平台提
供技术服务。如平安好医生结合其终端智能应用,为用户提供智 能分诊,为医生提供辅助决策等服务,辅助政府搭建区域信息化。
用户端服务:提升用户健康度,降低发病率 健康管理企业端衍生服务- 商业价