“大超人”——基于医疗大数据的的人工智能医生CDSS

来源:互联网 发布:网络禁止的100本小说 编辑:程序博客网 时间:2024/04/30 02:33

第一部分 项目背景及挑战

企业背景及基本IT环境。

湖南智超医疗科技有限公司是一家以在医疗健康大数据、超级计算和人工智能领域有杰出研究成果的优秀青年科学家团队等为核心的创新科技平台企业。湖南智超医疗科技有限公司研发的CDSS(Clinical Decision Support System)临床决策支持系统是一款结合大数据+超级运算+人工智能技术、以加强医疗相关决策和处方精准度、提高医疗服务效率和质量为目的的机器人辅助诊断系统。CDSS连接分导诊、临床检查与临床知识,提高临床决策精准度,提升临床效率,减少医院和患者的开支,是国家卫生系统、分级诊疗制度的有益重要补充。

企业目前面临的最大的问题和挑战

随着近几年人工智能、互联网、大数据的迅猛发展,AlphaGo、Watson横空出世,大众逐步认识到,机器人在脑力劳动方面比人类有着更大的优势。未来,机器人辅助或替代医生的部分工作将是大势所趋。机器人辅助诊断系统的三大关键挑战是医学大数据是基础、超级运算算力是支撑、人工智能算法是核心。因此该系统想要爆发真正的生命力,需要满足:以临床大数据为核心的证据支撑,以超级运算算力为核心的在线实现和以人工智能算法为核心的价值释放。全面提升医院的诊断精度和效率,改善全国尤其是边远地区和社区医院缺医少药、”看病难”、”三长一短”、误诊率高、由于人的原因医疗纠纷层出不穷的问题。

第二部分 技术方案:

1、为了解决这些问题和挑战,考虑过的技术和解决方案。对供应商所提供的服务、产品、解决方案的衡量标准。

围绕医疗大数据、算力和算法这三大关键挑战问题,2017年8月国家超级计算长沙中心、全国高等医学院校诊断学联盟和湖南智超医疗科技有限公司签订了关于建设 “医疗大数据中心与人工智能辅助诊疗系统” 三方合作协议。合作目标是建立医疗大数据中心并联合探索和研发人工智能机器人医生,其中基于国家超级计算长沙中心,建设面向全国的医疗大数据中心,并建设辐射全国的医疗大数据产学研基地及孵化中心;全国高等医学院校诊断学联盟负责协调联盟内各个医院和专家,提供医院案例和医疗数据等临床信息,并参与指导和组建医疗大数据中心;湖南智超医疗科技有限公司负责人工智能机器人医生的研发和系统测试,项目筹建和运营管理,并筹建医学大数据企业孵化器及”双创”基地。

该合作是产学研跨界合作的具体体现,有效地解决了数据、算力和算法这三大挑战。为湖南智超医疗科技有限公司研发CDSS系统提供了全面的支撑。智超公司核心研发人员结合循证医学和经验医学2大模型,利用医疗大数据、超级运算和人工智能等技术,并联合研发具有自然语言的处理系统、基于循症的自动问答系统、基于用户反馈的机器学习和系统优化体系3大系统,从”诊前”、”诊中”、”诊后”3个阶段,全力支持和辅助医院和医生进行全方位、全科的智能诊疗。加强挂号、诊疗决策和处方精准度,提高医疗服务效率和质量,连接分导诊、临床检查与临床知识,提高临床决策精准度,提升临床诊疗效率,减少医院和患者的时间和经费等开销,为国家卫生系统、分级诊疗体系的做出有益补充。

2、选择了该技术/解决方案的原因,详细对比一下该技术方案与其他技术方案的优缺点,描述一下该技术方案最大的亮点。

人类目前临床疾病约有3万种,常见的疾病约3000多种,且以每年20-30种疾病数量递增。国内当前医卫工作的主要问题是医疗资源分布不平衡,基层医疗机构需要的全科医生缺乏,培养周期长且难留住人才;病人满意度低,误诊率高,医疗事故死亡率呈不断增长态势。医疗行业已经普遍认为解决基层医疗机构需要的全科医生,贯彻实施分级诊疗制度;提高医疗质量、控制人为医疗差错、提高病人安全为优先和急迫的任务。疾病多样性、体征多样性、药物多样性的发展趋势,亟需计算机来辅助人脑做知识存储和快速检索,大部分的人为因素所致医疗差错也可以通过计算机辅助系统避免。通过引入大数据临床诊断辅助决策人工智能平台可以实现以大数据技术作为使能手段,提高医生的诊断能力和诊断效率、提升病人就诊满意度、拉动医院知识能力的传承和积累!

CDSS系统将人工智能技术应用于医疗行业,核心算法融合一系列人工智能VQ、RBF、BP算法,并融合循证医学和经验医学两大模型,显著提高临床疾病的诊断能力。

3、详细介绍一下该技术方案的具体部署和执行的思路、过程、遇到的困难,和最终的解决方法。

临床诊断辅助系统是大数据、人工智能与临床医疗的结合,也即技术和医疗数据的结合,因此技术和医疗数据成为临床诊断辅助系统突破的关键与核心。

技术挑战,CDSS系统包括基础层、技术层和应用层,CDSS的应用是建立在基础层和技术层的基础之上才能够完成,其中基础层包括计算能力和医疗数据,技术层包括通用技术、算法和框架。具体而言,在进行临床诊断辅助实际应用之前,第一,需要大数据、云计算等硬件加速,神经网络芯片等计算能力;第二,需要医疗领域大量数据进行系统训练和优化;第三,需要自然语言处理、认知技术、自动推理、机器学习、信息检索等技术提供支持;第四,需要机器学习、深度学习等各种算法;第五,需要Tensorflow、Caffe等深度学习框架。当前,国内基础层和技术层的核心技术大都掌握在BAT等巨头手中,能够完成以上全部技术突破的公司需要有较强的技术支持、研发能力和人才储备。

数据挑战,根据Gartner的咨询报告,国内2015年的医疗数据总量已经达到0.3ZB,主要包含HIS(医疗信息系统)的结构化数据,PACS(电子病历)的半结构化数据,LIS(检验检疫系统)和视频监控,教学视频、科研文章等非结构化数据。同时,还以每年翻一番的速度增长,预计到2020年,医疗相关的数据将占全球所有数据的7.2%,达到2.5ZB,我国医疗数据体量巨大。CDSS是大数据和人工智能在医疗临床诊断中的应用,大量的医疗数据是辅助系统建立和深度学习的基础。但是,我国包括公立医院在内的大量医疗机构,出于个体利益和历史遗留等原因,各医疗机构数据保持相互独立、互不流通,各医疗机构彼此之间形成信息孤岛,大量的医疗数据彼此孤立。

2012年美国IBM Watson沃森机器人即通过了美国职业医师资格考试,并部署在美国多家医院提供辅助诊疗的服务,其诊治服务的病种包括乳腺癌、肺癌等多种癌症,这成为IBM的新业务增长极,2016 年12月26日”浙江省中医院沃森联合会诊中心”成立,标志着IBM Watson 在中国医疗领域的商业应用正式落地;与此对比的是我国主流的信息系统企业都未涉及医疗行业的核心业务,对医疗大数据的研究开发和创新利用十分落后,对医疗大数据的研究开发和创新利用没有抓住医疗的核心问题(如门诊的诊断和处方)解决医疗的核心痛点(人民群众日益增长的健康需求和医疗机构羸弱的医疗服务能力之间的矛盾)!

计算机临床诊断辅助决策虽然全世界已经有不少公司在做,但是总体而言,包括IBM Watson沃森在内,离临床应用都有较大的距离,究其原因有三大瓶颈:

a、没有研究出来真正精准可靠、具有医疗特殊性的算法; 
b、没有可供分析研究的大量历史病历数据可用; 
c、没有强有力的算力支撑平台。

围绕上述挑战及瓶颈问题,CDSS系统将人工智能技术应用于医疗行业,结合大数据、超级运算和人工智能三大关键,建立循证医学和经验医学两大模型,其总体设计思路如图1所示:

图片描述

图1 总体设计思路

由于人体的差异性,相同疾病在不同人群中的表现形式(症状)也有较大的区别。随着现代医学的发展,越来越重视理化检查的指标,而相对忽视了问诊环节。CDSS就是在现代医学理化指标检测的基础上,进一步强化人体的外部症状识别,使得两者有机结合,增加临床诊断的准确性。

CDSS系统已开发通用版和专业版。通用版以线上(手机APP)为主要表现形式,为普通患者提供疾病筛查,导诊,线上-线下的引流,统计分析,查看药物不良反应,延伸医嘱等;专业版服务于线下网点和医疗机构的专业医疗人员,以症状+理化检测设备指标+医疗机构的病例统计为主要依据,精准定位疾病,并提供个性化的诊断、处方、保健、预防建议。其总体设计框架如图2所示:

图片描述

图2 总体设计框架

①入口层

手机客户端:针对线上用户,CDSS设计了疾病筛查入口,针对自身的疾病,病人如果有初步认识,就可以通过疾病筛查的方式,进一步了解该疾病的可能性。操作流程如下:输入自身可能患的疾病,查看该疾病的所有症状,勾选符合的自身症状,查看所患此疾病的可能性。

线下网点:由于疾病的复杂性,很多情况下单凭症状很难精准定位疾病本身,同时,由于线上用户专业医疗知识的缺乏,很难准确描述自身的实际症状,因此,CDSS设计了线下网点就诊功能。患者可以在有医疗背景的操作人员辅助下,完成症状的人机交互。

CDSS还能有效的提升患者就诊体验,减少患者排队等候时间。患者在挂号结束后,通过CDSS的诊断建议,做相应的理化指标检查,患者可以拿着理化指标检查数据完成医生诊断、处方,节省患者三分之一的就诊时间。降低医生30%的工作量。

②支撑层

支撑层是用来支撑应用展现的技术能力,支撑层包括:神经元算法、人工智能—机器学习、大数据处理、症状树、算法集成平台等。支撑层是整个CDSS的核心,决定了整个CDSS的精度、操作的人性化、合理化、人工智能—机器学习规则的设定等。

③数据层

数据层根据数据的不同类别完成经验模型库和循症模型库的建立。经验模型指的是一些不能通过理化设备检测所能得到的一些关键症状,如:既往病史、家族病史、职业、外部气温、季节等,还包括一些偶发指标,如:午后低烧、晨起咳嗽、月经不调、胸闷,气短、发声改变、小腹坠胀,头晕眼花等。循症模型指的是通过理化设备(如可穿戴设备,无创血常规、无创血糖仪、B超、CT等)检测所能得到的一些关键症状,如:血压、血糖、心率、心跳、脉搏、白细胞、红细胞、巨噬细胞、血小板、血沉等。

④采集层

由于数据的来源不同,因此数据采集的方式也有所区别。数据采集主要有两种方式:爬虫技术,针对互联网的数据。广泛搜索互联网中有关疾病的详细网页、资讯、著作等;数据集成,针对已经初步处理的数据。如:美国医学情报中心(IOM)黄种人近20年临床常见疾病病例统计数据。针对爬虫技术所获得的数据采取批量导入的方式,而针对数据集成技术所获得的数据采取实时导入和准实时导入技术,完成疾病模型库的建立。

⑤数据源

CDSS的数据有多种来源方式,主要有:CDSS的自诊数据,第三方已有数据(如IOM数据),医疗机构数据(如医院以往的历史就诊记录)、互联网数据(如百度百科、丁香园、春雨医生),专业医疗机构网络平台数据(如万方、百度文库等)。

4、解析这个技术方案的技术架构和特点

CDSS系统的技术架构和特点如下:

①症状树体系

症状树体系是CDSS的核心之一,症状树体系的本质是通过症状定位疾病的最短路径。症状树体系的要求用最少的问题,快速定位具体疾病。包括主诉、单一主诉问答体系、多主诉问答体系。

CDSS设计四大类主诉,包括:发热、咳嗽、疼痛、腹泻。以上症状可以包含临床95%以上的常见疾病。病人通过单选/复选主诉,来完成第一次人机交互。

②疾病模型体系

疾病模型是根据不同的疾病名称建立的经验症状库和理化指标库。分别对应经验模型和循症模型。

经验模型指的是一些不能通过理化设备检测所能得到的一些关键症状,如:既往病史、家族病史、职业、外部气温、季节等,还包括一些偶发指标,如:午后低烧、晨起咳嗽、月经不调、胸闷,气短、发声改变、小腹坠胀,头晕眼花等。

循症模型指的是通过理化设备(如可穿戴设备,无创血常规、无创血糖仪、B超、CT等)检测所能得到的一些关键症状,如:血压、血糖、心率、心跳、脉搏、白细胞、红细胞、巨噬细胞、血小板、血沉等。

③数据采集与预处理体系

疾病模型库的建立依赖于疾病智库的数据采集与预处理。疾病智库主要来源于美国医学情报中心(IOM)黄种人近20年临床常见疾病病例统计,同时还采用网络爬虫技术,广泛搜索互联网中有关疾病的详细网页、资讯、著作等。

④数据比对体系

数据比对体系是整个CDSS的核心,输入为:症状A……症状N,输出为:某种疾病可能性百分比。依据为:每一种症状对应的权重。数据对比体系主要有三个神经元算法(BP、RBF和VQ算法)和一个算法集成平台构成。

⑤描述应用新技术方案前后的分析对比、成果展示。

2017年8月19日在衡阳”第20届全国高等医学院校诊断学教学改革论坛”上,在现场数百位专家和临床医生的见证下,”大超人”系统在4.8秒内完成了100份临床真实病例的诊断,诊断一致性(对比三甲医院专业医生诊断结果)超过98%。

CDSS系统实现了让数万名不同领域专业医生数十年的诊断经验来服务每一位病人;在三甲医院的临床测试中,CDSS系统对肺结核等疾病的诊疗准确率比传统临床诊疗提高了20%”。

第三部分 经验总结:

1、在部署了该技术方案后,企业的业务能力的提升

社会效益:1、提高医院诊疗准确度,提升医院接诊率、医疗服务效率和质量,提升群众医疗服务满意度;2、全面减少医生工作量、减少病人等待时间,缓解医患矛盾、平衡医疗资源分布,解决我国医疗资源缺乏问题;3、降低社会疾病就诊平均费用。

核心产品临床诊断辅助决策CDSS系统目前整套系统部署在国家超级计算长沙中心的天河超级计算机上,并于2016-17年在上海华山医院的呼吸内科、西安西京医院的精神科、301医院、中山医科大学附属医院等已有测试应用,取得了很好的实际效果。系统将挂号准确率提升到99%,诊疗准确率提升了10-20%,医生诊疗效率提高了2-10倍,全面超越人工医生和国际国内相关技术和产品。

该技术预计三年内将CDSS临床诊断辅助决策系统覆盖全国约20%医疗机构,覆盖全国各类医疗机构5000家,三年内创造10亿元的价值。

2、在该技术方案执行的过程中的经验和教训

我国传统医疗面临着医疗资源不足和医疗资源分布不均、医疗成本高企、医生培养周期长、医疗误诊率高、疾病普遍率快、医疗技术日新月异等行业痛点,而智慧医疗是人工智能、医疗大数据和医疗的结合,它能够彻底提高医疗领域的效率。因此,解决医疗行业痛点,提升医疗领域生产力是对智慧医疗的根本需求和发展动力所在。

痛点1:优质医疗资源不足。中国病理医生与人口比例为 1:70000,而美国为 1:2000,据世界卫生组织预测,在未来20年内,全球将会出现1300万医护人员的缺口。另一方面,在当前的中国医疗卫生体制下,医生资源尤其是优质的医生资源被紧紧攥在大型公立医院手中,这给中国原本医疗资源不足的医疗行业,带来了更加严重的医疗资源分布不均的问题,由此导致了一系列如”看病难,看病贵”、”药价虚高”、”大医院门庭若市,小医院门可罗雀”、”排队3小时,看病3分钟”等问题。

痛点2:医疗成本高企。近年来,人均医疗费用和医疗费用在GDP中的占比持续上升。中国医疗成本高的一大部分原因是来自过度医疗-医生出于增收目的多开药多开检查项目。

痛点3:医生培养周期长。我国目前的医生培养模式是”5+3”模式,即5年医学类专业本科教育结束后,进行3年的住院医师规范化培训,结业考核合格后才具备医生(全科医生或内科医生)从业资格。如果是专科医生,还要继续接受专业教育,培养周期达到11年甚至更长。培训周期长首先会导致医疗人力成本高,其次是无法迅速满足持续增长的医疗需求。

痛点4:医疗误诊率高。全美首诊误诊率超过30%,中国基层医疗的误诊率至少在50%以上。受知识、情绪、偏见、诊疗手段等主客观因素影响,人类医生存在相当高的误诊率,优质医疗资源缺乏的地方更甚。

痛点5:疾病谱变化快。癌症发病率正呈现上升趋势,每年因癌症失去生命的人数不断增加;糖尿病、高血压等慢性病逐渐取代传染病、急性病成为危害人类健康的杀手;全球 70%以上人群常年处于亚健康;等等。目前刚性的医疗供给无法迅速应对疾病普遍的快速变化。

痛点6:医疗技术日新月异。据统计,全世界每年有4万多种生物医杂志上约有200万多篇医学论文发表,新的诊断方法、治疗方法不断出现。同时医生的学习时间、学习能力有限,无法在短时间内吸收、汲取新的医疗技术并应用于实践当中。

3、介绍该项目的最大创新点

CDSS系统在超级计算机上构建了大规模人工智能综合算法平台,核心算法融合一系列人工智能VQ、RBF、BP算法的结果并执行综合优化决策,显著提高临床疾病的诊断能力,实现更好的诊断效果;CDSS通过寻找疾病的共性来精确诊断疾病,通过在线机器学习、不断丰富疾病智库、完善疾病的经验模型和循症模型、调整理化检测指标和症状对疾病诊断的贡献值(权重),进而辅助一线医生临床诊断决策支撑。

4、方案点评

智超医疗所研发的这款CDSS系统是结合了”大数据+超级运算+人工智能”技术的计算机辅助诊断系统。大数据与人工智能的介入与应用,不仅能提高临床诊疗效率,还能有效缓解因医疗资源分布不均带来的诊疗体验与效果差异,促进分级诊疗制度建设。系统最大的优势在于,诊断和处方建议都是量化的,可操作性和可验证性强。系统将挂号准确率提升到99%,诊疗准确率提升了10-20%,医生诊疗效率提高了2-10倍,全面超越人工医生和国际国内相关技术和产品。

第四部分 专家推荐语:

请专家写明为何推荐此案例,并说明该案例的亮点所在。可以结合TOP10案例评选指标的创新性、先进性、引领性和效益性来评价。

程学旗:湖南智超医疗科技有限公司研发的临床决策支持系统(CDSS)将人工智能引入诊疗环节,可完成一整套诊疗流程,包括病人从入院到全科分导诊、挂号、开具检查单、完成常规生化指标检查,并出具诊断结论和处方。该系统最大的优势在于,诊断和处方建议都是量化的,可操作性和可验证性强。同意推荐2017年度TOP10大数据应用最佳实践案例。

彭绍亮:湖南智超医疗科技有限公司基于人工智能技术,突破算法、数据和算力这三大挑战研发的CDSS系统,不仅能提高临床诊疗效率,还能有效缓解因医疗资源分布不均带来的诊疗体验与效果差异,促进分级诊疗制度建设。提出的人工智能机器人诊疗模型结合了循证医学和经验医学2大模型,基于天河超级计算机研发的大规模人工智能核心算法精度准、效率高,系统将挂号准确率提升到了99%,诊疗准确率提升了10-20%,医生诊疗效率提高了2-10倍,达到国际领先水平。同意推荐2017年度TOP10大数据应用最佳实践案例。

原创粉丝点击