医疗大数据生态下基于标注引擎的医生画像研究

2021
09/22

+
分享
评论
郑涛 王觅也等 / 中国数字医学
A-
A+

医生画像的应用不仅有助于医院精细化管理,还能增强医生荣誉感、使命感,提升医院文化软实力。

随着医疗信息化建设的发展,大数据在医院文化建设的应用也层出不穷。本研究从医院文化视角出发,通过构建医生画像来提升医生职业幸福感和成就感,激发医生工作积极性,促进医生为患者提供更好的医疗服务。结合当下医疗大数据背景,以医院业务系统、互联网渠道系统和相关管理系统的数据为基础,文章提出大数据平台下的医生画像体系架构,并设计以标签模型为核心的标注引擎,通过该引擎生成涵盖临床、科研、教学、管理特征的医生画像,并将画像结果通过应用服务定向推送给医生,实现医生画像的可视化呈现。医生画像的应用不仅有助于医院精细化管理,还能增强医生荣誉感、使命感,提升医院文化软实力。

随着人们生活水平的发展进步,民众对医疗服务的要求也日益增加。《“健康中国2030”规划纲要》提出要大幅提升健康服务能力,加强医疗服务人文关怀。医生是提高医疗服务质量的重要力量,但在实际医院环境中,大部分临床医生不仅肩负着救死扶伤的重任,还需要面对比较复杂的医患关系,这可能导致医务工作者职业幸福感不高,严重时还会形成职业倦怠,不利于医疗服务的质量。针对这一现象,结合当下医疗大数据的背景,本研究从医院文化视角出发,通过构建医生画像来提升医生职业幸福感和成就感,促进医生为患者提供更好的医疗服务。

近年来,健康医疗大数据已经被广泛应用于医疗卫生行业,本研究在此背景下研究基于标注引擎的医生画像,从临床、科研、教学、管理多个维度分析医生画像的标签数据,并通过消息平台等定向推送给相关医生。一方面,标签数据可以量化医生的工作量,激发医生工作积极性,对医生的行为起着引导和约束作用,促进医院精细化管理;另一方面,本研究对医生画像的应用能够充分发挥医院文化的导向、凝聚、激励作用,提升医生幸福感和归属感。

1.用户画像研究现状

医生画像的本质其实是用户画像在医生群体的应用,即用户信息标签化,是大数据技术的重要应用之一,通过将用户行为特征进行整合、统计分析后凝练出一类用户标签,目的在于挖掘用户潜在价值信息,勾画用户全貌,并用可视化的方式展示出来。最近几年,各个学科领域的从业人员从不同角度对用户画像进行了研究。王正友等人在研究视频领域精准推荐时认为,通过评估用户的偏好兴趣,将权重较高的标签所包含的内容推荐给用户,这样更能符合用户需求和喜好。李一男等人在文章中指出在医疗领域中使用患者画像可以帮助医护人员高效识别目标患者、预测可能出现的并发症、为患者提供精准的照护服务。席岩等人介绍了基于微博数据的用户画像研究以及基于大数据的用户画像分类。杨丽静等人的文章探索患者360视图实现居民慢病趋势分析、医疗费用检测、病人治疗效果评估等功能。

在当前医疗行业中,针对患者画像的研究及应用逐渐丰富起来,但对医生画像的构建相对缺乏,也并未形成行业内统一认知。现有对医生画像的研究主要从患者角度出发,通过挖掘医生医疗质量的信息和患者对医生的评价特征,为患者提供精准的医生推荐,实现“智慧就医”。与现有研究不同,本研究从医生角度出发,在传统的评价维度之外,构建一个多维度、立体化的医生画像模型,以此增强医院文化塑造,促进医疗服务更加人性化,让医院管理更有温度。

2.基于标注引擎的医生画像

医疗大数据生态下基于标注引擎的医生画像架构如图1所示,由下至上分为三个层次,依次为数据源系统层、医疗大数据平台层、数据应用服务层。由于医生画像包含临床、科研、教学、管理四个方面的数据,因此需要将来源于不同系统的数据进行采集、清洗、转换、加载后,按主题分类存储在医疗大数据平台的数据仓储中心,经过处理分析后通过标注引擎生成每位医生的画像结果,最后采用消息平台等定向推送给相应医生,并在客户端实现数据可视化呈现。

图1 基于标注引擎的医生画像架构

数据源系统层

大多数医院经过数十年的信息化建设,现在都有较为全面的业务或支撑系统,这些系统主要有三类:医院业务系统、互联网渠道系统和相关管理系统。其中,常见的医院业务系统有医院信息系统(HIS)、检验系统(LIS)、电子病历系统(EMR)、手术麻醉系统等,这部分系统的数据可以反映大部分医生的临床工作特点。另外,随着当前智慧医疗政策的推进,远程会诊系统、联合门诊系统、在线诊疗系统等互联网渠道系统应运而生,这些系统的数据也是本研究构建医生画像的基础。除此之外,与医生画像相关的很多科研、教学、管理数据存放于相关管理系统(如:医院人力资源系统、科研管理系统、重大事件管理系统等)或者医院的一些职能部门,这些数据同样需要考虑纳入。由于数据源来自不同的业务场景,数据类型和结构多种多样,因此本研究构建医生画像的首要工作就是将这些数据准确、高效地采集,并根据实际情况进行清洗处理,为进一步分析处理提供数据支撑。

标注引擎

医生画像从多个角度全面刻画医生特征,数据来源于多个系统,需要借助医疗大数据平台来完成构建。通常医疗大数据平台的搭建会涉及到多个核心子系统,本研究根据研究方向将重点放在与医生画像相关的数据仓库和标注引擎。其中,数据仓库解决源数据、初步标签值和画像结果数据的存储问题,分别对应图1中的数据仓储中心、标签数据中心、画像数据。标注引擎根据标签策略及规则为医生“打标签”,该过程分为三个步骤:标签设计、数据统计、画像生成,并由多个模块共同实现,这也是本研究的研究重点。

标签设计

标签设计的目标是根据医生数据抽象出一个标签模型,如图2所示。标签模型按层级结构展开,其中一级分类即标签主题,包括临床属性、科研属性、教学属性、管理属性四大主题。临床属性针对医生在临床医疗服务方面的数据,是对一位医生最基本的特征刻画;科研属性是医生投入到科学研究中的事件描述,有助于医生了解自身的学术影响力;教学属性用来刻画医生在医疗教学方面的特征,反映医生对临床教学工作的积极性;管理属性则是为了反映医生在医院的日常管理和面对重大事件如地震救灾、抗击疫情、援非援藏等方面的工作情况。

图2 标签模型

二级分类承接自一级分类,并对各个标签主题进行细分,以临床属性为例,分为5大类:患者画像、节假日、门急诊、住院、手术。其中患者画像分析医生提供诊疗服务对象的来源地、国籍、民族等信息,帮助医生了解其诊疗服务的辐射情况、患者复诊动力等。节假日针对医生在一些特殊日子的临床工作数据,反映医生工作的辛苦与奉献,传递一种温情和关怀,提升医生职业幸福感。而门急诊、住院、手术则是对医生参与的临床工作进行分类展示,体现了医生的工作负荷、工作效率、诊疗质量等。

三级分类即标签列表,是对标签内容的展开及标签规则的制定。标签类型一般有3种:统计类、规则类、挖掘类,本研究采用统计类和规则类标签。统计类标签从医生诊间服务、入院服务、手术操作等行为数据中进行统计计算得出标签值,如:门急诊总人次、出院患者平均住院日、手术总台次等。规则类标签是基于特定规则产生,如:患者来源城市分级分布,先梳理并确定一线、新一线和其他城市的定义范围,再根据所确定的范围规则计算患者的不同城市来源分布情况。

标注引擎的建设核心是标签画像的规则和策略,因此设计一个层级合理、结构清晰的标签模型对于刻画全面、立体的医生画像是非常重要的环节。

数据统计

标签模型设计完成后,考虑到源数据结构化程度的差异,先将一些非结构化数据通过自然语言处理(Natural Language Processing,NLP)技术转化为方便统计的结构化数据,再进入到数据统计环节。此环节分为两步,第一步根据标签规则对原始数据进行统计加工,得到初步标签值。如一天中最晚结束手术时间,是根据手术医生施行手术结束时间在20:00至次日6:00之间的数据进行计算得到的最晚时间;再如患者来源人数最多top3的城市,将医生实际治疗患者的来源城市进行整合、统计,输出人数最多的3个城市。第二步对计算出的初步标签值进行分类和异常判断。分类的原因是便于后续数据应用时不同分类对应不同的画像使用场景。根据帕累托分析法原则,按照低(0~20%)、中(20%~80%)、高(80%~100%)三个区间划分,标识出不同医生标签值的分布情况。异常判断用来识别医生的每个标签值是否有异常,能进一步确保数据准确。本研究采用箱线图方法进行异常判断,分别将在全院和科室范围内超过上下四分位1.5倍的标签值打上异常标签以便做画像处理。

大数据平台下,通过ETL策略配置及作业调度中心完成统计处理的过程,统计后的数据分区分级存储在标签数据中心不同目录中,这样能减少ETL作业加载时间,保证标注引擎的性能。

画像生成

由于初步标签值分散在不同的中间表并存储于不同目录下,因此画像生成环节以医生为维度,将属于每位医生的全量标签值汇聚到一张目标表中,这样不管查询、解析还是推送都更加便捷。在汇聚之前,根据实际情况对初步标签值进行最终处理,处理方式主要有2种:模糊化处理、规则化处理。

模糊化处理针对在统计时被判定为异常的正确数据,这些异常通常是有原因的,在进行模糊化处理时只输出所在的数据区间而不列出具体标签值,这样较好的规避了一些特殊情况下的数据。

尽管数据在进入大数据平台时已经对数据质量和准确性进行了验证处理,但仍然存在部分医疗业务需要而产生的特殊数据,需要进行规则化处理。通过定制化的策略对标签值进行输出限制,如内科学的医生不出现外科手术类的标签值,医技超声学科医生没有治疗类的标签值等。另外,规则化处理还会针对数据输出格式、输出类型进行统一处理。

画像生成过程也是通过ETL调度作业实现,是标注引擎的最后环节,最终会输出不同医生的完整画像数据。

数据应用服务层

数据应用服务是医疗大数据生态下的门户窗口,构建医生画像的最终目的也是将画像结果通过应用服务定向推送,使每个医生能全面了解自己的临床、科研、教学、管理情况,促进医生工作积极性的提升。本研究采取的推送方式有多种:推送平台、邮件平台、可视化等。推送时可以将数据与一些温情、有力量的文字相结合,传递出激励、凝聚的正能量,提升医生的职业成就感和工作幸福感,加强医院文化软实力。

以某大型三甲综合医院为例,实现了近2 000名医生画像的构建,科室范围包括心脏内科、血液内科、骨科、消化内科等20多个业务科室,医生角色涵盖了麻醉医生、内科医生、外科医生、医技医生等,医生的画像结果如图3所示。每位医生画像根据标签模型产生标签值,以疫情期间援助地区与天数为例,其统计了全球新冠疫情期间,医生参与的各种抗击疫情工作,如前往武汉、黑龙江、西藏支援,一定程度反映医生的无私奉献和家国情怀。该医院实际外出参与抗疫的医生260人次,通过本研究的标注引擎,实际推送该标签260人次,有效接受260人次,经后续调查随访,95%的医生反馈效果良好。 


图3 医生画像应用


3.讨论与建议





作为专业性很强的知识型工作者,医生是医疗行业发展的核心力量,因此提升医生职业幸福感和归属感对促进更好的医疗服务具有重要意义。随着医疗信息化建设的不断推进,大数据的应用为医院文化建设探索新方法提供了更多的可能性。在此背景下,本研究提出了大数据平台下的医生画像体系,并设计以标签模型为核心的标注引擎,通过该引擎生成涵盖临床、科研、教学、管理特征的医生画像。



本研究的创新点在于:①从医生角度出发,构建一个多维度、立体化的医生画像模型,提升医生职业成就感,有利于医生为患者提供更好的医疗服务;②从医生最长手术时长、最晚结束手术时间等人文关怀角度进行标签设计,使医生画像更丰富饱满,大数据的应用更加人性化和有温度;③充分考虑重大事件的影响,将参与抗疫、援非等特殊事件的数据纳入画像,也进一步促进医院管理,增强医生荣誉感、使命感。但本研究仍然存在一定的局限性,后续将主要进行两方面的工作:①继续扩展医生画像的标签列表,丰富医生群体的画像构建;②将会纳入更多角色,比如为护士、药师、行政后勤等其他医务工作者进行标签设计,为医院精细化管理工作和软实力提升奠定基础。

本文转载自其他网站,不代表健康界观点和立场。如有内容和图片的著作权异议,请及时联系我们(邮箱:nanxingjun@hmkx.cn
关键词:
医疗大数据,医疗信息化,智慧医院

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

相关文章

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏作者

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×
打赏

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!