北医三院计虹:如何以大数据建立临床科研“新模式”?

2020
07/28

+
分享
评论
玉玲 / 健康界
A-
A+

数据驱动科研新发展

在数字化时代,支撑医院业务系统多达上百个,这其中拥有海量可供挖掘的数据,它们具有大数据的特点:传输快、数量大、价值高。而另一方面,这些数据标准不统一,共享和复用难度大,有很大局限性。大数据能否成为临床科研数据?能否赋能临床科研能力提升?

7月20日举办的2020年度健康界云峰会“重塑医院智慧大脑”分论坛上,北京大学第三医院(下称北医三院)信息管理与大数据中心主任计虹提出,以大数据建立新型临床科研模式:以医院业务系统数据为基础,建立全量数据中心,对数据进行聚合处理,最终形成大数据科研中心。反哺临床科研,供给临床科研应用。健康界对其演讲内容进行摘录,供各医院参考。 

传统科研模式下,数据局限性大

临床科研离不开数据,但现阶段临床科研数据,却有较大局限性:医院临床数据存在数据库相互独立、数据获取不及时、多是非结构化数据、难以重复应用的局限性。

计虹提到,传统临床科研的数据获取方式主要有三种,一是从病案科导数据;二是借阅电子病历;三是从信息中心导数据。各个科室还存在自有系统独立,数据互不通用。

而这样的数据来源和数据库分立的形式,造成数据标准不统一、难以重复应用;科学研究获取数据不及时、查阅工作繁重;以及复杂的数据关联。同时,医院的数据以非结构化数据为主,结构化的数据占比不到20%,文本型数据利用难度很大,需要人工分词,不仅效率低,还容易出错。

对于临床科研中数据的局限性。在计虹看来,随着医院进入数字化时代,医院可以利用在业务系统中的数据,打造新型科研模式。

数字化时代下,以数据为基建立新型科研模式

“现在,每个医院都涉及到几十甚至上百个业务系统,例如EMR、LIS、PIS、AMIS、NIS等等,这些系统产生了海量的医疗数据,形成:种类多、传输快、数量大、具有价值高的可以进一步挖掘利用的大数据。”

在现代医院,信息化与医院的临床、服务、管理、后勤、科研、教学都息息相关,计虹认为,医院涉及到的上百个系统中包含大量可供临床使用的数据,如果能够加以利用,就能反哺临床科研。

基于这样的思路,计虹确立了通过探索医疗数据的价值来提升临床科研能力的智能新型科研模式。而建立新型科研模式的第一步,北医三院建立了全量数据中心HDR。

“以前的科研模式,可能是围绕着单一目的,提出科研思路,以手工形式从病历等业务系统获取原始数据,然后人工处理数据,再进行统计处理,最后提出研究结论。而进入大数据时代,可以基于海量数据进行问题挖掘、提出科研假设,建立智能的新型科研模式。”计虹说道。

在丰富业务系统应用的前提下,北医三院建立了全量数据中心HDR,涵盖了医院各个业务系统的数据。现在,在北医三院数据中心,规模总量已经超过24亿条,日均增量100余万条。

对数据进行全生产线加工,建立大数据科研平台

那么,在大数据中心之上,如何建立为临床提供服务的科研平台呢?2017年,北医三院建立了基于云平台的数据科研平台:一方面基于全量数据中心,另一方面结合临床数据库和课题数据库。

计虹提到,在获取数据之后,需要对数据进行加工处理,从数据的抽取、脱敏、融合、分词处理和清洗加工,以及数据治理,如同一条生产线,才能最终供给各种应用场景利用。

在北医三院科研平台建设体系中,HDR数据中心是基础,在此之上建立科研平台,通过数据处理、数据质控、数据治理、敏感数据脱敏管理和多层级账号权限和安全体系设置等工作,供临床科研使用。

标准化建设  进行医院主术语建设、标准化术语本体库建设等。

数 据 处 理  包括数据融合处理、元数据模型建设、自然语言处理、数据标准化处理、数据处理过程分析等。

数 据 质 控  对数据完整性质控、规范性质控、内涵质控与评价、数据溯源核查。数 据 治 理  进行数据一致性治理、残缺数据治理、重复数据治理、数据可计算化治理、以及数据标注治理。

安 全 管 理  一方面,进行敏感数据的脱敏管理;另一方面,要建立账户安全体系,建立资源管控机制:项目数据池会产生出很多访问授权。对于研究者和数据生产者,都有访问项目数据池的需求,因此,要对不同类型的访问者给予不同的授权和分析应用权限。

补给临床,大数据科研平台三大功能

大数据科研平台应用后,成果显著。实现了三方面的功能:第一,在数据来源上,加宽科研获取数据范围;第二,产出新的科研模式,提供科研新方法;第三,提供智慧科研应用,提供前瞻性数据采集和回顾性数据利用。

    1. 从数据来源上,加宽科研获取数据范围

虽然很多医生希望数据实现临床科研一体化,但临床工作注重数据效率和质量,而科研需要的数据范围更大。两者存在交集。为此,北医三院扩大了数据来源,以三大数据来源为科研数据提供支撑:

第一种方式,是基于电子病历EMR模板改造建立的临床科研一体化。实现临床、科研病历数据一体化采集独立存储和应用,为科研提供数据来源。

第二种方式,是多中心课题支持EDC(电子数据采集系统)。从方案描述、eCRF模版设计、入组与采集一直到审核与质询、数据保存与处理,支持多课题、多中心的与数据资源中心和随访系统的对接。

第三种方式是基于公众平台的健康随访平台。在北医三院健康服务号上,对患者术后进行随访,还可以对慢病患者用药提醒,以及可穿戴设备的数据接入。“公众平台除了微信健康服务号,还有PC端应用,支持临床课题、病案、随访的数据纳入,汇集的数据是方方面面的。”

“这些数据最终汇总成为我们现在看到全面的数据资源,住院患者达到100多万,门诊能够达到5000多万,变量几乎达到16,000,这些为临床人员进行科研分析提供方便。”计虹说道。

    2.从科研模式上,提供科研新方法

传统科研是发现问题、提出假设、方案设计、数据采集、数据分析、提出结论的过程,而通过智能化的医疗数据大平台,可以形成大数据的新型科研模式,提升产出效率。

“经过大数据的优化后,我们可以采用一些新的方法,比如荟萃分析、探索性分析等等,从而从大数据中提出更优更好的预假设。”计虹说道。现在,在数据获取上,基于智能化的医疗数据大平台,可以自动进行数据获取,数据集规范之后,可以自由利用,大大提升了科研的产出效率。

   3.在智慧科研应用上,提供前瞻性数据采集和回顾性数据利用。

计虹在演讲中提到,大数据平台还可以提供智慧科研应用,分为两大部分,一是回顾性的数据利用,二是前瞻性的数据采集。

现在,在北医三院,有27个临床科室,161名医生在使用大数据科研平台,第一大应用就是用于科研的回顾性数据利用,通过平台,根据主题查找所有资源总览,建立词云分析。

另外一大应用就是前瞻性的数据采集 “通过前瞻性数据采集,通过通过刚才我介绍到的前瞻性数据采集,通过临床科研一体化的改造方式,或者EDC的补充采集方式,还有微信端随访数据,都可以用作我们前瞻性的数据分析利用。”

大数据科研需要多学科协同参与

最后,在谈到对大数据应用于科研的未来前景时,计虹说道,尽管大数据科研仍然存在着挑战和局限性,但未来应用范围非常广泛。同时,作为一项长期系统工程,大数据的使用也需要持续优化改进与完善,需要各个学科间的互相协同。

“我们需要以问题为导向,而问题的提出往往需要从临床医生视角提出,方法学的专家也需要参加,把控研究设计、减少数据偏倚;信息化专家更多的是在梳理数据的内在联系,构建信息的模型,来统一数据的管理,在多学科的共同协同下,最终让数据发挥巨大的价值,让数据驱动科研新发展。”计虹说道。

计虹:北京大学第三医院信息管理与大数据中心主任


注:本文系原创,欢迎转发朋友圈。

了解更多数字医疗信息请关注“new healthcare”公众号

扫码加小编进群,与全国数字医疗同行一起交流!

本文为健康界原创,任何机构或个人未经授权均不得转载和使用,违者将追究法律责任!
关键词:
医院信息化,大数据,数据中心,临床科研能力

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

相关文章

推荐课程


精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏作者

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×
打赏

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!