24小时更新医疗健康领域的要闻,打造最及时、最鲜活的资讯平台。

72 小时热文

赵邑新:医疗大数据是大财神还是大忽悠?

文/赵邑新 2014-05-26 来源:熵量
A- A+
摘要 在我看来,大数据是个大帽子。对于大多数人来说,不管有没有大数据这顶帽子,大家该干什么还要继续干什么。

各位同仁,大家上午好!很高兴在熵量大会上分享有关大数据的一些观点。

大数据紧随着云计算,在几年前就已经热火起来。2013年,我应邀参加一个大数据的会议,漂亮的PPT满天飞,气氛异常火爆,我听得却云里雾里。主持人让我发表意见,推辞不过,只好站起来,提了三个问题:第一,大数据是一夜之间产生的吗?第二,大数据是要一蹴而就吗?第三,大数据是一剂万能药吗?他们再也没有邀过请我去参加后来的大数据会议。希望今天我在这里讲完了,以后还能在熵量大会上见到大家。

不知道大家如何看待这三个问题,在我看来,大数据是个大帽子。对于大多数人来说,不管有没有大数据这顶帽子,大家该干什么还要继续干什么。

2009年8月7日,总理说,“物联网好。”于是神州大地物联网蓬勃兴起。在一次无锡会议上,一位先生自豪地跟我说,“我们做物联网已经28年了。”我非常崇敬地请教:“您是做什么的呢?”“物联网好啊,物物相连,感知中国!”“是,是,您是做什么的呢?”“物联网是经济新增长点啊。”“对,对,请问您是做什么的呢?”“我是做电视的。电视嘛,物物相连,感知中国啊。”如果类似的事情发生在大数据领域,那大数据就成了大忽悠。

很不幸的是,大数据确实存在大忽悠的现象。这是一个群里的讨论:“请教一下,现在医药公司销售药品的时候,有销售市场分析的大数据方案吗?”“ERP算不算?”……“不过现在随便一个统计报表都叫大数据分析,ERP,可能也可以算吧。”这是忽悠之一,沾数据就叫大数据。那做Excel的微软,是不是可以声称做大数据解决方案已经快30年了。

谈到方案,还有一类忽悠就是Hadoop包打天下。在云计算人云亦云时,Hadoop就是当家花旦,大数据膨胀时,Hadoop又成了镇宅利器;看来大象不仅会跳舞,而且既能腾云,还可以下海。如果以后还拿着Hadoop讲大数据,而没有对于数据和应用的分析,对不起,就是在忽悠。

每个公司都可以给自己戴上大数据的帽子,这无可厚非,但是为了真正能够从大数据中获益,需要认认真真做些实事,大数据重在分析。

这张图,是我半年的血压数据,其价值在于,它能够对我的血压状况给出一个准确的评价,高血压、低血压都不是通过单次、个别的测量来判断的,而需要长期的监测。这个分析很简单,但对我来说就很有价值。

这张图,是我半年来通过计步器获得的运动数据,应该如何解读呢,这时候就需要其他相关数据一起分析,在1月底的时候,运动量几乎是零,这个很好理解,春节期间,过了一周养猪一样的生活;春节假期结束,运动量开始恢复、上升,但是到这里又开始显著下降,原因何在?雾霾来了,走路又少了,这是天气信息;到了4月中旬,连续几天步行超过15000步,4月18日更是高达17000多步,这又是什么情况呢?深圳CMEF医疗器械博览会,我用3天时间走遍了全部展馆,这是位置信息和事件信息。

通过这两个简单的例子,可以看到,通过与行业结合的,以及结合多种关联数据的分析,数据和大数据是能够产生价值的。不过,别着急,在大数据成为大财神之前,还需要大的投入。

首先,大数据需要积累。这可不像拿北京市人口或者全国人口算个数那么容易,需要在时间维度上的多种投入,包括基础设施,数据采集、数据服务和用户维护,而且,这种投入通常需要创业者自己承担,也就是说,最先为大数据买单的,不是政府,不是医院,是创业者自己。一个最简单的例子是,现在开发一款手机App,不但挣不到钱,每个装机量都要花上十几块钱。针对医生这种专业人群的手机App,装机的成本会更高;而且装机之后为了维护活跃度,要继续投入成本。

有的同仁会说,这是对于新产生的数据,原有的系统中,已经有很多数据了。确实是这样的,但这些数据需要大量的行业投入。为什么这样说呢?每一个传统行业都有自身的特点和规则,当我们试图用信息技术试图帮助一个传统行业提高效率、挖掘价值时,需要对这个行业有充分的了解,并且能被这个行业所接受。要把一个行业应用做好,要么成为专家,要么和专家一起工作。

在给医院部署健康管理系统时,体检中心的医生一般会要求把原有体检系统中的数据导入健康管理系统,这听上去是一个很合理的要求,似乎也没有什么技术难度,顶多是一个拿着数据字典人工映射两边的数据库表,写程序进行处理的体力活。而且,能够一下子拿到七八年甚至是十多年来几十万人次的体检数据,是一件多么令人兴奋的事情啊。等工作开始了之后,才发现对其现有业务是多么缺乏了解,而积累的数据是多么难以消化。

十年前开发的系统,是服务于体检,最后根据数据生成体检报告就行。在录入血压时,会把高压、低压值和血压单位,甚至是当次测量是否正常的诊断结果都写在一个字段里,这对生成体检报告没有什么影响,但是对于进行健康管理所需要的结构化数据来说,就是个灾难。类似的,在总检师意见中,对于需要进一步关注的被检者,会写上“两个月之后进行肝功能复查”这样的内容,这本来对于生成健康管理中所需要的随访任务是非常重要的数据,但是由于在原有系统中,并不是结构化存储的,而且由于人工输入的随意性,比如“两和2”,“肝功能和肝功”,这些人很容易理解的内容,交给计算机去处理,开销就非常大。

在工作中还发现,并不是什么数据都要收着,否则可能不堪重负且没有收益。比如对于PACS影像系统中的图像数据,医生会希望也导入到健康管理系统中。我们知道,核磁、CT、超声、X光等各种检查产生的电子文件是非常大的,而PACS是需要几百万甚至是上千万投资的大系统,其中很多成本就花在了数据存储上。如果健康管理系统要接管这些数据,硬件成本会变成多少?更为重要的是,健康管理所需要的,不是这些影像文件本身,而是医生对于影像的诊断,或者说是meta data。而为了能够给医生同意,需要让他认可并接受你的知识和权威。

解决了这些,是否通向大数据的门就打开了呢?不尽然,恐怕还要继续投入。我们知道,医院,尤其是公立医院,对于数据的管理是有严格的要求的,比如“等保”信息安全等级保护制度。医院的网络划分为业务区,也就是内网区,以及DMZ区,Internet可以访问的区域。这两个区域是隔离的,不允许有直接的网络连接,要通过特殊的流程和工具进行数据交换,一定要手工操作,这种方式下,如何大数据?显然与通过物联网产生和消费数据的需求产生了冲突。那么,现在就要去挑战这些规则吗?恐怕会在叫做“信息科”这样的单位碰得鼻青脸肿。可行的策略是,应当继续在推动应用上不断投入,帮助有想法的医生和科室不断开展业务,通过业务推动规则的调整,最后解放数据的流动和使用。

回归到技术层面,我对大数据的技术发展和应用动态非常关注,目的是为产品和服务选择最恰当的技术支撑架构和方案,不为了大数据而大数据;同时,也为业务的发展做好技术储备,避免事到临头时手忙脚乱。总之,大数据不是大忽悠,在大数据成为大财神之前,需要大投入,期望与各位同仁共同努力,脚踏实地,共同迎接数据时代的繁荣,谢谢大家!


本文转载自其他网站,不代表健康界观点。

0人收藏

评论

点评
评论
24小时更新医疗健康领域的要闻,打造最及时、最鲜活的资讯平台。
取消 回复

©2012  北京华媒康讯信息技术有限公司  All Rights Reserved.  注册地址:北京  联系电话:82736610

京ICP证150092号 京卫网审[2014]第1812号互联网药品信息服务许可证(京)-非经营性-2014-0051 京公网安备11010802011554号

您的申请提交成功

确定 取消