医保相关的数据包括结算、费用明细、病案首页、病历等种类繁多、结构各异的数据,这些数据需要通过基于大数据技术的清洗、标注、归一、整合等工作后,才能规模化的应用于用户行为的探测、验证、预测等工作,对医保欺诈、不合理医疗行为、医保基金支付趋势预测、医保政策执行情况监控等工作起到关键性作用。
大数据风控结合人工智能技术,通过无监督学习和监督学习的结合形成打击欺诈骗保风控模型体系。无监督学习帮助我们发现规则类引擎无法发现的异常数据,揭示新的欺诈场景;而后,在欺诈场景下持续积累阳性数据,并使用监督学习训练模型。使用这种方式,可以建立的多维度、全场景、动态发现与风险评级等有监督与无监督模型体系,克服了传统智能审核的假阳性过多,人工审核工作量巨大、风险高低难以区分等技术瓶颈。但机器学习的输出要满足稽核的要求,需要一段路要走。
大数据人工智能风控依据费用一致性、强关联因子、动因解析、多维交互等内核方法论;采用对比分析法、分组分析法、交叉分析法、结构分析法、关联分析法、回归分析法、聚类分析法、时间序列分析法等识别风险因素,能快速实现本地化的风险导向,对于应对欺诈类违规场景有较理想的效果和优势,典型的场景包括虚假病历,诱导就医,过度诊疗等。
传统的预先设定规则智能审核系统,在结构化的知识库和数据标准化方面下了很大的功夫,同时在提取相关知识点上也有了大量的积累,比如说:重复用药、限年龄、性别用药、限就医方式、限医院级别等针对医保目录和说明书及相关诊疗规范的规则配置等等。而大数据典型模型有诱导就医模型、违规收费模型、虚假病历模型、过度诊疗模型、冒名顶替模型、项目串换模型、违规用药等,在知识点的收集上相对较少,维度多元化,输出角度略有不同。人工智能下的智能模型主要有:主要有关联模型、监督学习模型、无监督模型、费用一致性模型、合理内核模型、DRGS子空间模型等。输入符合特定场景的相关指标,通过机器学习、神经网络等技术手段,输出高风险项目(包括明细、就诊、医院、价格等)。
其核心方法论主要有:
1、因素分析法
2、矛盾分析法
3、合理内核
4、强关联
5、动因分析法
6、数据主线
7、多维交互
8、费用一致性
以关联模型为例;下图是项目这间的关联度值输出。因涉及相关业务核心,具体方法论的应用,请读者自行脑补。
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!