AI医疗在眼部疾病领域的重大突破盘点:科技让「视界」更清晰!
眼睛是心灵的窗户,但容易被忽视的眼部疾病却可能让这扇窗蒙上阴影。根据2024年12月20日发布的《五百万体检人群健康蓝皮书》显示,在超500万人次的人工智能视网膜健康评估结果中,整体异常检出率为77.4%。【1】如何快速,精确地检查出眼部的疾病?对此,AI给出了回答。从糖尿病视网膜病变检测到多模态眼科AI大模型,AI正在重新定义眼疾病筛查的未来。今天,我们盘点两项国内AI关于眼部疾病的研究,带你看懂科技如何守护光明!
一、DeepDR-LLM:糖尿病视网膜病变的「AI管家」清华大学、上海交通大学与新加坡国立大学等多方科研团队携手合作,成功构建了全球首个面向糖尿病诊疗的视觉-大语言模型集成系统--DeepDR-LLM。相关研究成果团队以《Integrated image-based deep learning and language models for primary diabetes care》为题发表与Nature Medicine。
DeepDR-LLM是全球首个将视觉人工智能(AI)与大语言模型(LLM)结合的糖尿病视网膜病变(DR)辅助诊疗系统。该系统的技术框架可以分为两个主要模块:
1.视觉AI模块(DeepDR-Transformer)
视觉AI部分主要通过分析眼底图像,识别糖尿病视网膜病变的早期症状。眼底图像中,系统能够精准地分割并检测出微血管瘤、出血点、棉絮斑等典型的视网膜病变特征。DeepDR-Transformer模块采用了先进的Transformer架构,并在超过50万张眼底图像的训练数据基础上进行深度学习,使得系统在眼底影像质量评估、病变分割和DR分级诊断方面达到高精度。研究表明,该系统的诊断准确度和效率已经可以媲美专业眼科医生。
2.大语言模型(LLM)模块 语言模型部分整合了患者的病史、用药记录及实验室测试等多维度数据,生成个性化的治疗建议。为了提高系统的准确性,研究人员采用了创新的适配器(Adaptor)和低秩自适应(LoRA)协同优化技术,使得LLM模型能够在低计算资源环境下高效运行,同时能够结合糖尿病领域的专业知识生成更为精准的管理建议。
该系统通过结合来自不同地区(如中国、印度、新加坡等)的超过50万张眼底图像进行训练,广泛验证了其在全球多种族、多地区应用场景下的有效性。在DR分级的准确性和效率方面,DeepDR-LLM的表现甚至超越了传统的医生诊断,且在时间效率上也表现出了明显的提升。系统帮助医生完成分级时,评估所需的中位时间减少了近30%,这意味着系统不仅提高了诊断准确性,还提高了工作效率。
二、「伏羲慧眼」:全球首个多模态眼科AI大型由北京同仁眼科中心王宁利教授团队与成都中医药大学银海眼科医院段俊国教授团队合作开发的国内首个多模态、多任务眼科人工智能大模型--"伏羲慧眼"模型,成功解决了眼科AI诊断中的多个难题。该模型的核心技术在《NEJM AI》杂志上发表的论文《Development and Validation of a Multimodal Multitask Vision Foundation Model for Generalist Ophthalmic Artificial Intelligence》中进行了详细介绍。【3】
"伏羲慧眼"模型采用大量的全球眼科影像数据进行训练。这些数据来自全球18个国家,涵盖了超过340万张眼科影像,包括眼底照片、光学相干断层扫描(OCT)、眼科B超等多种影像模态。通过这些多元化的数据输入,模型不仅能够高效进行眼部疾病的筛查与诊断,还具备了病理分割与疾病进展预测的能力。特别是通过整合联邦学习技术,研究团队成功突破了数据隐私和分散性问题,使得不同医院和机构的眼科数据可以共享训练,而不会涉及患者隐私的泄露。
这项技术的核心优势在于其多模态和多任务处理能力。模型不仅能够识别眼科常见病(如糖尿病视网膜病变、青光眼等)的早期症状,还能够精准标记出病变区域,如黄斑病变的具体位置。此外,通过对眼底影像的分析,该模型可以进一步预测全身性疾病的风险,例如高血压、糖尿病等,这对于早期健康干预和疾病预防具有重大意义。
技术上,模型通过深度学习算法,结合了大量眼科专家的标注数据,自动识别眼底影像中的病变区域,并进行精准的病理分割。例如在糖尿病视网膜病变的筛查中,模型表现出超过95%的准确率,能够在短短5分钟内分析一张眼底照片并生成详细的视网膜病变风险报告,同时推荐个性化的随访与治疗方案。此举极大地提高了基层医疗机构在眼科疾病早筛中的能力,减轻了医生的工作负担。
随着模型的不断优化与应用推广,"伏羲慧眼"有望在未来成为全球范围内眼科智能化诊疗的重要工具,推动眼科医疗的智能化进程。
写在最后
一张眼底照片就可检测身上的疾病,这些突破性的眼科AI研究让我们看到:技术不仅是工具,更是照亮生命的光。未来,随着伦理规范的完善,这些技术将更快走入寻常百姓家。保护眼睛,或许从此只需一次智能扫描!
参考资料
【1】https://www.guancha.cn/GongSi/2024_12_20_759567.shtml
【2】Li, J., Guan, Z., Wang, J. et al. Integrated image-based deep learning and language models for primary diabetes care. Nat Med 30, 2886-2896 (2024). https://doi.org/10.1038/s41591-024-03139-8
【3】Qiu, J., Wu, J., Wei, H., Shi, P., Zhang, M., Sun, Y., Li, L., Liu, H., Liu, H., Hou, S., Zhao, Y., Shi, X., Xian, J., Qu, X., Zhu, S., Pan, L., Chen, X., Zhang, X., Jiang, S., Wang, K., Yang, C., Chen, M., Fan, S., Hu, J., Lv, A., Miao, H., Guo, L., Zhang, S., Pei, C., Fan, X., Lei, J., Wei, T., Duan, J., Liu, C., Xia, X., Xiong, S., Li, J., Lam, K., Lo, B.P., Tham, Y., Wong, T.Y., Wang, N., & Yuan, W. (2024). Development and Validation of a Multimodal Multitask Vision Foundation Model for Generalist Ophthalmic Artificial Intelligence. NEJM AI.
不感兴趣
看过了
取消
不感兴趣
看过了
取消
精彩评论
相关阅读