【AI应用】同温层 AI 与越层建模:人工智能研究中错配问题

2026
01/05

+
分享
评论
杨金宇
A-
A+

通过引入“是否越层”的评价框架,AI 研究可以从单纯的性能竞赛,转向对建模高度与问题定义本身的反思。

[摘要] 近年来,人工智能(AI)在医学与生命科学研究中取得了显著进展,尤其在疾病诊断、分型与预测等任务中表现出优异的性能。然而,大量研究尽管在技术指标上不断突破,却在早期预测能力、机制解释与临床转化方面持续受限。本文提出"同温层 AI"这一概念,用以描述当前 AI 研究中普遍存在的一种范式性局限:模型主要在既定问题高度、既定标签空间与既定数据分布内进行优化,而未能触及研究对象的运行层逻辑与上游驱动机制。在此基础上,本文进一步提出一个"是否越层"的 AI 研究评价框架,用于区分不同 AI 工作在建模高度上的根本差异。通过这一框架,可以系统解释为何高分类性能并未转化为实质性预测与干预能力,并为下一代"运行层 AI"研究提供明确的方法论方向。

关键词:人工智能;同温层 AI;越层建模;疾病建模;长期运行系统;方法论;医学人工智能

Keywords:Artificial intelligence; Isothermal AI; Cross-layer modeling; Disease modeling; Runtime systems; Methodological framework; Medical AI

一、引言:当 AI 变得越来越"准",却依然不够"早"

在医学影像分析、疾病分类与生物标志物挖掘等领域,AI 模型的性能指标不断刷新纪录。准确率、AUC、Dice 系数等评价指标的持续提升,构成了当前 AI 医学研究的主旋律。然而,与这一技术进步形成鲜明对比的是,许多研究在真实临床环境中的应用价值却并未同步提升:疾病往往仍在症状出现或结构性损伤已经形成后才能被"高精度识别",而真正意义上的早期预警与有效干预支持依然稀缺。这一现象通常被归因于数据规模不足、标签噪声过大或模型泛化能力有限。然而,本文认为,更深层的原因并不在于技术细节,而在于一个长期被忽视的建模高度问题:AI 究竟是在学习系统如何运行,还是仅仅在区分系统已经呈现的结果?

二、"同温层 AI":一个被普遍忽视的范式性现象

2.1 概念定义

"同温层 AI"(Isothermal AI)是指这样一类人工智能研究模式:模型始终工作在既定的高度层级内,在不改变问题定义、不重构变量层级的前提下,对静态标签或终末表型进行高精度拟合。

57881767580636656

在这种模式下:疾病被视为稳定、离散的类别;数据被视为对这些类别的直接表征;模型优化的目标是在同一标签空间内不断提高区分能力。这种研究方式并非错误,但其隐含假设是:研究对象的本质信息已经完整地体现在当前可观测特征之中。

2.2 同温层 AI 的典型表现

同温层 AI 在当前研究中呈现出高度一致的特征:

静态标签依赖:疾病状态被简化为 Normal / MCI / AD 等离散标签。

结果变量主导:输入特征多来自结构萎缩、信号强度下降或终末生物标志物。

指标内循环优化:模型改进主要体现在同一评价指标体系内的微幅提升。

  • 时间维度缺失:系统的演化过程被压缩为单一时间点的横截面问题。

在这种框架下,AI 的"进步"更多表现为同一高度上的精细化打磨,而非问题层级的提升。

三、为何同温层 AI 在复杂系统研究中注定受限

3.1 疾病并非对象,而是过程

在衰老、神经退行性疾病、肿瘤及代谢综合征等领域,疾病并非静态对象,而是长期运行系统在多重约束下逐步演化的过程。其关键转折点往往发生在可见结构改变之前,表现为能量分配、使用模式、调控信号与系统稳定性的微妙变化。当 AI 仅以"结果状态"为学习目标时,模型天然只能在系统已经"定型"之后发挥作用。这解释了为何许多模型在区分晚期状态时表现出色,却在早期阶段失去预测力。

3.2 高性能分类≠高价值预测

同温层 AI 的一个典型悖论是模型越准,越可能是在重复确认已经发生的事实。这种现象在医学领域尤为突出,用已经显著萎缩的脑区去"预测"阿尔茨海默病,用明显异常的影像特征去"识别"肿瘤,本质上是在用结果预测结果。模型性能与临床价值之间的脱节,并非偶然,而是建模层级错配的必然结果。

四、从"是否越层"出发的 AI 研究评价框架

4.1 越层的含义

"越层"并非指模型复杂度的提升,而是指AI 是否跨越了结果表型层,进入系统运行层或驱动层进行建模。可以从四个维度评估 AI 研究是否实现了越层:

4.2 AI 研究越层评价的四个维

(1)变量层级

  • 同温层:结构性结果、终末指标;越层:使用模式、能量分配、调控信号、状态转移变量

(2)时间结构

  • 同温层:单时间点、横截面;越层:连续轨迹、阶段转换、阈值触发

(3)因果方向

  • 同温层:结果 → 标签;越层:驱动条件 → 状态演化 → 结果

(4)干预可达性

  • 同温层:难以干预或只能事后确认;越层:可用于早期调整与系统重置

只有在以上维度中至少实现部分跃迁,AI 研究才具备超越分类任务的潜在价值。

五、从同温层 AI 走向"运行层 AI"

同温层模式并非否定现有 AI 研究的技术成就,而是主张将其重新定位,同温层 AI 适合做确认性工具,而非预测性或干预性工具。下一阶段的关键挑战在于构建"运行层 AI",其核心特征包括以系统状态而非疾病标签为建模对象;关注变量如何共同推动系统跨越关键阈值;将时间与使用作为核心维度,而非背景噪声;服务于"是否进入风险轨道"的判断,而非"属于哪一类"。这类研究在技术上更困难,但在科学与临床意义上更具突破性。

六、结论

同温层 AI 的广泛存在,并非技术能力不足的体现,而是研究范式与问题高度选择的结果。当人工智能被用于研究本质上是动态、演化、分层运行的系统时,仅在结果层进行优化,注定无法触及系统的关键转折点。通过引入"是否越层"的评价框架,AI 研究可以从单纯的性能竞赛,转向对建模高度与问题定义本身的反思。这一转向,或许比任何模型结构的改进,都更有可能推动人工智能在医学与复杂系统研究中的真正突破。

杨 金宇 初稿(健康界)2026年1月5日

参考资料:

1. 医学 AI 与分类范式局限

  • [1] Topol, E. J. High-performance medicine: the convergence of human and artificial intelligence. Nat Med, 25, 44-56 (2019).

  • [2] Beam, A. L., & Kohane, I. S. Big data and machine learning in health care. JAMA, 319, 1317-1318 (2018).

  • [3] Kelly, C. J. et al. Key challenges for delivering clinical impact with artificial intelligence. BMC Med, 17, 195 (2019).

2. 疾病作为动态过程而非静态类别

  • [3] Jack, C. R. et al. Hypothetical model of dynamic biomarkers of the Alzheimer's pathological cascade. Lancet Neurol, 9, 119-128 (2010).

  • [4] Rockwood, K., & Mitnitski, A. Frailty in relation to the accumulation of deficits. J Gerontol A, 62, 722-727 (2007).

  • [5] Lipsitz, L. A. Physiological complexity, aging, and the path to frailty. Sci Aging Knowledge Environ, 2004.

3. 系统、生理稳态与运行层视角

  • [6] Kitano, H. Systems biology: a brief overview. Science, 295, 1662-1664 (2002).

  • [7] Noble, D. A theory of biological relativity. Interface Focus, 2, 55-64 (2012).

  • [8] West, G. B. Scale: The Universal Laws of Growth, Innovation, Sustainability, and the Pace of Life in Organisms, Cities, Economies, and Companies. Penguin (2017).

4. 时间、因果与可干预性

  • [9] Pearl, J. Causality: Models, Reasoning, and Inference. Cambridge University Press (2009).

  • [10] Hernán, M. A., & Robins, J. M. Causal Inference: What If. Chapman & Hall (2020).

  • [11] Shmueli, G. To explain or to predict? Statistical Science, 25, 289-310 (2010).

5. AI 评价与方法论反思

  • [12] Rahimi, A., & Recht, B. Random features for large-scale kernel machines. NIPS (2007).

  • [13] Lipton, Z. C. The mythos of model interpretability. Commun ACM, 61, 36-43 (2018).

  • [14] Ghassemi, M., Oakden-Rayner, L., & Beam, A. L. The false hope of current approaches to explainable artificial intelligence in health care. Lancet Digit Health, 3, e745-e750 (2021).

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
模型,研究,结果,同温层,系统

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • “健康为民 体验提升”案例征集 加入
  • 第九季管理奖官方群 加入
  • 全院血糖管理交流群 加入
  • 医院运营管理官方群 加入
  • 手术室精益管理联盟 加入
  • 医院SPD创新管理交流群 加入

精彩视频

您的申请提交成功

确定 取消
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交