二、观点评论解读 1. 马尔奖得主 Alan Yuille | AI 视觉的未来:像人一样看世界 人类的视觉系统经过百万年的进化已具有非常强大的功能,甚至是一种未受到充分赏识的超能力。人类之所以在视觉上表现如此优异,一方面归功于人类的进化史,另一方面是因为我们的大脑投入了很大一部分来实现视觉。目前 AI 领域已取得了一些令人振奋的重大进展,一些国家和地区已开启了长达 20 年的 AI 研究计划来实现和提升 AI 技术。 乍一看,AI 视觉似乎的确具有超越人类的识别能力。但事实上并非如此,比如,深度网络在预期外的非常规场景就很容易犯错误。这些错误是由于深度神经网络无法有效的处理对抗攻击造成的。AI 视觉的另一个大问题是如何解决跨域识别(Transfer Across Domains)问题。相较而言,如果更换了图片的场景,或者增加对抗样本,深度神经网络会在这类情况下犯一些非常低级的错误。 首先,人类视觉是优于 AI 视觉的。AI 视觉在比赛中开起来更优秀的表现,是由计算机视觉和机器学习领域当前普遍使用的研究范式造成的。事实上,没有哪个 AI 视觉算法能超越人类视觉的表现。就 “理想观察者” 的模型而言,它似乎能在任何视觉任务上都胜过人类,但这是因为这些模型知道数据的统计特性,而人类并没有这些先验知识。深度网络还不具备思维,而是擅长利用数据集中存在的偏向。 鉴于以上的分析,未来我们应该挑战 AI 视觉算法去实现人类视觉在开放复杂环境下的认知表现,我们要去探索人类视觉可以做的是什么,并挑战算法发挥相应的潜力,而不是仅仅是简单地基于平衡注释数据集、采用标准化的性能指标去评估 AI 算法。 内容来源:https://mp.weixin.qq.com/s/eacAnjS8b3UPxBB2ChNCwQ 2. 计算机可直接从大脑读取偏好,“神经权利” 被提上议程 算法能直接从我们大脑获取反应而非仅仅根据人的行为进行猜测,这听起来有点像科幻小说,但一项结合计算机科学和认知神经科学的研究显示,基于大脑的协同过滤确实可以使其变为可能。哥本哈根大学和赫尔辛基大学的一个联合研究小组证明,可以根据某人的大脑反应匹配情况来预测其个人偏好。这一发现可能会被用来提供个性化的媒体内容 —— 甚至可能让我们更了解自己。 论文题为 Collaborative Filtering with Preferences Inferred from Brain Signals,已经被 WWW 2021 收录。