AI 周报:高通研发出首个神经视频解码器;诺奖经济学家经典决策模型被 AI 挑战

2021
07/16

+
分享
评论
学术头条
A-
A+

深度神经网络已经对自然科学产生了很大的影响,但在行为科学上的作用却不如前者那么大,而 Joshua Peterson 所在的团队发表于 Science 的研究,便论证了机器学习为行为科学领域带来新的可能性。


一、技术理论前沿

1. 手机上用 AI 实时、流畅解码视频,超精细画质提升:高通研发出首个神经视频解码器

与此同时,随着 AI 领域深度神经网络的发展,越来越多的企业探索如何使神经网络赋能自身产品。高通骁龙 SoC 中的 AI 引擎就充分融入了神经网络能力,其中的硬件组件 Hexagon 向量处理器支持 8 位定点加速神经网络运行,软件组件骁龙神经处理(SNP)SDK 支持 CNN、LSTM 与自定义层。

旗舰 SoC 骁龙 888 集成的第六代高通 AI 引擎更是实现了 26 TOPS 的 AI 算力,神经网络处理 SDK 带来一系列改进,增加了对 RNN 模型的支持,助力手机端侧 AI 性能提升至了全新水平。

最近,高通就在这方面做了更多的尝试,利用骁龙 888 内置的 AI 引擎和 CPU 进行视频解码。结果发现:基于神经网络的神经视频解码效果还不错。高通 AI 研究院的新工作,实现了业界首款在商用智能手机端实时运行、基于软硬件结合的神经视频解码器,在接近 720p HD 分辨率的视频上实现了 30 fps 以上的实时解码。


内容来源
https://mp.weixin.qq.com/s/qmIhIxTRe6LtWt7aJONtTg
https://segmentfault.com/a/1190000038930366
https://cnx-software.cn/2021/06/28/neural-video-decoder-leverages/

2.50 年最重要,8 大统计学发展!哥大教授论文列举推动 AI 革命的统计学思想

尽管深度学习和人工智能已经成为家喻户晓的名词,但推动这场革命的统计学突破却鲜为人知。

在最近的一篇论文中,哥伦比亚大学的统计学教授 Andrew Gelman 和芬兰阿尔托大学的计算机科学教授 Aki Vehtari 详细列举了过去 50 年中最重要的统计学思想。


作者将这些统计学思想归类为 8 大类别:
反事实因果推断(counterfactual causal inference)
自举法和基于模拟的推断(bootstrapping and simulation-based inference)
超参数化模型和正则化(overparameterized models and regularization)
贝叶斯多级模型(Bayesian multilevel models)
通用计算算法(generic computation algorithms)
自适应决策分析(adaptive decision analysis)
鲁棒性推断(robust inference)
探索性数据分析(exploratory data analysis)

内容来源:
https://mp.weixin.qq.com/s/EY5eUIrXmi18D1bDis6W9A
https://www.tandfonline.com/doi/full/10.1080/01621459.2021.1938081

3.Science 论文:诺奖经济学家的经典决策模型,被 AI 挑战

深度神经网络已经对自然科学产生了很大的影响,但在行为科学上的作用却不如前者那么大,而 Joshua Peterson 所在的团队发表于 Science 的研究,便论证了机器学习为行为科学领域带来新的可能性。论文题为 Machine-generated theories of human decision-making。

首先,他们通过亚马逊的 Mechanical Turk 众包服务,开发了一个大型的风险决策数据集,收集了人类对近 10000 个 风险选择问题的决定(例如文章开头的 “20% 的机会获得 100 美元,80% 的机会获得 50 美元” 这样的问题),用于测试和开发围绕人类风险决策的新理论。据了解,这也是迄今为止最大规模的风险选择实验产物。

由于依赖大量初始假设,先前在制定决策理论方面的努力通常涉及使用非常小的数据集,每次只关注少数几个选择问题。他们利用这个数据集来训练了一个深度神经网络,用以来预测人类行为,并系统地比较了这大模型与此前的小模型(如前景理论)对风险决策行为的预测能力。

结果发现,由这个数据集驱动的深度神经网络可以模仿人类的决定,其准确度令人惊讶,已大大超过了现有的、由人类产生的风险选择模型,深度神经网络的预测能力比前景理论高出几个能级(当模型在特定场景下预测出的选择,和人类的预测重合 50% 以上,则该模型能够预测该场景 )。在他们的实验中,这个神经网络胜过了所提出的 50 多种风险决策理论,这表明目前的理论仍存在着差距。


内容来源:
https://mp.weixin.qq.com/s/3iucVwGOZXr7UHCseEPR5w

4.Nature Comm:从 AI、加密货币到火星任务,一种更强大、更稳定的存储设备

美国西北大学和意大利墨西拿大学(University of Messina)的一个联合研究小组开发了一种新型磁存储设备,可引领更快、更强大的人工智能 (AI) 系统。这种由反铁磁性材料组成的存储技术,可不受外部磁场的干扰,进而对包括人工智能硬件、加密货币挖掘和太空探索程序在内各种计算系统性能进行优化。

近日,一篇题为 “通过差分电压测量对非共线反铁磁 IrMn3 中的电流感应开关的观察”( Observation of Current-induced Switching in Non-collinear Antiferromagnetic IrMn3 by Differential Voltage Measurements)的研究,在 Nature Communications 杂志上发表。

从 Siri 这样的数字语音识别平台到医疗保健领域的医学图像处理,再到 Netflix 这样的交互式内容平台,AI 应用程序所使用的数据变得越来越大,这也致使现有的内存硬件技术效率低下且不可持续。基于磁性材料的存储器天生速度快且耐用性高(在重复写入周期中不容易磨损),是应对这一挑战的最佳解决方案。

现有的 MRAM 是建立在铁和钴等铁磁(ferromagnetic,FM)材料上的,这并不能满足高性能 AI 应用程序的需求。研究人员将目光投向了反铁磁体(AFM)。这是一类具有比 FM 材料更快动力学特性的材料,且没有宏观磁极,这就使得 AFM 材料能够避免不必要的磁相互作用。

有了这一特性,再加上其尺寸可以缩得很小,意味着基于 AFM 的存储器能够不被外部磁场擦除,安全优势明显。“反铁磁材料可以应对 MRAM 的铁磁性挑战,”Khalili 说,“反铁磁体显示出了可扩展性、高写入速度及不受外部磁场干扰的潜力,这些都是制造更快速设备,以支持计算、网络和数据存储行业的快速增长的必要条件。”

内容来源:
https://mp.weixin.qq.com/s/-Ks8V4bkW5M8cj6kPsnXrg
https://www.nature.com/articles/s41467-021-24237-/
https://techxplore.com/news/2021-06-antiferromagnetic-based-memory-device-bolster-applications.html

二、观点评论解读

1. 人脸识别走光引热议!原来后台能看到的不只有脸,网友已社死,审核辣哭眼

最近有人在微博上发文称:人们用人脸识别功能时,摄像头拍到的区域会被全部上传,还可能被后台工作人员看到。

对于人脸识别这一任务,人工审核员和计算机到底是怎么分工的?其实,这取决于不同行业和公司的业务逻辑和流程。像是很多应用都有的刷脸登录。在第一次识别登录之后,云端数据库中会保留一个你的人脸模型。之后你的每一次登录都会重新抓取你的五官特征值和已有的人脸模型进行匹配。

而算法也会根据新得到的特征值不断优化已有的人脸模型,以保证每一次匹配的都是最新的你。除非你的面部改变超出了算法的识别能力,或者已有的算法还存在一些不足。否则,整个人脸识别的过程都还是由计算机来完成的。而对于社交平台这种图片数量极大的审核,也会由计算机来担任大部分的识别工作。如果计算机发生误判或无法确认图片分类,再交由人工审核复审。并且,不是所有的人工审核都能看到整个前摄范围内的图像 。


虽然这次爆料可能只是一个小小的个例,但是它无意暴露了人脸识别行业依然存在很多不正规、不合理 的现象。 对于人脸数据的安全,不仅需要用户加强自我保护意识,更多是行业要做到主动去保护用户的隐私。

内容来源:
https://mp.weixin.qq.com/s/jSJGhGKEv7Yv6YY6lB5AgQ
https://weibo.com/2504747281/KmT9Fiqz4?type=comment#_rnd1625536587256
https://baijiahao.baidu.com/s?id=1694437108216697215&wfr=spider&for=pc


三、产业动态聚焦

1. 不靠激光雷达,坚定的纯视觉自动驾驶倡导者,特斯拉首席 AI 科学家是如何解释这一选择的?

近日,计算机视觉与模式识别大会(CVPR)以线上方式召开了 2021 年自动驾驶(WAD)研讨会,特斯拉公司 AI 高级总监 Andrej Karpathy 在会上发表了有关纯视觉自动驾驶的主题演讲。

相比于人类驾驶员,Karpathy 认为计算机系统的延迟更低,具有 360 度态势感知能力,始终全神贯注、不会低头看手机,而且可以从容应对路上的各种难题。Karpathy 还展示了特斯拉自动驾驶功能的重大作用。在演讲中,他展示了一段自动紧急制动的视频 —— 画面中行人突然冲出,正在穿越十字路口的司机反应不及,好在汽车检测到了行人并猛踩刹车、顺利避免了悲剧的发生。

为了节省成本,特斯拉坚决拒绝使用激光雷达进行精准测距。对此,Karpathy 在演讲中解释道,各家厂商必须使用激光雷达传感器预先绘制环境地图并据此创建高清地图。此外,厂商还得添加每一条车道、每个交通灯,这样在测试期间车辆就可以完全按照地图到处行驶。

“我们采取的方案则主要基于视觉元素,车辆可以依靠环绕车身的 8 个摄像头即时捕捉并理解周边发生的一切。这样当我们第一次来到某个十字路口,就需要弄清楚车道在哪里、每条车道间如何连接、交通灯在哪里、什么灯控制什么车道等,一切都由车辆亲自观察和处理,不需要高清地图作为支持。”Karpathy 还解释道,这无疑是一种更具可扩展性的方法。

此外 Karpathy 还 表示,特斯拉过去几年构建的视觉系统已经非常出色,因此不再需要其他各类传感器。摄像头已经能够满足视觉感知方面的大部分需求,因此特斯拉能够更有信心地逐渐去掉那些已无必要的旧有传感器装置。

内容来源:
https://mp.weixin.qq.com/s/UFpxdCMDkK4DFPuYe1phYg

2.AI 第一股冲击失败!依图科技科创板 IPO “弃考”

7 月 2 日,上海证券交易所发布消息,因 6 月 30 日,依图科技和保荐人国泰君安分别提交撤回公司首次公开发行存托凭证并在科创板上市申请文件的申请,上交所决定终止对依图科技首次公开发行存托凭证并在科创板上市的审核。这意味着,在经历了近 8 个月的筹备后,依图科技主动 “弃考”,科创板 IPO 告败。

招股书显示,依图科技是一家世界领先的人工智能公司,以人工智能芯片技术和算法技术为核心,研发及销售包含人工智能算力硬件和软件在内的人工智能解决方案。报告期内公司的营业收入分别为 6,871.89 万元、30,430.64 万元、71,678.62 万元及 38,063.49 万元。值得一提的是,在招股书披露的风险因素一章内,依图科技披露了公司的技术、经营、财务等方面可能存在的风险。

在技术方面,依图科技在招股书内描述了公司当前面临的困境和不确定性:“人工智能技术水平目前正处于快速发展阶段,行业内企业不断投入大量资金用于技术研发,已有技术不断成熟、改进,新的技术方案不断涌现。另外,芯片设计也需要持续投入大量的资金和人员到现有产品的升级更新和新产品的开发工作中,以适应不断变化的市场需求,且由于人工智能芯片属于前沿科技领域,研发项目的进程及结果的不确定性较高。”

内容来源:
https://mp.weixin.qq.com/s/3nnkJWVDieP5i3FsVd8U5g
http://www.chuangze.cn/attached/file/20201109/20201109085574187418.pdf

3. 打造标杆,中科院人工智能战队发布新一代智算平台

国内人工智能在部分行业应用已非常成熟,而在其它许多行业还处于碎片化状态,但发展迅猛。无论从模型层面,还是从应用层面,国内对智能算力的需求都是非常庞大的。而开发 “新一代人工智能计算平台” 的动机,正是源于对中国人工智能应用现状的深刻认识。

7 月 8 日 - 10 日,2021 世界人工智能大会在上海召开,大会期间,中国科学院人工智能产学研创新联盟发布新一代人工智能计算平台。中国科学院人工智能产学研创新联盟由中国科学院自动化所、计算所等 AI 相关研究机构,以及 26 家企业在 2018 年发起成立,目前已有 34 家成员单位。

中科院科技战略咨询研究院院长潘教峰表示,“智能化数字基础设施建设已成为新基建的主导方向,事关国家发展全局和长远利益,需以开放、安全、绿色、普惠为前瞻战略谋划,才能重塑数字产业化及产业数字化发展格局”。平台依托中科院顶层战略规划,汇聚算力、算法、数据、软件、人才、应用等资源要素,将为 AI 产业化发展、行业数智化转型和政府智慧化治理提供有力支撑。


据现场介绍,平台拥有四大优势,即:开放包容、通用融合、绿色高效、普惠可及。

其一:采用开放架构,可以兼容主流软件应用生态,具备使用面广、迁移灵活、编译开发难度低等特点;
其二:支持多元芯片组合,提供多样丰富算力,可胜任模拟、训练、推理等 AI 全链条应用需求;
其三:底层算力基础设施采用相变浸没式液冷技术,单位算力效率大幅提升且能耗成本降低 30%;
其四:通过透明化价格模型,为市场提供参考依据和建设标准,有效避免公共财政资源浪费。
其中,通用融合、开放包容、绿色高效是当前行业对智能计算中心的普遍要求,当然这也是平台在行业的基本优势,使其能成为顺应时代的新基建。而普惠可及则更加体现了平台的独特之处,为行业设立了新标准。

内容来源:
https://mp.weixin.qq.com/s/4mFTO9qXqcaNk_INA-C4_w

不感兴趣

看过了

取消

本文由“健康号”用户上传、授权发布,以上内容(含文字、图片、视频)不代表健康界立场。“健康号”系信息发布平台,仅提供信息存储服务,如有转载、侵权等任何问题,请联系健康界(jkh@hmkx.cn)处理。
关键词:
人工智能,计算机,AI,模型

人点赞

收藏

人收藏

打赏

打赏

不感兴趣

看过了

取消

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

  • 医生交流群 加入
  • 医院运营群 加入
  • 医技交流群 加入
  • 护士交流群 加入
  • 大健康行业交流群 加入

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!