中国AI专利申请量世界第1;不骂人驾校“教练”上线;AI模仿已逝歌手原创4首歌曲|AI周报

2021
04/20

+
分享
评论
学术头条
A-
A+

近日,《中国人工智能发展报告 2020》正式发布。数据显示,过去十年(2011-2020)全球人工智能专利申请量 521264 件,总体上呈逐年上升趋势。报告显示,过去十年,全球人工智能专利申请集中在中国、美国、日本、韩国。其中,中国和美国处于领先地位。中国专利申请量为 389571,位居世界第一,占全球总量的 74.7%,是排名第二的美国的 8.2 倍。  


一、技术理论前沿

1. 训练 AI 来玩 CS 反恐精英!清华朱军与剑桥博士后的这项研究太燃了 | 童年回忆

近日,博士毕业于剑桥大学的 Tim pearce 与他的清华大学博士后导师朱军教授联合为《反恐精英:全球攻势》开发了一个 AI 游戏智能体 —— CSGO 。当 CSGO 以第一人称视角玩游戏时,能够按 FPS 标准在复杂环境下进行移动和精准射击。

据了解,与其他游戏 AI 不同,CSGO 没有使用 API,而是采用了一种行为克隆(Behavioural Cloning)的新型解决方案,即从在线服务器上抓取大量人类游戏视频进行对战训练。目前相关论文《基于大规模行为克隆的反恐精英死亡竞赛》(Counter-Strike Deathmatch with Large-Scale Behavioural Cloning)已提交至 arXiv 上面。论文中指出,CSGO 所使用的数据集约有 400 万帧,与 ImageNet 大小相当,这一规模比之前在 FPS 游戏中的模仿学习大了一个数量级。


内容来源:
https://mp.weixin.qq.com/s/p_7c2IakrG8sCOLq5VjSQw
https://www.youtube.com/watch?v=p01vWk7uMvM&feature=youtu.be

2. 把《我的世界》马赛克变成逼真大片!这项 AI 研究令人想入非非

来自 NVIDIA 和康奈尔大学的新研究 GANcraft,可以把《我的世界》中的像素块场景世界转换成真实世界的逼真图案。在近期的 GTC 2021 主题演讲中,研究人员为大家进行了相关演示。


GANcraft 是一个无监督 3D 神经渲染框架,该方法通过使用 GAN 预训练网络生成 “伪 ground truths”,可以在没有成对的《我的世界》真实数据的情况下学习如何执行此转换。

图|完整的 GANcraft 架构

两级结构在减少计算量和内存占用的同时显著提高了图像质量,因为辐射场可以用更简单的 MLP 建模,这是基于隐式体积方法的计算瓶颈。

内容来源:
https://mp.weixin.qq.com/s/4prx7XvDr0mdGCdbekIYTQ
https://www.youtube.com/watch?v=1Hky092CGFQ
https://twitter.com/arunmallya/status/1382860338584952840https://www.reddit.com/r/MachineLearning/comments/mru35h/r_gancraft_unsupervised_3d_neural_rendering_of

3. AI 重聚知名已故歌手,发布四首原创歌曲

为了提醒大家关注音乐人的心理健康,总部位于加拿大的非营利组织 Over the Bridge,发起了一项新的项目:基于 AI 模仿这些英年早逝的音乐人,以他们的创作、演唱风格,重新创作歌曲。

经过一年的算法优化,和半年的录音、制作,Over The Bridge 发布了四首单曲,并收录在专辑《 Lost Tapes of the 27 Club》中出版。这张专辑目前已经正式发布至 YouTube、Spotify ,并被全球多家知名音乐媒体报道和传播。

Over the Bridge 董事会成员 Sean O'Connor 介绍说,该项目主要基于 Google 的 AI 作曲工具 Magenta。

他们从每位音乐人的 20 到 30 首歌曲中,提取了 MIDI 文件(MIDI 是编曲界最广泛的音乐标准格式,它用音符的数字控制信号来记录音乐,可以说是计算机能理解的乐谱),并将它们分解为钩子(hook),独奏(solo),人声旋律或节奏吉他,然后分别交给 AI 进行训练。

训练模型主要基于 RNN(循环神经网络)进行。掌握这些歌曲的曲风之后,AI 会生成时长大约 5 分钟的 riff (即兴重复段)。


内容来源:
https://mp.weixin.qq.com/s/eLvCGMD-yhFE2WBPdNNzgQ

4. 测量误差 1mm 以内、5 分钟拿到手术方案,AI 如何为主动脉疾病患者多争取一分钟?

基于临床经验和观察,柴象飞博士带领汇医慧影科学家团队与中国人民解放军总医院血管外科进行多项数据实验,研究成果在欧洲放射学杂志 ELSEVIER 发表。

基于学术研究,汇医慧影 AORTIST 主动脉人工智能精准诊疗系统于 2016 年研发落地,以人工智能技术赋能肾下腹主动脉瘤 + B 型主动脉夹层诊疗全流程链条。这是全球首个深入临床、覆盖跨学科多病种疾病诊治全流程的医学影像 AI 产品,实现数据分析介入以患者为核心的精准医疗。

为了最大程度降低误差,柴象飞博士团队对数据进行双盲的标注和专家的验证,将测量误差控制在 1mm 以内,较常规手动测量精准度提升约 70%,自动分割结果准确率达 95%,与专家测量相比高达 98%。

另外,将深度学习技术应用到主动脉三维重建、分割、中心线提取等环节,30 秒内能完成主动脉和髂动脉整体、瘤腔、血栓及钙化及内脏动脉的自动分割测量,并在 5 分钟内生成手术方案文档。

内容来源:
https://mp.weixin.qq.com/s/S7FE4ZESIl8fQu0T_3U1SA

5. 考驾照选择 AI 教练,心态稳定不会骂人

近日,上海某驾校采用 AI 教练授课的视频登上微博热搜。据介绍,截至目前已有超过 2100 名学员,在该校 AI 教练的协助下,成功毕业。

在硬件方面,给教练车配置 GPS 定位仪和雷达。两个高精度 GPS 定位仪,可以实时监测教练车的位置。车头处安装的多个雷达,则用于检测障碍物。在软件方面,AI 教练还会为每位学员建立个人档案,评测学员训练能力,依据学员学习情况调整练习内容。此外该车还设置了主动刹车功能,以便在突发状况下保证学员独自练习时的安全。然而驾校在不断尝试新技术、新突破的背后,也透露出一种不得已而为之的焦虑。

内容来源:
https://mp.weixin.qq.com/s/MySO4ObDipdauvL08gc2Ew

6. 史上最酷变形金刚 “中国制造”!能自动变形、语音控制,还能编程

在 PULSE FAN FEST 2021 上,和中国机器人公司乐森(Robosen)联合推出的革命性变形金刚系列产品之一,能自动变身的现实版擎天柱。擎天柱在机器人形态和汽车形态之间变身的时间大约 10 秒,整个动作非常连贯流畅,简直就是完美还原《变形金刚》动画中的擎天柱。孩之宝在公布擎天柱时,表示这是世界上第一个自动转换,交互式,可编程,语音激活,移动控制的擎天柱机器人。


为了达成自动变形的目标,Robosen 为这款擎天柱机器人装备了 27 台伺服电机、60 个微芯片、以及总共 5000 多个组件,直立后的高度可达 19 英寸(约 48 厘米)。在语音方面,用户可发出 25 种指令,不仅限于变形,机器人的 “前进” 或 “转身” 都可以通过语音下指令,而且同时支持中英文!还可以通过编程,自定义擎天柱的动作,通过游戏学习编程!

内容来源:
https://mp.weixin.qq.com/s/wKfu3aTdsiru8p5pOsshyQ
https://hasbropulse.com/collections/hasbro-pulse-fan-fest/products/transformers-optimus-prime-auto-converting-programmable-robot-collectors-editionhttps://www.bilibili.com/video/BV1R64y1v7Fihttps://robosen.com/transformersoptimusprime

7. AI 一键去纹身,几秒钟让你看见明星“真面目”

有些时候,我们需要把一些人身上的纹身覆盖掉,以避免引人效仿。有的时候人们只是单纯地好奇,想知道一些大明星如果没有纹身会是什么样子。来自印度的机器学习研究者 Vijish Madhavan 最近开源的一个机器学习工具 SkinDeep 满足了我们的需求。


根据作者介绍,完成这个项目需要大量的图像对,因为没有合适的数据集,很多时候训练内容采用合成数据来完成,具体来说:

  • 首先将 APDrawing 数据集图像对与一些背景去掉纹身设计的图像叠加在一起,使用 Python OpenCV 实现;

  • 绘制数据集有线条艺术对,可以模拟纹身线条,这将有助于模型学习和删除这些线条;

  • APDrawing 数据集只有头像,对于全身图像,项目作者采用了以前的项目 ArtLine,并将输出与输入图像叠加在一起;

  • ImageDraw.Draw 与森林绿色(forest green colour)色码一起使用,并随机放置在身体图像上,类似于 fast.ai 中的 Crappify ;

  • Photoshop 也被用来在需要弯曲和角度改变的对象上放置纹身。


内容来源:
https://mp.weixin.qq.com/s/eM-FjqyHmjo8oPafLsCVvQ

二、观点评论解读

1. 华为田奇:人工智能两大趋势,大模型,AI+X

随着 AI 在各行各业的应用逐渐深化,应用碎片化的问题逐渐凸显。与此同时,提升 AI 的可解释性也是未来发展的关键。

就在前几天,2021 华为全球分析师大会发布的“迈向智能世界 2030 的九大技术挑战与研究方向”中提出:

AI 模型的通用性是解决应用碎片性的关键。通过大量无标注的数据和更大的模型,从全监督到自监督,构建通用的 AI 系统,这是当前需要突破的方向。其次,把 AI 与科学计算交汇,这也为 AI 应用走出碎片提供了大用场。AI 为科学计算带来了新思路、新方法、新工具,而科学计算的严谨体系也有助于提升 AI 的可解释性。

华为云人工智能领域首席科学家、IEEE Fellow 田奇博士最近也在苏州举办的 2020 中国人工智能产业年会上重申了相似的观点:
1)从小模型到大模型的范式转变,这导致了模型应用向大公司集中,大模型正在改变 AI 产业的规则与格局;
2)人工智能与科学计算的深度融合,AI+X 逐渐迸发光彩。

内容来源:
https://mp.weixin.qq.com/s/uiCdd2wZofxYaXB9JB49UQ

2. AI 给老照片上色,真的准吗?技术圈和历史圈吵了 1000 帖

AI 给老照片上色,近来确实很火爆,但上的颜色真的准确吗?有人便就此做了个实验,把 20 世纪初俄国的彩色照片去色后,再与 AI 上色的结果做对比。


此帖一出,在 Reddit 上的机器学习社区和历史爱好者社区引发了大激辩。不到一天的时间盖起一千多楼,总计 3 万 5 千赞。来自机器学习版块的选手首先提出了质疑:你用的这个算法,他是 State of the Art 吗?一看就是简单地将损失函数设计成计算周围像素的均方误差 (MSE) 一类的东西,这样就会促使 AI 选择低饱和度的颜色

在照片上色爱好者聚集地,人们认为手动给老照片上色最有价值的环节其实是搜集资料。寻找照片中事物应有颜色的过程中总是能学到很酷的历史知识。也有人指出,在网上发布 AI 上色的照片,人们的焦点都放在对技术进步的庆祝了。老照片背后的人文价值却被忽略。

内容来源:
https://mp.weixin.qq.com/s/IsIY55QI1Bo7E-uF5xZgag
https://www.reddit.com/r/MachineLearning/comments/mqqnxj/d_r_aiml_colorisation_versus_actual_color_photos/
https://www.reddit.com/r/Colorization/comments/mqn103/the_problem_with_ai_colorization/

三、产业动态聚焦

1. 微软重资押注医疗 AI , 或将 160 亿美元收购 Nuance

近日,微软正在进行关于收购全球最大语音识别技术公司 Nuance Communications 的谈判。微软的出价是每股 56 美元,这比 Nuance 上周五的收盘价溢价 23%,使其的股权价值达到近 160 亿美元。因此,如果最终交易成功,这将是微软史上第二大收购案(仅次于 2016 年 270 亿美元对 LinkedIn 的收购)。

这一行为背后,微软可能正在向医疗 AI 押下重注。此次收购对于微软来说,最直接的益处是提升其在语音软件领域的实力。Nuance 的知名之处是其 AI 语音识别技术,被网友成为 “美国的科大讯飞”,比如 Nuance 是苹果 Siri 语音识别技术的合作伙伴。并且, Nuance 研发的语音识别、记录工具在医生问诊、客服电话和语音邮件中都有应用。

虽然目前微软已经向开发者提供了诸如语言转录等相似功能,但通过此次收购,微软依然可以将 Nuance 的相关技术和其他 AI 工具整合到自身产品中,从而提升语音软件实力。从更长远的角度看,微软的目的是向医疗 AI 领域增加投入。Nuance 近年围绕医院和医生的云系统进行了业务重建,而微软也在拓展医疗行业的业务,尽力提升与医疗相关的云计算软件销量。

内容来源:
https://mp.weixin.qq.com/s/SRpOEm62Uw2gNl-thLe5rw

2. 报告|中国人工智能专利申请量世界第 1,是美国的 8.2 倍

2020 中国人工智能产业年会日前在苏州举行,会上《中国人工智能发展报告 2020》正式发布。数据显示,过去十年(2011-2020)全球人工智能专利申请量 521264 件,总体上呈逐年上升趋势。报告显示,过去十年,全球人工智能专利申请集中在中国、美国、日本、韩国。其中,中国和美国处于领先地位。中国专利申请量为 389571,位居世界第一,占全球总量的 74.7%,是排名第二的美国的 8.2 倍。

从专利申请的地域分布来看,广东省的 AI 专利申请量以 72737 位居第一,比排名第二的北京市(50906)多出 42.8%,具有突出优势。前十名的省份主要分布在东部、中部、西部等地区,分布较为均衡,但是以东部省市居多,江浙沪三省市均位居前五名。这与这些地区的经济水平、发展程度、科研投入及知识产权保护等因素密切相关。

此外报告显示,过去十年,全球人工智能专利申请之中,将近一半的申请人是来自于企业。高校和研究所的相关申请量共计约两成。从人工智能领域的人才角度来看,国内 AI 领域高层次人才也主要分布在京津冀、长三角和珠三角地区,其中,京津冀地区(主要是北京市)在 AI 领域的高层次人才数量最多。长三角地区也有较多的 AI 高层次人才分布。相比之下,内陆地区领域高层次人才较为缺乏。

内容来源:
https://mp.weixin.qq.com/s/_Yhh1K2Xl7xaHvyS1Fz_qw

3. 英伟达推出首个 CPU,基于 ARM 架构主攻巨型 AI,性能超 x86 十倍

北京时间 4 月 13 日凌晨,英伟达在 GCT 2021 大会上宣布了 Grace、BlueField-3 DPU,还有用于自动驾驶的汽车 SoC 芯片三款处理器,均基于 Arm 架构打造。

其中最引人瞩目的当属名为 Grace 的 CPU 产品,这款产品主要为现代数据中心设计。这是英伟达首款服务器 CPU。

英伟达认为,AI 模型的数据量和规模正在成倍增长。 当今最大的 AI 模型包括数十亿个参数,并且每两个半月就会翻一番。 训练它们需要一个新的 CPU,可以与 GPU 紧密结合,以消除系统瓶颈。

NVIDIA 创始人兼首席执行官黄仁勋表示:“前沿的 AI 和数据科学正推动当今的计算机架构超越其极限,以处理规模难以想象的海量数据。NVIDIA 借助 Arm 授权的 IP 设计了 Grace,这是一款专为大规模 AI 和 HPC 设计的 CPU。与 GPU 和 DPU 一起,Grace 为我们提供了计算的第三种基础技术,以及为了推进 AI 发展重构数据中心的能力。NVIDIA 现在是一家拥有三种芯片的公司。”

内容来源:
https://mp.weixin.qq.com/s/j29sAdm4bDIXtr2_v8HG5g
https://www.cnbeta.com/articles/tech/1113887.htm
https://www.cnbeta.com/articles/tech/1113901.htm
https://www.cnbeta.com/articles/tech/1113891.htm
本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
人工智能,AI,数据,模型,微软,语音

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!