近日,来自德克萨斯大学阿灵顿分校(University of Texas at Arlington,UTA)的一个研究团队,提出了一种名为 PCGAN 的方法。相关研究论文以“A Progressive Conditional Generative Adversarial Network for Generating Dense and Colored 3D Point Clouds”为题,发表在预印本网站 arXiv 上。
研究人员表示,这是第一个以无监督方式生成 3D 点云(3D point cloud)的条件生成对抗网络(GAN),该网络能够产生具有多分辨率和精细细节的 3D 彩色点云,以生成利于辨别的物体图像,这将极有利于机器人视觉灵敏度的提升。话不多说,先上图。 图 | real 列为真实物体的 3D 点云图像,后列为 PCGAN 产生的的结果(来源:该论文) 图像不逼真怎么办 想象一下,家里的扫地机器人是如何工作的?一般来说,这类需要与环境交互的机器人首先需要在已构建的环境中完成导航任务,这就要求机器人必须能够感知环境情况并实时做出决策,决定当前如何与其周围环境进行交互。
而要想让机器人具有这种自我决策能力,科学家们则需要使用机器学习和深度学习等方法来训练 Ta 们:通过将收集到的大量图像数据集用作训练数据,来训练机器人应对各种不同物体或环境时应该做出的正确反应。
作为生成模型的一种,GAN 的主要结构包括两个神经网络:生成器(Generator)和判别器(Discriminator)。生成器不断生成假图像,判别器则判断这些图像的真假。两个神经网络就这样相互竞争,最终形成非常强的制造样本的能力。一旦经过培训,这样的网络将能够创建无数可能的室内或室外环境,其中放置着多种多样的桌椅或车辆等物体。这些物件之间的差别将变得很微小,但对于人和机器人来说,其图像仍带有可识别的尺寸和特征。 PCGAN:更清晰的 3D 点云图像 整个研究小组由 UTA 的计算机科学与工程学系助理教授 William Beksi和他的六名博士学生组成。参与这项研究的博士生 Mohammad Samiul Arshad 表示:“手动设计这些对象将耗费大量资源和人力,而如果进行适当的培训,生成网络就可以在几秒钟之内完成同样的任务。”
此次研究中的图像数据则通过 3D 点云呈现,这是一种透过 3D 扫描器所取得的物体图像形式,它以点的形式记录对象,每一个点包含有三维座标,强度信息(可以反映目标物体的材质、粗糙度、入射角方向等信息),还可能含有色彩信息(RGB)。