三维重构

2019-03-11 15:34

摘要：我们描述凿：实时housescale系统（300平方米以上）密集三维重建

板载通过使用动态一个谷歌探戈[1]移动设备空间散列截断签订距离场[2]映射，和本地化的视觉惯性测程。通过积极剔除不包含表面场景的部分，我们避免不必要的计算和内存浪费。即使在非常嘈杂条件下，我们通过生产高品质的重建利用空间雕刻。我们能够重建和渲染非常在实时的2-3厘米的分辨率在移动大场面设备无需使用GPU计算的。该用户能够查看并与通过实时重建相互作用直观的界面。我们提供定性和定量

上公开可用的RGB-D数据集[3]，并在数据集的结果从两个设备收集实时。引言

近日，手机厂商也开始加入

高品质的深度和惯性传感器到移动电话和

片。我们在工作中使用的设备，谷歌的探戈[1] 手机和平板电脑具有非常小的主动红外投影深度传感器，高性能的IMU和组合视摄像机宽视场（第四节-A）。其它装置，例如

作为Occiptal Inc.的结构的传感器。[4]具有类似的功能。这些器件提供了板载的，完全集成的传感平台的3D绘图与定位，与应用

从移动机器人为手持设备，无线增强现实。

(a) CHISEL creating a map of an entire office building floor on a mobile device in real-time.

(b) Reconstructed apartment scene at a voxel resolution of 2cm.

Fig. 1: CHISEL running on Google’s Tango [1] device.

实时3D重建是一个众所周知的问题

计算机视觉和机器人[5]。的任务是，以提取从喧闹的序列中的真实场景的真3D几何传感器读数在线。解决这个问题是非常有用导航，映射，对象扫描，等等。问题可以分解成两部分：定位（即估计传感器的姿态和轨道），以及映射（即重建场景几何和结构）。

考虑房子规模（300平方米）的实时3D绘图和本地化探戈般的设备上。用户（或机器人）绕着大楼，扫描现场。在房子规模，我们只关注功能，分辨率

约2-3厘米（墙壁，地板，家具，家电等）。至便于扫描，实时反馈被提供给用户的

该设备的屏幕。用户可以导出生成的3D扫描而不丢失任何数据。图1显示了这种用法示例

（一）凿上创建一个地图上整个办公室建筑物楼层的移动设备中的实时性。

（b）于2厘米的体素分辨率重构公寓场景。图。 1：钻探谷歌的探戈[1]设备上运行。

案件进展（第三节）。

众议院比例尺制图需要的三维重建算法运行完全板载;和足够快，使实时

相互作用。重要的是，整个密集的三维重建必须符合设备的限制（2-4GB）记忆里（第四节-A）。由于一些移动设备缺乏足够强大的独立图形处理单元（GPU），我们选择不依赖于通用GPU计算进行

这个问题无论是在创建或渲染3D听话重建。

3D映射算法涉及占用电网[6]

关键点映射[7]点云[8-10]已经存在手机在小规模。但大多数现有的方法要么需要脱机后处理或云计算

在规模，我们创造出高品质的3D重建有兴趣。

许多国家的最先进的实时三维重建算法 [2，11-14]计算截短符号距离场

的场景（TSDF）[15]。该TSDF存储离散估计的距离，以在场景中的最近的表面。而允许非常高品质的重建中，TSDF是

非常消耗内存。以前的作品[12，13]已经扩展的TSDF较大的场景通过存储移动体素化并逐步丢弃数据 - 但我们有兴趣在保持体数据供以后使用。的大小 TSDF需要重建整个房子可能对

几千兆字节的顺序（第IV-D）中，并将所得重构的网具有100万顶点的顺序。

在这项工作中，我们详细介绍一个实时的房子规模TSDF 3D 重建系统（称为凿），用于移动设备。

在实验上，我们发现，在空间的大部分（？93％）一个典型的场景是在实际上空的（表I）。遍历空重建和渲染废物的目的，空间

计算时间;并存储它浪费存储器。因为此，凿利用由引入的数据结构的 Nie?ner等。 [2]，动态空间哈希[16] TSDF

（第III-F）中，存储该距离场数据作为twolevel 结构，其中静态3D体素块是动态根据现场的观察分配。由于

数据结构具有O（1）访问的性能，我们能够快速识别场景的部分应该呈现，

更新或删除。这使我们能够最小化的量时间我们花费在每个深度扫描，并保持重建在实时上的设备（表9E）运行。

对于本地化，雕刻刀使用的视觉惯性测程的组合 [17，18]和稀疏基于二维关键点映射[19]如一个黑盒子输入（第三节-J），增量相结合扫描到模型ICP [20]来校正漂移。我们提供上公开定性和定量结果

可用的RGB-D数据集[3]，并在所收集的数据集实时从两个设备（第四节）。我们比较不同方法创建（第四节-C）和存储

（第四节-D）的TSDF的内存效率方面，速度，和重建质量。凿子，能生产高质量，户外和室内大型三维重建场景实时车载的移动设备。 II。相关工作

映射范一般分为两类：

具有里程碑意义的基础（或稀疏）的映射，以及高分辨率密映射[19]。虽然稀疏映射产生一个节律一致的地标地图基于关键在环境特点，密集映射在全球范围注册

所有传感器数据转换成一个高分辨率的数据结构。在这工作中，我们主要关心密集的映射，这是高品质的三维重建至关重要。

因为移动电话通常不具有深度传感器，以前的作品[9，21，22]在密集的重建移动手机已经竭尽全力，从提取的深度

一系列的注册单眼相机图像。由于我们的工作的重点是集成了深度感应器的移动设备，如谷歌探戈设备[1]，我们并不需要执行昂贵的单目立体作为先决条件密

重建。这使我们能够拯救我们的内存和CPU 预算三维重建本身。

一个密集的3D绘图的最简单的方法是存储多个已注册的点云。这些基于点的方法 [8-10，22]自然深度数据转换成3D预测点。虽然简单，点云并没有捕捉到当地现场结构，嘈杂，并没有捕捉到负（非表面）关于场景的信息。这个信息是关键现场重建在高噪音水平[23]。 Elfes [6]介绍占用电网映射，这将世界分成含有格素入住

概率。入住电网保护当地结构，

优雅地处理冗余和缺失数据。尽管有更多的比点云功能强大，占用电网从走样苦，大约表面法线和内部缺乏信息/ 障碍外部。入住电网映射早已

被证明在实时探戈执行[1]设备使用一个八叉树表示[24]。

Curless和Levoy [15]创建占用替代网格称为截断符号距离场（TSDF）其存储的签名的距离场的一个体素化现场。该TSDF里面障碍阴性，阳性外面的障碍。表面被隐式给出零

在TSDF的等高线。当使用比占用更多的内存网格，该TSDF创建更高质量的面通过保持局部结构重建。

在机器人技术，远程域在运动规划使用 [25]，映射[26]，和场景理解。距离场为机器人提供有用的信息：以最近的距离障碍，梯度方向带他们远离

障碍。瓦格纳等人最近的工作。 [27]探讨

直接使用了机器人手臂的运动规划TSDF的;制造使用的梯度信息隐式地存储在TSDF 本地优化机器人运动轨迹。我们有兴趣自主飞行机器人同样的轨迹规划

通过直接使用TSDF数据。实时内建3D绘图，导航和里程计已经在实现飞行

机器人[28，29]使用占用网格。凿是免费的这项工作。

Kinect的融合[11]采用TSDF同时提取移动深度摄像头和场景几何中的姿态即时的。为使扫描融合大量使用GPU的和渲染，Fusion是能够创造非常高质量的，在一个小的高分辨率表面重建

区。然而，像占用网格映射，该算法

依赖于一个单一固定大小的3D体素网格，并且因此是不适宜重建非常大的场面因为内存约束。这一限制在扩大产生了兴趣 TSDF融合到大的场面。

移动窗口的方法，如Kintinuous [12]延长

Kinect的融合，通过记录一个移动的格素场面大在GPU。由于相机移动网格之外，区域这不再是可见的变成了表面表示。因此，距离场数据被过早地丢弃

以节省内存。当我们要保存距离场数据，以便它可在以后用于后处理，运动规划，和

共5页:

三维重构.doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档