【导语】在三维重建技术日新月异的今天,3DGS以其颠覆性的场景表示与渲染架构,引领着高精度三维重建的新纪元。本文深入聚焦3DGS技术的核心环节,特别是数据采集与三维重建的关键步骤与技术细节。从专业的采集车设计到点云生成的精细流程,再到光场重建的创新实践,我们将逐步揭开“从像素到三维”的神秘面纱,探索3DGS技术如何实现从“传统低效”向“高效逼真”的跨越。通过实例分析与效果展示,您将亲身体验到3DGS技术在高精度三维场景重建中的非凡魅力与广阔应用前景。
在三维重建技术从 “传统低效” 向 “高效逼真” 跨越的进程中,3DGS 凭借颠覆性的场景表示与渲染架构,为高精度三维重建提供了全新可能。本文将聚焦 3DGS 技术落地的核心环节,解析数据采集、三维重建的关键步骤与技术细节,揭开 “从像素到三维” 的实现密码。
基于的高精度三维场景重建的生产流程主要分成四个步骤,包括数据采集、三维重建、引擎集成、VR搭建。其中引擎集成和VR搭建涉及更多的是工(gōng)程(chéng)实(shí)现(xiàn)。本(běn)文重(zhòng)点(diǎn)介(jiè)绍(shào)数(shù)据(jù)采集、三(sān)维(wéi)重(zhòng)建(jiàn)的(de)过(guò)程(chéng)。

图(tú)2 生(shēng)产(chǎn)流(liú)程(chéng)
1、数(shù)据(jù)采集
关于(yú)采集场(chǎng)景(jǐng)的(de)要(yào)求(qiú),采集前(qián)需(xū)对(duì)场(chǎng)地(de)进(jìn)行(xíng)考(kǎo)察(chá),根(gēn)据(jù)场景制定合理的采集动线路线,应尽量完成场地清场,并对环境整理留出采集动线空间。采集中,避免移动场景中物体,避免移动物体、人等进入采集画面,并且尽量保证环境光照稳定,不可忽明忽暗。

图3 采集角度示意图

图4 采集路线示意图
为了保证场景重建质量,提升数据采集效率,采用专业采集车进行拍摄采集,采集车是有多台运动相机组成的相机阵列,各个相机的位置分布和朝向设计如图3,采集车的行进方向参考图4采集路线示意图,整体采集车如图5所示,图6是使用专业采集车进行室外拍摄的路线示意图。

图5 专业采集设备示意图

图6 室外采集路线示意图
2、点云生成
点云生成一般通过以下步骤进行。首先对拍摄数据进行预处理,通过图片质量检测,移除模糊图片。之后,通过对应点检索进行相机校准和照片对齐,完成相机位姿计算并获得初始点云。随后进行增量式重建,增量式重建主要利用SfM(Structure From Motion,从运动中恢复结构),SfM是一种从一组不同视角下拍摄的无序或有序影像中,同时恢复场景三维结构和相机姿态的技术。增量式SfM会选择无序影像进行特征匹配,并进行几何纠正、三角测量恢复稀疏点云结构,通过已有点云重新估计相对姿态,再进行局部和全局的(de)BA优(yōu)化(huà),最(zuì)后(hòu)输(shū)出(chū)全部(bù)的(de)相(xiāng)机(jī)参(cān)数(shù)和(hé)稀(xī)疏(shū)三(sān)维(wéi)点(diǎn)云(yún)。

图(tú)7 稀(xī)疏(shū)点(diǎn)云(yún)和(hé)相(xiāng)机(jī)姿(zī)态(tài)的(de)计(jì)算(suàn)流(liú)程(chéng)
一(yī)般(bān)在(zài)采集照(zhào)片(piàn)充(chōng)足(zú),质(zhì)量(liàng)高(gāo)的(de)情(qíng)况(kuàng)下(xià),获(huò)取(qǔ)的(de)相(xiāng)机(jī)位(wèi)姿(zī)和(hé)实(shí)际(jì)采集位(wèi)置(zhì)相(xiāng)似(shì),且(qiě)初(chū)始(shǐ)点(diǎn)云(yún)形(xíng)状(zhuàng)可(kě)明(míng)显(xiǎn)看(kàn)出(chū)和(hé)采集场(chǎng)景(jǐng)一(yī)致(zhì)。下(xià)面(miàn)是(shì)厦(shà)门(mén)钢(gāng)琴(qín)博(bó)物(wù)馆(guǎn)室(shì)内(nèi)场(chǎng)景(jǐng)的(de)部(bù)分(fēn)拍摄图片,以及计算得到的相机位姿和稀疏模型。

图8 钢琴博物馆的拍摄图片

图9 钢琴博物馆的稀疏点云
如果发现有很多相机位姿发生了漂移或初始点云有明显的异常,则需要重新选择照片或根据异常情况重新补拍照片,然后重新计算相机位姿及初始点云。

图10 metashape初始点云异常情况
3、光场重建
3DGS三维场景重建的大致流程如图11所示,包括:

图11 3DGS的基础流程
①输入:输入是一组静态场景的图像,以及通过SfM算法得到的SfM点,以及(jí)所(suǒ)有(yǒu)图(tú)像(xiàng)对(duì)应(yīng)的(de)相(xiāng)机(jī)位(wèi)姿(zī)。
②初(chū)始(shǐ)化(huà):对(duì)获(huò)取(qǔ)的(de)每(měi)个(gè)稀(xī)疏(shū)点(diǎn)云(yún)创(chuàng)建(jiàn)初(chū)始(shǐ)化(huà)3D高(gāo)斯(sī)椭球,其由位置(平均值)、协方差矩阵(XYZ轴缩放因子、旋转因子等)、不透明度和球谐函数系数(后文简称SH系数)所定义。该定义允许3D场景合理紧凑的表示,并通过调节参数紧凑化表示精细化场景结构。其中使用球谐函数来映射整个辐射场的方向性外观分量(RGB颜色)。
③构建梯度流迭代优化:3D高斯椭球在对应的相机位姿下进行投影,获取光栅化之后的图像,与真实输入图像(真值图像)进行比对优化,对初始化后的参数(位置、协方差矩阵、SH系数、高斯球密度的自适应控制)进行优化,同时通过自适应密度控制策略对高斯球进行拆分融合操作。图12展示了多个场景的光场重建效果,图13展示了使用MetaQuest VR头显体验6DoF实景漫游。

图12 实景1:1光场重建复(fù)刻(kè)效(xiào)果(guǒ)。左(zuǒ)上(shàng):首(shǒu)钢(gāng)冰(bīng)壶(hú)馆;左中:咪咕咖啡;左下:首钢咪咕大楼;右上:信息港二期大堂;右中:信息港工区;右下:信息港二期一层休息区

图13 MetaQuest VR头显体验效果图