同时 , HyperReel是用vanillaPyTorch实现的 , 可在单张RTX3090GPU上以6.5FPS的速度渲染800×800像素的图像(或者用Tiny模型实现29FPS的渲染) 。
此外 , 与R2L的88层、256个隐藏单元的深度MLP相比 , 研究人员提出的6层、256个隐藏单元的网络外加TensoRF体积骨干的推理速度更快
文章图片
LLFF数据集
LLFF数据集包含8个具有1008×756像素图像的真实世界序列 。
如表1所示 , HyperReel的方法优于DoNeRF、AdaNeRF、TermiNeRF和InstantNGP , 但取得的质量比NeRF略差 。
由于错误的相机校准和输入视角的稀疏性 , 这个数据集对显式体积表征来说是一个巨大的挑战 。
文章图片
动态场景的比较
Technicolor数据集
Technicolor光场数据集包含了由时间同步的4×4摄像机装置拍摄的各种室内环境的视频 , 其中每个视频流中的每张图片都是2048×1088像素 。
研究人员将HyperReel和Neural3DVideo在全图像分辨率下对这个数据集的五个序列(Birthday,Fabien,Painter,Theater,Trains)进行比较 , 每个序列有50帧长 。
如表2所示 , HyperReel的质量超过了Neural3DVideo , 同时每个序列的训练时间仅为1.5个小时(而不是Neural3D的1000多个小时) , 并且渲染速度更快 。
Neural3DVideo数据集
Neural3DVideo数据集包含6个室内多视图视频序列 , 由20台摄像机以2704×2028像素的分辨率拍摄 。
如表2所示 , HyperReel在这个数据集上的表现超过了所有的基线方法 , 包括NeRFPlayer和StreamRF等最新工作 。
特别是 , HyperReel在数量上超过了NeRFPlayer , 渲染速度是其40倍左右;在质量上超过了StreamRF , 尽管其采用Plenoxels为骨干的方法(使用定制的CUDA内核来加快推理速度)渲染速度更快 。
此外 , HyperReel平均每帧消耗的内存比StreamRF和NeRFPlayer都要少得多 。
谷歌Immersive数据集
谷歌Immersive数据集包含了各种室内和室外环境的光场视频 。
如表2所示 , HyperReel在质量上比NeRFPlayer的要好1dB , 同时渲染速度也更快 。
文章图片
有些遗憾的是 , HyperReel目前还没有达到VR所要求的渲染速度(理想情况下为72FPS , 立体声) 。
不过 , 由于该方法是在vanillaPyTorch中实现的 , 因此可以通过比如自定义的CUDA内核等工作 , 来进一步优化性能 。
文章图片
作者介绍
论文一作BenjaminAttal , 目前在卡内基梅隆机器人研究所攻读博士学位 。 研究兴趣包括虚拟现实 , 以及计算成像和显示 。
文章图片
- 操作系统|国产操作系统,是如何助力新时代经济、科技腾飞的?
- 显卡|摩尔线程发布国产GPU云桌面:一颗当20颗用、CPU占用率暴降80%
- 音响|Quest新功能:躺卧模式、接触式UI交互模式、双击手柄切换手势功能
- excel|新泽西州长禁止TikTok、华为、海康威视、腾讯等软件进入州内设备
- 蓝牙耳机|降噪、防尘、防水、长续航,200多的HIK X5蓝牙无线耳机功能真全
- Wi-Fi|129元 荣耀智能体脂秤3开售:Wi-Fi、蓝牙双连接
- 大消费2022:降本增效、行业寒冬、报团取暖
- 苹果|29.4%、14.4%,苹果公布重要数据,人民网说得很对
- 华为荣耀|三款高销量大折叠对比!重量、折痕、内外屏一致性,谁表现更好
- GPU|智能电视会员充值乱象:漫天要价、反复收费的套娃式陷阱,应该整治了!