点云网络设计或许可以更“轻”:把计算资源留给加深层、扩规模,而把聚合任务交给像pospo

最近有人在研究点云网络,觉得这些网络的性能差别挺大,有些复杂的算子虽然听起来挺好,比如旋转、置换、距离加权之类的,说能捕捉更精细的几何结构,可真正到了深层网络,表现还是不稳定。所以大家开始怀疑:这些复杂的算子真的有必要吗?这次研究给这个问题提供了一些新的视角。研究者们选择了一个相同的深度残差网络骨架来做实验,结果发现,只要参数量和感受野匹配得好,不同的算子在相同输入下给出的分数其实很接近,甚至都能达到当时的最优水平。所以这个发现让人们开始反思:是否真的需要越来越复杂的算子呢? 为了验证这个想法,他们搭建了一个通用测试平台。主干网络用的是深度残差架构,通道数和归一化策略也都统一了。还有三类典型的局部聚合算子都被放到平台上测试。基准数据用的是ModelNet40、S3DIS、PartNet,涵盖了小规模单场景到大规模多场景的数据。唯一变化的变量就是这些不同的算子。 结果出来后发现:当感受野和通道数对齐时,这些不同类别的聚合算子之间的差异很小。平均IoU差距不到1%。这个结果让人意外,因为通常认为复杂的算子会比简单的要好一些。而且这三组数据中还发现了一个重要现象:最简单的PosPool在所有基准数据上都表现得很好,甚至在PartNet这个特别难处理的数据上还有7.4mIoU的显著优势。这说明“朴素”并不一定输给“复杂”。 更有趣的是在深层网络里做实验时发现:浅层网络里一些表现优秀的配置到了深层却失效了。过于复杂的算子容易过拟合,让训练变得不稳定。而PosPool因为零权重设计,避开了这个陷阱。在50层以上的模型中依然能保持稳定提升。这个结果告诉我们:深层网络可能需要更简单冷静的聚合策略,而不是更多可训练参数。 总结这次研究有三点共识:公平对比很重要;深层网络需要新配方;零权重也能跑赢高权重。所以未来点云网络设计或许可以更“轻”:把计算资源留给加深层、扩规模,而把聚合任务交给像PosPool这样高效又鲁棒的简单算子。