作者:时间:2025-04-09点击数:401
[作者-赵亮|编辑-王欣芮|审核-刘心月]近期我组在Image and Vision Computing在线发表了题为“TSGaussian: Semantic and depth-guided Target-Specific Gaussian Splatting from sparse views”的论文。
Gaussian Splatting 技术在 3D 场景的全景与交互式分割领域取得了重大进展。然而,现有方法在从稀疏视图重建结构复杂的指定目标时仍存在不足。为解决这一问题,研究团队推出了 TSGaussian——将语义约束与深度先验相结合的全新框架,有效避免几何结构退化。
TSGaussian 的设计理念是将计算资源优先分配给指定目标,同时尽量减少对背景的计算投入。研究团队利用 YOLOv9 提供的边界框作为提示,调用 Segment Anything Model 生成二维掩码预测,从而保证语义准确性与计算效率。
在三维空间中,TSGaussian 通过为每个高斯椭球引入紧凑的身份编码,并结合三维空间一致性正则化,实现高斯点的有效聚类。基于此,研究团队提出了创新的剪枝策略,有效降低冗余三维高斯点数量。
实验结果显示,TSGaussian 在三套标准数据集以及自建数据集上均超过现有最先进方法,在复杂目标重建精度和效率上表现出显著优势。

本组博士研究生赵亮与硕士研究生鲍泽韩为论文的共同第一作者,李伟夫副教授为该论文的通讯作者。本论文得到国家自然科学基金项目(12301651)和国家自然科学基金项目(62376104)的资助。