首页 > 新闻资讯 > 正文

【科研进展】SAMM:基于Segment Anything Model 2的通用材料显微图像分割模型

作者:时间:2026-02-07点击数:

文章题目:SAMM: a general-purpose segmentation model for material micrographs based on the Segment Anything Model 2

出版信息:Adv. Powder Mater. 5 (2026) 100404.

第一作者:涂佳濠

通信作者:谭黎明、黄岚

该图像系统概述了通用材料微观结构分割模型(SAMM)的核心架构和性能验证。左侧数据集部分展示了13种材料系统(如镍基合金、钛合金)的显微图像,展示了研究数据的多样性。右侧模型架构图揭示了其创新设计:基于SAM2骨干网络,通过跨尺度特征融合和混合损失函数优化实现高精度分割,并通过记忆增强注意力机制整合材料先验知识。底部结果部分通过可视化边界检测(如晶界、粉末颗粒识别)验证了模型在材料场景中的高泛化能力,为开发通用材料计算工具提供了技术突破。

01 文章摘要

精确的分割对于定量微观结构分析至关重要,而定量微观结构分析又是建立材料科学中加工-结构-性能关系的基础。然而,深度学习模型的泛化能力仍然是一个关键挑战,当应用于未见过的材料系统或成像条件时,其性能往往会显著下降。这一局限性凸显了开发通用分割模型的迫切需求。在此,我们提出了 SAMM,这是一种用于材料微观图像的通用分割模型,它是通过在大规模、多样化的数据集上对Segment Anything模型2(SAM2)进行微调而开发出来的。我们的方法整合了全参数微调策略、用于增强细节分辨率的跨尺度特征融合模块以及一种混合损失函数,以确保像素级准确性和结构完整性。因此,SAMM在13种不同的材料数据集上都表现出了出色的泛化能力。例如,在具有挑战性的镍基高温合金微观图像上,它实现了76.63%的平均交并比(mIoU),比次优基准高出10.3%。在对增材制造粉末进行分段处理时,SAM能够实现近乎完美的效果(98.13%的mloU)。尤为重要的是,SAMM具有出色的零样本泛化能力,在完全未在训练过程中见过的数据集上能达到高达97.41%的mloU。这项工作不仅提供了一个通用的微观结构分段的稳健框架,还提供了一个全面且公开可用的数据集,以促进该领域的进一步研究。

02 研究背景

在材料科学中,微观结构定量分析是建立工艺-结构-性能关系的关键,对材料性能具有决定性影响。传统分析方法依赖人工或半自动阈值处理,效率低且主观性强。近年来,深度学习已广泛应用于合金、陶瓷、能源材料等领域的微观结构表征,但多数方法仍局限于特定材料或成像模式,通用性不足。为此,本研究提出基于SAM2架构的微调框架SAMM,通过全参数训练和大规模专家标注数据集,实现了对复杂微观结构的高效、准确分割,并展现出较强的跨域零样本泛化能力。

03 创新点

1.提出全参数微调的通用分割框架

区别于现有基于提示词且无需训练的零样本方法,本研究提出了一个基于SAM2架构的、可进行全参数微调的通用框架SAMM。该设计从根本上降低了模型对人工提示的依赖性,实现了对复杂微观结构的端到端高效精准分割。

2.构建了大规模、多材料、多模态的基准数据集

为训练和评估模型,研究构建了一个大规模、经专家标注的显微图像数据集,涵盖镍基高温合金、陶瓷、氧化物纳米线、金属粉末及复合材料等13个子集。该数据集融合了多种分辨率和数据来源,为微观结构分割任务建立了一个统一的、具有广泛代表性的基准。

3.实现了高效的复杂结构分割与强大的跨域泛化能力

该方法有效克服了现有方法在推理速度和多实例分割能力上的局限,能够精准分割重叠相、不规则析出相和高密度颗粒等复杂结构。此外,在未见数据集上的大量跨域实验表明,SAMM具备优异的零样本泛化能力,仅需极少标注数据即可适用于实际复杂的显微分析任务。

04 文章概述

(1)数据库构建:

本研究构建了一个涵盖自采集显微图像与公开材料图像的多样化综合多模态数据集,旨在为评估不同合金体系和成像条件下的微观组织分割方法奠定基础。该数据集主要包含两部分:一是基于NiX–6Mo–4Nb合金体系通过高通量多组分扩散偶(MCDM)策略制备并利用SEM表征的自采集数据(Data 1-8),涵盖了TCP/GCP相、γ′相、镍基变形高温合金以及增材制造(AM)用IN718和稀有贵金属粉末的手动标注;二是为增强多样性而整合的5个公开数据集(Data 9-13),涉及纳米线、钛合金、多合金体系及纳米晶结构等,所有公开数据均经过统一预处理(如转换为兼容格式、分辨率调整)以确保与自采数据的一致性。如图1所示,数据集覆盖了镍基高温合金、钛合金、钢、AM粉末及纳米结构等多种材料体系,显著拓宽了微观组织分割任务的范围,并通过T-SNE降维可视化展示了其丰富的形态多样性与分布统计特征。

图1:本研究所用数据集概述,展示了从13个数据集中采样得到的扫描电子显微镜(SEM)图像块集合。其中,η σ 分别代表镍基高温合金中的γ’、TCP 和 GCP 析出相,δ 表示纳米晶结构,ο 表示氩气雾化粉末,ε 表示碳钢,v 代表 V2O5(五氧化二钒),α 表示钛合金中的析出相。

(2)模型搭建:针对材料显微图像分割中低对比度边界和多尺度结构等领域特定挑战,本文提出了基于SAM2架构的端到端微调框架SAMM。与冻结骨干网络的方法不同,SAMM解冻了完整的分层Vision Transformer编码器,以适应SEM/TEM图像的灰度分布和纹理噪声特征。该框架由四大模块组成:图像编码器通过全参数微调提取密集特征表示;记忆编码器利用记忆库存储历史编码与提示信息,增强复杂微观结构分割的时序与上下文一致性;提示嵌入模块通过将空间坐标归一化至[-1,1]消除输入尺寸偏差,并支持点、框、掩码等稀疏与密集输入;掩码解码器则引入跨尺度特征融合结构,通过对齐高层语义特征与细粒度细节,显著提升了对模糊边缘、重叠相或不规则沉淀相的分割精度。此外,模型采用混合精度训练和动态学习策略,优化了在标注数据稀缺条件下的性能与稳定性。

图2:所提出的 SAMM 框架概述。(a)图像编码器:一种具有全参数微调功能的分层视觉转换器。(b)记忆编码器:融合了自注意力和交叉注意力机制,以实现对象感知的特征对齐。(c)提示嵌入:整合了支持点、框和掩码形式的提示。(d)掩码解码器:执行多分辨率特征融合、基于注意力的细化以及最终掩码预测。

(3)模型分割能力对比: 为系统评估SAMM模型的性能,本研究在构建的13个显微图像数据集上进行了对比实验,选取了包括UNet、DeepLabV3+、SegFormer、Mask2Former等在内的7种代表性算法作为基准,并在统一的实验配置下进行训练与验证。定量分析显示,SAMM在13个数据集中的11个上取得了最优或次优的平均交并比(mIoU),特别是在处理低对比度边界、致密不规则微观结构及复杂成像噪声方面表现卓越;例如在Data 1中,SAMM的mIoU(94.56%)显著优于UNet(87.27%),在增材制造粉末数据集(Data 7-8)中更是实现了近完美分割(>97%),有效克服了基线模型常见的边界破碎、误检和过分割问题。定性可视化分析进一步证实,相比于SAM2等模型,SAMM能生成更平滑、精准的分割掩码,更好地保留了沉淀相、晶界等细微形态特征。此外,通过引入边界F1分数(Boundary F1 Score)作为关键指标,研究发现SAMM在多个数据集上的得分均超过0.96,展现出卓越的边缘细节拟合能力与稳定性。综上所述,SAMM通过有效解决相边界模糊、形态多变及标注稀缺等长期挑战,在材料显微组织分割任务中展现出强大的泛化能力,确立了材料信息学领域语义分割的新基准。

图3:不同方法在公开数据集(数据9-13)上的分割结果可视化对比。黄色区域:正确预测的区域。红色像素:与真实标注相比的预测错误。从左到右依次为:真实标注(Truth)、SAMM、KNet、UNet、Segformer和Deeplabv3+的分割结果。样本按数据9(顶部)至数据13(底部)的顺序排列。

图4:不同方法在自采数据集(数据1 - 8)上的分割结果可视化对比。黄色区域:正确预测的区域。红色像素:与真实标注相比的预测错误。从左到右依次为:真实标注(Truth)、SAMM、KNet、UNet、Segformer和Deeplabv3+的分割结果。样本按数据1(顶部)至数据8(底部)的顺序排列。

(4)模型泛化能力对比:

为系统评估分割模型的跨域泛化能力,本研究对6个未见测试集(Data 8-13)进行了零样本迁移验证实验。实验设计巧妙地将测试集分为两组:一组是与训练集形态相似的“同源域验证组”(Data 8, 9, 11),另一组是形态差异显著的“异源域压力测试组”(Data 10, 12, 13),以此全面覆盖材料微观结构分析中典型的域适应场景。研究对比了提出的SAMM模型、零训练方法(SAM2, MatSAM)及最新基线模型(KNet, Mask2Former),其中SAMM仅在Data 1-7上训练,无需微调直接部署至测试集。

实验结果表明,SAMM在各类跨域场景下均展现出卓越的鲁棒性:在工业稀有金属粉末(Data 8)中,SAMM以97.41%的mIoU精准捕捉颗粒边界,有效抑制过分割;在五氧化二钒层状结构(Data 9)中,SAMM以94.71%的mIoU保持了拓扑连续性,而MatSAM则出现严重碎片化;在强噪声干扰的钛合金(Data 10)和腐蚀表面的碳钢(Data 13)等极端异源域中,尽管所有模型性能均有下降,SAMM仍分别保持了50.12%和57.06%的mIoU,显著优于几乎失效的基线模型;在纳米材料超细相界面(Data 12)的跨尺度挑战中,SAMM更是表现出惊人的稳定性(94.58% mIoU)。这些发现证实,SAMM不仅在同源域中表现优异,更具备应对尺度变化、成像模态偏移、强噪声及表面退化等复杂情况的强大泛化能力。

图5:不同分割模型在未见数据集上的泛化性能定性比较。从每个数据集(数据8-13)中各选取一个代表性样本。前两列展示原始图像及相应的真实标注掩码。其余各列分别展示SAMM、MatSAM的三种变体(B:基础版,H:超大版,L:大型版)以及Mask2Former(方案1)的分割预测结果。

05 启示

本研究通过构建并全参数微调面向材料科学领域的通用分割基础模型(SAMM),并结合大规模、多材料的标准数据集进行训练,能够有效突破传统深度学习模型局限于特定材料体系的瓶颈,实现精准、高效的跨域微观结构分析;这一路径不仅验证了开发领域专用基础模型的方法优势,也为材料学界建立高质量数据共享基准提供了范例,最终将显著降低先进智能分析技术的应用门槛,仅需极少标注数据即可服务于新材料研发与工业检测,从而推动材料微观结构研究向更高效、更智能的方向发展。

06 团队介绍

涂佳濠是华中农业大学信息学院的博士研究生,目前在武汉进行科研工作。他的研究方向主要集中在深度学习辅助的材料表征和大型图像模型方面。

谭黎明是中南大学粉末冶金国家重点实验室的副教授和博士生导师。他长期致力于通过数据驱动高效设计和制造高温合金和涂层材料,尤其关注这些材料的使用行为和失效机制,并为此整合了先进的计算方法和实验手段。

黄岚目前是中南大学粉末冶金国家重点实验室的教授和博士生导师。她的研究方向是结合大数据、机器学习、高通量实验和模拟技术,以及传统的粉末冶金和增材制造技术,加速高性能合金的开发。

07 文章信息

Jiahao Tu, Zi Wang, Weifu Li, Liming Tan, Lan Huang, Feng Liu, SAMM: a general-purpose segmentation model for material micrographs based on the Segment Anything Model 2, Adv. Powder Mater. 5 (2026) 100404.

论文链接:https://doi.org/10.1016/j.apmate.2026.100404

转载自:https://mp.weixin.qq.com/s/-SvWOjan145N0KBdxq8Jug



Copyright© 人工智能与统计学习团队 All Rights Reserved. 

鄂ICP备13013419号