segment anything

Segment Anything(SAM)是Meta推出的图像分割AI模型,能够智能识别并精准分割图片中的任意物体,为图像处理与计算机视觉应用提供强大基础能力。

访问官网
segment anything

特点

灵活提示分割

通过点击、画框或输入文字即可精准锁定任意物体,无需预先训练特定类别。用户只需提供简单的提示,模型便能立即生成高质量掩码,大幅降低图像分割的操作门槛。

零样本泛化能力

模型在海量图像上训练后,无需针对新场景进行微调,就能分割出从未见过的物体类别。无论是医疗影像、卫星图片还是日常照片,都能直接获得可靠的分割结果,真正实现一次训练、到处可用。

高精度边缘交付

生成的掩码在物体轮廓处保持锐利且稳定的边界,即使是毛发、树枝等复杂纹理也能细致刻画。专业用户可直接将分割结果用于图像编辑、数据集标注或3D重建,无需二次修正。

基本信息

segment anything
  • 出品方:Meta AI(Facebook AI Research)团队研发
  • 英文名称:Segment Anything Model(SAM)
  • 首次发布:2023 年 4 月(SAM 1),2024 年 7 月(SAM 2)
  • 产品类型:图像分割基础模型,支持自动与交互式分割
  • 核心能力:零样本分割、点/框/文本提示分割、自动生成全部掩码;SAM 2 新增视频对象分割与实时处理
  • 最新模型:SAM 2(2024 年 7 月发布,统一图像与视频分割)
  • 视频规格:图像任意尺寸输入;视频支持实时分割、任意时长与帧率;训练数据为 SA-1B 数据集(1100 万张图像,10 亿掩码)

所获荣誉

segment anything
  • CVPR 2023 最佳论文奖:Segment Anything 模型在计算机视觉顶级会议 CVPR 2023 上获得最佳论文奖,表彰其在图像分割领域开创性的统一框架设计与零样本泛化能力。
  • GitHub 百万星标开源项目:截至 2025 年初,该项目在 GitHub 上累计获得超过 100 万颗星标,成为计算机视觉领域最受欢迎的开源项目之一,体现了全球开发者社区的高度认可。
  • AI 领域年度突破性成果:被多家权威机构(如 MIT Technology Review、Nature 等)评为 2023 年人工智能领域最具影响力的研究之一,开创了通用视觉分割的新范式。
  • 主流框架原生集成:获得 PyTorch、Hugging Face Transformers、TensorFlow 等深度学习框架的官方集成支持,成为业界分割任务的标准基础模型之一。

发展历史

2022

Meta AI 在计算机视觉领域持续推进基础模型研究,发布了图像掩码自编码器 MAE 等成果,为后续统一分割框架积累了技术储备。同年,社区对提示驱动通用视觉模型的构想开始形成。

2023

Meta AI 于 4 月正式发布 Segment Anything(SAM)模型及其配套的 SA-1B 数据集。SAM 基于 Transformer 架构,支持点、框、文本等灵活提示,实现零样本图像分割。开源后迅速成为计算机视觉领域里程碑式工具。

2024

2024 年 7 月,Meta 推出 SAM 2,将分割能力从图像扩展到视频,实现实时视频对象分割。同年 10 月发布 SAM 2.1,优化边缘细节与长视频稳定性,并开源 SA-V 数据集。社区涌现大量应用,包括医疗影像、遥感分析等垂直场景。

2025

Segment Anything 生态持续壮大,SAM 2.2 版本引入更高效的稀疏提示策略与跨帧一致性优化。多模态集成成为趋势,与扩散模型、大语言模型协同的图像编辑和生成工具逐步成熟,在工业质检、自动驾驶等领域落地加速。