Segment Anything Model

Segment Anything Model (SAM)：一种来自 Meta AI 的新 AI 模型，只需单击一下即可“切出”任何图像中的任何对象

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务，而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。这个循环重复多次以改进模型和数据集。

1100 万张图片，1B+ 掩码

在 SAM 的帮助下注释了足够多的蒙版后，我们能够利用 SAM 复杂的歧义感知设计来完全自动地注释新图像。为此，我们向 SAM 展示图像上的点网格，并要求 SAM 在每个点处分割所有内容。我们的最终数据集包括在约 1100 万个许可和隐私保护图像上收集的超过 11 亿个分割掩码。

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。

数据统计

相关导航

Masterpiece Studio

Masterpiece Studio的愿景是...

NVIDIA GET3D

NVIDIA GET3D是NVIDIA发布的...

Tafi-AI生成3D模型

Tafi是一家领先的全球3D内容开发和推广公司，为数百万专业和娱乐艺术家提供高质量的3D资产，与知名品牌合作推动Web3和NFT的发展。

Masterpiece X|杰作 X|文本转 3D|AI 3D 模型生成器

Masterpiece X is the 3D creation platform for modern creators. Generate. Edit. Share & Use.：杰作 X - 生成：第一个支持创建具有网格、纹理和动画的资产的生成式 3D 应用程序。快速探索在 3D 中创建和发展您的想法 - 只需几句话！

kinetix

在虚拟世界中表达自我,自定义表情可用于任何头像和多个世界，以创造性的方式表达您的个性。

Meshy|AI3D模型|文本转3D|图像转3D|AI纹理

Meshy是一个3D人工智能工具包，使用户能够轻松地将文本或2D图像转换为3D资产。用Meshy释放你的创造力-3D内容创作的未来。

热门标签

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务，而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。这个循环重复多次以改进模型和数据集。

1100 万张图片，1B+ 掩码

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。

数据统计

相关导航

热门网址

相关文章

Segment Anything Model

热门标签

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务，而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。 例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升 为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。 研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。 这个循环重复多次以改进模型和数据集。

1100 万张图片，1B+ 掩码

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。 我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。

数据统计

相关导航

热门网址

相关文章

输出掩码可用作其他 AI 系统的输入。例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升为 3D 或用于拼贴等创意任务。

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。这个循环重复多次以改进模型和数据集。

SAM 旨在高效地为其数据引擎提供动力。我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。