Meta 开源了一个名为 Image Bind 的 AI 模型

79次阅读
没有评论

Meta 开源了一个名为 Image Bind 的 AI 模型

计算机视觉 ImageBind:一种跨感官“链接”人工智能的新方法 ,这是第一个能够同时绑定来自六种模式的数据的 AI 模型,无需明确监督。通过识别这些模式(图像和视频、音频、文本、深度、热和惯性测量单元 (IMU))之间的关系,这一突破通过使机器能够更好地分析许多不同形式的信息来帮助推进人工智能。

通过对齐 6 种模式,你可以做一些用纯文本 GPT-4 做不到的事情:

  • 跨模式检索:将其视为多媒体 Google 搜索
  • 嵌入空间算法:无缝组合不同的数据格式。
  • 生成:通过扩散将任何模态映射到任何其他模态。
Meta 开源了一个名为 Image Bind 的 AI 模型
正文完
 
Windows12系统管理员
版权声明:本站原创文章,由 Windows12系统管理员 2023-06-15发表,共计265字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)