您现在的位置是:群英 > 互联网资讯 > 人工智能
Meta 开源多感官人工智能模型,整合文本、音频、视觉等六类数据
Admin发表于 2023-09-21 08:57:52173 次浏览
在这篇文章中我们会学习到关于“Meta 开源多感官人工智能模型,整合文本、音频、视觉等六类数据”的知识,小编觉得挺不错的,现在分享给大家,也给大家做个参考,希望对大家学习或工作能有帮助。下面就请大家跟着小编的思路一起来学习一下吧。


    


Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验。同时,该模型也表明了 Meta 公司在人工智能研究领域的开放态度,而其竞争对手如 OpenAI 和谷歌则变得越来越封闭。

该研究的核心概念是将多种类型的数据整合到一个多维索引(或用人工智能术语来说,“嵌入空间”)中。这个概念可能有些抽象,但它正是近期生成式人工智能热潮的基础。例如,人工智能图像生成器,如 DALL-E、Stable Diffusion 和 Midjourney 等,都依赖于在训练阶段将文本和图像联系在一起的系统。它们在寻找视觉数据中的模式的同时,将这些信息与图像的描述相连。这就是为什么这些系统能够根据用户的文本输入生成图片。同样的道理也适用于许多能够以同样方式生成视频或音频的人工智能工具。

Meta 公司称,其模型 ImageBind 是第一个将六种类型的数据整合到一个嵌入空间中的模型。这六种类型的数据包括:视觉(包括图像和视频);热力(红外图像);文本;音频;深度信息;以及最有趣的一种 —— 由惯性测量单元(IMU)产生的运动读数。(IMU 存在于手机和智能手表中,用于执行各种任务,从手机从横屏切换到竖屏,到区分不同类型的运动。)

未来的人工智能系统将能够像当前针对文本输入的系统一样,交叉引用这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅能够生成音频和视觉输入,还能够生成你所处的环境和物理站台的运动。你可以要求它模拟一次漫长的海上旅行,它不仅会让你置身于一艘船上,并且有海浪的声音作为背景,还会让你感受到甲板在脚下摇晃和海风吹拂。

Meta 公司在博客文章中指出,未来的模型还可以添加其他感官输入流,包括“触觉、语音、气味和大脑功能磁共振成像信号”。该公司还声称,这项研究“让机器更接近于人类同时、全面、直接地从多种不同的信息形式中学习的能力。”

当然,这很多都是基于预测的,而且很可能这项研究的直接应用会非常有限。例如,去年,Meta 公司展示了一个人工智能模型,能够根据文本描述生成短而模糊的视频。像 ImageBind 这样的研究显示了未来版本的系统如何能够整合其他数据流,例如生成与视频输出匹配的音频。

对于行业观察者来说,这项研究也很有趣,因为IT之家注意到 Meta 公司是开源了底层模型的,这在人工智能领域是一个越来越受到关注的做法。


以上就是关于“Meta 开源多感官人工智能模型,整合文本、音频、视觉等六类数据”的介绍了,感谢各位的阅读,希望文本对大家有所帮助。如果想要了解更多知识,欢迎关注群英网络,小编每天都会为大家更新不同的知识。

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。

相关信息推荐
2023-06-06 09:55:32 
摘要:植保科学的chatGPT问答
2023-06-06 10:35:35 
摘要:image 什么是maui .NET 多平台应用 UI (.NET MAUI) 是一个跨平台框架,用于使用 C# 和 XAML 创建本机移动(ios,andriod)和桌面(windows,mac)应
2023-06-06 10:34:59 
摘要:如何使用ChatGPT来自动化Python任务
云活动
推荐内容
热门关键词
元宇宙+chatgpt+midjourney+意间绘画+AI作图 持续进化+chatgpt+midjourney+意间绘画+AI作图 钉钉+chatgpt+midjourney+意间绘画+AI作图 AI整顿职场+钉钉+chatgpt+midjourney+意间绘画+AI作图 主动开卷+chatgpt+midjourney+意间绘画+AI作图 StableLM+chatgpt+midjourney+意间绘画+AI作图 智能化+SaaS公司+chatgpt+midjourney+意间绘画+AI作图 游戏人+chatgpt+midjourney+意间绘画+AI作图 提示工程+chatgpt+midjourney+意间绘画+AI作图 编写提示指南+chatgpt+midjourney+意间绘画+AI作图 CG大佬+chatgpt+midjourney+意间绘画+AI作图 文心一格+chatgpt+midjourney+意间绘画+AI作图 ChatGPT又崩了+腾讯前副总裁+游戏手柄 原画师+chatgpt+midjourney+意间绘画+AI作图 反对ChatGPT+chatgpt+midjourney+意间绘画+AI作图 文心一言发布会+chatgpt+midjourney+意间绘画+AI作图 下载评测+chatgpt+midjourney+意间绘画+AI作图 文心一言+开放测试+chatgpt+midjourney+意间绘画+AI作图 谎言制造机+chatgpt+midjourney+意间绘画+AI作图 midjourney提示词+chatgpt+midjourney+意间绘画+AI作图 聊天+chatgpt+midjourney+意间绘画+AI作图 视频版Midjourney+chatgpt+midjourney+意间绘画+AI作图 伟大的公司+chatgpt+midjourney+意间绘画+AI作图 下一代操作系统+chatgpt+midjourney+意间绘画+AI作图 阿拉丁时代+chatgpt+midjourney+意间绘画+AI作图 文心一言+chatgpt+midjourney+意间绘画+AI作图 chatgpt+midjourney+意间绘画+AI作图 高薪大神+chatgpt+midjourney+意间绘画+AI作图 爆款游戏+chatgpt+midjourney+意间绘画+AI作图 Firefly+chatgpt+midjourney+意间绘画+AI作图
热门信息
群英网络助力开启安全的云计算之旅
立即注册,领取新人大礼包
  • 联系我们
  • 24小时售后:4006784567
  • 24小时TEL :0668-2555666
  • 售前咨询TEL:400-678-4567

  • 官方微信

    官方微信
Copyright  ©  QY  Network  Company  Ltd. All  Rights  Reserved. 2003-2019  群英网络  版权所有   茂名市群英网络有限公司
增值电信经营许可证 : B1.B2-20140078   粤ICP备09006778号
免费拨打  400-678-4567
免费拨打  400-678-4567 免费拨打 400-678-4567 或 0668-2555555
微信公众号
返回顶部
返回顶部 返回顶部