​马斯克的xAI正努力实现Grok多模态化 将支持上传照片获得文本回复

埃隆・马斯克的人工智能公司 xAI 正在努力为其 Grok 聊天机器人增加多模态输入功能。

根据公开的开发者文件,埃隆·马斯克(Elon Musk)的人工智能公司 xAI 在向其 Grok 聊天机器人添加多模态输入方面取得了进展。这意味着,很快,用户就可以将照片上传到 Grok 并接收基于文本的答案。

​马斯克的 xAI 正努力实现 Grok 多模态化 将支持上传照片获得文本回复

xAI 上个月在一篇博客文章中首次调侃了这一点,该博客称 Grok-1.5V 将提供“多个领域的多模态模型”。开发人员文档的最新更新似乎显示了新模型的发布进度。

在开发者文档中,一个 Python 脚本示范了开发人员如何使用 xAI 软件开发工具包库来生成基于文本和图像的回应。这个脚本读取图像文件,设置一个文本提示,并使用 xAI SDK 生成回应。

对于 xAI 而言,这是 Grok 的一项重大更新。Grok 最早于 2023 年 11 月发布,目前仅供购买 X 高级会员订阅的用户使用。最后一次更新是在今年 3 月的 Grok1.5 版本,带来了改进的推理能力。

据 xAI 的一篇博文介,该模型是 “基于来自互联网公开来源直至 2023 年第三季度以及由人类审核员审查和整理的各种文本数据” 进行训练的。该博文补充说,Grok-1 并未经过 xAI 的训练(包括 xAI 的公开帖子)。然而,Grok 确实拥有 “对世界的实时知识”,包括 xAI 上的帖子。

由埃隆・马斯克于 2023 年 3 月创立的 xAI 在人工智能领域相对较新,并落后于竞争对手,如 OpenAI 的 ChatGPT。然而,根据 xAI 的一篇博文,他们的 Grok1.5 模型在各种基准测试中正在缩小与 GPT-4 的差距,这些测试涵盖了从小学到高中各种竞赛题目的广泛范围。值得注意的是,大型语言模型的基准测试经常受到批评,因为如果这些基准测试包含在它们的训练数据中,这些模型就可以在基准测试上表现良好。

以上关于​马斯克的xAI正努力实现Grok多模态化 将支持上传照片获得文本回复的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。

「点点赞赏,手留余香」

0

给作者打赏,鼓励TA抓紧创作!

微信微信 支付宝支付宝

还没有人赞赏,快来当第一个赞赏的人吧!

声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
码云笔记 » ​马斯克的xAI正努力实现Grok多模态化 将支持上传照片获得文本回复

发表回复