最强大模型Llama 3正式发布 已达GPT4级别

Meta 公司宣布了一项重大技术进展,发布了其最新的开源模型——Llama3。这一模型包含两种参数规模:8B(80 亿参数)和 70B(700 亿参数),预计将于今年 7 月正式面世。Llama3 模型不仅具备多模态能力,还集成了新的计算机编码功能,能够输出文本和图像,预示着其未来将被应用于雷朋 Meta 智能眼镜等设备。

最强大模型 Llama 3 正式发布 已达 GPT4 级别

Meta 公司与谷歌建立了合作伙伴关系,将实时搜索结果整合到 AI 助手的答复中,进一步提升了用户体验。与前代 Llama2 相比,Llama3 在多个行业基准测试中展现了突破性的性能,特别是在推理、代码生成和指令跟踪等方面取得了显著进步。为了训练这一模型,Meta 构建了两个包含 2.4 万个 GPU 的集群,其中 1.6 万个 GPU 同时用于 Llama3 的训练。

Llama3 的开发预示着 Meta 在 AI 领域的雄心壮志。目前,公司正在开发的最大型模型拥有超过 400B(400 亿)的参数规模。Meta Llama3 的主要性能特点包括:

模型规模与类型:提供 8B 和 70B 两种规模的预训练和指令调优生成文本模型,专为对话和其他语言处理任务优化。

模型架构:采用自回归方法和基于优化的变换器架构,引入了分组查询注意力机制,提升了大规模参数下的推理可扩展性。

训练与数据处理:使用超过 15 万亿的 tokens 进行预训练,训练集是 Llama2 的七倍,支持高达 30 种语言。

性能与基准测试:在多个自动化基准测试中表现出色,包括对话、问答、推理等多种任务,并特别针对现实世界场景进行了优化。

Meta 还发布了基于 Llama3 的 AI 助手,目前已在美国之外的十多个国家推出。用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 助手,它能够推荐餐厅、规划周末活动、协助学习等。此外,Meta AI 还整合了搜索功能,可以直接访问网络上的实时信息,无需切换应用。

Llama-3-70B-Instruct 已经登陆 Hugging Chat ,可以在上面直接使用!

体验地址:点击这里

模型下载:点击这里

Hugging Chat:点击这里

「点点赞赏,手留余香」

0

给作者打赏,鼓励TA抓紧创作!

微信微信 支付宝支付宝

还没有人赞赏,快来当第一个赞赏的人吧!

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
码云笔记 » 最强大模型Llama 3正式发布 已达GPT4级别

发表回复