真诚欢迎您的来访，留言，投稿！欢迎（Ctrl+D）收藏并经常访问本站 —- https://mybj123.com
欢迎在本站投放广告，特意开通合作通道『立即了解详情』

当前位置：码云笔记 > AI头条 > 性能超越LLaMA2-7B！AI模型JetMoE-8B训练成本不到10万美元

热点大师 AI头条 2024-04-17

性能超越LLaMA2-7B！AI模型JetMoE-8B训练成本不到10万美元

JetMoE-8B 是一款采用稀疏激活架构的人工智能模型，其性能卓越且训练成本不到 10 万美元，令人惊讶的是，它的表现甚至超越了 LLaMA2-7B、LLaMA-13B 和 DeepseekMoE-16B。

JetMoE-8B 由 24 个块组成，每个块包含两个 MoE 层:注意力头混合（MoA）和 MLP 专家混合(MoE)。每个 MoA 和 MoE 层有 8 个专家，并且每个输入令牌激活 2 个专家。这种独特的设计使得在不牺牲性能的情况下显著降低了计算成本。

值得一提的是，尽管 JetMoE-8B 的总参数量达到 80 亿，但由于其特殊的架构设计，每个输入令牌仅激活约 22 亿参数，从而大大减少了总体的计算需求。

此外，JetMoE-8B 的训练完全依赖于公开数据，并且整个训练过程，包括代码，都是完全开源的，这无疑为 AI 领域的研究和应用提供了极大的便利。

在与 Open LLM 排行榜相同的评估方法下，JetMoE-8B 的性能表现优于 LLaMA2-7B、LLaMA-13B 和 DeepseekMoE-16B，这一结果无疑是对其高效性能的最好证明。

与此同时，与具有类似训练和推理计算的模型（如 Gemma-2B）相比，JetMoE-8B 展示了更优异的表现。这不仅证明了其在性能上的优势，也展示了其在成本效益上的显著优势。

模型地址：点击这里

「点点赞赏，手留余香」

赞 0 赏

给作者打赏，鼓励TA抓紧创作！

微信

支付宝

还没有人赞赏，快来当第一个赞赏的人吧！

AI AI头条 AI模型

声明：本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符，请将相关资料发送至 admin@mybj123.com 进行投诉反馈，一经查实，立即处理！
码云笔记 » 性能超越LLaMA2-7B！AI模型JetMoE-8B训练成本不到10万美元

热点大师普通

分享到：

相关推荐

清华系发布全新金融AI功夫量化快速完成金融数据分析

清华系发布全新金融AI功夫量化快速完成金融数据分析

三星S25系列将新增电池AI功能：性能不减续航提升10%

三星S25系列将新增电池AI功能：性能不减续航提升10%

AI换装MagicClothing：专注实现可控的换装效果

AI换装MagicClothing：专注实现可控的换装效果

谷歌 AI 在 YouTube 引用量猛增 25%，医疗行业引领增长潮流

谷歌 AI 在 YouTube 引用量猛增 25%，医疗行业引领增长潮流

出租司机先别慌智驾行业的程序员们会更早被AI抢饭碗

出租司机先别慌智驾行业的程序员们会更早被AI抢饭碗

Meta发布类GPT-4o多模态模型Chameleon

Meta发布类GPT-4o多模态模型Chameleon

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低 50%

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低 50%

Domo AI新增乐高、美国漫画等4个风格新用户可免费试用15个点数

Domo AI新增乐高、美国漫画等4个风格新用户可免费试用15个点数

发表回复取消回复

要发表评论，您必须先登录。