阿布扎比G42发布87亿参数开源印英语言模型NANDA87B,引领语言技术新潮流

12 月 16 日,阿布扎比的人工智能企业 G42 正式对外推出了 NANDA87B。这是一款参数规模达 87 亿的开源印英大型语言模型,是对早期版本 NANDA 的升级之作。目前,NANDA87B 已在穆罕默德・本・扎耶德人工智能大学(MBZUAI)的 Hugging Face 页面上以开放权重的方式开放,开发者、创作者以及企业均可自由使用,并对其功能进行拓展。
该模型由 MBZUAI 与 G42 旗下的 Inception 公司,还有芯片制造商 Cerebras 携手合作开发。NANDA87B 以 Llama-3.170B 模型为基础构建,在超过 650 亿个印地语标记上完成训练,并采用了专门针对印地语的分词器,以此提升训练与推理的效率。
G42 印度首席执行官马努・贾因称:“印度理应拥有能运用本国语言的世界顶尖技术。NANDA87B 正是朝着这一目标迈出的关键一步。”他还补充道,该模型旨在助力印度 AI 生态系统在教育、娱乐、企业等多个领域实现创新。
G42 方面表示,NANDA87B 具备处理正式印地语、日常口语以及混合印地语(Hinglish)的能力,能够完成翻译、摘要撰写、指令遵循和音译等多项任务。此外,该公司在模型设计过程中,充分考虑了安全性和文化一致性,以确保输出结果具有责任性。
穆罕默德・本・扎耶德人工智能大学基础模型研究所执行董事理查德・莫顿表示,此次发布是扩大高级语言技术可及性的重大突破。他称:“NANDA 为全球最大的语言社区之一提供了高质量、开放访问的语言技术,是重要的里程碑。”
NANDA87B 的训练工作是在 G42 与 Cerebras 共同打造的 Condor Galaxy 超级计算系统上开展的。
以上关于阿布扎比G42发布87亿参数开源印英语言模型NANDA87B,引领语言技术新潮流的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 阿布扎比G42发布87亿参数开源印英语言模型NANDA87B,引领语言技术新潮流

微信
支付宝