新闻中心
新闻中心
新闻中心

阿联酋科技集团G42推出开源阿拉伯语AI模型Jais

最近,一群工程师、研究人员以及硅谷的芯片公司CerebrasSystems合作,发布了一款先进的阿拉伯语软件,可为生成式AI应用提供支持。这项名为Jais的大语言模型包含130亿个参数,它是从大批阿拉伯语数据和英语数据中训练而成的,其中一部分来自计算机代码。之所以启动这个项目,是因为该小组认为目前具有双语能力的大型语言模型很少。Jais的训练是在CerebrasSystems生产的超级计算机CondorGalaxy上完成的。今年,Cerebras宣布已经向阿联酋科技集团G42出售了三台这样的超级计算机,第


最近,一群工程师、研究人员以及硅谷的芯片公司Cerebras Systems合作,发布了一款先进的阿拉伯语软件,可为生成式AI应用提供支持。

这项名为Jais的大语言模型包含130亿个参数,它是从大批阿拉伯语数据和英语数据中训练而成的,其中一部分来自计算机代码。之所以启动这个项目,是因为该小组认为目前具有双语能力的大型语言模型很少。

Jais的训练是在Cerebras Systems生产的超级计算机Condor Galaxy上完成的。今年,Cerebras宣布已经向阿联酋科技集团G42出售了三台这样的超级计算机,第一台将在今年交付,其余两台将在2024年交付。与Jais的合作方还包括Mohamed bin Zayed人工智能大学和G42的子公司Inception。

由于用于训练Jais这种规模模型的阿拉伯语数据不足,英语数据中的计算机代码有助于训练模型的推理能力。Mohamed bin Zayed大学教授Timothy Baldwin表示,代码可以“大大提高模型的推理能力,因为它详细说明了(逻辑)步骤”。

Jais将通过开源许可方式提供。阿联酋G42推出这一开源阿拉伯语AI模型,有助促进阿语资源的开发,也体现了该国推动AI发展的决心。其开源性质也使更多研发团队能参与 Arabic AI的建设,为阿拉伯世界的 AI进步贡献力量。



稿源:站长之家


地址:辽宁省沈阳市和平区文化路17号
电话:024-31501869 024-31501801
邮箱:market@qcong.com.cn
copyright © 2022 青葱科技 All Rights Reserved  技术支持:青葱科技  辽ICP备2021000932号-1