作为开放科学计划的一部分,学术志愿者的国际合作正在以新的 1750 亿参数模型进入大型语言模型领域。
经过价值 700 万美元的公共资助计算时间的训练,BLOOM 语言模型将与谷歌和 OpenAI 等科技巨头的类似模型并驾齐驱。
除了其协作项目和开源该项目的决定之外,BLOOM 还是该规模的第一个多语言模型,并将用于研究用途。
开放的方法
大型语言模型是 ML 算法,可通过利用大量基于文本的数据集(用于训练人类语言)来识别、预测和生成人类语言。他们可以回答问题、撰写论文或生成具有有限指令的计算机代码。事实上,帮助软件开发人员编写代码的 GitHub Copilot 由 Codex 提供支持,Codex 本身是由著名的 GPT-3 模型改造而来的。
由于训练此类模型需要大量计算,迄今为止,大型语言模型都是由拥有强大财务支持的大型科技公司构建的。然而,在幕后,该模型由相对较小的团队掌舵,他们运用容易获得的资源,例如在线存储库或 Reddit 等热门网站来获取数据来训练模型。
据《自然》报道,BLOOM 由数百名研究人员共同开发,主要由伦理学家、法律学者和哲学家等学者组成。数据来源是通过一系列研讨会确定的,合作者基础更广泛,包括世界各地的社区团体。据了解,研究人员从大约 500 个来源中精心挑选了 3410 亿文字数据集中的近三分之二。该模型以质量过滤的多语言网络爬网为基础。
......
新闻内容来自以下网站,不代表GoOA头条立场:
https://www.cdotrends.com/story/16577/new-open-science-initiative-setting-ai-free