新闻详情

一项新的开放科学计划正在让 AI 自由化

发布时间：2022-08-12浏览：27次

栏目：[开放科学] 作者： Paul Mah

关键词：新闻组织

作为开放科学计划的一部分，学术志愿者的国际合作正在以新的 1750 亿参数模型进入大型语言模型领域。

经过价值 700 万美元的公共资助计算时间的训练，BLOOM 语言模型将与谷歌和 OpenAI 等科技巨头的类似模型并驾齐驱。

除了其协作项目和开源该项目的决定之外，BLOOM 还是该规模的第一个多语言模型，并将用于研究用途。

开放的方法

大型语言模型是 ML 算法，可通过利用大量基于文本的数据集（用于训练人类语言）来识别、预测和生成人类语言。他们可以回答问题、撰写论文或生成具有有限指令的计算机代码。事实上，帮助软件开发人员编写代码的 GitHub Copilot 由 Codex 提供支持，Codex 本身是由著名的 GPT-3 模型改造而来的。

由于训练此类模型需要大量计算，迄今为止，大型语言模型都是由拥有强大财务支持的大型科技公司构建的。然而，在幕后，该模型由相对较小的团队掌舵，他们运用容易获得的资源，例如在线存储库或 Reddit 等热门网站来获取数据来训练模型。

据《自然》报道，BLOOM 由数百名研究人员共同开发，主要由伦理学家、法律学者和哲学家等学者组成。数据来源是通过一系列研讨会确定的，合作者基础更广泛，包括世界各地的社区团体。据了解，研究人员从大约 500 个来源中精心挑选了 3410 亿文字数据集中的近三分之二。该模型以质量过滤的多语言网络爬网为基础。

......

新闻内容来自以下网站，不代表GoOA头条立场：

https://www.cdotrends.com/story/16577/new-open-science-initiative-setting-ai-free

一项新的开放科学计划正在让 AI 自由化

来源：CDOTrends

相关新闻