荷兰内梅亨大学近日发布研究报告,指出 Meta 和 OpenAI 等公司在使用“开源”术语时容易误导用户,部分标记为“开源”的大语言模型实际上并非开源的。
该报告特别提及了 Meta 公司的 Llama 2 模型和 OpenAI 的 GPT / codex 模型,表示训练这些大语言模型的代码并未向公众开放。
研究人员表示,当前 AI 社区中 ,缺乏开源大语言模型问题日益突显。 研究人员呼吁公司发布更多的开源 LLM,以便研究人员和开发人员可以访问代码并提高这些模型的性能。
OpenAI 的 ChatGPT 模型是最“神秘”的,不符合开源标准;而 Meta 的 Llama 2 虽然宣称是“开源”,但实际透明度只是稍微优于 ChatGPT 模型,在开源排行榜上的程度依然很低。
研究报告认为这些公司主要出于以下几点原因:
-
想要保护自己的知识产权
-
想要控制如何使用大语言模型
而研究人员和开发人员在面临开源大语言模型上存在天然的弱势,可能无法研究论文结果、改进现有大语言模型的性能。
Meta 的立场是讽刺的,因为该公司自豪地说,Llama 2 可用于研究。即便如此,该公司似乎仍将该项目的某些部分锁定在开发人员和研究人员之外。
IT 之家在此附上论文链接地址,感兴趣的用户可以深入阅读。
本文转载自 IT 之家。本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在 30 日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
原文链接:https://www.donews.com/news/detail/4/3627753.html
正文完