阿里云通义千问开源!70亿参数模型上线魔搭社区,免费可商用

134次阅读

8 月 3 日,阿里云开源通义千问 70 亿参数模型,包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。此举让阿里云成为国内首个加入大模型开源行列的大型科技企业。

通义千问开源!8 月 3 日,AI 模型社区魔搭 ModelScope 上架两款开源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云确认其为通义千问 70 亿参数通用模型和对话模型,两款模型均开源、免费、可商用。在多个权威测评中,通义千问 7B 模型取得了远超国内外同等尺寸模型的效果,成为当下业界最强的中英文 7B 开源模型。

今年 4 月,阿里云推出自研大模型通义千问,引发井喷式的市场需求。此次小型化模型版本开源,有望抹平模型使用门槛,让海量中小企业和 AI 开发者更早、更快地用上通义千问。这一举动也让阿里云成为国内首个加入大模型开源行列的大型科技企业。

Qwen-7B 是支持中、英等多种语言的基座模型,在超过 2 万亿 token 数据集上训练,上下文窗口长度达到 8k。Qwen-7B-Chat 是基于基座模型的中英文对话模型,已实现与人类认知对齐。开源代码支持对 Qwen-7B 和 Qwen-7B-Chat 的量化,支持用户在消费级显卡上部署和运行模型。

用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

阿里云通义千问开源!70 亿参数模型上线魔搭社区,免费可商用

通义千问 7B 预训练模型在多个权威基准测评中表现出色,中英文能力远超国内外同等规模开源模型,部分能力甚至“跃级”赶超 12B、13B 尺寸开源模型。

在英文能力测评基准 MMLU 上,通义千问 7B 模型得分超过一众 7B、12B、13B 主流开源模型。该基准包含 57 个学科的英文题目,考验人文、社科、理工等领域的综合知识和问题解决能力。

在中文常识能力测评基准 C -Eval 上,通义千问在验证集和测试集中都是得分最高的 7B 开源模型,展现了扎实的中文能力。相比英文世界热闹的 AI 开源生态,中文社区缺少优秀的基座模型。通义千问的加入有望为开源社区提供更多选择,推动中国 AI 开源生态建设。

阿里云通义千问开源!70 亿参数模型上线魔搭社区,免费可商用

在数学解题能力评测 GSM8K、代码能力评测 HumanEval 等基准上,通义千问 7B 模型也有不俗表现,胜过所有同等尺寸开源模型和和部分大尺寸开源模型。

阿里云表示,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。

附:开源地址

魔搭 ModelScope:

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face:https://huggingface.co/Qwen

GitHub:https://github.com/QwenLM/Qwen-7B

开源生态对促进中国大模型的技术进步与应用落地至关重要。今年 7 月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等全方位服务。2022 年阿里云牵头发起 AI 模型社区魔搭,以 AI 模型为核心服务 AI 开发者。目前,魔搭聚集了 20 多家顶尖人工智能机构贡献的 1000 多款开源模型,已经成为中国大模型开源第一门户。(完 / 供图)

注:请在转载文章内容时务必注明出处!

举报 / 反馈

原文链接:https://baijiahao.baidu.com/s?id=1773287260470680977&wfr=spider&for=pc

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-05发表,共计1500字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。