通义千问宣布开源

127次阅读
通义千问宣布开源

经济观察网 记者 钱玉娟

继海外开源大模型体系推出并实现商用化后,8 月 3 日,阿里云宣布其自研的大模型通义千问正式开源,成为首个宣布大模型开源的大型中国互联网科技公司。具体来看,通义千问 70 亿参数的通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat,均上架在 AI 模型社区魔搭 ModelScope,开源、免费、可商用。

据了解,魔搭社区是阿里云在 2022 年牵头发起的一个 AI 模型社区,借此服务 AI 开发者。官方数据显示,目前魔搭社区聚集了超 20 家顶尖人工智能机构贡献的 1000 多款开源模型,是中国大模型开源的第一门户。

不过,在此之前的 6 月,由王小川创立的人工智能创新科技公司百川智能,先后推出了 70 亿规模参数的 Baichuan-7B 开源模型,以及号称拥有 130 亿的参数规模的 Baichuan-13B 模型,率先成为国内推行完全开源、免费可商用的大模型创业公司。

在加入魔搭社区的开发者飞鲸看来,尽管通义千问开源的模型参数只有 70 亿,但经过微调后,模型的数学推理能力表现不错,“对于一些常见的加减乘除应用题,答得还可以。”

伴随通义千问开源消息发出,两个模型在社区上架后,应用开发者等用户既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat 两个模型。当用户使用上述开源大模型体系的过程中,阿里云会提供包括模型训练、推理、部署、精调等在内的全套服务。

今年 4 月推出自研大模型通义千问后,今年 7 月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等服务。

谈及当前国内外开源的模型,飞鲸认为对包括他在内的开发者们帮助极大,“可以基于自己的业务领域需求,做 finetune(微调)或者和本地知识库对接,实现快速地业务落地。”

飞鲸告诉记者,在一些垂直领域并不需要参数量很高、通用能力很强的模型,而是“希望一些小甜点”,他举例到,比如几十到百亿左右参数规模的模型,结合垂直领域数据,就可以发挥很好的价值。

阿里云方面认为,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。

举报 / 反馈

原文链接:https://baijiahao.baidu.com/s?id=1773316888306740427&wfr=spider&for=pc

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-05发表,共计984字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。