(图片来源:摄图网)
8 月 3 日,阿里云宣布开源了通义千问 70 亿参数模型,这 包括了通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。这两款模型已经上线了魔搭社区,而且是开源、免费、可商用的。此举使得阿里云成为了国内首个加入大模型开源行列的大型科技企业。
其中,Qwen-7B 是一种支持中英等多种语言的基座模型,它是在超过 2 万亿 token 数据集上进行训练的,上下文窗口长度达到了 8k。而 Qwen-7B-Chat 则是基于 Qwen-7B 的中英文对话模型,已经实现了与人类认知的对齐。开源代码支持对 Qwen-7B 和 Qwen-7B-Chat 进行量化,用户可以在消费级显卡上部署和运行这些模型。用户可以直接从魔搭社区下载这些模型,也可以通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat。阿里云为用户提供了包括模型训练、推理、部署、精调等全方位的服务。
阿里云的开源行动也有助于推动人工智能领域的发展。通过将大模型开源,可以吸引更多的开发者和研究人员参与到模型的优化和改进中来。AIGC 全称为 AI-Geneated Content, 指基于大型预训练模型、生成对抗网络 GAN 等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。
——AIGC 产业链剖析
目前,我国 AIGC 产业已涌入了互联网大厂,AI 公司、生态场景链公司。研究机构等多类参与者。由于产业发展相对有限,目前各类玩家间区别相对有限。在我国的 AIGC 产业中,应用层是最适合初创企业进入的部分,因此目前应用层的企业竞争也是最为激烈。
——主要企业模型研发皆取得重大进展
底层大模型的开发工作是 AIGC 产业链的基础和极为重要的工作。目前国内已经出现了多家专门从事大模型开发及延展应用的公司,这些公司在模型研发上都取得了突破性的重大进展。
——AIGC 多行业渗透,渗透度高
根据 IDC 的数据,2022 年中国人工智能行业应用渗透度排名前五的行业依次是互联网、金融、政府、电信和制造。此外,人工智能为自动驾驶和交通物流领域带来的价值也非常重要,据麦肯锡预计,人工智能为交通领域创造了 3800 亿元的经济价值。
——AIGC 市场规模预测
据前瞻产业研究院测算,到 2023 年,我国的人工智能与大数据产业市场规模预计将达到 170 亿人民币。在 2023 年至 2025 年期间,这将是我国人工智能与大数据产业市场规模增长的第一阶段,增长率将保持在 25% 左右,到 2025 年市场规模预计将达到约 260 亿人民币。从 2025 年开始,随着行业生态的不断完善,尤其是底层大模型对外开放,应用层将会蓬勃发展,这将推动产业快速增长,年复合增长率预计将超过 70%。预计到 2027 年,我国人工智能与大数据产业规模将超过 600 亿人民币。从 2028 年开始,人工智能与大数据产业将延展出完整的产业链,并在商业化场景上持续扩展和深化,深刻改变各行业。到 2028 年,我国人工智能与大数据产业规模将继续保持高速增长,预计到 2030 年市场规模将超过万亿人民币。
智源研究院院长黄铁军认为,大模型具备三个关键条件。首先,大模型的规模要庞大,参数数量要达到百亿以上。其次,大模型要具备涌现性,即能够产生出预料之外的新能力。最后,大模型要具备通用性,不仅仅限于特定问题或领域,而是能够处理多种不同的任务。黄铁军院长强调,大模型技术体系是共建共享的。他认为我们应该共同努力构建一个满足智力社会需求的基础算法体系。
黄铁军院长的观点强调了大模型的重要性和发展方向。大模型不仅仅是一个技术问题,更是一个需要社会共同努力的战略性任务。通过共建共享的方式,我们可以共同推动大模型技术的发展,进一步提升人工智能的水平和应用能力,为智力社会的建设做出贡献。
原文链接:https://i.ifeng.com/c/8RySlv6KVIC