4月,国内大模型遍地开花

74次阅读

原标题:4 月,国内大模型遍地开花

4月,国内大模型遍地开花插图

作者 | 元鹅 Julie 张

ChatGPT 的火热掀起了国内外对大模型的探索热情,即便是一边呼吁暂停 AI 研究以防“失控的人工智能”的马斯克,近期也被曝正在推特内部启动人工智能项目。

不管是差 GPT“2 个月”还是“3 年”,国内大模型一夜之间已经遍地开花。继百度打响国内大模型第一枪后,目前阿里、京东、华为等互联网大厂,商汤、昆仑万维等科技公司也纷纷推出了自家的大模型,包括内容平台知乎也在 4 月 13 日推出了中文大模型“知海图 AI”。

另一边,王小川、王慧文等互联网大佬的大模型也有了新进展。在获得 5000 万美元启动资金后,4 月 10 日,王小川官宣 AI 大模型公司“百川智能”;王慧文的“光年之外”在 A 轮融资后估值已达到 10 亿美元。

接下来大模型的热潮将继续。虽然没有直接推出大模型产品,但腾讯已经发布“国内性能最强的大模型算力集群”,同花顺、科大讯飞等正在跑步入场。

与此同时,有关大模型的讨论也在继续,我们需要这么多大模型吗?在这场大模型的同台竞技中,谁能最终脱颖而出,打造出中国的 OpenAI?

百度“文心一言”大语言模型

被称为中国版 ChatGPT 的百度“文心一言”于 3 月 16 日 14:00 在百度北京总部大楼正式发布。百度在会上用 PPT 展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

百度同时公布了文心一言的邀请测试方案。发布会后一小时内,排队申请文心一言企业版 API 调用服务测试的企业用户已达 3 万多家,申请产品测试网页多次被挤爆。截至 3 月 27 日,百度文心一言已收到 12 万家企业申请测试。

从港股市场表现来看,发布会当天,百度港股一度跳水跌超 10%,百度当日股价最终跌近 8%。但第二天,百度港股又大涨 13.67%。

不过,作为国内第一款官宣的大模型,文心一言被追捧,也被质疑。

在发布会结束大约一周后,文心一言深陷套皮质疑。

微博博主“刘大可先生”发文质疑文心一言文生图功能抄袭“StableDiffusion”,同时在中文语义理解方面存在局限。他称,找到了对文心一言更多的不利证据,恐怕是和汉芯、鸿蒙一样的东西:套壳、画皮、造假。

3 月 23 日,百度官博发文称,注意到对文心一言文生图功能的相关反馈,并针对质疑做出澄清。百度称,文心一言完全是百度自研的大语言模型,在大模型训练中,其使用的是互联网公开数据,符合行业惯例。

3 月 27 日,百度正式推出“文心千帆”大模型平台。文心千帆大模型平台,整合了百度全套文心大模型、相应的开发工具链,未来还会支持第三方的开源大模型。在现场实时演示中,文心千帆可实现三分钟做 ppt、数字人直播带货、订机票和酒店等操作。

4 月 3 日,百度地图 V18 版本发布。该版本由文心交通大模型和生成式 AI 提供底层支撑,可面向实时交通实现刻画、感知、预测、调度的端到端优化。一同发布的还有领航数字人叶悠悠。介绍称,叶悠悠可与车主实现拟人级语音交互。

阿里云“通义千问”大语言模型

4 月 7 日,在阿里云峰会上,阿里云大语言模型“通义千问”正式推出。

据介绍,通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够帮助用户续写小说,编写邮件等。现阶段该模型主要定向邀请企业用户进行体验测试。

另外,阿里巴巴决定未来将所有产品接入通义千问,进行全面改造。据悉,钉钉、天猫精灵将率先接入通义千问测试,评估认证后正式发布新功能。阿里巴巴集团董事会主席兼 CEO、阿里云智能集团 CEO 张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次。

目前,通义千问仅支持自然语言处理,尚不支持文生图等跨模态功能,不过有知情人士称,后续通义千问也会尽快推出相关大模型,能够支持更多功能。

早在去年 9 月,阿里巴巴就已经发布了通义大模型系列,包括通义 M6、Alice mine 以及视觉模型。单一模型可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务。资源消耗也不高,以当时通义系列中的 M6 大模型为例,相同参数规模下训练能耗仅是 GPT- 3 的 1%。

华为“盘古系列 AI 大模型”

4 月 8 日至 9 日,由中国人工智能学会主办的人工智能大模型技术高峰论坛将在杭州萧山举办。有媒体从华为云官网推测,华为即将上线的“盘古系列 AI 大模型”分别为 NLP 大模型、CV 大模型、科学计算大模型(气象大模型)。

其中 NLP 大模型是被认为最接近人类中文理解能力的 AI 大模型,而 CV 大模型首次兼顾了图像判别与生成能力。盘古 CV 大模型覆盖了工业质检、物流仓库监控、时尚辅助设计等行业;盘古 NLP 大模型覆盖了智能文档检索、智能 ERP、小语种大模型等领域。

4 月 10 日消息,针对上述情况,华为云方面暂未回应。

与此同时,有媒体经从华为云官方微信、微博等官方渠道查证,华为云从未明确表示 4 月将发布新的大模型,也从未透露过有关盘古大模型的产品计划。华为云人工智能领域首席科学家田奇也并未在本次论坛中透露盘古大模型的产品上市计划。知情人士透露,华为云即将上线盘古系列 AI 大模型疑似资本炒作。

商汤日日新大模型

4 月 10 日,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型体系。据悉,日日新大模型体系主要包括自然语言生成、文生图、感知模型标注、以及模型研发功能,即“商量(中文语言模型)”、“秒画(文生图)”、“如影(数字人视频生成)”、“琼宇(场景生成)”,“格物(物体生成)”。

商量:使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。

秒画:可帮助用户轻松地创作高质量的艺术作品,自动生成元素和细节。

如影:可以帮助用户轻松创作视频,支持 AI 数字人动作表情、AI 文案生成、AI 跨语言文稿、AI 素材生成的全栈式智能创作,卡通 / 真实多风格变换自如。

琼宇、格物:它们是商汤科技基于神经辐射场技术(NeRF)的 3D 内容生成平台,可基于 3D 内容生成技术实现对空间和物体的复刻与交互,大到城市数字孪生,小到桌面手办,都能逼真复刻。

商汤方面表示,该技术主要面向 B 端,商汤日日新大模型体系目前仅面向政企客户开放 API 接口,客户可登录商汤官网申请。

不过,商汤在现场展示秒画时,有眼尖的网友发现商汤所演示的精选模型中出现 AI 模型站 civitai 的图片,该模型底部有显示 civitai 的文字水印,引发了网络质疑。

对此,商汤方面表示:秒画 SenseMirage 包含商汤自研 AIGC 大模型,也提供第三方社区开源模型,支持导入多个平台的开源模型或上传用户本地模型。用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。”在现场演示中,该模型底部有显示 civitai 的文字注释。

科大讯飞“1+ N 认知智能大模型”

在今年 3 月举行的沪港创新发展论坛上,科大讯飞集团总裁吴晓如表示,以 ChatGPT 为代表的技术表明机器在自然语言的处理能力上已实现质的飞跃,应该看到和 Open AI 的差距并迎头追上。科大讯飞已储备了一段时间,很快会发布自己的大模型技术。

4 月 11 日,科大讯飞在互动平台表示,讯飞依托认知智能全国重点实验室的长期积累,于 2022 年 12 月份启动生成式预训练大模型“1+N”任务攻关,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

关于讯飞预训练大模型的详细信息将于 2023 年 5 月 6 日产品发布会上进行发布。

受此消息影响,科大讯飞和人工智能板块大涨。

昆仑万维“天工”3.5 大语言模型

4 月 10 日,昆仑万维宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型 ——“天工”3.5 发布在即,并将于 4 月 17 日启动邀请测试。未来,天工”4 和 天工”5 也将与大家见面。

“天工”大模型已经非常接近 OpenAI ChatGPT 的智能水平。ChatGPT 是基于 GPT3.5 大模型,因此昆仑万维把此版本命名为“天工”3.5。“天工”作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景。

4 月 11 日,昆仑万维在前一天暴跌之后,当天强势反弹大涨 9.5%,其中盘中最高上涨近 16%。

与此同时,昆仑万维 4 月 11 日收深交所关注函,要求说明“天工”3.5 可能面临的风险。

4 月 13 日,昆仑万维回复深交所关注函时表示,“天工”3.5 可能面临的风险包括:技术研发进展不及预期的风险;应用实践商业化不及预期风险等。昆仑万维表示,目前公司 AIGC、人工智能等业务产品尚未产生实际收入,预计对公司 2023 年财务状况不会产生较大贡献。

知乎“知海图 AI”中文大模型

4 月 13 日,知乎创始人、董事长兼 CEO 周源在“2023 知乎发现大会”上宣布,知乎联合面壁智能发布中文大模型“知海图 AI”,邀请 AI 加入知乎“讨论场”。

知乎方面表示,在特定场景中,把“知海图 AI”大模型的效果与 GPT- 4 进行了比较,两个模型几乎是持平的。

“知海图 AI”中文大模型已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。

受此消息影响,知乎美股盘前一度暴涨 15%。

据悉,“知海图 AI”是基于面壁智能自主研发的 CPM 企业级大模型与 ModelForce 大模型系统。

面壁智能团队早在 2020 年底就发布了首个中文大语言模型 CPM-1,三年时间内又陆续发布了 CPM-2、CPM- 3 和 CPM-Ant、CPM-Bee 等开源模型。

毫末智行“雪湖·海若”自动驾驶算法模型

4 月 11 日,毫末智行正式官宣首个应用 GPT 模型和技术逻辑的自动驾驶算法模型,中文名“雪湖·海若”。

该自动驾驶生成式大模型“雪湖·海若”通过引入驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶认知决策模型进行持续优化,最终实现端到端自动驾驶。

据介绍,“雪湖·海若”通过引入驾驶数据建立 RLHF 技术,对自动驾驶认知决策模型进行持续优化,最终目标是实现端到端自动驾驶,现阶段主要用于解决自动驾驶的认知决策问题。

目前,“雪湖·海若”实现了模型架构与参数规模的升级,参数规模达到 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据。

据了解,2021 年,毫末智行在推出数据智能体系 MANA 的同时,也宣布要借助大模型提升数据处理能力,从而加速 HPilot 智能辅助驾驶产品的进化。

王小川成立“百川智能”

4 月 10 日,搜狗创始人王小川正式宣布入局中国大模型创业,和前搜狗 COO 茹立云联合创立人工智能公司,旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用。

王小川在公开信中表示,新公司名为“百川智能”,目前已初步组建了 50 人的团队,获 5000 万美元启动资金,争取年内发布国内最好的大模型和颠覆性的产品。

据悉,百川智能以前搜狗团队为基础,快速融合了来自百度、华为、微软、字节、腾讯等知名科技公司以及其他创业公司核心成员在内的数十位顶尖 AI 人才。

值得一提的是,近日,王小川与百度副总裁肖阳就国内大模型发展与 OpenAI 之间的差距问题,隔空打起了嘴仗。

这场嘴仗源于王小川对李彦宏谈及“百度的文心一言和 OpenAI 差距可能在两个月左右”的观点不认同。王小川表示:“怎么可能只差两个月?那一定是(在)另一个宇宙。”如果用时间衡量的话,王小川认为 OpenAI 比国内领先三年时间。

针对上述观点,百度副总裁肖阳回应称:“百度做 AI,始终相信长期主义的价值。我们向来不回避与国外的差距,但是这个差距到底在什么位置,一线的都懂。天上一天,人间一年,王小川脱离一线太久,确实跟我们不在一个宇宙。”

今日凌晨,王小川回怼了百度副总裁肖阳的言论。王小川称,“什么样的平行宇宙里,才能做到让一个脱离一线 15 年的人,去怼一个脱离一线 1.5 年的人。”

马斯克被曝入局大模型

据外媒援引知情人士称,特斯拉 CEO 埃隆·马斯克近日在推特内部启动了一项人工智能项目,用于公司的两个数据中心之一。

知情人士透露,尽管马斯克签署了呼吁暂停人工智能开发 6 个月的公开信,但其却暗中在推特推进新的生成式人工智能(AIGC)项目,并为此购买了上万个 GPU(图形处理器),还从谷歌的人工智能部门 DeepMind 招募了人才。

该项目涉及创建一个生成式人工智能,推特将根据自己的海量数据进行训练。一位消息人士称,如果推特不打算将它们用于 AI 工作,几乎没有理由在数据中心级 GPU 上花费这么多钱。

知情人士称,马斯克的人工智能项目还处于早期阶段,尽管其购买如此多的额外计算能力表明他对这个项目给予了很大期望。

此外,今年 2 月,马斯克与人工智能研究人员接洽,商讨成立一个新的研究实验室,以开发 ChatGPT 的竞争对手。

值得一提的是,他不止一次在公开场合称人工智能是一项危险的技术。就在几周前,他还和人工智能研究界和产业界的大佬们一起签署了一篇公开信,呼吁全球所有实验室暂停比 GPT-4 更强的 AI 模型研发,暂停时间至少为 6 个月。返回搜狐,查看更多

责任编辑:

原文链接:http://news.sohu.com/a/666725972_115060

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-10发表,共计5330字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。