ChatGPT,魔法失灵了!
数据统计,在自今年 1 月以来,ChatGPT 的访问量增速,正在节节下滑。
1 月,131.6%;2 月,62.5%;3 月,55.8%;4 月,12.6%;到了 5 月,就只剩 2.8%。
如果说,前面几个月还是缓慢增长,那么到了 6 月,下滑已然出现,成为笼罩在 ChatGPT 头顶的一片阴云。截至 6 月 20 日,访问量比 5 月少了 38% 左右,也就是说,如无意外,到 6 月 30 日,ChatGPT 的网页访问,将首次出现负增长。
此外,AceCamp 数据更是显示,ChatGPT 在内,几乎所有的 AI 聊天机器人,都已经出现用户增长停滞,乃至下滑。与年初的风光无量形成鲜明对比。摩根士丹利 6 月初的一项数据进一步补充,仅有 16% 的受访者使用过 ChatGPT,4% 的用户成为 ChatGPT 的重度用户。同一时期,谷歌 Bard 的使用人数,更是只有 9%。
仅仅半年时间过去,大模型就从开局巅峰,走向下滑谷底,成为最短命的风口?
答案或许并没有这么简单。
01 ChatGPT,究竟怎么了?
ChatGPT 数据真的下滑了吗?
或许这只是一个统计口径选择,带来的误会。
ChatGPT 访问量下滑,出自一个叫做 SimilarWeb 的国外网站数据分析工具,该网站统计的口径来源为 ChatGPT 网站的访问量。
但众所周知,作为一个爆款 AI 应用,ChatGPT 的客群,主要包括了两方面:其一,ChatGPT 网站自身的 C 端用户;其二,使用 ChatGPT 对外 API 接口的各种下游 B 端应用。
也就是说,随着越来越多的 APP 使用 ChatGPT 的 API 接口,SimilarWeb 的数据已经逐渐失真。
6 月初流传出的一份闭门会议纪要,也佐证了这一猜想的正确:Open AI CEO 阿尔特曼表示,ChatGPT 未来的核心战略使命,是吸引更多的企业应用程序接入 API,而非在 C 端,与自己的企业客户争夺流量。
为什么要把自己从一个 C 端爆火的超级 AI 应用,变成一个听来并不性感的 API 企业?
一个非常基础的认知是,随着使用 ChatGPT 的时间增长,越来越多的用户发现,ChatGPT,其实并不像我们所想的那样万能。当我们用 ChatGPT 搜寻资料时,AI 经常会凭空编造出一个并不存在的答案。有人用 GPT- 4 做了个测试后发现,相同的问题,不同的提问阶段,GPT- 4 给出的回答不尽相同,甚至时间越近,错误率越高。
这是什么道理?针对这种通用大模型的“胡说八道”,科研界将其称作大模型的 记忆幻觉。
所谓记忆幻觉,指的是,AI 大模型所生成的内容,并不是来源于现实世界,而是大模型自己“想象”出的内容。比如 AI 给出的一些看似权威的论文、法律、名人、历史,经过检索,就会发现这些内容在真实世界中并不存在。
这种幻觉的来源,与大模型的底层逻辑有关——AI 本身并不理解自己所说的内容,而是仅仅根据自己吸收的内容进行学习模仿。
那么这种 AI 幻觉,是否有可能被消除?
当前的方法,主要有三个流派:
其一,奖励 AI 的每个正确推理过程,而不只是简单的奖励推理结果。
其二,使用知识图谱,蒙特卡洛树搜索算法等方式,进行算法层面的改进;
其三,针对特定场景,使用垂直优质数据,训练出基础认知就能达到专家级的行业大模型。
第三种,其实也正是 Open AI 选择将越来越多精力转移到 B 端应用 API 接口的根本原因。
同时,这也正是无数 AI 大模型企业正暗中角力的另一隐秘战场。
API 能解千愁吗?
尽管 Open AI 正将越来越多的精力放到更行业,更垂直的 API 应用之上,但业内的另一个观点则是:垂直 API 虽好,但却并不是一把万能的锤子。
开放 API,仅仅意味着在将现成的模型开发好之后,给客户一个接口,所有的升级、数据来源,依旧是由 Open AI 提供,这样的 API 接口,距离客户将其工程化落地,其实还有相当长一段距离。
众数信科 CEO 吴炳坤举了个例子“很多 AI 大厂现在不会将大模型微调为行业专用模型的能力开放出来。”但“站在客户角度,行业客户最为看重的是定制化的需求,以及 AI 企业的工程化落地能力。”
也就是说,如果想要 AI 更好落地,开放 API 接口是远远不够的,需要大模型企业将自己的底层模型直接开放给下游客户,让其基于大模型本身,进行微调或再训练,甚至直接参与到大模型的研发过程。
很显然,没有任何 AI 企业,愿意随意将自己的 AI 大模型底层核心技术随便开放给下游。
而 众数信科的股权架构,则给予了他们能够深度参与行业,同时也能参与大模型定制化开发的能力。
天眼查数据显示,众数信科成立于 2021 年,专注于数字城市的数据及场景的产品定义和运营。其三大股东,分别是云从科技、厦门火炬创投、民生电商,其商业模式为无需财政付费、可自我造血的“政府搭台、国企主导、产业联合运营”数字经济新模式。
得益于与云从科技之间的股东关系,作为一家专注于 AI 落地的创业公司,众数信科也能够参与到大模型的开发过程,甚至在云从从容大模型的基础上,训练出自己的专业模型。
这种基于通用大模型训练行业大模型的意义,在云从科技创始人周曦看来:如果没有强大的基础大模型,行业大模型将失去长期生命力以及成本控制力;如果只有通用大模型,就无法在具体需求上做到极致。
两者之间的关系,就像是武术中的内功心法以及外在招式;只有互相搭配,才能发挥出更高效用。
而这种内功心法与外在招式的内外兼修,也成了众数信科成立不久,就能接连拿下政企大单的底气所在。
落地才是硬道理
在联合云从,在从容大模型基础上定制自己的专属大模型后,困扰众数信科的第二个问题就变成了如何更快速的落地?
依旧是众数信科的股东结构,我们可以得到这个问题的答案。
三大股东:云从科技、厦门火炬创投、民生电商,云从提供用于微调的底层大模型,厦门火炬创投提供下游产业化落地的上下游撮合,民生电商提供资金支持。
有了技术,有了产业链资源,也有了钱,距离大模型真正落地就只差最后一步,用于训练行业大模型的数据。
这正是众数信科的强项。过去两年,通过搭建“众寻知识智能化平台”的技术优势和“i 城市生活平台”两大平台,其中,“i 城市生活服务平台”已经签约 16 个城市,服务覆盖 3000 万的个人用户和数十万的企业用户,让众数信科积累了丰富的行业语料数据。
基于以上技术、资源、资本以及语料库层面的优势,众数信科当前在城市生活服务领域,教育、养老和文旅三大场景跑出了自己独特的优势。
以城市生活服务中的海关政策智能 AI 解读这一细分领域举例:
对众多跨国公司,以及跨境电商企业来说,单是一个基础的入关清关,就需要拆分成订单申报、支付申报、运单申报、清单申报、三单对碰多个环节,每个环节都涉及到不同的部门、法规以及政策文件,如何跟上这些不断变化的政策以及数千份文件,需要企业花费巨大的精力以及投入,而对海关来说,大量的咨询以及政策变动,也会导致他们人力资源的紧张。
如果有 AI 的帮助,入关清关的准备工作,就能够被大大简化。
通过多年积累以及大模型加持,众数信科打造了用于海关通关政策问答应用“海关政策 AI 精灵”。基于海关总署 2000 多份材料,“海关政策 AI 精灵”形成了本地的知识库,通过语义分割、语义检索、实现 prompt learning,构造精准提示词,让模型能精确地按照本地的知识库来回答用户的问题。
这一思路,一方面可以明确提问者问题所涉及的具体政策文件;另一方面,彻底解决大语言模型存在的 知识局限和数据偏见问题,让解答更专业。
另外,针对政策的变化,“海关政策 AI 精灵”还可以根据政策调整和变化更新本地知识
库,同时通过用户的问答的正、负反馈意见,实现基本 RLHF(Reinforcement Learning from Human Feedback)的模型优化与微调。
在教育领域,众数信科还开发了 ” 智能教育 AI 精灵 ”,在厦门地区的部分学校、教育培训机构试点使用,从 AI 内容生成辅助教学切入,充当教师的教学助手,并为学生做出千人千面的发展评价,未来逐步实现因人施教,着力打造优秀教师数字分身,将先进地区优秀教学经验通过 AI 学习传承复制,解决三四线城市的教育资源匮乏问题。
大模型没有失灵,但死亡谷正在加速到来
上世纪九十年代,美国航空航天局(NASA) 发布了一份《TRL 白皮书》(Technology ReadinessLevels, 缩写为 TRL),将技术的成熟度,分为九个等级:
1 基本原理被发现
2 形成技术概念或初步应用方案
3 进入关键功能实验室验证阶段
4 技术方案在实验环境中验证
5 技术方案在相关环境中验证
6 技术方案在模拟环境下系统验证
7 真实环境下的系统演示
8 定型试验
9 运行与评估。
在这 9 个等级中,高校与机构科研人员擅长 1 - 3 环节下的基础研究;企业为追求利润,更倾向于进行 8 - 9 环节中的具体产品设计与生产,相应地,中间的4- 7 环节,就成了所有技术从实验室走向行业普惠中间的死亡之谷。
如今的大模型,死亡之谷正加速到来。
如何让大模型在应用中真的降本增效,如何让中小企业也能用得上用得好 AI,如何减少大模型应用中的 AI 幻觉,这些都是死亡谷中,一个又一个必须解决的现实问题。
这些问题,既不像 ChatGPT 可以在短时间内,吸引全世界的目光,也没像最早发布大模型论文提出通往 AGI 可能性一样的性感。跨越死亡谷的解法只有一条,一步步夯实通用大模型基础,深耕行业,让 AI 从高高的神坛走下,成为普惠每一个普通人生活的基础设施。
原文链接:https://www.163.com/dy/article/I8R820FC05118K7K.html