ChatGPT,魔法失灵了?

93次阅读

  【天极网 IT 新闻频道】ChatGPT, 魔法失灵了!

   数据统计, 在自今年 1 月以来,ChatGPT 的访问量增速, 正在节节下滑。

  1 月,131.6%;2 月,62.5%;3 月,55.8%;4 月,12.6%; 到了 5 月, 就只剩 2.8%。

   如果说, 前面几个月还是缓慢增长, 那么到了 6 月, 下滑已然出现, 成为笼罩在 ChatGPT 头顶的一片阴云。截至 6 月 20 日, 访问量比 5 月少了 38% 左右, 也就是说, 如无意外, 到 6 月 30 日,ChatGPT 的网页访问, 将首次出现负增长。

   此外,AceCamp 数据更是显示,ChatGPT 在内, 几乎所有的 AI 聊天机器人, 都已经出现用户增长停滞, 乃至下滑。与年初的风光无量形成鲜明对比。摩根士丹利 6 月初的一项数据进一步补充, 仅有 16% 的受访者使用过 ChatGPT,4% 的用户成为 ChatGPT 的重度用户。同一时期, 谷歌 Bard 的使用人数, 更是只有 9%。

图片 1.png

   仅仅半年时间过去, 大模型就从开局巅峰, 走向下滑谷底, 成为最短命的风口?

   答案或许并没有这么简单。

  01 ChatGPT, 究竟怎么了?

  ChatGPT 数据真的下滑了吗?

   或许这只是一个统计口径选择, 带来的误会。

  ChatGPT 访问量下滑, 出自一个叫做 SimilarWeb 的国外网站数据分析工具, 该网站统计的口径来源为 ChatGPT 网站的访问量。

   但众所周知, 作为一个爆款 AI 应用,ChatGPT 的客群, 主要包括了两方面: 其一,ChatGPT 网站自身的 C 端用户; 其二, 使用 ChatGPT 对外 API 接口的各种下游 B 端应用。

   也就是说, 随着越来越多的 APP 使用 ChatGPT 的 API 接口,SimilarWeb 的数据已经逐渐失真。

  6 月初流传出的一份闭门会议纪要, 也佐证了这一猜想的正确:Open AI CEO  阿尔特曼表示,ChatGPT 未来的核心战略使命, 是吸引更多的企业应用程序接入 API, 而非在 C 端, 与自己的企业客户争夺流量。

   为什么要把自己从一个 C 端爆火的超级 AI 应用, 变成一个听来并不性感的 API 企业?

   一个非常基础的认知是, 随着使用 ChatGPT 的时间增长, 越来越多的用户发现,ChatGPT, 其实并不像我们所想的那样万能。当我们用 ChatGPT 搜寻资料时,AI 经常会凭空编造出一个并不存在的答案。有人用 GPT- 4 做了个测试后发现, 相同的问题, 不同的提问阶段,GPT- 4 给出的回答不尽相同, 甚至时间越近, 错误率越高。

   这是什么道理? 针对这种通用大模型的“胡说八道”, 科研界将其称作大模型的记忆幻觉。

   所谓记忆幻觉, 指的是,AI 大模型所生成的内容, 并不是来源于现实世界, 而是大模型自己“想象”出的内容。比如 AI 给出的一些看似权威的论文、法律、名人、历史, 经过检索, 就会发现这些内容在真实世界中并不存在。

   这种幻觉的来源, 与大模型的底层逻辑有关——AI 本身并不理解自己所说的内容, 而是仅仅根据自己吸收的内容进行学习模仿。

   那么这种 AI 幻觉, 是否有可能被消除?

   当前的方法, 主要有三个流派:

   其一, 奖励 AI 的每个正确推理过程, 而不只是简单的奖励推理结果。

   其二, 使用知识图谱, 蒙特卡洛树搜索算法等方式, 进行算法层面的改进;

   其三, 针对特定场景, 使用垂直优质数据, 训练出基础认知就能达到专家级的行业大模型。

   第三种, 其实也正是 Open AI 选择将越来越多精力转移到 B 端应用 API 接口的根本原因。

   同时, 这也正是无数 AI 大模型企业正暗中角力的另一隐秘战场。

  02 API 能解千愁吗?

   尽管 Open AI 正将越来越多的精力放到更行业, 更垂直的 API 应用之上, 但业内的另一个观点则是: 垂直 API 虽好, 但却并不是一把万能的锤子。

   开放 API, 仅仅意味着在将现成的模型开发好之后, 给客户一个接口, 所有的升级、数据来源, 依旧是由 Open AI  提供, 这样的 API 接口, 距离客户将其工程化落地, 其实还有相当长一段距离。

   众数信科 CEO 吴炳坤举了个例子“很多  AI  大厂现在不会将大模型微调为行业专用模型的能力开放出来。”但“站在客户角度, 行业客户最为看重的是定制化的需求, 以及 AI 企业的工程化落地能力。”

   也就是说, 如果想要 AI 更好落地, 开放 API 接口是远远不够的, 需要大模型企业将自己的底层模型直接开放给下游客户, 让其基于大模型本身, 进行微调或再训练, 甚至直接参与到大模型的研发过程。

   很显然, 没有任何 AI 企业, 愿意随意将自己的 AI 大模型底层核心技术随便开放给下游。

   而众数信科的股权架构, 则给予了他们能够深度参与行业, 同时也能参与大模型定制化开发的能力。

   天眼查数据显示, 众数信科成立于 2021 年, 专注于数字城市的数据及场景的产品定义和运营。其三大股东, 分别是云从科技、厦门火炬创投、民生电商, 其商业模式为无需财政付费、可自我造血的“政府搭台、国企主导、产业联合运营”数字经济新模式。

   天眼查数据显示, 众数信科成立于 2021 年, 专注于数字城市的数据及场景的产品定义和运营。其三大股东, 分别是云从科技、厦门火炬创投、民生电商, 其商业模式为无需财政付费、可自我造血的“政府搭台、国企主导、产业联合运营”数字经济新模式。

   得益于与云从科技之间的股东关系, 作为一家专注于 AI 落地的创业公司, 众数信科也能够参与到大模型的开发过程, 甚至在云从从容大模型的基础上, 训练出自己的专业模型。

   这种基于通用大模型训练行业大模型的意义, 在云从科技创始人周曦看来: 如果没有强大的基础大模型, 行业大模型将失去长期生命力以及成本控制力; 如果只有通用大模型, 就无法在具体需求上做到极致。

   两者之间的关系, 就像是武术中的内功心法以及外在招式; 只有互相搭配, 才能发挥出更高效用。

   而这种内功心法与外在招式的内外兼修, 也成了众数信科成立不久, 就能接连拿下政企大单的底气所在。

  03  落地才是硬道理

   在联合云从, 在从容大模型基础上定制自己的专属大模型后, 困扰众数信科的第二个问题就变成了如何更快速的落地?

   依旧是众数信科的股东结构, 我们可以得到这个问题的答案。

图片 2.png

   三大股东: 云从科技、厦门火炬创投、民生电商, 云从提供用于微调的底层大模型, 厦门火炬创投提供下游产业化落地的上下游撮合, 民生电商提供资金支持。

   有了技术, 有了产业链资源, 也有了钱, 距离大模型真正落地就只差最后一步, 用于训练行业大模型的数据。

   这正是众数信科的强项。过去两年, 通过搭建“众寻知识智能化平台”的技术优势和“i 城市生活平台”两大平台, 其中,“i 城市生活服务平台”已经签约 16 个城市, 服务覆盖 3000 万的个人用户和数十万的企业用户, 让众数信科积累了丰富的行业语料数据。

   基于以上技术、资源、资本以及语料库层面的优势, 众数信科当前在城市生活服务领域, 教育、养老和文旅三大场景跑出了自己独特的优势。

   以城市生活服务中的海关政策智能 AI 解读这一细分领域举例:

   对众多跨国公司, 以及跨境电商企业来说, 单是一个基础的入关清关, 就需要拆分成订单申报、支付申报、运单申报、清单申报、三单对碰多个环节, 每个环节都涉及到不同的部门、法规以及政策文件, 如何跟上这些不断变化的政策以及数千份文件, 需要企业花费巨大的精力以及投入, 而对海关来说, 大量的咨询以及政策变动, 也会导致他们人力资源的紧张。

   如果有 AI 的帮助, 入关清关的准备工作, 就能够被大大简化。

   通过多年积累以及大模型加持, 众数信科打造了用于海关通关政策问答应用“海关政策  AI  精灵”。基于海关总署 2000 多份材料, “海关政策  AI  精灵”形成了本地的知识库, 通过语义分割、语义检索、  实现  prompt learning , 构造精准提示词, 让模型能精确地按照本地的知识库来回答用户的问题。

   这一思路, 一方面可以明确提问者问题所涉及的具体政策文件; 另一方面, 彻底解决大语言模型存在的   知识局限和数据偏见问题, 让解答更专业。

   另外, 针对政策的变化,“海关政策  AI  精灵”还可以根据政策调整和变化更新本地知识

   库, 同时通过用户的问答的正、负反馈意见, 实现基本 RLHF( Reinforcement Learning from Human Feedback ) 的模型优化与微调。

   在教育领域, 众数信科还开发了 ” 智能教育 AI 精灵 ”, 在厦门地区的部分学校、教育培训机构试点使用, 从 AI 内容生成辅助教学切入, 充当教师的教学助手, 并为学生做出千人千面的发展评价, 未来逐步实现因人施教, 着力打造优秀教师数字分身, 将先进地区优秀教学经验通过 AI 学习传承复制, 解决三四线城市的教育资源匮乏问题。

  04  大模型没有失灵, 但死亡谷正在加速到来

   上世纪九十年代, 美国航空航天局 (NASA)  发布了一份《TRL 白皮书》 (Technology ReadinessLevels, 缩写为 TRL), 将技术的成熟度, 分为九个等级:

  1 基本原理被发现

  2 形成技术概念或初步应用方案

  3 进入关键功能实验室验证阶段

  4 技术方案在实验环境中验证

  5 技术方案在相关环境中验证

  6 技术方案在模拟环境下系统验证

  7 真实环境下的系统演示

  8 定型试验

  9 运行与评估。

   在这 9 个等级中, 高校与机构科研人员擅长 1 - 3 环节下的基础研究; 企业为追求利润, 更倾向于进行 8 - 9 环节中的具体产品设计与生产, 相应地, 中间的 4 - 7 环节, 就成了所有技术从实验室走向行业普惠中间的死亡之谷。

图片 3.png

   如今的大模型, 死亡之谷正加速到来。

   如何让大模型在应用中真的降本增效, 如何让中小企业也能用得上用得好 AI, 如何减少大模型应用中的 AI 幻觉, 这些都是死亡谷中, 一个又一个必须解决的现实问题。

   这些问题, 既不像 ChatGPT 可以在短时间内, 吸引全世界的目光, 也没像最早发布大模型论文提出通往 AGI 可能性一样的性感。跨越死亡谷的解法只有一条, 一步步夯实通用大模型基础, 深耕行业, 让 AI 从高高的神坛走下, 成为普惠每一个普通人生活的基础设施。

类型:广告

免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。

原文链接:http://news.yesky.com/hotnews/205/2147466205.shtml

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-07-04发表,共计4180字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。