2023 年 4 月 11 日,阿里版 ChatGPT——通义千问,在阿里云峰会上正式亮相。
该模型支持多轮交互及复杂指令理解、多模态融合、外部增强 API 等功能,被官网称为专门响应人类指令的效率助手,也是点子生成机。
除了功能展示,阿里董事局主席兼阿里云 CEO 张勇还公布了该类 GPT 模型的应用规划。
与同行把精力放在模型本身和问答产品的思路不同,阿里更强调云计算和大模型能力的结合,在此基础上“所有行业和服务,都值得重做一遍”。
据悉,已有如 OPPO、吉利、波司登、太古可口可乐等来自不同行业的企业,表示将在对应场景与阿里云大模型共研共创。
从阿里内部看,目前阿里云集团旗下的钉钉、天猫精灵已接入模型进入测试阶段。未来,通义千问还将进一步给淘宝、天猫、高德、夸克等业务赋能,以优化用户体验。
不少网友表示,“无论如何接入最终都会演变成各种推荐,可能比原先用户画像那套好一点”,也有网友的第一反应是,“淘宝客服换 AI?”
阿里最拿手的电商生意,会如何重塑?是商家最关心的问题。
通义千问,什么水平?
从发布时间上看,阿里比百度的“文心一言”慢了半拍,但“通义千问”并非凑热闹的存在。
据通义千问回复,Open AI 发布 GPT- 2 那年(2019 年),阿里内部已开始对其进行训练,主要负责生成各种类型的文本,帮助集团进行业务决策。
阿里云智能 CTO 周靖人在接受采访时表示,阿里达摩院自 2019 年起就开始大模型的探索,训练了从 StructBERT 到 M6,到 PLUG 再到最新的 Composer 等一系列视觉模型。
结合 2022 年 9 月阿里发布的“通义”大模型系列来看,千问是该系列的排头兵。顾名思义,千问即千万次问,主要以对话作为能力的表现形式,这也是当前市面上的主流模态。
目前,从钉钉的测试效果来看,还算比较理想。
例如可基于群聊历史内容,自动生成摘要,帮助用户快速了解上下文;根据需求进行文档创作包括创意图片生成;甚至仅凭功能草图,无需写代码即可做出小程序。
而接入通义千问的天猫精灵,则成了更聪明的智能助手,支持自由对话,可随时打断、切换话题,可回答小朋友的各种刁钻问题,还多了一份情感连接。
不过这些只是阿里的内部实验,从第三方视角出发,通义千问的基本功到底如何?
“有惊喜也有惊讶”,知名互联网消费互动媒体 TechWeb 如是评价。该模型发布至今,也有不少科技平台争先测评其生成对话能力,并与 ChatGPT 和文心一言作对比。
“通义千问的回答更理智、严谨、有逻辑,偶尔能超过 ChatGPT3.5,基本和文心一言打得有来有回”。有媒体大 V 给三家大模型进行了常规测试,高级语义理解测试,代码测试,学习能力测试,以及 GPT- 4 出题测试后,得出了这样的结论。
一位阿里云研究院高级专家评价,“在参数和预训练语料数据集方面,不及 Open AI 和百度;效果方面,通义千问总体相当于 GPT-3,与文心一言差不多,但模型调优和人工精标、反馈机制的设计上优于百度”。
更“通人性”,可能是通义千问的加分项。ChatGPT 是基于监督学习进行微调的,可以更好地适应特定领域,而通义千问是基于人类反馈进行学习的,可以根据用户偏好和满意度调整回答。
也就是说,通义千问并没有完全成熟,但它的特点决定了,投身于一个真实的商业环境中,应用和研发齐头并进,反而会成长更快。
GPT 如何重塑电商
目前,已有多个头部电商卖家入局 GPT。如乐歌股份、巨星科技等,吉宏股份也在今年初接入 ChatGPT,并在提升运营效率方面取得一定成果。
吉宏股份在投资者平台介绍,几个月内,ChatGPT 已辅助其完成 1w+ 新品的上新,并在千万级商品中新挖掘了 150W 种商品之间的关系;通过 NLP 相关技术提取 15W+ 的电商需求概念。
另外,还通过 ChatGPT 生成新的广告文案 7W+,处理图像素材 2W+,接手客户闲聊与安抚对话 10W+,累计节省客服 1000 人次工时。
从选品到客服,从有效关系挖掘到广告投放,甚至连美工的活,ChatGPT 都能无缝对接。
已用上 ChatGPT 的跨境卖家反映,“用它写一个申诉、申请、包括换类目,5 秒钟就搞定了,而且英语还很地道,效率大大提高”。
但 GPT 的想象力还不止于此。
2023 年 2 月,Shopify 宣布将为商家提供 ChatGPT 支持,上线智能购物助手,用户可通过对话方式高效地找到所需商品;2023 年 3 月 3 日,美国生鲜电商 Instacart 接入 ChatGPT,同样看好该语言模型的处理能力。
Instacart 公司的首席架构师 JJ Zhuang 表示:“购买食材时,需要考虑许多因素,比如预算、营养、季节、烹饪技能及时间,不如让人工智能来承担这些认知负担”。
换句话说,当用户输入“什么是我孩子需要的健康午餐”,软件会直接给出一份午餐的配餐清单。
当消费者不再依赖关键字搜索,线上购物的决策链路也将大大缩短。
商家和用户之间的交互效率提升,正不断改善用户体验,而伴随着技术的升级,更隐形的消费需求也会慢慢被看见。
到了 3 月 16 日,最新版 GPT- 4 面世,更是推出了图像输入功能,其图文信息处理能力的呈现效果十分惊艳,也给模糊搜索提供了想象空间。
也许不久之后,用户可以输入喜欢的图片搜出心里那条“适合春天野餐的碎花裙”。
当下,除非目标商品品牌明确,否则人找货的一般的路径是,有了大致想法,去抖音、小红书等平台做攻略,再根据预算全网比价,再权衡评价、发货地点和时间,反复搜索比对后,最终下单。
电商平台和 KOL 们尽管会做出相应推荐,但顶多精确到群体需求,千人千面,很难触及那些无法描述的个体感觉。
说白了,无论是商家还是用户,想要的都不是信息而是答案。要想成为商家的万能胶,最懂用户的私人“李佳琦”,非常依赖大模型的信息处理和文本生成能力。
在电商的应用还存在不足
但是 ChatGPT 在电商领域的应用,也有不好的反馈。
比如近期集成 ChatGPT 后的电商平台 Newegg,就遭大量买家吐槽。“输入英特尔或 AMD 具体查询,得到的结果只限于这两个品牌,并无在价格或性能上更优秀的推荐。
并且搜索结果同质化严重,该工具就同一个问题给出的答案会有略微变化,但依然没给出具体的推荐理由”。
一位卖家颇有感触,“用 ChatGPT- 4 选品、优化或写 listing,不能简单地把关键词甩过去,还需不断细化字数、排序、口吻等,越详细越好,此外全面的参考数据也必不可少”。
若购物时还要费这番脑筋,倒显得工具有些鸡肋,只能说 ChatGPT 还没进化成买家想要的样子,但也有一些卖家仍在观望。
像出价和选品这样牵扯因素较复杂的工作,大多商家表示不敢轻易外包给机器,甚至作为客服,GPT 还是会掉链子,“它无法推测当前客户的语气和情绪,纯粹安抚反而会适得其反”。
据行业人士透露,通义千问现在只是和天猫有业务横向对接,做了案例但没实际落地。
毕竟总的来说,大模型暂时均处于可用阶段,还没完全取得人类信任。某种程度上,通义千问尚处于短期垂直化应用的起步期。
而当大模型步入可信阶段时,基于阿里的综合生态,模型目前能辅助到达的状态,大概率也不会是电商的终态。
按周靖人的说法,今后的模态必然能做到,任何一个模态来的信息,人的知识体系或者接收到的信号都能在一个高维的空间里有机融合。
目前,开放了第三方插件的 ChatGPT 给自己装上了“手”和“耳”,若配上 OpenTable(订餐插件)、WolframAlpha(科学计算插件)和 Instacart(购物插件),数秒之内 ChatGPT 就能帮忙订购好心仪减肥食谱的食材。
若将来,像智能家居、车载系统、旅游软件、视频媒体纷纷接入大模型,购物场景和效率边界是否又会被进一步拓宽?
紧跟阿里步伐,京东版 GPT 也将在不久之后发布。京东的言犀人工智能平台,将推出产业版 ChatGPT——ChatJD。另外,字节跳动也在人工智能领域进行布局,包括对芯片公司翱捷科技和 AI 语音技术思必驰的投资。
也许未来,拼多多、快手、小红书等平台也会跟进,电商平台 AI 化是大势所趋。
参考文章:
1. 品玩《对话阿里云 CTO 周靖人:通义千问不是起点也不是终点》
2. 亿邦动力《对电商而言,ChatGPT 是否拐点?》
3. 差评《阿里大模型敢对标 GPT-3.5?我们让 GPT- 4 给它上了点强度。》
4. 价值星球 Planet《ChatGPT 挺进电商,打工人慌了?》
5. 电商热点《GPT4 横空出世,AI 或将重塑电商行业》
6. 集微网《通义千问三年磨一剑,阿里大模型征程弥远》
特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的 30 日内与新浪网联系。
原文链接:http://k.sina.com.cn/article_1770735827_698b48d30190122fq.html