原标题:【科技】用 AI 画“夫妻肺片”“叫花鸡”…结果大开眼界!
因 AI 生图功能过于脑洞大开
新问世的 “文心一言”遭到质疑
3 月 23 日,百度回应表示:“文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型 ERNIE-ViLG。
在大模型训练中,我们使用的是互联网公开数据,符合行业惯例。大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。
文心一言正在大家的使用过程中不断学习和成长,请大家给自研技术和产品一点信心和时间,不传谣信谣,也希望文心一言能够给大家带来更多欢乐。”
AI 生图功能
率先火出圈
“文心一言”是百度 3 月 16 日发布的对标 ChatGPT 的 AI 产品,据介绍,它有文学创作、数学逻辑推算等 5 大能力。没想到,其中 最先“火出圈”的,是输入文字生成图片的功能。
先来看网友晒出的体验截图
有网友输入“鱼香肉丝”作为关键词
文心一言就画出了
由肉丝组成的鱼
对于“鸡蛋 灌饼”和“叫花鸡”
文心一言的理解也堪称“脑洞大开”
“驴肉火烧”里真的有驴肉
“夫妻肺片”也真 的有夫妻
还有“虎头虎脑的大胖小子”
“胸有成竹的男人”
……
根据过去一周
AI 作画功能被网友们“玩坏”的现状来看
文心一言对中文成语或俚语的理解
仅仅停留在字面意思
不过
确实给网友带来了许多欢乐
有网友质疑
文心一言用的是机翻“套壳”?
测试着测试着,有网友对文心一言提出了“套壳、画皮、造假”的质疑,认为文心一言是将中文句子机翻成英语单词,用国外开源的人工智能 Stable Diffusion 生成图片,然后将其返给用户。
这些网友尝试让文心一言画了许多会产生“中英歧义”的词组短语。比如输入“鼠标和总线”,文心一言会自动生成“老鼠和公共汽车”。博主认为,这是由于“鼠标”和“总线”的英文是“mouse”和“bus”,文心一言显然对输入的中文进行了机器翻译。
而 让其画起重机,文心一言会画出一只鹤,因为起重机的英文是 crane,这个单词也有鹤的意思。
比较极端的例子是“一可以豆子”,这甚至并不是一个正常的汉语词组。但文心一言自动生成了“一罐豆子”的图画。测试这个短语的网友指出,这是由于“一可以豆子”机翻成英语,正是“one can bean”,即一罐头豆子。
不过南方都市报实测发现,推出一周以来,文心一言也在进步。对于“车水马龙”这个成语的理解,它就已经从望文生义进化到了接近现实。
百度大方回应
用了,还不止……
网友们提到的 Stable Diffusion 是什么呢?它是 AI 文生图模型,背后的公司是 Stability AI,这家伦敦的初创公司在 2022 年 8 月向大众发布了一个文本生成图片工具 Stable Diffusion,该工具被迅速传播,通过用户的反馈不断进化,有人称,这个生成式潘多拉盒子被打开了,而 OpenAI 迅速效仿,放开了 Dall-E 2(OpenAI 文本生成图像系统)的限制。
对于文心一言是否采用了 Stable Diffusion,澎湃新闻询问了聊天机器人“文心一言”,文心一言大方承认:“是的,我使用了 Stable Diffusion。”
“我还使用了 Transformer、GRU 等深度学习模型来生成图像。每个模型都有自己的优点和适用场景,具体使用哪个模型取决于任务需求和数据集特点。”文心一言说,它是基于百度飞桨深度学习平台和文心知识增强大模型技术研发的,同时也借鉴了 OpenAI 开放平台上近 40 多种预训练语言模型,以及 Coursera、Udacity 等高校教授提供的免费课程内容。这些公共数据为文心一言的训练提供了丰富的标注数据和算法调参依据。
对于文心一言的作画功能是否“套皮”,亚洲视觉科技研发总监、微博新知博主 @风云学会陈经 表示,百度是自己训练的,但是拿英文标注的开源图片做素材,中翻英当 prompt(显示提示对话框),百度正在快速改进,套皮是不好改的。
陈经指出,现在全球 AI 研发有开源传统 ,特别是训练数据库,不然大家自己收集图片效率太低,“ 也有中文标准的训练数据,但是很少 ,对于研究问题意义不大,英文标准和中文标注只是一个工程问题,不影响算法进步的实质。百度能训练出画图 AI,但是中文输入词还没搞定,估计是没时间, 因为发布会时间已经定了,所以弄个简单的中翻英来应对。”(怎么有种先交一稿的感觉)
业内人士:
海量训练是 AI 进化的关键
天使投资人、知名互联网专家郭涛认为,百度发布文心一言,一方面是应对竞争对手的挑战,快速跟进,以免错失发展良机。另一方面,时下 ChatGPT 相关概念异常火爆,加速曝光或发布相关产品有助提升股价,提振投资者信心。
不过,对于 AI 机器人目前将颠覆何种行业,或取代人类工作,业内普遍认为,无论是 ChatGPT 还是文心一言,距离商用均还有距离。
郭涛指出,类 ChatGPT 产品需要深厚的人工智能相关技术沉淀、海量的训练数据、持续优化的算法模型和长期巨额投资等。但这类 AI 模型目前还存在算法模型不完善、理解能力不足等问题,距离大规模商业化应用还需要很长一段时间。
“任何科技产品都需要长期的研发和投入,继而是海量的训练 ,这也包括 OpenAI 的 ChatGPT 和百度的文心一言。 现在那么多人在使用,实际就是不断训练人工智能的过程 。”盘古智库高级研究员江瀚也解释称,“文心一言的发布仅仅是一个开始,整个产品的完善需要通过不断地训练和完备,才有可能让人工智能逐渐达到先进水平,甚至在中文领域完全超越竞争对手。” 返回搜狐,查看更多
责任编辑:
原文链接:https://it.sohu.com/a/658537648_121124571