原创 刘杨楠 简春燕 甲子光年
ChatGPT 蝴蝶震动翅膀,世界开始为之颤动。
整理|刘杨楠 简春燕
编辑|赵健
ChatGPT 带来的 AI 浪潮正在蔓延至更广的地方。
上周,GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言接连出场;本周,英伟达、Adobe 紧跟其后,OpenAI 更是在本周五推出插件功能,点亮“AI 的 AppStore 时刻”。
此外,李开复、阿里 VP 贾扬清、前字节跳动视觉技术负责人王长虎多为商业大咖入场 AI 大模型创业;阿里 M6 大模型前带头人杨红霞被曝加入字节 AI Lab,参与语言生成大模型的研发;还有一系列整合 AI 的新产品雨后春笋般涌现。
相信所有关注 AI 的人都有一种感受:每天都不知道明天和 OpenAI 的新产品到底哪一个会先来。
「甲子光年」整理了一份 AI 周报,整理了过去一周生成式 AI 领域的新鲜事。
以下为详细内容:
3 月 20 日,周一
OpenAI 发布重磅研究,80% 打工人或被颠覆!
OpenAI 与宾夕法尼亚大学共同探索大型语言模型如何影响美国劳动力市场,研究估计,对于 19% 的岗位,至少 50% 的工作内容会被影响;对于 80% 的岗位,也至少有 10% 的工作内容被波及。
OpenAI 引入了“暴露”的概念,衡量标准为,使用 ChatGPT 或相关工具,在保证质量的情况下,能否减少完成工作的时间。
E0:没有暴露。
E1:直接暴露,仅使用大型语言模型(比如 GPT-4 聊天界面),可以将时间至少减少 50%。
E2:间接暴露,单独使用大型语言模型无法达到效果,但在它的基础上开发的额外软件(比如图像生成),可以将时间至少减少 50%。
有着极高暴露风险的职业更容易受到震荡,如作家、数学家、新闻从业者、会计与审计、金融量化分析师等。十年前有传统观点认为,人工智能将首先影响体力劳动,然后是认知劳动,最后可能会影响到那些需要创造力的工作。但如今看来,一切都是相反的顺序。
OpenAI 研究论文链接:https://arxiv.org/pdf/2303.10130v1.pdf
3 月 21 日,周二
Adobe 推出名为 Adobe Firefly 的 “ 创造性生成 AI 模型系列 ”
Adobe 推出自己的 AI 图像生成器,宣布了一个名为 Adobe Firefly 的 “ 创造性生成 AI 模型系列 ”,并发布了利用这些模型的前两个工具——一个类似 DALL- E 或 Midjourney,用户输入提示后,工具便能创建一个图像;另一个可生成风格化的文本,类似人工智能驱动的 WordArt。
对 Adobe 来说,此次发布意义重大。过去一年,面对 AIGC 的冲击,作为创意应用领域头部企业的 Adobe 一直在观望。如今,Adobe 终于有所动作。
“我们不害怕变化,我们正在拥抱这种变化,”Adobe 公司生成型人工智能和 Sensei 的副总裁 Alexandru Costin 说,“我们可以产生高质量的内容,而不是随意品牌和他人的 IP”。
Firefly 的前两个工具将从 3 月 21 日起提供公开测试版。非 Creative Cloud 用户也可以申请使用,但 Adobe 将限制进入测试版的人数。
访问地址:https://www.adobe.com/sensei/generative-ai/firefly.html
在年度活动 GTC(GPU Technology Conoference)上,英伟达发布了四款 AI 推理芯片,包括针对生成式 AI 图像处理、大模型处理的芯片;三个大模型云服务,分别适用于文本、图像和生物研究;超级计算机,以及针对场景优化的应用 100 个、更新功能的工业元宇宙 Omniverse。
在演讲中,黄仁勋又把“AI 的 iPhone 时刻”这句话重复了三遍。在 ChatGPT 以及生成式 AI 的热潮下,英伟达的股价今年以来涨幅超过 80%,市值接近 6500 亿美元,一举超过特斯拉。
英伟达也把 AI 当做一次二次腾飞的机遇。2023 年初各大科技公司财报发布,英伟达提及 AI 75 次,超过谷歌、微软、Meta。本周为期四天的 GTC 活动包含了 650 多场会议,由众多研究者、开发者和行业领袖参与,其中仅生成式 AI 的主题会议就超过 70 场。
黄仁勋表示:“AI 正迎来有史以来最辉煌的时刻。这将是我们迄今为止最重要的一次 GTC。”
阿里 VP 贾扬清被曝离职创业大模型
阿里 VP 贾扬清被曝将离职,创立一家新的 AI 公司,和他一起创业的还有曾参与 ONNX、PyTorch 和 Caffe2 项目的“老战友”。
贾扬清是 AI 架构领域最厉害的华人之一,他创建了知名深度学习框架 Caffe,还是 TensorFlow、Pytorch 的核心成员和共同领导者。
在阿里时,他曾率队升级了以 ODPS 和 PAI 为代表的大数据和人工智能平台产品,支撑了整个集团大数据存储、计算、分析和机器学习的需求;支持发布了魔搭(ModelScope)开源模型社区。
此次,贾扬清团队将打造一个统一、多云和可观察的人工智能平台——不仅是 AI 基础设施提供商,也关注包括大模型在内的 AI 应用。
3 月 22 日,周三
谷歌发布 Bard 公测,硬刚 ChatGPT
谷歌宣布正式开放旗下 ChatGPT 竞争对手 Bard 的公测,首先将面向美国和英国地区启动。这两个国家的用户都可以在 bard.google.com 上进行排队等候,随着测试的推进 Bard 也会逐步在其他地区上线。
总体来看,Bard 与 New Bing 的使用模式和功能基本一致。目前 Bard 并不具备 New Bing 能够给 AI 生成答案提供信息来源,以及基于生成答案自动提供拓展问题的功能。当用户提出一个问题之后,Bard 能生成 3 个不同版本的答案,用户可以根据自己的内容喜好进行选择。
此外,在 New Bing 上线后曾出现的混乱和批评的前车之鉴下,此次谷歌十分谨慎,在 Bard 界面上时刻提醒用户:“Bard 可能生成不准确或者略带攻击性的信息,但并不代表谷歌官方观点。”
对于 ChatGPT 的威胁,谷歌 CEO 桑达尔·皮查伊(Sundar Pichai)表示,谷歌过去一些最成功的产品也并不是第一个推向市场的。在 AI 的竞争上,谷歌将依然如此。
微软宣布,Bing Chat 现已整合 Bing Image Creator 功能
微软宣布 Bing Chat 现已整合 Bing Image Creator 功能,允许用户通过文本生成图片,基于 OpenAI 旗下的深度学习模型 DALL- E 实现。
此外,微软表示已经整合了 OpenAI 的安全措施,并添加了额外的保护功能,以此限制图片生成功能被滥用。
GitHub 推出全新版本 Copilot X,接入 GPT-4,解放程序员双手
微软旗下代码托管平台 GitHub 发布了编程辅助工具 Copilot 的全新版本 Copilot X,新版本接入 GPT-4,并新增了聊天和语音功能,开发人员用自然语言询问如何完成特定的编码功能。
Copilot X 更新的一系列功能包括有:GitHub Copilot Chat,可实现与 AI 对话完成编码;Copilot for Pull Requests,由 AI 协助程序员拉取请求;Copilot for Docs,智能文档编写工具;Copilot for CLI,命令工具;Copilot Voice,语音扩展功能,说话就完成程序编写。
此次更新意味着 GitHub Copilot 编程模型重磅级升级,GPT- 4 正将程序员从基础性编码工作中解放出来,很大程度上提高了生产力。
Runway 发布 Gen-2,三秒钟生成大片
Runway 成立于 2018 年,是一家 AI 视频编辑软件提供商。Runway 在文本到图像领域就曾经大放异彩,开发了大名鼎鼎的 Stable Diffusion。
今年 2 月,Runway 提出了首个 AI 编辑模型 Gen-1,可以在原视频基础上进行编辑。但部分用户 Gen- 1 的内测都还没拿到,Gen- 2 就已经来了。Gen- 2 进一步升级,可以用任意的图像、视频、文本,生成各种风格的创意大片。
Runnway 官网地址:https://research.runwayml.com/gen1
Zapier 推出自然语言操作
无代码自动化平台 Zapier 推出了一个通用的、人工智能驱动的 API,称为自然语言动作(NLA),以将 Zapier 动作集成到任何应用程序中。NLA 针对基于自然语言的产品进行了优化,例如聊天机器人或使用 LLM 构建的产品,但任何开发人员都可以使用。
非营利组织 Mozilla 新成立人工智能初创公司 Mozilla.ai,旨在构建开源且“值得信赖”的 AI
Firefox 浏览器背后的非营利组织 Mozilla 新成立人工智能初创公司 Mozilla.ai。
Mozilla 执行总裁兼 Mozilla.ai 负责人 Mark Surman 称,这家新成立的公司名为 Mozilla.ai,其使命不仅仅是构建任何 AI——它的使命是构建开源且“值得信赖”的 AI。
“在可信赖的人工智能领域工作了将近五年,我一直感到既兴奋又焦虑,”Surman 表示,“过去一两个月快速发布的大型科技 AI 公告没有什么不同。真正令人兴奋的新技术正在出现——新工具立即激发了艺术家、创始人……各种各样的人去做新事物。当你意识到几乎没有人在看护栏时,焦虑就来了。”
Mozilla.ai 由 Mozilla 的母公司 Mozilla 基金会的 3000 万美元种子投资资助,是 Mozilla 基金会的全资子公司——很像 Mozilla Corporation(负责开发 Firefox 的组织)和 Mozilla Ventures(Mozilla 基金会的 VC 基金)。其董事总经理是 Moez Draief,他曾任华为诺亚方舟人工智能实验室首席科学家、凯捷咨询公司全球首席科学家。
值得注意的是,Mozilla.ai 不是非营利组织。“最大的问题是,有多少新的、规模较小的值得信赖的 AI 初创公司能够保持独立?”Draief 表示,“很明显,亚马逊、谷歌和微软等巨头的云平台正急于整合人工智能领域,所有的钱都是从这里赚来的,小公司很难不被卷入这种整合。”
阿里 M6 大模型前带头人杨红霞加盟字节跳动,参与语言生成大模型研发
3 月 22 日,阿里 M6 大模型前带头人杨红霞被曝加入字节 AI Lab(人工智能实验室),参与语言生成大模型的研发,直接向字节跳动副总裁杨震原汇报。目前,字节跳动尚未出面证实该消息。
杨红霞曾是阿里达摩院超大规模多模态预训练模型 M6 的技术负责人,毕业于南开大学、杜克大学统计科学系,师从著名统计学家 David Dunson;在人工智能领域国际会议、顶级期刊有近百篇顶级论文;曾带领 M6 大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。
2022 年 9 月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职。
由于达摩院 AI 大模型还未找到实际落地场景,加上大厂降本增效需求迫切,大模型无法得到更多支持,这也间接导致包括杨红霞在内的多位顶级人才离职,如智能研究领域负责人金榕、城市大脑实验室负责人华先胜。
腾讯高管:AI 大模型是增长的加速器,会进一步投资
3 月 22 日,腾讯发布 2022 年财报。
在晚间的电话会议上,针对市场热议的人工智能和 ChatGPT 相关话题,腾讯高管表示,生成式 AI 可以用来提升腾讯旗下旗舰产品的用户体验。未来可能每一个用户都会有人工智能助理,如果效果好,有可能将生成式 AI 纳入微信和 QQ。
腾讯高管进一步表示,对于腾讯而言,AI 和大模型是一个增长的加速器,会帮助改善现有业务,加速商业化,腾讯会在资源上进一步投资,来建立腾讯自己的大模型,同时会确保打好打牢模型建设的基础。
3 月 23 日,周四
微软协作平台 Micro Loop 上线,剑指 Notion AI
3 月 23 日,微软协作平台 Loop 官方账号宣布 Microsoft Loop 正式开启公测,并同步开放公众预览版下载。无需 Waiting list,用户现在就可以登录 Microsoft Loop 并直接体验。
尽管 Loop 对标 Notion AI,但在用户体验上,Loop 远不如 NotionAI。
Loop 网址:https://loop.microsoft.com/
百度回应网友对文心一言文生图功能的反馈
文心一言推出后,因文生图功能不够准确,许多网友开始调侃“文心一言”,甚至开始用文心一言生成的图片做起了”看图猜词的游戏。
更有甚者,有人开始质疑百度文心一言并非自研,只是套在国外模型上的一个空壳产品。为此,百度再 3 月 23 日在官方微博正式回应质疑:
当天,有消息称李彦宏接受采访时表示,中国基本不会再出现一个像 OpenAI 的公司了。
李彦宏称,OpenAI 之所以诞生是因为美国大厂都不看好这个方向(所以没人竞争),但现在中国大厂都看好 AI 大模型,所以都在做这个方向。他表示,创业公司重新做一个 ChatGPT 没有多大意义,基于大语言模型开发应用机会很大,所以没有必要再重新发明一遍轮子。
此外,李彦宏还回应了文心一言发布会为何用录屏的问题,他表示,他是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来有两个因素让他改变了主意:“一是生成式 AI 每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也 OK。”
3 月 24 日,周五
OpenAI 推出插件功能,ChatGPT“有了联网能力”
如果说 ChatGPT 是 AI 的“iPhone”,那么 OpenAI 推出的插件功能,就是“iPhone 的 App store”。
在目前已实现的“初步功能”来看,ChatGPT 已经可以具备了三项能力:
● 访问最新信息,比如体育比分、股票价格、最新消息;
● 检索知识库信息,比如公司文件、个人笔记、运行计算;
● 代表用户执行操作,比如订机票、订餐。
目前,插件系统还处于 alpha 测试期,首批参与插件创建的厂商包括 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier。其他使用插件的开发者可以申请进入候补名单。OpenAI 表示,在了解更多情况后将逐步开放访问范围。
OpenAI 还自己托管了两款插件,其一为网络浏览器,其二是代码解释器。OpenAI 开源了一款知识库检索插件的代码,任何开发者都可以借此托管用于增强 ChatGPT 的信息。OpenAI 将插件比喻成语言模型的“眼睛和耳朵”,能帮助模型访问因为较新、较私人或较具体而不宜包含在训练数据内的信息。为了响应用户的明确要求,插件还能帮助语言模型切实执行安全、受控的操作,从而提高整个系统的实用性
一位资深程序员感叹道,ChatGPT 的插件接口可能是一生中见过最疯狂、最令人印象深刻的。
刚刚回归 OpenAI 不久的特斯拉前 AI 主管 Andrej Karpathy 则表示,GPT 类模型是一种运行在文本上的新型计算机架构,它不仅可以与我们人类交谈,也可以与现有的软件基础设施“交谈”,API 是第一步,插件是第二步。
加入 ChatGPT 插件候补名单:https://openai.com/waitlist/plugins
前字节跳动视觉技术负责人王长虎加入 AI 创业大潮
投中网获悉,前字节跳动视觉技术负责人王长虎近期将于龙湖集团离职,并即将组建新的创业团队。
王长虎的创业方向将聚焦于生成式 AI 的视觉多模态算法平台,并基于过去近 20 年顶级的学术研究及技术应用能力,赋能视觉相关的各大垂直应用场景。
此前,字节跳动的官方介绍也显示,王长虎于 2017 年加入字节跳动人工智能实验室担任总监一职,主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。
王长虎完整参与了抖音和 TikTok 等视频类产品从 0 到 1 的建设和发展,并搭建了数百人的视觉技术和产品团队,建设了视觉技术和业务中台,带领团队将相关技术广泛应用到字节跳动全线产品中,为集团各产品提供 AI 技术支撑和业务解决方案,包括今日头条、抖音、TikTok 等,覆盖了视觉相关产品内容生产与消费的全流程。
END.
原标题:《生成式 AI 继续狂飙,正以“天”为单位迭代|甲子光年》
原文链接:https://www.thepaper.cn/newsDetail_forward_22454028