文 | 阿尔法工场
近日,美团宣布以 20.65 亿元人民币的价格,收购 AI 公司光年之外,引发了业界的广泛关注。
王慧文与美团创始人王兴是清华大学的同学兼室友,曾经在创业道路上数度并肩作战,被誉为互联网圈的一段佳话。
此前,王慧文因健康原因,不得不中止了对光年之外 AI 事业的领导。
这次的收购,被很多人看成是王兴对这位上铺兄弟的 “ 出手相救 ”。
不过,除了个人情谊之外,光年之外本身在 AI 领域的价值,自然也是美团此次收购的重要原因。
光年之外成立于 2023 年 2 月,由王慧文个人出资 5000 万美元,估值 2 亿美元,王慧文曾表示,“ 个人肉身不占股份,75% 的股份用于邀请顶级研发人才 ”。并发布了 “ 英雄帖 ”,声称要打造 “ 中国的 OpenAI”。
那么,如此高调进军 AI 领域的光年之外,其真正技术实力究竟如何?被收购之后,其与美团又将在 AIGC 领域,打开怎样的局面呢?。
收购下的收购
按照常理推断,今年 2 月才成立的光年之外,注定在 AI 技术上不会有太深厚的积累。
既然如此,决意向 AGI 进军的王慧文,就只能通过最 “ 速成 ” 的方式 —— 收购,来增强自身团队的技术实力。
王慧文在两个月内完成技术人才团队搭建,吸引了包括多名人工智能领域顶级专家和创业者的加入。其中最引人注目的是收购了有着 40 多人规模的 AI 框架公司 “ 一流科技 ”。
一流科技是一家专注于人工智能基础设施软件的研发工作的创新企业,由清华袁进辉博士于 2017 年创立。
师从清华人工智能研究院院长张钹的袁进辉,不仅曾任微软亚洲研究院主管研究员,获得过多项国际专利,还提出了当时世界上最快的主题模型训练算法系统 LightLDA。
今年 4 月,光年之外完成收购一流科技,持有约 46.52% 股权,袁进辉及辉煌合伙持有约 34.63% 及 18.84% 权益,到被美团收购时,光年之外整个团队规模已经达到了 70 多人。
可以说,目前光年之外最主要的 AI 技术,就是来自一流科技。
而要衡量一流科技在 AI 领域的技术水平,我们不妨看看其亲自研发的核心产品 ——OneFlow,这是一个对标 TensorFlow、PyTorch 及百度飞桨的深度学习框架。
如果要用一句话,概括 OneFlow 对大模型的意义,那就是它可以使用更多的计算资源,加快训练速度,提高模型性能,同时不受内存容量的限制。
这样的特点,主要归功于 OneFlow,静态编译和流式并行的核心理念和架构。
这样的架构,简单来说,就是在运行前就会构建好一个完整的计算图和数据流的表示,包括计算节点、数据节点、通信节点等,而非在运行时才根据输入这些信息。
如此一来,就可以有效地减少运行时的开销,提高计算效率,降低大模型训练所需的设备数量和通信量。
虽然,在当下的大模型竞争中,降低模型的训练难度和成本,早已不是什么新颖的技术,但 OneFlow 的独特之处就在于:其不仅让大模型训练得更快,而且还让大模型具备了更高的 “ 易用性 ”。
而这样的 “ 易用性 ”,说白了就是能让应用更容易地落地,并支持更多的场景,例如大规模人脸识别、广告推荐大规模训练等。
为实现这点,OneFlow 采用了数据并行与模型并行相结合的技术。
简单地说,就是可以将一个大的数据集切分到多个设备上,每个设备使用相同的模型参数进行训练,然后通过通信同步梯度,提高训练速度和效率。
这样的技术,不仅解决了解决模型过大,无法放入单个设备的问题,还能根据不同的用户和场景,灵活地选择最合适的并行方式,实现更高效的分布式训练。
了解了这一切之后,我们再从整体上分析这次美团的收购事件,就可以从中窥见,这样的技术,在美团目前的 AI 布局中,为何显得至关重要。
并行训练
要理解光年之外对美团的意义,我们就得先看看美团想用 AI 来做什么。
早在 2020 年的世界人工智能大会上,美团首席科学家、AI 平台部总经理夏华夏首次公布了美团在 AI 科技领域的布局和愿景。
夏华夏表示:“ 美团 AI 将以 ‘ 帮大家吃得更好,生活更好 ’ 为核心目标,致力于在实际业务场景需求上探索前沿的人工智能技术,并将之迅速落地在实际生活服务场景中,完成线下经济的数字化。”
说白了,就是以 AI 技术 + 海量真实数据,形成以美团 AI 为核心的智能化生活服务闭环。
但问题是,“ 实际生活服务场景 ”,是一个涵盖面很广的概念,它包括了餐饮、外卖、酒店、旅游、电影、打车等。
这么多的场景,怎么用 AI 一揽子拿下?
美团给出的策略是 “ 以场景驱动技术 ”。
换句话说,美团有很多种不同的服务,包括线下生活里的各种方面,有这些场景就有大量的数据,这些大量的数据可以反过来帮助美团人工智能算法不断迭代、优化,这些算法再帮助用户在场景中得到更好的服务。
这实际上是一种以专有数据形成正循环的思路。
在这样的整体布局中,一个能够根据不同的用户和场景,实现高效的分布式训练的算法框架,就显得尤为重要。
而这正是之前提到的 OneFlow 的并行训练所具备的优势。
举例来说,在美团外卖场景下,需求是与情境依存的,在不同的时间、空间以及其他更广义的环境下,用户需求、商家供给等都有显著区别。
这样的情况,造成了外卖场景具有很强的地理位置和就餐文化约束,
比如工作日多为单人餐,以饭类套餐、轻食、米线为主;而在周末,用户会适当犒劳自己、兼顾家人,倾向于选择更适合多人就餐的烧烤、韩国料理、火锅。
面对这种情况,以往的模型设计,比如用户兴趣建模,或者朴素的多层神经网络,都无法应对这些复杂的用户、时间和地理环境纠缠在一起的情况。
虽然美团对此提出了 “ 情境细分 + 统一模型 ” 的思路,将用户的行为序列按照不同的情境进行划分,然后用一个统一的模型,来对每个情境下的用户行为进行预测。
但这种大参数的统一模型,往往会导致训练和预测的开销较大,影响推荐的效率和稳定性。
而 OneFlow 的框架,正好解决了这一痛点。
得益于数据并行与模型并行的技术,OneFlow 可以把一个大的模型切分成多个小的模型,分配到多个设备上,每个设备负责一部分模型的计算,然后通过通信传递中间结果,完成整个模型的计算。
如此一来,OneFlow 就不需要一个统一的模型,而是可以使用多个子模型来对不同细分群体的用户行为进行预测,并通过多任务学习和迁移学习,来实现不同情境间的知识共享和迁移,提高推荐的精准度和个性化程度。
从这个角度上说,OneFlow 的技术对美团而言,无疑是一块用在刀刃上的 “ 好钢 ”。
留住人才才是关键
尽管光年之外的加入,在技术层面上,为美团的 AI 生态注入了新的活力,然而,每一个技术的背后,其实都是人才的竞争。
可以说,正是这些人才的存在,才让此次的收购真正具有了 “ 价值 ”,而非仅仅是买来了一个徒有口号和情怀的空壳公司。
在此次的收购中,光年之外对美团最大的意义,就是带来了原先一流科技顶尖的 AI 人才。
除了在深度学习有着颇深造诣的袁进辉博士外,一流科技的首席科学家张钹,不仅是清华大学人工智能智能研究院院长、而且还是中国计算机学会 CCF 终身成就奖获得者,堪称中国人工智能领域的学界泰斗。
从这点来看,美团的科研队伍正不断壮大。
然而,在繁盛的表象之下,如何留住这些顶尖的人才,将是王兴接下来的一个重大难题。
在这方面,百度与辛顿之间的往事,也许是一个很有启发意义的例子。
2012 年,百度曾斥资 4400 万美元,试图收购辛顿(人工智能三大泰斗之一)的初创公司 ——DNNresearch,想将这位学界泰斗纳入自己麾下。
结果辛顿最终还是选择了谷歌。
虽然钱是少了点,但辛顿选择了遵从内心 —— 谷歌才是他想要的环境。
这样的例子说明了,对于 AI 人才,尤其是顶尖的 AI 人才来说,钱永远不是唯一考虑的因素。
能否为人才提供一个施展自身才华、理想的空间,能否使之认同企业的价值观,这都是能否留住人才的重要的因素。
在这点上,美团是否会表现得比其他企业更好?恐怕只有时间才能给出答案了。
原文链接:https://www.tmtpost.com/6599280.html