自 2022 年底,ChatGPT 横空出世,让世人看到了通用人工智能的曙光,大模型就成为了创业圈、创投圈最热的话题。
如今,中国的大模型创业者已经集结在十字路口。他们之中既有研究自然语言理解将近 40 年的科学家,也有已经功成名就的前创业者,还有刚刚博士毕业的年轻人。创业者们在各个层面展开竞争。
为此我们发起 AI 大模型系列直播【探索 AI 大模型时代 引领 AIGC 新浪潮】,本系列直播共 5 场,主要从大模型应用场景、元宇宙标准、大模型在 tob、toc 领域的应用等方面,邀请国际、国内 AI 领域方面的重量级嘉宾为大家深度解析大模型的当下与未来。
2018 年,中科院院士鄂维南在全球首次提出“AI for Science(科学智能)”概念,2021 年之后,AI for Science 迅速被一些国际机构公开采用,如英伟达提出 AI for Science 是一场正在发生的革命,DeepMind 也开通了 AI for Science 博客,2022 年,微软在全球成立了重磅机构 AI for Science 研究院,国内工业界也在迅速跟进,其中不乏阿里达摩院、字节跳动人工智能实验室以及华为等互联网大厂。
“AI for Science”为什么会受到产业界如此追捧?在算力、算法、数据三个维度,会面临哪些重大挑战?人工智能时代下的投资理念和布局是什么?未来人与 AI 共生协作会是一番怎样的图景?
本期直播,盛景嘉成管理合伙人王湘云女士携手普华资本管理合伙人蒋纯、商汤人工智能产业基金董事总经理余俊、深势科技 CTO 胡成文,带来了重磅分享。
以下为精华内容整理,enjoy ~
一、AI for Science 科技智能会给前沿科技的研发和产业化带来哪些巨大的价值?
余俊:
从企业业务和基金投资角度,结合 SenseCore 商汤 AI 大装置(商汤科技打造的新型人工智能基础设施),首先会综合考量 AI for Science 涉及的落地场景,包括制药、无人驾驶、元宇宙数字人以及帮助科研院所提升科研效率和生产力等。然后围绕这些方向在对 SenseCore AI 大装置算力需求较大的场景中,再进一步挖掘更多的应用和投资标的,这是我们关注的焦点,其中对算力和计算机视觉需求量较大的场景,关注度会更高。
胡成文:
我们认为 AI for Science 是底层科研范式比较大的突破,希望能通过算法创新赋能到产业,进而解决行业面临的实际问题。
比如生物制药行业是一个研发周期长、风险高、费用大的科研领域,业内对于创新药也有着“双十困境”的观点,即一款创新药从研发到上市,平均成本超过 10 亿美元,研发周期大于 10 年。因为在临床前的很多环节,需要大量科学家、专家花费大量时间运用人工的一些经验去不断地试错和实验。而通过 AI for Science 可以把临床的很多环节用算法进行模拟,数量级地降低研发和时间成本,并且已经在我们的 Hermite®平台上得到完整呈现。
最近较大的一个突破则是体现在材料领域中的电池材料研发,一般通过“实验试错”手段开展的电池研发昂贵低效,需要不断测试材料性质是否符合预期,现在运用 AI for Science 的方法,可以先用模拟,再通过实验,从而持续提升电池研发的创新效能。
这两个简单的例子,让我们直观地感受到 AI for Science 对于行业的影响,其应用空间非常广阔。
二、与应用于其它领域的人工智能相比,AI for Science 在算力、算法、数据三个维度,主要面临哪些重大的挑战?
胡成文:
AI 大家都非常了解,它通过积累大量数据训练出模型,再利用这些模型解决实际问题,比如 ChatGPT 这种火爆全球的应用。
但在科研领域,缺少足够多的有效数据来进行训练,所以“AI for Science”概念,强调利用 AI 学习科学原理、创造科学模型来解决问题,使之成为与传统的深入学习或者 AI 模式不同的科研新范式。
因此,第一个挑战是模型。这个模型不是简单的通过数据,或者深度模型、深度算法就能得到的解决方案,它需要结合物理原理和科学算法,在具有一定物理约束情况下得出解法,最后才能解决我们的实际问题。
第二个挑战是数据,目前除了互联网行业,其他行业整体而言是严重缺乏更好更标准化的数据的。反而是算力在 AI for Science 领域,由于模型规模相对小于互联网大模型,面临的挑战难度与其他维度相比会小一些。
最大的挑战则是跨行业复合型的人才。AI for Science 领域需要的人才既要懂 AI,也要懂科学和行业,这样才能产生化学反应,碰撞出原创性的突破,目前还是比较紧缺的。
三、除了技术上的挑战之外,AI for Science 在产品 / 技术的研发、技术应用推广,以及产业化等方面,是否会面临比其它领域更大的挑战?
胡成文:
产业化的挑战还是非常大的,一方面需要刚刚提到的复合型人才与行业或领域专家和用户一起去发现、解决行业中的实际问题,避免陷入“拿着锤子找钉子”的窘境,。另一方面,需要与行业中的合作伙伴一起去建设最终的解决方案,即哪些是算法、体系和平台能够解决的问题,哪些是需要行业领域专家结合平台和工具去解决的问题。当然目前来看,包括医药、新能源材料、高分子材料方面还是取得了不错的进展。
余俊:
首先,最终决定商业化能否成功,或能否成规模地执行落地,本质上往往考量的可能不全是技术能力。从 Day one(创业起步)阶段,第一件事情应该是从需求开始再到产品、方案、技术,它是一个倒过来的逻辑,而不是执念于我的技术特别厉害,我能解决你的问题,这是大多数技术型团队经常存在的认知差。
其次,由于 AI for Science 的行业 Know-How 是跨界的,把 Know-How 转化为数据、算法从而提高效率,在多大程度上能够解决应用或产业的最终落地,是需要深度评估的。特别是从长期来看,最后拼的不一定是技术有多好,因为在解决实际场景问题的时候,突破某一个技术拐点,就已经能够解决 95% 以上的问题。
举个例子,今天我们谈人脸识别,银行在做刷脸支付场景时,对相关技术的要求会非常高,能够解决其中问题的企业可能没有那么多,但在普通门禁的刷脸使用场景下,大多数企业已经能解决 99% 的问题。所以最终导致是否能够规模化的问题就转移到非技术的因素,比如商务拓展,后端的能力和团队的互补性等。
当然不同的细分领域有不同的差异,像做药的研发、自动驾驶、元宇宙数字人等领域,不同的商业模式本身所具备的能够起到 5 倍、10 倍力量的核心是不一样的,所以还是要 case by case(具体问题具体分析)。
四、作为业内较早关注硬科技的投资机构,普华资本投资的航空航天、创新药、新能源、新一代信息技术等领域,有哪些特别代表性的前沿科技创新发展趋势?
蒋纯:
从投资方向角度来讲,我们比较关注所谓的“断点、堵点、痛点”,即由于国际形势的变化,全球化的破裂所形成的一些国内产业链上的风险点,围绕这些进行投资,一是助推整个产业的生存和发展,同时也是因为市场巨大。
另一个关注点是产业的创新,我们有时叫“换道超车”。比如现在半导体的制程已经微缩到一定极限了,如何用一些其他的方法或新的计算手段去继续摩尔定律,继续进行高性能计算,从而为 AI 整个体系打下基础;抑或在新能源、新制造领域,如何通过新技术的引入,使其能够为新的需求所用,开创一些全新的结构,比如汽车、航天领域,这是我们现在特别关注的趋势。
在这些领域,真正能解决问题的、大家使用更多的还是偏传统的“AI for science”。比如像 CAE、EDA(工业软件),这些其实也是 AI,是传统“符号主义”范畴中的 AI。(符号主义:人工智能三大学派之一,主张人工智能源于数理逻辑,即通过逻辑符号来表达思维的形成。)
而对于整个 AI 行业,由于现在“深度学习、大模型”声量特别大,让很多人觉得只有“连接主义”才是 AI,如果没有大模型,没有深度学习,好像就不是 AI,这是不对的。(连接主义:人工智能三大学派之一,具有模拟人脑处理信息的能力,但网络的训练需要大量的时间和计算资源)。
现阶段,还是要把“符号主义”和“连接主义”结合起来,不能因为大模型炫酷,就统统跑到“连接主义”这条路上去,因为我们还是要去真正解决工程和科研中遇到的问题,传统的“符号主义”依然很重要,是当前能够解决问题最主要的途径。
五、深势科技虽然成立不到 4 年,但发展非常快,2020 年还一举拿下了有着「超算届诺贝尔奖」之称的戈登•贝尔奖。目前公司的产业定位是“新一代微尺度工业设计和仿真平台”,这个定位的深刻含义和思考,应该如何解读?新一代和老一代的差别在哪里?
胡成文:
微尺度面临的挑战和宏观可能不太一样,比如我要建个房子、一座桥或造一架飞机,我们的工程师、设计师基本上能在计算机上全程模拟出来,之后进行具体施工,质量也有保障。但回到微观领域,比如做药,通常还是需要做实验,要对几千个、几万个甚至几十万个分子持续地去测试,再比如材料,很多时候真的得生产出来一个个去试错。它没办法像宏观领域一样,整个流程可以在计算机上去模拟,然后再去实施就能把这个事情完成,微观领域还是大量试错和经验驱动的逻辑。
为什么会是这样的状态?因为传统的量子力学模型尽管模拟精度高,但在实际应用中,经常遇到一个巨大挑战是,微观粒子的数量极其庞大,粒子一增长,整个计算模拟的算力都是以指数级增加的,继而陷入“维数灾难”。仅能实现几十到几百个原子体系的建模,难以支撑药物、材料研究所需的数万乃至数百万级原子规模体系的模拟。
而深度学习背后的数学原理——深度神经网络对高维函数提供了有效逼近,使得它能够有效处理高维问题,最终可以实现上亿微观粒子规模的模拟。这是我们基于 AI for Science 一系列的解决方案,不用特别大的规模算力情况下,使得原本很多需要通过长时间实验和试错,甚至靠人的经验去做的一些微观设计,能够完全在计算机上去模拟,从而加快速度降低成本,这是我们做的比较大的创新突破,也是与老一代设计平台最根本的一个区别。
不过在实际运用中,我们会发现宏观、微观有时是一个连续的过程。举个例子,新能源电池的制造,需要先从微观领域去探索正负极、电解质不同的性质,然后找到不同的材料最终制成电芯组装成电池,再到生产应用,它本身不是一个纯微观或者纯宏观的问题。虽然现在我们这套平台可能以微观为主,但我们希望未来能够为工业伙伴提供完整的生产解决方案,而不局限于微观领域。
能够成为平台级的软件或公司,第一是在算法层面上,需要有一系列的突破和创新点,相对于传统工具、平台或解决方案,能够以数量级的效率去提升和解决客户在生产中遇到的实际问题。
第二是需要有一套解决方案,用户用起来要非常灵活方便,同时也提供一系列的灵活性。比如基于 AI 或大模型,深势科技会提供一系列预训练的数据集、模型、工作流,客户可以根据自己的场景特点,对模型里面的微调和各种工作流进行灵活适配,最大化满足特定场景的需求,最终希望为客户提供一个 SaaS 平台,可以进行快速迭代,满足用户各种新的需求。
六、2018 年商汤就已经开始进行大模型的相关探索,2023 年连续推出了多模态多任务通用大模型“书生(INTERN)2.5”和大模型体系“日日新 SenseNova”。商汤发布的大模型是否也能支持 AI for Science 或者前沿科技的研发?商汤人工智能产业基金的投资方向和投资逻辑是怎样的?
余俊:
针对大模型,商汤的投入是有前瞻性的。由于最开始有大量长尾场景算法需要去满足,如果全部通过非训练的方式,成本会更高,所以更多是通过生成式模型这种方式,来达到降低成本的目的。
目前商汤已经发布了一些相应产品,包括:商量 SenseChat(中文语言大模型)、秒画 SenseMirage(文生图创作平台)、琼宇 SenseSpace」/ 格物 SenseThings(3D 内容生成平台)等。之所以能不断推出 AI 大模型,得益于提前布局的大算力基础设施——商汤 AI 大装置,并且已经为 10 家左右的大模型客户提供了整体的算力支持,帮助其尽快缩短大模型的训练周期,提高效率。
对于具体应用的未来商业化方向,就商汤而言,个人认为,由于国内数据集和数字应用场景的问题,未来在 2B 的场景里会有很多符合商汤商业化基因的重要机会。
从投资的方向来看,无论是 AI for Science 或是大模型甚至是范 AI 的应用,我们还是会去寻找一些偏 2B 的应用场景,也包括类似 AI Agent 这样偏产品化的一些公司。而广大创业者需要关注的是那些资本进入较早,效率提升更快以及商业和货币化增长空间更大的领域。
另外,我个人比较关注的还有大模型、多模态和机器人的结合,会思考如何利用商汤的优势去赋能这些多模态机器人公司。无论是 2B 还是 2C 的场景,这中间还是有很多机会的。
七、从投资人的角度,不仅看到机会,往往也会高度重视和研究风险,您觉得在 AI for Science 这种前沿领域,会存在哪些高度的风险或特殊的风险?对于 AI for Science 的应用者,您有什么建议?
蒋纯:
说风险并不意味着不看好这个领域,深度学习、大模型肯定是有用的,否则也不会有如此多的关注和进展。在我的理解里,AI for Science 相当于是人类探索自然世界的一把尺子,所以用起来要确保这把尺子是准的,如果“尺子不准”,就会出比较大问题,所以从“校准”这个角度,有三点要特别关注。
一是“边界感”。由于任何一个科学测量手段或者理论都有它的边界,有它的局限性,肯定有一些它无法做到的地方,那么在什么样的情况下,它是可用的,需要我们把它划出来,说明白。
二是“可解释性”。虽然大家一直觉得有些东西本来就是不可解释的,有用就行,但现在即使是 OpenAI,都只能试图用 GPT4 来解释 GPT2 节点的一些情况。这说明目前还没有针对大模型实现可解释性的好办法。但只有“可解释性”才能充分证明这个“尺子”是准的,不然真的不知道会出现什么结果。比如深度学习放到自动驾驶上,很多人就不一定敢用,就怕它“不可解释”,最后出现问题不好收场。
三是“失效场景”。由于 AI 在解决一些问题时,会使用降维的方式把高维数据转换为低维数据,以便更好地进行分析和处理。从数学角度来说,这样很可能就会丢失某一部分信息,有些信息丢掉没有问题,但也许有些信息丢掉就会有问题。
比如在视觉识别场景下,如果放一个奇怪的形状进去,有可能会导致识别失败或者误识,这就是一个典型的“失效场景”。所以,这些失效场景在哪里,它是怎么产生的,或者如果我们不知道它怎么产生的,至少可以把它圈出来进行规避,这是需要搞清楚的。
我认为任何事物都有风险,任何理论都有边界,但只要我们能把这个边界框出来,尽可能做到可解释,并且关注它的失效场景,就可以把很多风险排除掉,让我们可以更好地前进。
作为一个旁观者,我们要用好 AI for Science 这把“尺子”,需要把前面说的三个问题处理好,而处理好的前提,最重要的还是要去用。
希望不管是创造者也好,潜在客户也好,大家还是要有一种开放的心态去拥抱这些新生事物,去大胆用。用的过程当中,无非就是发现问题、解决问题。这样我们才能发现边界,找到进一步改善的空间,才能把整个“尺子”测量的有效程度和失效的地方弄清楚。
八、深势科技是典型的科学家创业项目,是否遇到过一些科学家创业的典型挑战?是如何面对和处理的?深势科技是跨界科技创新项目,既需要计算机科学家,也需要人工智能、生物医药、材料等领域的科学家,要融合这么多不同领域的专家人才,有哪些探索和经验?您毕业于清华大学,之前供职于百度,成功打造第一代亿级用户高并发在线系统,从头搭建了数百人规模的顶级技术团队,来到深势科技之后,在研发管理和产业化方面有哪些更新的发展规划?
胡成文:
科学家创业的挑战之一是技术能力很强,但如何落地到最终的产品比较难;另一个更大的挑战是,把算法或 idea 最终落地成产品之后,如何能够卖给客户形成一个商业闭环。
我们团队运气比较好,少走了很多弯路,关键就在深势科技的两位创始人——首席科学家张林峰和 CEO 孙伟杰是非常好的搭档,又是北大元培的同学,一开始就建立了很强的信任感。
由于北大元培的特殊的培养体系,林峰的专业是物理、数学、计算机,偏理工科,偏科学;伟杰的专业是政治、经济、哲学,两人不仅专业互补,而且在管理和商业领域也有着非常好的能力互补。所以不管是在科研领域还是商业领域,目前我们走得相对还是比较顺的。
我有三点经验和大家分享。
第一,一定要明确自己是一家商业公司,不是研究院所。虽然我们有星辰大海的梦想,但商业公司最终的目的是要形成一个良好的商业闭环,要赋能我们的客户成功,所以最终客户的需求能否满足好,是我们判断绝大部分事情最终的一个决策点,就是客户导向,而不是说我们有这个能力,用户就会用我们的产品。
第二,要尊重专业,尊重行业内人才的经验。因为在这个领域你是专家,很可能在其他领域就是小白,我们是交叉的学科,有很多行业领域的专家,他们都是非常非常有经验的,所以我们要去尊重和学习他们的经验,并结合自己已有的经验形成化学反应,最终形成 1 + 1 大于 2 的结果。
第三,要不断去学习,与行业伙伴和领域专家能有一套共同的对话体系。也许没有办法达到专家那么深的能力,但是你需要快速地去理解他的语言和整个体系结构,这样才能迅速协同地去推进事情的进展。
我来到深势之后也是一个重新开始学习的过程。首先是做了一些体系化的工作。由于最终我们需要去落地解决问题,形成方案,交付产品,需要有体系化的解决思路方案,所以我们做了大量关于系统化的建设,不管是人的方面,还是开放流程、客户交付流程,算法研发流程等。
其次是快速迭代。我们的客户诉求差异化相对比较多,所以从新的 idea 开始到算法完成,再到最终做成产品,最后交付,拿到用户反馈,我们还是希望各个阶段能尽可能的快,要缩短我们的反馈周期,能及时倾听到客户的声音,能够像互联网那样小步快跑,快速迭代优化产品。
再次是打造内部实验室平台,加速迭代过程。我们产品的业务模式具有特殊性,所以会很多创新思路和算法,有一部分最终会作为产品交付给客户,也有一部分会再不断打磨、训练,中间是有“漏斗”的一个过程。
那么如何验证这些思路或算法是否需要落地,怎么去落地,过去存在很多瓶颈。我们就打造了一个内部实验室,提供内部监测平台,科研人员在做算法的同时,可以把从算法到代码甚至到系统能够快速地搭建起来,最终看到一个效果。无论是内部评估算法最终落地的可能性,还是给客户做 Demo,都能以一个还不错的初步雏形,来做展示。
九、2021 年世界人工智能大会期间,商汤正式推出新型 AI 基础设施——SenseCore 商汤 AI 大装置。2023 年 2 月 25 日,商汤大装置 AI 云正式上线。商汤大装置 SenseCore 在千卡集群上达到了 90% 的利用率,远远领先行业平均水准。那么商汤大装置和现在大家普遍说的大模型的主要区别和竞争壁垒在哪里?商汤 AI 大装置 主要覆盖的客户群和应用场景有哪些?
余俊:
智能化的应用需求爆发式增长,使得 AI 进入生产阶段,大量的企业有需求,但本身很难具备把 AI 模型快速生成出来的工业化流水线式的生产能力。不仅如此,高昂的成本和模型迭代所要耗费的时间,也让很多公司望而却步。
所以,专业的事还是需要专业的人去做,因为大模型里要解决的是预训练的模型,集中式的研发,涵盖包括大数据、大参数等领域,中间可能还会涉及网络存储、计算、调度等方面。
而 AI 大装置基于 AI 算力中心(AIDC)可以帮助有需求的企业“生产”大模型,解决模型制造、高性价比等方面的问题。举例来说,第一,它本身是算力的基础设施,能够解决大模型如何达到一个最优的成本,如何去设计计算,网络、存储以及适应典型 AI 的场景,包括如何去解决系统性瓶颈的问题,模拟训练的周期、效果问题等,这些是基础设施层面的问题。
第二,AI 模型生产其实也是有流水线的,包括认知、人才、技术、模型上线的成本、工程系统的复杂性、模型效果的衰减等等,同时还有比如部署的问题,规模的问题。所以这种集约化的、规模化的设施,在比较早时我们就判断未来一定会有市场,但其间还是有很多工程化的 Know-How,需要一步步地由专业团队去做。
从生意的角度来看,商汤 AI 大装置目前会更多专注于愿意支付更多资金的公司所涉及的场景。首先肯定是大模型预训练的这一类公司,因为他们有比较大的算力需求。目前市面上,商汤 AI 大装置已经支持了 10 个大模型(以千卡并行)进行训练。
除了大模型之外,涵盖的应用场景还有智能驾驶、生物制药、芯片设计等对算力要求较高的前沿领域。另外,元宇宙和数字资产运行方面也有涉及,但相比其他而言是较小的场景。
十、蒋总在 2020 年发表的一篇关于《人工智能投资的黄金十年》的主题分享中谈道:新基建与世界的数字化认识、深度学习开启新黄金十年,以及通过数字孪生,把人工系统和真实系统放在一起,也是创新产业能否取得成功的关键等观点。其中,把人工系统和真实世界联系在一起的数字孪生,这也是盛景所特别关注的元宇宙 + 人工智能领域,想请您分享一下对于“元宇宙 + 人工智能”未来的发展设想?在 AI for Science 或者人工智能领域,您的投资逻辑或者比较看好的核心要素是什么?
蒋纯:
元宇宙,我理解有两个定义,一个是“你想怎样就怎样”。你可以创造一个随便你想象的世界,有点像消费元宇宙或者娱乐元宇宙,只要你觉得这个东西对你个人有意义,对人娱乐放松有意义,就可以随意创造,不管是故事世界设定,还是物理规律,反正这个事由你自己说了算。
还有一种是和真实世界一一对应的元宇宙,我们一般叫它“数字孪生”,也是一种特殊的元宇宙。很多对于真实世界来说高风险的演练或者成本非常高昂的事情,可以在这个特殊的元宇宙里进行仿真,然后通过人工智能反复地去优化解决问题的路径,最终能够得到一个最标准的最好的处理方式。它如果以后还能跟机器人结合,还可以把它映射到真实世界去,对于如何应对真实世界的各种挑战,就会变得非常方便。
但是具体到和 AI for science 结合,就会有一个悖论。数字孪生的基本逻辑是世界已经被仿真了的,但是基于连接主义的 AI for science 之所以出现,就是因为在一些微观尺度上,一些未能被我们充分理解的自然和工程现象中,传统的仿真没有能力完全做好。基于连接主义的 AI for science 本来就是用来补这个空缺的。所以数字孪生的元宇宙和 AI for science 的结合本身是个很有意思也很有挑战性的话题。甚至会牵涉到更深层次的思考:那就是无论我们怎么讲连接主义的 AI,我们喂给 AI 的,其实还是“符号”,是人类处理过的数据,而非真正自然界的真实情况。我们可以称它为一种“基于符号主义的连接主义”。所以,如何通过传感器让 AI 接触真实的自然界,做一个“纯连接主义 AI”,这是在 AI for science 的元宇宙里独特而非常有想象力的话题。
至于说到投资逻辑,那其实简单的多,说白了就是看它有没有真实的用处。因为实践是检验真理的唯一标准,只要这个东西确实能真正解决问题,那它就有投资价值。
如果它还没有体现出有用,或者它的用处是不确定的,就比较麻烦。比如在 A 处或许有用,但在 B 处没用,但 A 是什么,B 是什么,哪些地方有用,哪些地方没用,说不准;或者一会有用,一会没用,如果是这样的 AI for Science,这个事情就没办法运作。就像疯子预言家一样,他平常疯疯癫癫,但是有时候说两句话又是非常准确的预言,你也不知道该相信他,还是不相信他。
因此,我只有精确地知道,它在什么时候是有用的,什么时候是没有用的,而且还能通过一定方式去解释,那这个东西就会比较有用,我们想要寻找的其实就是类似于这样的一些标准,因为它会真正对人类社会的发展起到非常重要的作用。
十一、6 月 10 日,深度学习之父 Geoffrey Hinton 出席被称之为中国“AI 春晚”的 2023 年智源大会,并线上发表题为《通向智能的两条通路》(Two paths to Intelligence)的主题演讲,作为大会的压轴闭幕演讲。想请湘云总谈谈您的理解。
王湘云:
这其实是一个蛮宏大的问题,Hinton 可能圈外的人不太了解,但是圈内的人都知道,他是深度学习的教父,2018 年图灵奖获得者,是人工智能产业前沿的领军人物,之前也是谷歌的科学家,既有学术研究背景,也有产业的衔接。Hinton 在 80 年代开始就提出了今天非常重要的一些理论、算法,但实际上有大概几十年的时间他都处于边缘人的状态。
说这些背景看似好像跟我们的主题无关,但我恰恰想说的是,可能一些前沿科技的研究,它需要一些人超越我们今天的一些环境约束,要用思维实现的方式超越地去看未来,就像爱因斯坦当年提出相对论的时候,他也没有什么装置去实验,是很多年以后才被验证,但是他是用思想在做实验。
实际上可能一些前沿科技的东西,它还是需要人的智能去超越物理条件的限制去思考。未来人工智能这样一个前沿科技,既需要我们在算力、算法、数据等以及生产要素上面不断地去迭代,同时也更需要这种具有坚定信念的,就像 Hinton 这样从 80 年代开始,坐了几十年冷板凳却依然坚定的人,他们从思想、从逻辑上考虑很多问题,这样可能会给我们带来很多新的道路和方向。
再具体谈到 Hinton 的演讲,他这次演讲的题目叫“通向智能的两条道路”,我是觉得有一些关键的内容,还是需要分享一下。
第一个,Hinton 提到了一个叫“super-intelligence(超级智能)”的概念,实际上在讨论人工智能的时候,大部分讨论的还是 AGI,即通用人工智能,而我理解的通用人工智能对标的还是人的智能,大家现在也认为大模型其实只是看到了通用人工智能的曙光,离通用人工智能还有一些实质性的差距。只是大家觉得朝这条路走下去,也许说能走通或者部分走通,但业内也没有一致的意见。
但在 Hinton 的演讲中,他提到的“super-intelligence”已经超越人的智能了,同时 Hinton 告诉我们“super-intelligence will a quite soon(超级智能很快会到来)”让我非常震撼。在其他资料中显示,Hinton 原以为这种超级智能,可能会需要一百年才能到来,但他最近改变了想法,他认为可能只需要 5 -20 年的时间。鉴于 Hinton 是一个非常有前瞻性的人,我觉得这件事情值得我们去认真思考。
第二个,Hinton 谈到了实现 super-intelligence 的路径,就是实现人工智能的两条路线的结合,是哪两条路线呢?第一条路线:数字计算(digital computation)也就是今天我们所用的计算机,软件和硬件分离,通过这种方式,实现了智能和数据的永生,也就是说,今天所有训练的人工智能模型、数据、参数,哪天你换另一套硬件也完全没问题,它可以无缝切换,这是今天我们普遍使用的计算方式。
它的特点是标准统一,只要你按照我们的工业制程方法设计制造出来,它的质量是统一的,你可以随意替换,这种计算机它能够形成一个可控的结果。但这种计算机器它缺乏的是什么呢?对真实世界的适应性。它能够基于现有人产生的文本数据去训练,性能特别强,一旦把它放到变化的动态环境中,它可能就没有那么强了。
所以 Hinton 提到了第二个路径:生物计算,也叫模拟计算。软件和硬件不能分离,要紧密地捆绑在一起的,硬件消失软件和数据也就消失,但现在业内对它的研究凤毛麟角。
我想说的是,Hinton 提供了一个全新实现智能的思路和框架,在人工智能的前沿领域,说不定某一天就会有一个新的道路出现,只是它现在还不被大家普遍认可,或者没有普遍研究。
但最重要的一点,就是 Hinton 的结论,他认为超级智能有一天会控制人类。这个观点从他这样地位的人口中说出来,我觉得不是空穴来风,他有一套逻辑,大家有兴趣的可以去看一看。
最后,他跟大家说,自己已经七十多岁了,看不到这一天了,但是希望年轻人更好去应用超级智能的同时,不要让超级智能来控制我们。他说自己不知道该怎么处理,甚至我感觉他对此还有很多的不确定性,但是希望年轻人来研究这个问题。
Hinton 的演讲,我觉得是有思辨性、哲学性的,这种思辨性就是思想实验,是人非常重要的智能的体现,也是前沿科技研究非常重要的能力。他已经把自己的接力棒往下一代年轻人身上去传递了,这也是我们所说的:科技的薪火代代相传。所以我想用这个分享,作为我们今天和这次系列大模型直播的结束语。
我觉得今天所有的科技,一定是基于智能发展的基础上,不管是人的智能也好,还是人工智能也好,智能的发展才能推动科技的发展,科技的发展才能推动我们生产力的发展,生产力的发展才能推动我们生产关系的发展,生产关系的发展才能让我们的世界变得更好,让我们的生活更幸福。
所以也希望我们所有在人工智能这样一个行业里,每天都在日夜奋进的科学家们、工程师们,还有志同道合的伙伴,包括投资人,大家一起努力,为我们人类智能的发展来作贡献,同时我相信经过我们的努力,我们也许真的能完成 Hinton 给我们的任务,那就是找到一个既能够拥有超级人工智能,又能很好的控制超级人工智能的道路。
原文链接:https://new.qq.com/rain/a/20230703A0368200