Agent：OpenAI的下一步，亚马逊云科技站在第5层

262次阅读

原创关注前沿科技量子位

丰色梦晨发自凹非寺

量子位 | 公众号 QbitAI

大模型下半场拉开序幕。

Agent 成为最受重视的方向。

OpenAI 创始成员 Andrej Karpathy 就在黑客马拉松演讲中表示，相比大模型训练，OpenAI 内部目前更关注 Agent 领域。

每当有新的 Agent 论文出来的时候，团队都会很兴奋并且认真地讨论。

你们（开发者们）都正站在 Agent 开发的最前沿，这个领域 OpenAI 也没什么积累。

什么是 Agent？

在大模型语境下，可以理解成能自主理解、规划、执行复杂任务的系统。

以 AutoGPT 和 BabyAGI 为代表的技术演示型项目，今年 4 月短暂的火了一阵，但离真正应用到业务中还有一段距离。

现在，Agent 第二轮爆发正在酝酿中，标志就是新一轮应用与场景结合更紧密了。

不出意外，先行动起来的又是编程开发行业。

最近的热门开源项目 Sweep，直接与 GitHub 的 Issue 和 Pull Request 场景整合，自动“清扫”bug 报告和功能请求，直接完成对应代码。

创业公司中，也有 OpenAI 支持的 Cursor 代码编辑器，把生成代码抬到了一句话生成整个项目框架的高度。

接下来，Agent 也将成为新的起点，成为各行各业构建新一代 AI 应用必不可少的组成部分。

对此，初创公司 Seednapse AI 创始人提出构建 AI 应用的五层基石理论，受到业界关注。

Models，也就是我们熟悉的调用大模型 API。

Prompt Templates，在提示词中引入变量以适应用户输入的提示模版。

Chains，对模型的链式调用，以上一个输出为下一个输入的一部分。

Agent，能自主执行链式调用，以及访问外部工具。

Multi-Agent，多个 Agent 共享一部分记忆，自主分工相互协作。

创业先锋之外，连 AI 基础设施的巨头也已经开始在 Agent 上发力。

比如亚马逊云科技纽约峰会上宣布的 Amazon Bedrock Agents 新功能，便是这种趋势最有代表性的体现。

Amazon Bedrock Agents 在全托管基础模型服务的基础上，又把开发、部署和管理多个 Agent 的能力打包集成在一起。

如果按照前面的五层基石理论，这类服务相当于直接从第五层开始，大大降低开发门槛。

正如亚马逊云科技在发布会上所形容：

只用几次点击，搞定能执行任务的生成式 AI 应用。

可以预见的是，降低了门槛的 Agent 应用也将在各行各业全面爆发。

Agent，AI 应用新时代的起点

怎样才算一个 Agent 应用？OpenAI 华人科学家翁丽莲给出直观的“配方”：

Agent = 大模型 + 记忆 + 主动规划 + 工具使用

以亚马逊云科技平台为例，开发 Agent 应用首先要根据具体任务场景给 Agent 选择合适的基础模型。

Amazon Bedrock 上除了自家的 Amazon Titan 大模型，还集结了擅长安全可控的 Anthropic、擅长检索汇总信息的 Cohere、以及专攻文生图的 stability.ai 等各家模型。

选好后，把要执行的任务指令直接用文字描述出来，让 Agent 明白要扮演的角色和要完成的目标。

指令可以是包括一系列“问题 - 思考步骤 - 行动步骤 - 示例”的结构化提示词，在 ReAct（协同推理和行动）技术支持下，基础模型可以通过推理和决策找出相应的解决方案。

接下来的重头戏便是 Add Action Group（添加动作组）。

Agent 要完成的具体任务，以及能使用的工具如企业系统 API、Lambda 函数等都是在这里设置。

官方演示中是一个保险索赔管理场景，Agent 通过提取未结索赔的列表、确定每个索赔的未完成文书工作并向保单持有人发送提醒来管理保险索赔。

所有动作组设置好后，创建 Agent 和部署都是几次点击就能完成。

部署完成后，在测试中就可以看到 Agent 理解用户请求、将任务分解为多个步骤（收集未结保险索赔、查找索赔 ID、发送提醒）并执行相应的操作。

Amazon Bedrock 通过向导式交互界面，减少了配置基础模型所需的编码工作量。

动作组提供调用 API 实现特定功能，以及使用自己的数据构建差异化应用程序，又让基础模型能够完成更复杂的实际业务任务。

在整个流程中，还可以配合亚马逊云科技平台上的各种安全服务。比如使用 PrivateLin 建立基础模型和本地网络之间的私有连接，所有流量都不会暴露给互联网。

又通过提供完全托管的服务，让开发者不需要管理底层系统就能发挥基础模型的能力。

最终缩短从基础模型到实际应用的周期，加速基础模型为业务创造的价值。

加速大模型应用，还应关注什么

有了 Amazon Bedrock 的 Agent 能力，我们得以快速将大模型投入实际业务，为企业实现降本增效或创新。

但要真正利用生成式 AI 的全部价值、发挥全部潜力，并与其他竞争对手拉开潜力，私有数据才是其中根本。

换言之，大模型应用落地的关键，是企业自己宝贵的行业数据。

如何集成这些丰富的资源到我们的 Agent 之中，保证我们的大模型应用在执行任务时能够高效访问到正确的信息——是当下每一个企业都要面对的问题。

当然，这一切都必须以保证隐私为前提。

除了私有数据的集成和调用，在大模型应用落地的路上，最为底层的支撑，算力，也始终是一个百说不厌的话题。

众所周知，当下的显卡资源异常稀缺，且价格不菲。

譬如有调查就发现，像英伟达的 H100，今年 4 月中旬在海外电商平台就已炒到超 4 万美元，甚至标价 6.5 万美元的也不算罕见。

无论是购买还是租用，这都成了全球各企业在探索生成式 AI 应用上的一大笔支出。

如何让这一笔花销更为经济实惠？这也是每个企业的思虑所在。

值得关注的是，以马逊云科技为代表的领先供应商，正在针对生成式 AI 落地过程中的这些挑战和痛点提供系统性的解决方案，对上述问题一一破解。

针对个性化数据问题，亚马逊云科技宣布为三款数据服务提供向量引擎，用来助力生成式 AI 应用与业务整合。

我们知道，在生成式 AI 爆发之后，向量数据库也实在火爆不已。因为相比传统的关系数据库，它能给予与模型上下文更相关的响应（如下图所示）。

亚马逊云科技这一最新服务，就是将我们的私有数据存储到具有向量引擎的数据库中，在进行生成式 AI 应用时，通过简单的 API 调用就能方便地查询企业内部的数据。

而根据当前数据存储位置、对数据库技术的熟悉程度、向量维度的扩展、Embeddings 的数量和性能需求等不同需求，亚马逊云科技提供了 3 个选项来满足：

-Amazon Aurora PostgreSQL 兼容版关系型数据库，支持 pgvector 开源向量相似性搜索插件；

- 分布式搜索和分析服务 Amazon OpenSearch，带有 k -NN（k 最近邻）插件和适用于 Amazon OpenSearch Serverless 的向量引擎；

- 兼容 PostgreSQL 的 Amazon RDS（Amazon Relational Database Service）关系型数据库，支持 pgvector 插件。

当然，最值得说道的是这次最新推出的 Amazon OpenSearch Serverless 服务，它最大的优点就是让企业只关心向量数据的存储和检索，而不用背上任何底层运维的负担。

解决完数据集成问题，在底层支撑上，亚马逊云科技这次也直接推出 H100 支持的全新 Amazon EC2 P5 实例，这一曾经对于大多数企业都相当难得的算力资源，现在也变得“唾手可得”了。

据了解，该实例包含 8 个英伟达 H100 Tensor Core GPU，640GB 高带宽 GPU 内存，同时提供第三代 AMD EPYC 处理器、2TB 系统内存和 30TB 本地 NVMe 存储，以及 3200Gbps 的聚合网络带宽和 GPUDirect RDMA 支持，可实现更低延迟和高效的横向扩展性能。

相比上一代基于 GPU 的实例，Amazon EC2 P5 可以让训练时间最多可缩短 6 倍（从几天缩短到几小时），降低高达 40% 的训练成本。

再加上亚马逊云科技之前基于自研芯片发布的 Amazon EC2 Inf2 和 Amazon EC2 Trn1n 等性能也表现不错的实例，我们在算力需求这一问题上，可以说是有了非常多的按需选择空间。

除了以上这些基础支持，各种开箱即用的 AI 服务也不“缺席”：

如针对开发环节的 AI 编程助手 Amazon CodeWhisperer，现在它与 Amazon Glue 实现集成，将 AI 代码生成的场景又扩展到一个新人群：数据工程师，只需自然语言（比如“利用 json 文件中的内容创建一个 Spark DataFrame”），这些开发人员即可搞定各种任务；

再如针对商业智能（BI）的 Amazon QuickSight，也能够让业务分析师们使用自然语言执行日常任务，在几秒钟内创建各种数据可视化图表；

还有 Amazon HealthScribe，可以用于医疗行业生成临床文档，节省医生时间。

这些工具都是主打让企业专注于核心业务，提高生产效率。

最后，简单总结，我们能够发现：

从今年 4 月起，亚马逊云科技就结合自身定位并基于真实用户需求出发，正式宣布进军生成式 AI 市场，为一切想要利用生成式 AI 技术加速或创新业务的企业提供服务。

在短短的 4 个月期间，亚马逊云科技已推出了各类底座资源，从基础模型到算力支撑，从私人数据存储到高效开发工具，应用尽有。

而这次在纽约峰会释出的最新动向，则是继续加码生成式 AI 应用开发所需的一切。

从 Amazon EC2 P5 实例代表的算力层、到 Amazon OpenSearch Serverless 向量引擎、Amazon Bedrock Agents 代表的工具层、再到 Amazon QuickSight 等代表的应用层，一项端到端的解决方案已然形成。

在这之中，亚马逊云科技不断降低生成式 AI 的门槛，无论是初创企业还是传统行业，无论是处于生成式 AI 进程的哪一层，都能在这里找到合适的工具，无需耗费太多精力在底层逻辑之上，便可快速投入实际业务。

如亚马逊云科技数据库、数据分析和机器学习全球副总裁 Swami Sivasubramanian 所说：

我相信生成式 AI 将改变每一个应用程序、行业和企业。

在各行各业都全力奔赴的这场全新技术变革之下，亚马逊云科技的这一系列服务，无疑为普通玩家赢得了宝贵的时间和机会。

我们可以期待：越来越多的生成式 AI 应用将被开发出来，生成式 AI 的创造力也得以渗透到各个领域，去改变、去颠覆每一个行业。

如果想了解更多构建生成式 AI 应用的资料，可以复制下面链接或点击阅读原文。

https://aws.amazon.com/cn/generative-ai/?social0731=&sc_channel=sm&campaign=genaikol

参考链接：

[1]https://www.youtube.com/watch?v=zyLOJEXm-lk&t=280s

[2]https://twitter.com/cristobal_dev/status/1684211808947650564

[3]https://twitter.com/lilianweng/status/1673535600690102273

[4]https://aws.amazon.com/cn/blogs/aws/preview-enable-foundation-models-to-complete-tasks-with-agents-for-amazon-bedrock/

— 完 —

点这里��关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

原标题：《Agent：OpenAI 的下一步，亚马逊云科技站在第 5 层》

原文链接：https://www.thepaper.cn/newsDetail_forward_24081978

正文完

openai 云计算亚马逊大数据科技

发表至：资讯

2023-08-02

转载说明：声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。

IDEA 用上这款免费 GPT4 插件，生产力爆表了

怎么跟火爆全球的ChatGPT聊天，详细攻略来啦

5月17日晚间要闻盘点：证监会降薪对标公务员！国家金融监管总局揭牌在即，一“黑嘴”获刑十九年被罚7903万

重读百度：文心一言意味着什么？

消息称OpenAI测试DALL-E 3 将推动AI图像生成进入新阶段