创建网站花费,怎么可以做网站,东莞网上推广,电商网站规划论文AI Agent#xff0c;最近火得一塌糊涂。
Sam Altman 曾这样描述未来的AI Agent#xff1a;“今天的AI模型是它们将会是的最‘笨’状态#xff0c;未来只会越来越聪明#xff01;” 吴恩达在AI Ascent 2024会议上也不吝赞美#xff1a;“这是AI发展的黄金时代#xff0c;…AI Agent最近火得一塌糊涂。Sam Altman 曾这样描述未来的AI Agent“今天的AI模型是它们将会是的最‘笨’状态未来只会越来越聪明” 吴恩达在AI Ascent 2024会议上也不吝赞美“这是AI发展的黄金时代生成式AI和AI Agent将彻底改变我们工作的方式”。这些业界领袖的话让人感受到未来AI与人类生活、工作的深度融合正在加速到来。Agent之所以能成为Agent是因为它具有了判断的能力因而能够做成决策。那么它的判断能力是从哪里得到的是从海量的人类语言中提炼出来的智慧。因为我们人类的自然语料中指定了场景A中应该这样做场景B中应该那样做。因此大语言模型也就能够做出判断。这就是大语言模型成为Agent的基础。一个可爱的Agent不过愿景虽好现实并不理想。公众号“产品二姐”的一篇文章就指出——Agent开发者坦白大家正在窘境中前行。Agent的开发现状是既没有什么有体系的理论指导有没有什么优秀的范例来启发并模仿。那么在大模型应用开发时代大家都在讨论的Agent到底应该如何设计实现。本文作者黄佳代表作GPT图解动手做AI Agent将以干货的方式全面解析7大设计模式的设计理解和实现方式。一、Agent认知框架的4种设计模式吴恩达教授在红杉资本的人工智能峰会(AI Ascent)上谈到了自己对于AI Agent认知框架设计模式的四种分类包括反思、工具使用、规划、多智能体协作。吴恩达教授提出的Agent认知框架的4种设计模式这四种基本的思维框架设计模式分别是反思ReflectionAgent通过交互学习和反思来优化决策。工具使用Tool useAgent 在这个模式下能调用多种工具来完成任务。规划Planning在规划模式中Agent 需要规划出一系列行动步骤来达到目标。多Agent协作Multiagent collaboration涉及多个Agent之间的协作。Agent认知框架的技术架构OpenAI公司的安全系统主管Lilian Weng也提出了一个由大模型驱动的自主Agent系统的架构其中包含规划Planning、记忆Memory、工具Tools、执行Action四大要素。在这个架构中Agent位于中心位置它通过协同各种组件来处理复杂的任务和决策过程。规划Agent需要具备规划同时也包含决策能力以有效地执行复杂任务。这涉及子目标的分解Subgoal decomposition、连续的思考即思维链Chain of thoughts、自我反思和批评Self-critics以及对过去行动的反思Reflection。记忆:包含了短期记忆和长期记忆两部分。短期记忆与上下文学习有关属于提示工程的一部分而长期记忆涉及信息的长时间保留和检索通常是通过利用外部向量存储和快速检索。工具这包括了Agent可能调用的各种工具如日历、计算器、代码解释器和搜索功能以及其他可能的工具。由于大模型一旦完成预训练其内部能力和知识边界基本固定下来而且难以拓展那么这些工具显得异常重要。它们扩展了Agent的能力使其能够执行超出其核心功能的任务。执行或称行动Agent基于规划和记忆来执行具体的行动。这可能包括与外部世界互动或者通过工具的调用来完成一个动作任务。围绕着这个架构一系列的Agent认知框架开始落地。接下来我们将重点介绍几种具有代表性的Agent认知框架设计模式及其实现思路。二、7种Agent认知框架的具体实现下面我们就来说一说主流的7种Agent认知框架的基本思想并简明扼要的阐述如何具体实现这些框架。框架 1 思维链Chain of Thought在Agent认知框架领域开一代风气之先的就是Chain-of-Thought Prompting这篇论文这篇论文的出现甚至是早于ChatGPT。在大模型推理能力普遍较弱的时代这篇论文通过引入连贯的思考过程来引导模型进行更深入的逻辑推理极大地提高了模型处理复杂问题的能力。这种方法不仅优化了模型的推理过程还改善了输出的可解释性使得模型的决策过程对于用户来说更加透明和易于理解。论文中的Chain of Thought简称CoT即思维链是指在解决问题过程中形成的一系列逻辑思考步骤。在AI领域尤其是在自然语言处理和机器理解任务中CoT方法通过模拟人类的思考过程来提高模型的理解和推理能力。通过明确展示解决问题的逻辑步骤CoT有助于增强模型的透明度和可解释性。Chain-of-Thought论文中的思维链示例其实我们设计Agent时需要参照的就是其方法论中的思想精华参悟了思想我们就可以通过精心设计的提示工程模板来实现CoT框架。举例来说假设我们需要建立一个模型用于评估个人的信用等级。这是一个典型的金融服务场景其中涉及多个变量和逻辑判断。在CoT框架下我们可以设计以下提示以帮助AI模型通过逻辑推理来评估信用等级考虑到申请人的以下信息- 年龄35岁- 年收入$50,000- 信用历史无违约记录- 负债$10,000的信用卡债务- 资产无房产有一辆值$15,000的汽车步骤1评估信用历史。申请人没有违约记录这是一个积极的信用因素。步骤2考虑年收入与负债的比例。申请人的年收入为$50,000而负债为$10,000债务收入比为20%这表明申请人有足够的收入来覆盖债务。步骤3考虑资产情况。虽然申请人没有房产但有一辆汽车可以作为贷款的担保。步骤4基于以上分析综合评估申请人的信用等级。最终判断根据以上逻辑推理申请人的信用等级应该是中等偏上。下面是一个使用OpenAI API调用CoT框架的示例这里使用Python语言进行编程。该代码通过发送一个包含逻辑推理步骤的详细问题描述到模型从而获得关于个人信用评估的决策推理。from openai import OpenAI client OpenAI() completion client.chat.completions.create( modelgpt-4, # 使用GPT-4模型 messages[ {role: system, content: 你是一个专门处理信用评估的智能助手能够通过逻辑推理来分析申请人的信用状况。}, {role: user, content: 考虑以下申请人的信息 - 年龄35岁 - 年收入50,000美元 - 信用历史无违约记录 - 负债10,000美元的信用卡债务 - 资产无房产 分析步骤如下 1. 根据年龄、收入和信用历史来评估违约风险。 2. 考虑负债与收入的比率判断负债水平是否合理。 3. 评估无房产的风险因素考虑是否会影响申请人的偿债能力。 根据上述分析步骤请评估这位申请人的信用等级。 } ] ) print(completion.choices[0].message)这里我们构造了一个详细的提示引导模型沿着设置的思维链路进行逻辑推理。这种方式不仅有助于生成更可解释的答案而且能够提高决策的准确性。CoT这篇文章是一石激起千层浪后面研究大模型推理认知的文章就逐渐丰富了起来。框架2 自问自答Self-Ask顺着Chain-of-Thought的思路就有了Self-Ask是对CoT的进一步扩展。Self-Ask它允许模型自我生成问题进行自查询来获取更多信息然后再结合这些信息生成最终答案。这种方法使模型能够更深入地探索问题的各个方面从而提高答案的质量和准确性。Self-Ask论文中的示例Self-Ask这种认知框架在需要深入分析或创造性解决方案的应用中非常有用例如创意写作或复杂查询。假设我们正在设计一款新的智能手表需要考虑用户的多样化需求和技术可能性。我们可以设置如下的 Self-Ask 框架from openai import OpenAI client OpenAI() completion client.chat.completions.create( modelgpt-4, # 使用GPT-4模型 messages[ {role: system, content: 你是一个专门处理产品设计创新的智能助手能够自我生成问题来探索创新的设计解决方案。}, {role: user, content: 我们正在开发一款新的智能手表。请分析当前市场上智能手表的主要功能并提出可能的创新点。 }, {role: system, content: 首先考虑目前市场上智能手表普遍缺乏的功能是什么}, {role: system, content: 接下来探讨哪些新增功能可能吸引健康意识强的消费者}, {role: system, content: 最后分析技术上可行的创新功能这些功能如何通过可穿戴技术实现} ] ) print(completion.choices[0].message)在这个示例中通过系统自我生成的问题和回答不仅引导了深入的市场和技术分析还激发了对潜在创新点的思考。 这种方法有助于在产品设计初期阶段就识别和整合创新的元素。你可以通过Few-shot的方式以这个样板为例让大模型自己进行更多有创造性的思考往往能激发我们开始并没有想到的创意点子。框架3 批判修正Critique Revise或 反思RefectionCritique Revise批判修正这个认知框架也叫做Self-Refection是一种在人工智能和机器学习领域中应用的框架主要用于模拟和实现复杂决策过程。这种架构基于“批判”和“修正”两个核心步骤通过不断迭代改进来提高系统的性能和决策质量。批判Critique在这一步骤中系统会评估当前的决策或行为产出并识别出其中的问题或不足之处。这一过程通常涉及与预设目标或标准的比较以确定当前输出与期望结果之间的差距。修正Revise基于批判步骤中识别的问题系统在这一步骤中会调整其决策过程或行为策略以期改进输出的质量。修正可以是对现有算法参数的调整也可以是采用全新的策略或方法。Critique Revise 认知架构的目标是通过不断自我评估和调整使系统能够学习并改进决策过程从而在面对复杂问题时做出更加有效的决策。假设一家公司正在评估其最近的数字营销活动效果以便制定未来的营销策略。使用 Critique Revise 框架可以通过以下步骤来优化决策过程批判Critique系统首先分析现有营销活动的数据包括广告点击率、转化率、消费者互动情况等并与既定的目标或行业标准进行比较。在这一阶段系统识别出当前策略的不足之处例如目标受众定位不准确、广告内容不吸引人或预算分配不合理。修正Revise基于批判阶段的分析结果系统提出改进方案。这可能包括调整目标受众、重新设计广告内容、或优化预算分配策略。此外系统还可能推荐测试新的营销渠道或技术以提高整体营销效果。代码实现如下from openai import OpenAI client OpenAI() # 执行 Critique 阶段 critique_completion client.chat.completions.create( modelgpt-4, messages[ {role: system, content: 你是一个市场营销分析助手。}, {role: user, content: 分析最近一次营销活动的效果并指出存在的问题。} ] ) # 执行 Revise 阶段 revise_completion client.chat.completions.create( modelgpt-4, messages[ {role: system, content: 你是一个市场策略优化助手。}, {role: user, content: 根据之前的批判提出具体的改进措施。} ] ) print(Critique Results:, critique_completion.choices[0].message) print(Revise Suggestions:, revise_completion.choices[0].message)在这个过程中AI系统首先执行 Critique 阶段分析和识别问题然后在Revise 阶段根据识别的问题提出具体的改进措施。这种方法帮助企业深入理解市场动态精确调整营销策略从而实现更有效的市场应对。框架 4 函数工具调用Function Calling/Tool CallsFunction Calling是由OpenAI提出的一种AI应用开发框架。在这种架构中大语言模型被用作调用预定义函数的引擎负责判断根据用户的需要自动调用哪些工具。OpenAI Assistant中的支持的工具有代码解释器数据分析、函数调用、文件检索工具等等。对于需要与现有系统集成或执行具体技术任务的应用如自动化脚本或数据分析此方法非常合适。Open AI Assistant中的各种工具当然工具调用这种框架并不仅仅属于OpenAI API所专有LangChain中的Agent也集成了大量的可用工具。LangChain中的工具和工具箱关于Agent的工具调用目前的常见大模型开发框架都已经形成了非常完备的解决方案。框架 5 ReActReasoningPlan-and-Acting那么有了CoT的逐步推理 有了Refection的反思又有了工具调用我们就终于来到了Agent认知框架的集大成者—— ReAct框架这个框架整合了先前的CoT和Reflection方法并引入了工具调用功能进一步增强了模型的交互能力和应用范围代表了在Agent认知框架发展中的一个新的里程碑。ReAct论文中指出既要有推理又要有行动ReAct框架是推理和行动的整合Reasoning and Acting, ReAct框架的核心思想在于 在思考观察和行动 反复循环迭代不断优化解决方案知道问题最终解决位置这就不仅使Agent能够进行复杂的内部推理还能实时反应并调整其行为以适应不断变化的环境和需求。目前ReAct框架已经被无缝集成至LangChain开发者可以非常轻松地创建ReAct Agent来完成具体任务。框架 6 计划与执行Plan-and-ExecutePlan-and-Execute可以翻译为计划与执行架构。这种架构侧重于先规划一系列的行动然后执行。它使LLM能够先综合考虑任务的多个方面然后按计划行动。在复杂的项目管理或需要多步骤决策的场景中尤为有效如自动化工作流程管理。Plan-and-Solve论文中的示例目前LangChain的Experiment实验包中支持Plan-and-Execute框架开发者可以尝试创建Plan-and-Execute Agent对任务先计划再具体执行。Plan-and-Solve的实现示例框架 7 多Agent协作Multi-Agents Collaboration多Agent系统Multi-Agent System的确是一个新的研究热点。这类研究关注如何使多个Agent协同工作实现复杂的任务和目标。这包括合作、竞争以及协商策略的研究。这类多Agent协作框架的代表性作品是AutoGen和MetaGPT。AutoGen框架中的Agent定制Agent Customization功能允许开发者对Agent进行定制用以实现不同的功能。MetaGPT的框架它将标准操作程序SOPs与基于大模型的多智能体系统相结合使用SOPs来编码提示确保协调结构化和模块化输出。这种框架允许智能体在类似流水线方法的范式中扮演多样化的角色通过结构化的智能体协作和强化领域特定专业知识来处理复杂任务提高在协作软件工程任务中解决方案的连贯性和正确性。MetaGPT的Demo中构建了一个软件公司场景下的多Agent软件实体它能够处理复杂的任务模仿软件公司的不同角色。其核心理念是代码等同于团队的标准操作程序Code SOP(Team)将标准操作程序具体化并应用于由大模型组成的团队。软件公司组织角色图这个软件公司的组织角色图突出了公司内的不同角色及其职责。老板Boss为项目设定总体要求。产品经理Product Manager负责编写和修订产品需求文档PRD。架构师Architect编写和修订设计审查产品需求文档和代码。项目经理Project Manager编写任务分配任务并审查产品需求文档、设计和代码。工程师Engineer编写、审查和调试代码。质量保证QA编写和运行测试以确保软件的质量。你只要输入一行具体的软件开发需求。经过几轮协作MetaGPT的假想软件工程团队就能够开发出真正可用的简单APP。当然MetaGPT的功能不仅限于此还可以用于其他场景构建应用程序。各种认知框架的组合运用上述认知框架当然是可以的组合的比如说ReAct框架中就一定应该配置Tool Calls通过工具的调用Tool Calls 才能够改变环境的状态继续观察才能够进一步的思考。ReAct Tool Calls当然每种Agent认知架构都有自己独特的优势至于选择哪一种如何组合起来更实用取决于具体需求、应用场景和期望的用户体验。选择适合应用的认知架构是大语言模型应用开发的一个关键步骤。好吧今天的干货分享就到这里。我试图用比较简短的篇幅从理论到实践全面系统地分析了Agent技术的发展现状希望能够为你的Agent应用开发提供了参考和启发。未来Agent技术的进一步发展将深刻影响人工智能在各领域的应用推动人机协同迈上新台阶。上述所有示例我的课程中均有代码实现和详细讲述从小白到专家一起入群学习大模型。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】