跳到内容
主题

AI代理与自动化

理解AI代理、RAG和自动化工作流。从概念到实际应用和实施指南。

34 篇文章

排序文章以找到您需要的内容

什么是多智能体?——架构、模式、框架、成本与决策准则的全景指南

什么是多智能体?——架构、模式、框架、成本与决策准则的全景指南

进入 2026 年,AI 智能体的讨论已从"无所不能的超级智能体"转向"由不同角色组成的智能体团队"。本文从定义出发,依次介绍单智能体跨不过的三道高墙、五大核心架构模式、Claude Agent SDK / OpenAI Agents SDK / LangGraph / Strands 四大框架对比、Anthropic Research 与 Claude Code 子智能体等真实案例,以及 2 至 15 倍令牌的成本结构,并给出"何时该用、何时不该用"的判断准则。请丢掉"上多智能体就更聪明"的幻想,带走真正可用于设计决策的依据。

GPT-5.5 vs Claude Opus 4.7:实战正面对决——基准、编码、代理、定价、如何选择

GPT-5.5 vs Claude Opus 4.7:实战正面对决——基准、编码、代理、定价、如何选择

2026 年 4 月,Anthropic Claude Opus 4.7 与 OpenAI GPT-5.5 相隔一周接连发布。Opus 在真实代码库工作上领先(SWE-bench Pro 64.3%);GPT-5.5 在终端控制与客户支持上领先(Terminal-Bench 82.7%、OSWorld 78.7%)——强项几乎互为镜像。而 Opus 标价虽低,输出令牌量却常常让 GPT-5.5 在同一任务上的真实成本只有 Opus 的约四分之一。本文系统梳理规格表、基准深度解读、令牌经济学、强项与弱项一览、按场景的选型,以及双供应商策略,全部基于官方资料与第三方评测。

什么是缰绳工程(Harness Engineering)?AI 代理时代 LLM 外侧那一层的设计学

什么是缰绳工程(Harness Engineering)?AI 代理时代 LLM 外侧那一层的设计学

重心已从提示词工程转移到缰绳工程——这是 AI 代理时代全新的主战场。本文系统梳理缰绳工程到底是什么、与提示词工程有何不同、6 大组件(工具定义、上下文管理、记忆、循环、护栏、输出 UX),横向对比 Claude Code、Cursor、Codex CLI 与 Devin,并给出实用的设计清单——这是你认真使用或构建 AI 代理时不可或缺的根基。

AI 代理为何无视你的 .md 规则——让 CLAUDE.md、Cursor Rules 与 AGENTS.md 真正生效

AI 代理为何无视你的 .md 规则——让 CLAUDE.md、Cursor Rules 与 AGENTS.md 真正生效

AI 代理(Claude Code、Cursor、Copilot、Codex)无视你的 .md 规则文件,根源在 5 点:上下文窗口限制、自动压缩稀释早期指令、优先级模糊、措辞含混、文件臃肿且分散。本文从诊断方法、立竿见影的快速方案(压缩到 150 行内、添加优先级标记),到借助 Claude Code Hooks、子代理与自定义斜杠命令的长期系统化,并附各工具最佳实践。

ChatGPT 5.5(GPT-5.5)发布完全解析——基准测试、价格及与Claude Opus 4.7对比

ChatGPT 5.5(GPT-5.5)发布完全解析——基准测试、价格及与Claude Opus 4.7对比

OpenAI于2026年4月23日发布"ChatGPT 5.5(GPT-5.5)"。这款被定位为"面向real work与AI智能体的新一代智能"的模型,在Terminal-Bench 2.0上取得82.7%的成绩,超越Claude Opus 4.7(69.4%)和Gemini 3.1 Pro(68.5%),重夺榜首。然而API价格相比GPT-5.4翻倍($5/$30 per MTok),SWE-Bench Pro上仍输给Claude Opus 4.7,可谓有光有影。本文基于官方信息,全面解析新功能、基准测试、价格、套餐别提供情况、与Claude/Gemini的对比及选型指南。

RAG是什么?面向初学者的工作原理与用途详解

RAG是什么?面向初学者的工作原理与用途详解

想让ChatGPT读取公司文档来自动回答员工的问题——满足这类需求的关键技术就是RAG(Retrieval-Augmented Generation/检索增强生成)。本文用3个步骤图解RAG的工作原理,覆盖向量数据库、LangChain实现、与微调的区别等内容,面向初学者通俗易懂地讲解。同时介绍企业内部QA、客服、法律与医疗等丰富的实战用例。

有了Claude Code和Codex,基础设施与网络工程师会被淘汰吗?——AI正在改变的运维现实

有了Claude Code和Codex,基础设施与网络工程师会被淘汰吗?——AI正在改变的运维现实

当Claude Code和OpenAI Codex能够自动生成Terraform、Docker、Ansible等基础设施代码时,"基础设施工程师是不是要失业了?"的声音此起彼伏。但现实并没有那么简单。本文梳理了AI擅长的领域,以及物理层、故障判断、安全责任等只有人类才能胜任的领域,解析AI时代基础设施工程师应如何进化。