《面向智能体人工智能的 hitchhiker 指南》是一本面向实践者的全面参考手册,专为构建自主式人工智能系统而编写。本书从第一性原理出发,覆盖从基础理论到生产部署的完整技术栈,并围绕一个核心论点展开:要构建卓越的智能体系统,必须深入理解整个技术管线的每一层,而非仅聚焦于其中某一层。
全书开篇聚焦于大语言模型(LLM)这一底层基座——包括Transformer架构、GPU计算系统、模型预训练与微调(监督微调SFT、低秩适配LoRA、混合专家MoE)、模型压缩技术以及推理优化方法;这些内容被视作不可或缺的基础支撑,而非全书的唯一重心。随后,本书深入探讨对齐与推理层:涵盖基于人类反馈的强化学习(RLHF)、近端策略优化(PPO)、直接偏好优化(DPO)及其各类变体、通用奖励策略优化(GRPO)、奖励建模,以及面向大规模推理模型的强化学习方法——包括思维链(Chain-of-Thought)和测试时缩放(Test-Time Scaling)。
本书后半部分则专门聚焦于“智能体人工智能”本身。所涉主题包括:面向智能体的训练范式与基于轨迹的强化学习、检索增强生成(RAG及智能体增强型RAG)、记忆系统(上下文内记忆、外部记忆、情节记忆与语义记忆)、智能体运行时框架(Agent Harness)设计与上下文管理,以及一套系统化的智能体设计模式分类体系。
书中还就智能体间的协同机制进行了深入阐述:涵盖模型上下文协议(Model Context Protocol, MCP)、智能体能力(Skills)与工具调用机制、智能体间通信协议(Agent-to-Agent, A2A),以及覆盖集中式、去中心化与分层式等多种拓扑结构的多智能体系统架构。
最后,本书以智能体开发框架、智能体专属用户界面(UI)设计、面向智能体任务的评估方法论,以及生产环境下的部署实践收尾。每一章均兼顾严谨的理论基础与切实可行的工程指导,辅以可运行的代码示例,并精准引用相关领域的原始文献。