本周系统设计速览包括:
- 12 个每位工程师都应了解的 Claude Code 功能
- Agentic RAG 如何工作?
- REST API 如何工作?
- 7 个关键的负载均衡使用场景
12 个每位工程师都应了解的 Claude Code 功能

CLAUDE.md:项目记忆文件,用于定义自定义规则与约定。Claude 在每次会话开始时会读取。Permissions(权限):控制 Claude 可以使用和不能使用哪些工具。
Plan Mode(计划模式):Claude 先计划再行动。你可以在任意代码变更发生之前审阅计划。
Checkpoints(检查点):项目的自动快照,出问题时可回退。
Skills(技能):可复用的指令文件,Claude 会自动遵循。
Hooks(钩子):在生命周期事件(如
PreToolUse或PostToolUse)上运行自定义 shell 脚本。MCP:将 Claude 连接到数据库与第三方服务等外部工具。
Plugins(插件):通过包含 skills、MCP 与 hooks 的第三方集成扩展 Claude。
Context(上下文):向 Claude 投喂它需要的信息,并用
/context管理当前上下文窗口。Slash Commands(斜杠命令):为常用任务创建快捷方式。输入
/并从已保存命令中选择。Compaction(压缩):压缩长对话以节省 token。
Subagents(子代理):为复杂任务并行启动多个代理,拆分大型多步工作流并同时运行。
交给你:你最常用哪一项 Claude Code 功能?还有哪些功能你希望出现在这份清单里?
Agentic RAG 是如何工作的?
传统 RAG 往往检索方式简单、适应性有限,并依赖静态知识,对动态与实时信息不够灵活。
Agentic RAG 通过引入能够做决策、选择工具、甚至细化查询的 AI 代理来改进这一点,从而获得更准确、更灵活的回应。高层来看,Agentic RAG 的工作方式如下:

用户查询被送往 AI Agent 处理。
代理使用短期与长期记忆跟踪查询上下文,并制定检索策略、为任务选择合适的工具。
数据拉取过程可使用向量检索、多代理与 MCP 服务器等工具,从知识库中收集相关数据。
代理将检索结果与查询及系统提示合并,再交给 LLM。
LLM 处理优化后的输入以回答用户问题。
REST API 是如何工作的?
它有哪些原则、方法、约束与最佳实践?希望下图能给你一个快速概览。

7 个关键的负载均衡使用场景
流量分发:负载均衡器有助于在多台服务器实例之间较均匀地分配流量。
SSL 终结:负载均衡器可将 SSL 终结从后端服务器上卸载,从而减轻后端负担。
会话保持:负载均衡器可确保来自同一用户的请求始终打到同一实例,以维持会话。
高可用:通过将流量从故障或不健康的实例切到健康实例,提高系统可用性。
可扩展性:当向服务器池增加实例以应对更高流量时,负载均衡器支持水平扩展。
缓解 DDoS:负载均衡器可通过限流或将请求分散到更大面积上来减轻 DDoS 影响。
健康检查:负载均衡器还会监控实例的健康与性能,并将失败或不健康的实例移出池。
交给你:你还会在清单里加上哪些负载均衡使用场景?

本文为学习目的的个人翻译。
原文标题:EP209: 12 Claude Code Features Every Engineer Should Know。
版权归原作者或原刊登方所有。本文为非官方译本;如有不妥,请联系删除。