Agent面试五十题
一、Agent 核心架构与模式
1. 什么是 ReAct?它的思考-行动-观察循环和工具调用流程是怎样的?
- 分类:Agent / LLM
- 难度:进阶
- 高频公司:淘天、腾讯、字节、百度
5. 多 Agent 协作有哪些常见模式、适用场景和主要挑战?
- 分类:Agent
- 难度:进阶
- 高频公司:字节、阿里云、阿里、蚂蚁、小红书、淘天
6. Agent 的上下文管理和记忆机制通常如何设计,如何避免上下文过长或信息污染?
- 分类:Agent
- 难度:进阶
- 高频公司:快手、百度、字节、阿里云、蚂蚁
14. ReAct 与 Plan-and-Execute 有什么区别,分别适用于什么场景,为什么在项目中会选择 ReAct?
- 分类:Agent
- 难度:进阶
- 高频公司:淘天、腾讯
15. 如何自建一个 Agent 系统,并将其做到生产级落地?
- 分类:Agent
- 难度:进阶
- 高频公司:万类智生、蚂蚁、字节、腾讯
17. 单 Agent 和多 Agent 分别适用于哪些场景,如何判断是否需要多 Agent?
- 分类:Agent
- 难度:进阶
- 高频公司:字节、淘天、阿里云
23. 当 Agent 需要调用多个工具或工具之间存在依赖关系时,调度引擎应该如何设计?
- 分类:Agent
- 难度:深入
- 高频公司:未知
27. 在多 Agent 协作中,如何解决冲突、分歧以及争议无法收敛的问题?
- 分类:Agent
- 难度:深入
- 高频公司:未知
28. 基于强化学习的 Agent 与传统基于 Prompt 的 Agent 有什么区别?
- 分类:Agent / LLM / Prompt
- 难度:进阶
- 高频公司:未知
29. 如何评估 Agent 的执行效果和项目效果?
- 分类:Agent / Evaluation
- 难度:深入
- 高频公司:数坤科技
30. 什么是 Multi-Agent 系统?它与单 Agent 系统相比有哪些特点和适用场景?
- 分类:Agent
- 难度:基础
- 高频公司:未知
31. 在多轮工具调用中,如何判断下一步是继续调用工具还是直接结束流程?
- 分类:Agent / LLM
- 难度:进阶
- 高频公司:淘天
32. Agent 项目通常如何进行测试与评估?
- 分类:Agent / Evaluation
- 难度:进阶
- 高频公司:字节
33. 为什么 Agent 需要 Memory 系统来维持任务连贯性?
- 分类:Agent / LLM
- 难度:进阶
- 高频公司:淘天
34. 长上下文场景下如何做摘要压缩,既控制上下文长度又尽量避免关键信息丢失和语义扭曲?
- 分类:Agent / LLM
- 难度:进阶
- 高频公司:淘天
37. 请详细讲解 ReAct 框架的原理。
- 分类:Agent
- 难度:进阶
- 高频公司:未知
41. 如何让 Agent 具备自我学习和经验沉淀的能力?
- 分类:Agent
- 难度:深入
- 高频公司:未知
43. 什么是 Memory?短期记忆在对话轮次增加时如何持续处理上下文爆炸和重复压缩?
- 分类:Agent
- 难度:深入
- 高频公司:阿里、Moka
44. Agent 的 Planning 模块有哪些主流实现方式,Step-by-step 和 Plan-and-execute 有什么区别?
- 分类:Agent
- 难度:进阶
- 高频公司:未知
46. Agent 耗时过长时,工程侧和基座侧分别有哪些优化手段?
- 分类:Agent / LLM
- 难度:进阶
- 高频公司:未知
48. 如何设计 Agent 的流式输出,以提升用户体验,尤其是在包含工具调用和多轮大模型交互的场景下?
- 分类:Agent
- 难度:进阶
- 高频公司:未知
49. Agent 长期记忆的 FIFO 淘汰策略有哪些问题,如何优化?
- 分类:Agent
- 难度:进阶
- 高频公司:腾讯
50. 什么是 Self-Reflection 机制?它在代码生成或故障排查 Agent 中如何应用?
- 分类:Agent / AICoding
- 难度:进阶
- 高频公司:未知
二、工具调用与安全
13. 工具调用的安全控制与敏感接口限制如何实现?
- 分类:Agent / Prompt
- 难度:进阶
- 高频公司:快手
19. 工具调用超时或返回空值时,如何设计 Prompt 让 Agent 进行用户反馈?
- 分类:Agent / Prompt
- 难度:进阶
- 高频公司:快手
21. LLM 是如何实现工具调用的?Function Calling 的底层机制与执行流程是什么?
- 分类:LLM / Agent
- 难度:进阶
- 高频公司:未知
24. 开源模型的 Function Calling 能力较弱时,如何通过微调或 Prompt 设计来提升其工具调用能力?
- 分类:Agent / Prompt / LLM
- 难度:进阶
- 高频公司:未知
38. 如何解决 Agent 工具调用时的幻觉问题,例如编造 API 或传错参数?
- 分类:Agent / LLM
- 难度:进阶
- 高频公司:未知
40. 为什么工具描述中"什么时候该用"比"能做什么"更重要?工具描述设计有哪些关键原则?
- 分类:Agent / Prompt / LLM
- 难度:进阶
- 高频公司:未知
45. Agent 开发中常见的系统安全风险有哪些,例如 Prompt Injection、沙箱逃逸和越权执行?应如何防范?
- 分类:Agent / LLM
- 难度:深入
- 高频公司:未知
三、RAG 检索增强生成
2. RAG 中长文档切片的粒度和分块策略如何设计与优化?
- 分类:RAG
- 难度:进阶
- 高频公司:快手、字节、淘天
4. RAG 系统中的文档分块策略如何设计?chunk 大小、父子分块和不同文档格式要怎么取舍?
- 分类:RAG
- 难度:进阶
- 高频公司:Moka、阿里、百度
10. 在 RAG 中,既然向量检索已经计算了相似度,为什么还需要引入交叉编码器进行重排?
- 分类:RAG / Evaluation
- 难度:进阶
- 高频公司:快手
16. 向量数据库检索到的历史信息即使语义相关但时间过久,还能直接使用吗?
- 分类:RAG
- 难度:进阶
- 高频公司:快手
18. Rerank 的 Top-k 数量通常如何确定?
- 分类:RAG
- 难度:进阶
- 高频公司:快手
25. Agentic RAG 与传统 RAG 的核心区别是什么?
- 分类:RAG / Agent
- 难度:进阶
- 高频公司:未知
35. 在 RAG 场景中,什么时候适合使用静态知识库,什么时候适合使用动态网页检索?
- 分类:RAG
- 难度:进阶
- 高频公司:蚂蚁
36. RAG 中长文本应该如何切分,如何选择合适的切分策略?
- 分类:RAG
- 难度:进阶
- 高频公司:海天同创、淘天
39. 为什么要使用 RAG(检索增强生成)技术?
- 分类:RAG
- 难度:基础
- 高频公司:字节、淘天
42. Rerank 之后的 TopK 截断如何实现,截断值怎么确定?
- 分类:RAG
- 难度:进阶
- 高频公司:快手
四、RAG 评测与质量
3. RAG 系统评测的维度和常用指标如何设计?
- 分类:RAG / Evaluation
- 难度:进阶
- 高频公司:快手、米可
11. 如何评估 Rerank 的有效性,常用哪些指标?
- 分类:RAG / Evaluation
- 难度:进阶
- 高频公司:快手
五、LLM 训练与推理
8. 大模型长上下文场景下,如何进行上下文压缩与优化?
- 分类:LLM / RAG / Agent
- 难度:进阶
- 高频公司:快手、淘天、拼多多、腾讯
9. 在 LLM 或 RAG 应用中,如何减少和规避幻觉问题?
- 分类:LLM / RAG
- 难度:进阶
- 高频公司:阿里云、京东、蚂蚁
12. GRPO 和 PPO 的核心区别是什么?在信用分配、优势估计和方差控制上分别有什么差异?
- 分类:LLM / Evaluation
- 难度:深入
- 高频公司:作业帮、腾讯、三七互娱
26. 在项目中是如何进行 LLM 模型选择的?是支持多模型切换、统一使用某家模型,还是自研模型?
- 分类:LLM / OpenEnded / Agent
- 难度:进阶
- 高频公司:Shopee、腾讯、Moka
六、MCP 协议
20. MCP 和 Skills 有什么区别?它们分别解决什么问题?
- 分类:MCP / Agent
- 难度:进阶
- 高频公司:作业帮、腾讯
47. 请介绍 MCP(Model Context Protocol)的作用、原理,以及你是否有过相关实践?
- 分类:MCP
- 难度:进阶
- 高频公司:腾讯、蚂蚁、字节
七、AI 编程与开放问题
7. 在开发工作中如何使用 AI 工具辅助编程和提效?
- 分类:AICoding / OpenEnded
- 难度:进阶
- 高频公司:小红书、蚂蚁、影石
22. 你做过的 AI 项目中最困难的技术挑战是什么,你是如何解决的?
- 分类:Agent / OpenEnded / RAG
- 难度:进阶
- 高频公司:阿里云