跳转到内容

Agent面试五十题

一、Agent 核心架构与模式

1. 什么是 ReAct？它的思考-行动-观察循环和工具调用流程是怎样的？

分类：Agent / LLM
难度：进阶
高频公司：淘天、腾讯、字节、百度

5. 多 Agent 协作有哪些常见模式、适用场景和主要挑战？

分类：Agent
难度：进阶
高频公司：字节、阿里云、阿里、蚂蚁、小红书、淘天

6. Agent 的上下文管理和记忆机制通常如何设计，如何避免上下文过长或信息污染？

分类：Agent
难度：进阶
高频公司：快手、百度、字节、阿里云、蚂蚁

14. ReAct 与 Plan-and-Execute 有什么区别，分别适用于什么场景，为什么在项目中会选择 ReAct？

分类：Agent
难度：进阶
高频公司：淘天、腾讯

15. 如何自建一个 Agent 系统，并将其做到生产级落地？

分类：Agent
难度：进阶
高频公司：万类智生、蚂蚁、字节、腾讯

17. 单 Agent 和多 Agent 分别适用于哪些场景，如何判断是否需要多 Agent？

分类：Agent
难度：进阶
高频公司：字节、淘天、阿里云

23. 当 Agent 需要调用多个工具或工具之间存在依赖关系时，调度引擎应该如何设计？

分类：Agent
难度：深入
高频公司：未知

27. 在多 Agent 协作中，如何解决冲突、分歧以及争议无法收敛的问题？

分类：Agent
难度：深入
高频公司：未知

28. 基于强化学习的 Agent 与传统基于 Prompt 的 Agent 有什么区别？

分类：Agent / LLM / Prompt
难度：进阶
高频公司：未知

29. 如何评估 Agent 的执行效果和项目效果？

分类：Agent / Evaluation
难度：深入
高频公司：数坤科技

30. 什么是 Multi-Agent 系统？它与单 Agent 系统相比有哪些特点和适用场景？

分类：Agent
难度：基础
高频公司：未知

31. 在多轮工具调用中，如何判断下一步是继续调用工具还是直接结束流程？

分类：Agent / LLM
难度：进阶
高频公司：淘天

32. Agent 项目通常如何进行测试与评估？

分类：Agent / Evaluation
难度：进阶
高频公司：字节

33. 为什么 Agent 需要 Memory 系统来维持任务连贯性？

分类：Agent / LLM
难度：进阶
高频公司：淘天

34. 长上下文场景下如何做摘要压缩，既控制上下文长度又尽量避免关键信息丢失和语义扭曲？

分类：Agent / LLM
难度：进阶
高频公司：淘天

37. 请详细讲解 ReAct 框架的原理。

分类：Agent
难度：进阶
高频公司：未知

41. 如何让 Agent 具备自我学习和经验沉淀的能力？

分类：Agent
难度：深入
高频公司：未知

43. 什么是 Memory？短期记忆在对话轮次增加时如何持续处理上下文爆炸和重复压缩？

分类：Agent
难度：深入
高频公司：阿里、Moka

44. Agent 的 Planning 模块有哪些主流实现方式，Step-by-step 和 Plan-and-execute 有什么区别？

分类：Agent
难度：进阶
高频公司：未知

46. Agent 耗时过长时，工程侧和基座侧分别有哪些优化手段？

分类：Agent / LLM
难度：进阶
高频公司：未知

48. 如何设计 Agent 的流式输出，以提升用户体验，尤其是在包含工具调用和多轮大模型交互的场景下？

分类：Agent
难度：进阶
高频公司：未知

49. Agent 长期记忆的 FIFO 淘汰策略有哪些问题，如何优化？

分类：Agent
难度：进阶
高频公司：腾讯

50. 什么是 Self-Reflection 机制？它在代码生成或故障排查 Agent 中如何应用？

分类：Agent / AICoding
难度：进阶
高频公司：未知

二、工具调用与安全

13. 工具调用的安全控制与敏感接口限制如何实现？

分类：Agent / Prompt
难度：进阶
高频公司：快手

19. 工具调用超时或返回空值时，如何设计 Prompt 让 Agent 进行用户反馈？

分类：Agent / Prompt
难度：进阶
高频公司：快手

21. LLM 是如何实现工具调用的？Function Calling 的底层机制与执行流程是什么？

分类：LLM / Agent
难度：进阶
高频公司：未知

24. 开源模型的 Function Calling 能力较弱时，如何通过微调或 Prompt 设计来提升其工具调用能力？

分类：Agent / Prompt / LLM
难度：进阶
高频公司：未知

38. 如何解决 Agent 工具调用时的幻觉问题，例如编造 API 或传错参数？

分类：Agent / LLM
难度：进阶
高频公司：未知

40. 为什么工具描述中"什么时候该用"比"能做什么"更重要？工具描述设计有哪些关键原则？

分类：Agent / Prompt / LLM
难度：进阶
高频公司：未知

45. Agent 开发中常见的系统安全风险有哪些，例如 Prompt Injection、沙箱逃逸和越权执行？应如何防范？

分类：Agent / LLM
难度：深入
高频公司：未知

三、RAG 检索增强生成

2. RAG 中长文档切片的粒度和分块策略如何设计与优化？

分类：RAG
难度：进阶
高频公司：快手、字节、淘天

4. RAG 系统中的文档分块策略如何设计？chunk 大小、父子分块和不同文档格式要怎么取舍？

分类：RAG
难度：进阶
高频公司：Moka、阿里、百度

10. 在 RAG 中，既然向量检索已经计算了相似度，为什么还需要引入交叉编码器进行重排？

分类：RAG / Evaluation
难度：进阶
高频公司：快手

16. 向量数据库检索到的历史信息即使语义相关但时间过久，还能直接使用吗？

分类：RAG
难度：进阶
高频公司：快手

18. Rerank 的 Top-k 数量通常如何确定？

分类：RAG
难度：进阶
高频公司：快手

25. Agentic RAG 与传统 RAG 的核心区别是什么？

分类：RAG / Agent
难度：进阶
高频公司：未知

35. 在 RAG 场景中，什么时候适合使用静态知识库，什么时候适合使用动态网页检索？

分类：RAG
难度：进阶
高频公司：蚂蚁

36. RAG 中长文本应该如何切分，如何选择合适的切分策略？

分类：RAG
难度：进阶
高频公司：海天同创、淘天

39. 为什么要使用 RAG（检索增强生成）技术？

分类：RAG
难度：基础
高频公司：字节、淘天

42. Rerank 之后的 TopK 截断如何实现，截断值怎么确定？

分类：RAG
难度：进阶
高频公司：快手

四、RAG 评测与质量

3. RAG 系统评测的维度和常用指标如何设计？

分类：RAG / Evaluation
难度：进阶
高频公司：快手、米可

11. 如何评估 Rerank 的有效性，常用哪些指标？

分类：RAG / Evaluation
难度：进阶
高频公司：快手

五、LLM 训练与推理

8. 大模型长上下文场景下，如何进行上下文压缩与优化？

分类：LLM / RAG / Agent
难度：进阶
高频公司：快手、淘天、拼多多、腾讯

9. 在 LLM 或 RAG 应用中，如何减少和规避幻觉问题？

分类：LLM / RAG
难度：进阶
高频公司：阿里云、京东、蚂蚁

12. GRPO 和 PPO 的核心区别是什么？在信用分配、优势估计和方差控制上分别有什么差异？

分类：LLM / Evaluation
难度：深入
高频公司：作业帮、腾讯、三七互娱

26. 在项目中是如何进行 LLM 模型选择的？是支持多模型切换、统一使用某家模型，还是自研模型？

分类：LLM / OpenEnded / Agent
难度：进阶
高频公司：Shopee、腾讯、Moka

六、MCP 协议

20. MCP 和 Skills 有什么区别？它们分别解决什么问题？

分类：MCP / Agent
难度：进阶
高频公司：作业帮、腾讯

47. 请介绍 MCP（Model Context Protocol）的作用、原理，以及你是否有过相关实践？

分类：MCP
难度：进阶
高频公司：腾讯、蚂蚁、字节

七、AI 编程与开放问题

7. 在开发工作中如何使用 AI 工具辅助编程和提效？

分类：AICoding / OpenEnded
难度：进阶
高频公司：小红书、蚂蚁、影石

22. 你做过的 AI 项目中最困难的技术挑战是什么，你是如何解决的？

分类：Agent / OpenEnded / RAG
难度：进阶
高频公司：阿里云