跳转到内容

Agent面试五十题

一、Agent 核心架构与模式

1. 什么是 ReAct?它的思考-行动-观察循环和工具调用流程是怎样的?

  • 分类:Agent / LLM
  • 难度:进阶
  • 高频公司:淘天、腾讯、字节、百度

5. 多 Agent 协作有哪些常见模式、适用场景和主要挑战?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:字节、阿里云、阿里、蚂蚁、小红书、淘天

6. Agent 的上下文管理和记忆机制通常如何设计,如何避免上下文过长或信息污染?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:快手、百度、字节、阿里云、蚂蚁

14. ReAct 与 Plan-and-Execute 有什么区别,分别适用于什么场景,为什么在项目中会选择 ReAct?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:淘天、腾讯

15. 如何自建一个 Agent 系统,并将其做到生产级落地?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:万类智生、蚂蚁、字节、腾讯

17. 单 Agent 和多 Agent 分别适用于哪些场景,如何判断是否需要多 Agent?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:字节、淘天、阿里云

23. 当 Agent 需要调用多个工具或工具之间存在依赖关系时,调度引擎应该如何设计?

  • 分类:Agent
  • 难度:深入
  • 高频公司:未知

27. 在多 Agent 协作中,如何解决冲突、分歧以及争议无法收敛的问题?

  • 分类:Agent
  • 难度:深入
  • 高频公司:未知

28. 基于强化学习的 Agent 与传统基于 Prompt 的 Agent 有什么区别?

  • 分类:Agent / LLM / Prompt
  • 难度:进阶
  • 高频公司:未知

29. 如何评估 Agent 的执行效果和项目效果?

  • 分类:Agent / Evaluation
  • 难度:深入
  • 高频公司:数坤科技

30. 什么是 Multi-Agent 系统?它与单 Agent 系统相比有哪些特点和适用场景?

  • 分类:Agent
  • 难度:基础
  • 高频公司:未知

31. 在多轮工具调用中,如何判断下一步是继续调用工具还是直接结束流程?

  • 分类:Agent / LLM
  • 难度:进阶
  • 高频公司:淘天

32. Agent 项目通常如何进行测试与评估?

  • 分类:Agent / Evaluation
  • 难度:进阶
  • 高频公司:字节

33. 为什么 Agent 需要 Memory 系统来维持任务连贯性?

  • 分类:Agent / LLM
  • 难度:进阶
  • 高频公司:淘天

34. 长上下文场景下如何做摘要压缩,既控制上下文长度又尽量避免关键信息丢失和语义扭曲?

  • 分类:Agent / LLM
  • 难度:进阶
  • 高频公司:淘天

37. 请详细讲解 ReAct 框架的原理。

  • 分类:Agent
  • 难度:进阶
  • 高频公司:未知

41. 如何让 Agent 具备自我学习和经验沉淀的能力?

  • 分类:Agent
  • 难度:深入
  • 高频公司:未知

43. 什么是 Memory?短期记忆在对话轮次增加时如何持续处理上下文爆炸和重复压缩?

  • 分类:Agent
  • 难度:深入
  • 高频公司:阿里、Moka

44. Agent 的 Planning 模块有哪些主流实现方式,Step-by-step 和 Plan-and-execute 有什么区别?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:未知

46. Agent 耗时过长时,工程侧和基座侧分别有哪些优化手段?

  • 分类:Agent / LLM
  • 难度:进阶
  • 高频公司:未知

48. 如何设计 Agent 的流式输出,以提升用户体验,尤其是在包含工具调用和多轮大模型交互的场景下?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:未知

49. Agent 长期记忆的 FIFO 淘汰策略有哪些问题,如何优化?

  • 分类:Agent
  • 难度:进阶
  • 高频公司:腾讯

50. 什么是 Self-Reflection 机制?它在代码生成或故障排查 Agent 中如何应用?

  • 分类:Agent / AICoding
  • 难度:进阶
  • 高频公司:未知

二、工具调用与安全

13. 工具调用的安全控制与敏感接口限制如何实现?

  • 分类:Agent / Prompt
  • 难度:进阶
  • 高频公司:快手

19. 工具调用超时或返回空值时,如何设计 Prompt 让 Agent 进行用户反馈?

  • 分类:Agent / Prompt
  • 难度:进阶
  • 高频公司:快手

21. LLM 是如何实现工具调用的?Function Calling 的底层机制与执行流程是什么?

  • 分类:LLM / Agent
  • 难度:进阶
  • 高频公司:未知

24. 开源模型的 Function Calling 能力较弱时,如何通过微调或 Prompt 设计来提升其工具调用能力?

  • 分类:Agent / Prompt / LLM
  • 难度:进阶
  • 高频公司:未知

38. 如何解决 Agent 工具调用时的幻觉问题,例如编造 API 或传错参数?

  • 分类:Agent / LLM
  • 难度:进阶
  • 高频公司:未知

40. 为什么工具描述中"什么时候该用"比"能做什么"更重要?工具描述设计有哪些关键原则?

  • 分类:Agent / Prompt / LLM
  • 难度:进阶
  • 高频公司:未知

45. Agent 开发中常见的系统安全风险有哪些,例如 Prompt Injection、沙箱逃逸和越权执行?应如何防范?

  • 分类:Agent / LLM
  • 难度:深入
  • 高频公司:未知

三、RAG 检索增强生成

2. RAG 中长文档切片的粒度和分块策略如何设计与优化?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:快手、字节、淘天

4. RAG 系统中的文档分块策略如何设计?chunk 大小、父子分块和不同文档格式要怎么取舍?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:Moka、阿里、百度

10. 在 RAG 中,既然向量检索已经计算了相似度,为什么还需要引入交叉编码器进行重排?

  • 分类:RAG / Evaluation
  • 难度:进阶
  • 高频公司:快手

16. 向量数据库检索到的历史信息即使语义相关但时间过久,还能直接使用吗?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:快手

18. Rerank 的 Top-k 数量通常如何确定?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:快手

25. Agentic RAG 与传统 RAG 的核心区别是什么?

  • 分类:RAG / Agent
  • 难度:进阶
  • 高频公司:未知

35. 在 RAG 场景中,什么时候适合使用静态知识库,什么时候适合使用动态网页检索?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:蚂蚁

36. RAG 中长文本应该如何切分,如何选择合适的切分策略?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:海天同创、淘天

39. 为什么要使用 RAG(检索增强生成)技术?

  • 分类:RAG
  • 难度:基础
  • 高频公司:字节、淘天

42. Rerank 之后的 TopK 截断如何实现,截断值怎么确定?

  • 分类:RAG
  • 难度:进阶
  • 高频公司:快手

四、RAG 评测与质量

3. RAG 系统评测的维度和常用指标如何设计?

  • 分类:RAG / Evaluation
  • 难度:进阶
  • 高频公司:快手、米可

11. 如何评估 Rerank 的有效性,常用哪些指标?

  • 分类:RAG / Evaluation
  • 难度:进阶
  • 高频公司:快手

五、LLM 训练与推理

8. 大模型长上下文场景下,如何进行上下文压缩与优化?

  • 分类:LLM / RAG / Agent
  • 难度:进阶
  • 高频公司:快手、淘天、拼多多、腾讯

9. 在 LLM 或 RAG 应用中,如何减少和规避幻觉问题?

  • 分类:LLM / RAG
  • 难度:进阶
  • 高频公司:阿里云、京东、蚂蚁

12. GRPO 和 PPO 的核心区别是什么?在信用分配、优势估计和方差控制上分别有什么差异?

  • 分类:LLM / Evaluation
  • 难度:深入
  • 高频公司:作业帮、腾讯、三七互娱

26. 在项目中是如何进行 LLM 模型选择的?是支持多模型切换、统一使用某家模型,还是自研模型?

  • 分类:LLM / OpenEnded / Agent
  • 难度:进阶
  • 高频公司:Shopee、腾讯、Moka

六、MCP 协议

20. MCP 和 Skills 有什么区别?它们分别解决什么问题?

  • 分类:MCP / Agent
  • 难度:进阶
  • 高频公司:作业帮、腾讯

47. 请介绍 MCP(Model Context Protocol)的作用、原理,以及你是否有过相关实践?

  • 分类:MCP
  • 难度:进阶
  • 高频公司:腾讯、蚂蚁、字节

七、AI 编程与开放问题

7. 在开发工作中如何使用 AI 工具辅助编程和提效?

  • 分类:AICoding / OpenEnded
  • 难度:进阶
  • 高频公司:小红书、蚂蚁、影石

22. 你做过的 AI 项目中最困难的技术挑战是什么,你是如何解决的?

  • 分类:Agent / OpenEnded / RAG
  • 难度:进阶
  • 高频公司:阿里云