大模型LLM ACA - ACP认证考试模拟试卷五 目录一、大模型LLM ACA - ACP认证考试二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 如果一款大模型无法理解复杂图片中的信息应该采取什么策略2. 以下哪一项最淮确地描述了预训练大模型在处理特定问题时可能遇到的局限性3. 通过LamaIndex创建RAG应用时一份知识文件传入RAG应用的顺序是以下哪一项?4. 你准备为企业内部人事系统搭建一个多轮问答功能现有历史对话“张三的办公楼在哪”“在A栋一楼”“他的主管是谁”。你应该怎么设计检索步骤5. 在提示词框架中任务目标Object的主要作用是什么6. GraphRAG 技术结合了哪两种技术的优点7. 在使用大型语言模型之前用户首先应该做什么8. 在文档切片过程中以下哪些切片方法适合模型总是报 Token 超限的场景9. 以下哪个提示词框架要素用于提供参考案例帮助大模型理解预期输出10. 在ask_llm_route函数中如果问题类型无法识别会返回什么11. 你正在使用 Qwen-Plus 生成商品介绍文档完整的提示词是“请帮我生成我们公司最新智能手表的产品介绍”。但你发现生成的内容是介绍其他公司的产品。以下策略中应首先尝试的是12. 在构建有效的提示词时清晰表达需求的主要作用是什么13. 多模态转化任务的一个实例是14. 在加载本地索引文件时load_index_from_storage方法的主要作用是什么15. 以下代码片段实现了哪种文本合规检查方法 ... import re def check_text(text): pattern r 假货|劣质|骗子 if re.search(pattern, text): return 包含敏感词 else: return 文本安全 text 这个产品质量很好不像其他假货 result check_text(text) print(result) # 输出包含敏感词16. 以下哪项不属于通义千问Qwen-VL-Max的能力17. 以下哪个代码片段正确地使用了 system 角色来指示模型扮演一个友好的客服代表18. 在意图识别中以下哪种方法不需要修改模型本身的参数19. 用户对你开发的聊天机器人提了反馈总是要等 10s 以上才能看到答案。你考虑是否要采取流式输出策略。以下想法正确的是20. Ragas 提供的以下哪些指标用于评估整体回答质量21. 请问这段代码的主要作用是22. 在优化检索效果时以下哪种方法可以提升文档的层次分明性23. 在控制大模型生成内容的随机性时temperature参数的作用是什么24. 在切片向量化与存储阶段以下哪种方法用于执行比较25. 在 context recall 的计算过程中以下哪个步骤是必要的26. 在构建 RAG 应用时以下哪种向量存储方案按量付费、自动扩容27. 以下代码片段中temperature 参数设置为 0.6其主要作用是什么 28. def set_default_model(): EMBED_MODEL DashScopeEmbedding( model_nameDashScopeTextEmbeddingsModels.TEXT_EMBEDDING_V2, type_nameDashScopeTextEmbeddingType.TEXT_TYPE_DOCUMENT, ) LLM_MODEL DashScope(model_nameqwen-plus) Settings.embed_model EMBED_MODEL Settings.llm LLM_MODEL ...29. Ragas 提供的 Context Precision 指标用于评估什么30. 你是某公司IT部门主管想使用大模型生成符合公司内部编码规范的Java代码模板请问以下哪个提示词更合适31. 你在阿里云百炼上搭建了一个智能应用为用户提供美食推荐服务你希望能记住用户的喜好、避免推荐之前用户提及过的忌口食物。以下哪个方案能以低成本满足这一诉求32. 在问题改写中以下哪种方法用假设文档来增强检索33. 以下哪种做法不符合利用大模型提升开发效率的思路34. 在文档切片过程中以下哪种切片方法适合模型总是报 Token 超限的场景35. 在文档切片过程中以下哪种切片方法是默认的切片策略36. 以下关于 LoRA 的描述哪一项是错误的37. 在提示词框架中受众Audience的主要作用是什么38. 在切片向量化与存储阶段以下哪种方法用于准备测试数据39. 在意图识别中以下哪种方法涉及调整模型的部分或全部参数40. 请问这个函数的主要作用是41. 设计程序时一般不会设计为调用一次大模型就处理完所有任务。下列关于如上说法的分析中错误的是哪一项42. 在 RAG 应用中进行多轮对话应该如何进行检索43. 如果你想快速构建一个效果不错的 RAG 应用可以参考哪篇文档44. 以下代码片段旨在模拟RAG应用的向量检索过程。哪一行代码实现了计算用户问题向量与文档向量相似度的功能?45. 在 qwen2.5-1.5b 微调训练时训练损失、验证损失都收敛到较低水平不再明显波动变化你应该46. 以下哪项可以最淮确地描述大语言模型与多模态模型之间的区别47. 在 RAG 工作流程中以下哪个阶段涉及将文档切片向量化并存储到向量数据库中48. 假设我们开发了一款基于多智能体协作的软件公司应用可以实现多智能体协作帮用户写应用软件的能力。为了衡量系统遵循用户需求开发软件的实际能力我们想设计一套评测体系。以下哪个选项不是构建该评测体系的关键考虑因素49. 如果想要发送“你好请介绍一下你自己”给大模型应该修改以下 import os from openai import OpenAI client OpenAI( api_keyos.getenv(DASHSCOPE_API_KEY), base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1 ) completion client.chat.completions.create( modelqwen-max, messages[{role: user, content: 你是谁?}] ) print(completion.choices[0].message.content)50. 在以下代码片段中DashScopeRenank(top_n3,modelgte-renank)的作用是什么51. 多Agent系统就是让机器模拟或利用多个Al实例来协作解决问题。设计巧妙的Agent之间共享信息的方法往往能提升多Agent系统的搜索效率。在一个多Agent搜救场景中若要最大化搜索效率以下哪种策略最不合理52. 在RAG应用中检索生成阶段包括以下哪些步骤53. 在提示词框架中以下哪些要素可以用于提供任务的背景信息54. 在问题改写中以下哪种方法通过分解复杂问题为多个子问题来解决问题55. 在构建 RAG 应用时以下哪种向量存储方案最简单56. 你是某金融APP的智能投顾系统负责人发现用户存在恶意咨询的情况如涉及“内幕消息”等敏感词。为了在检测到敏感词时立即返回固定话术以下哪种方案最能满足需求57. 以下哪种方式可以更好地处理大语言模型返回结果中可能存在的错误或异常?58. 在以下代码片段中SimilarityPostprocessor(similarity_cutoff0.2)的作用是什么59. 在切片向量化与存储阶段以下哪种模型用于将文本转换为高维向量60. 大语言模型预训练与微调之间的关系是什么61. 在以下代码片段中client.chat.completions.create的作用是什么62. 在RAG应用的多轮对话中业界常用的解决方法是什么63. 相较于从头全新训练一个模型下列对大语言模型微调的描述中正确的是哪一项?64. 在调用大语言模型对话的API过程中以下哪个代码片段展示了正确的用户(user)提问方式?65. 在创建提问引擎时index.as_query_engine方法的主要作用是什么66. Qwen-Max线上模型可能指的是以下哪一种情况?67. Ragas 提供的 Answer Correctness 指标用于评估什么68. 以下哪项技术是通过从更广泛的数据源获取信息以补充知识库不足的69. 在使用Assistant API创建一个Assistant实例时下列哪个参数用于指定使用的模型?70. 在大模型调用外部 API 工具时工具函数的描述description起到的关键作用是什么二多选题30 题 × 1 分 30 分1. 在检索召回阶段以下哪些方法通过增加更多信息让检索结果更全面2. 关于Loss function Cost function下面描述正确的是3. 在优化 answer correctness 指标时以下哪些措施是可行的4. 在ask_llm_route函数中以下哪些是可能的处理流程5. 在以下代码片段中哪些操作有助于生成更具确定性的文本6. 把API Key配置到环境变量里有哪些优点7. APIAssistantAgent 示例代码 query 函数中哪些步骤与大语言模型交互8. 在优化后的答疑机器人中以下哪些是提示词中规定的角色背景9. 基于字符的文档切片方法有哪些潜在的缺点?10. 在监控大语言模型训练性能时哪些指标是常用的11. 你和同事在设计一个知识库答疑机器人他提出了以下路线哪两个是合理的12. 在文档切片过程中以下哪些切片方法适合处理逻辑性强、内容专业的文档13. 在 context recall 的计算过程中以下哪些步骤是必要的14. 在ask_llm_route函数中以下哪些是可能的输出15. 在RAG应用的生成阶段主要步骤包括哪些16. 在进行 RAGAS 评测时使用通过自定义 API 封装的 langchain LLM 对象主要有哪些优点17. 某团队计划为法律咨询场景微调一个大模型。在正式启动微调前团队需优先评估以下哪三点18. 如果将 RAG 与开卷考试相类比下列哪两项描述最符合它们的相同之处19. 在意图识别中以下哪些方法可以帮助大模型进行意图识别20. 你在开发的招聘答疑机器人在回答“产品经理的岗位职责有哪些”时输出的职责经常包含客户经理的工作职责。经排查发现不同岗位的说明文档使用了相同的模板文档切片时经常将#客户经理#岗位和#产品经理#岗位的职责主要是这样描述的。以下哪两种方法能有效解决这个问题21. 在优化 context recall 指标时以下哪些是使用大模型改写 query 的好处22. 关于多模态技术底层原理正确的说法是23. 某教育类AI产品出现以下现象哪些属于“幻觉”风险24. 在 RAG 工作流程中以下哪些是关键步骤25. 在以下代码片段中哪些参数可以影响生成文本的多样性26. 在提示词框架中以下哪些要素可以用于明确输出的格式27. 在以下代码片段中哪些操作有助于提高检索的准确性28. 以下哪些任务可以使用 ffmpeg 完成?29. 以下哪个参数的设置会影响训练时显存占用峰值的大小30. RAG 应用在检索时共召回了 10 条切片其中 3 条高度相关但这 3 条内容都来自相邻段落却被系统拆分成不同切片从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度一、大模型LLM ACA - ACP认证考试探索未来智能的钥匙——ACA-ACP大模型工程师认证专栏导读 含十套模拟真题和真题精选请认真阅读考试须知后准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。答题开始即开始计时中途不可暂停如超时则自动提交1、考试共 (100) 道题总分100分及格分数80分。模拟试题库对应模拟试题按70:30-单选题-多选题真题一般50:252、考试需在120分钟内交卷过程中无法暂停请提前安排好时间如未及时交卷则本次考试作废3、推荐使用 Chrome 浏览器版本73及以上的正式版本或Firefox浏览器版本66及以上的正式版本)4、开始答题前会进行身份验证需要您拍摄并上传身份证人像面照片并按照系统要求开启摄像头进行面部识别5、考试过程中请保持摄像头开启并对准面部系统会不定时进行抓拍并与身份证照片做对比如发现作弊行为您的考试成绩将作废6、考试过程中系统将判断您的浏览器状态如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为以及弹出广告弹窗将会给出警告。如果次数过多您的考试成绩将作废7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件以免影响您的考试祝大家一次上岸顺利拿证未来在云赛道上越走越宽、越走越远 ✨二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 如果一款大模型无法理解复杂图片中的信息应该采取什么策略A. 手动提取图片信息。B. 使用其他开源 OCR 工具再次尝试识别。C. 放弃使用该图片。D. 使用语义空间 API 的视觉理解模型对图片进行更深层次的分析。2. 以下哪一项最淮确地描述了预训练大模型在处理特定问题时可能遇到的局限性A. 预训练的大模型能够准确理解并回答所有类型的问题因为它已经学习了广泛的语料库B. 预训练的大模型只能回答有关统计规律的问题而无法处理有关一般知识的查询C. 预训练的大模型可能无法直接理解人类的意图并且在没有额外微调的情况下无法始终提供与具体查询直接相关的答案3. 通过LamaIndex创建RAG应用时一份知识文件传入RAG应用的顺序是以下哪一项?A. Node对象 - Document对象 - index - query_engineB. Node对象 - query_engin- Document对象 - indexC. Document对象 - index - Node对象 - query_engineD. Document对象 - Node对象 - index - query_engine4. 你准备为企业内部人事系统搭建一个多轮问答功能现有历史对话“张三的办公楼在哪”“在A栋一楼”“他的主管是谁”。你应该怎么设计检索步骤A. 对“主管”进行同义词扩展包含“领导”、“上级”等提高召回率B. 提高检索的相似度阈值确保不包含无用信息C. 混合使用关键词检索与向量检索策略D. 结合对话历史改写 query再进行检索5. 在提示词框架中任务目标Object的主要作用是什么A. 明确要求大模型完成的具体任务B. 提供任务的背景信息C. 定义大模型扮演的角色6. GraphRAG 技术结合了哪两种技术的优点A. 检索增强生成RAG和查询聚焦摘要QFSB. 检索增强生成RAG和自然语言处理NLPC. 查询聚焦摘要QFS和机器学习ML7. 在使用大型语言模型之前用户首先应该做什么A. 直接开始使用模型B. 阅读并理解服务条款和隐私政策C. 尝试模型的所有功能8. 在文档切片过程中以下哪些切片方法适合模型总是报 Token 超限的场景A. Token 切片B. 句子切片C. 句子窗口切片9. 以下哪个提示词框架要素用于提供参考案例帮助大模型理解预期输出A. 输入数据Input ParametersB. 样例SampleC. 任务目标ObjectD. 角色Role10. 在ask_llm_route函数中如果问题类型无法识别会返回什么A. “未能识别问题类型请重新输入。”B. reviewed_promptC. translate_prompt11. 你正在使用 Qwen-Plus 生成商品介绍文档完整的提示词是“请帮我生成我们公司最新智能手表的产品介绍”。但你发现生成的内容是介绍其他公司的产品。以下策略中应首先尝试的是A. 调低 Top-p 值缩小候选词范围B. 调低温度参数Temperature以降低随机性C. 提高 Top-p 值扩大候选词范围D. 改进提示词明确产品信息、文档主题和结构12. 在构建有效的提示词时清晰表达需求的主要作用是什么A. 确保大模型生成的内容与任务高度相关B. 增加模型的训练数据C. 减少模型的推理时间13. 多模态转化任务的一个实例是A. 通过文本描述生成匹配的图像内容B. 在视频流中自动检测并识别面部表情C. 分析大量文本评论以预测电影票房14. 在加载本地索引文件时load_index_from_storage方法的主要作用是什么A. 将指定文件夹中的文件加载为document对象B. 将本地索引文件加载为索引C. 将文本向量化15. 以下代码片段实现了哪种文本合规检查方法 ... import re def check_text(text): pattern r 假货|劣质|骗子 if re.search(pattern, text): return 包含敏感词 else: return 文本安全 text 这个产品质量很好不像其他假货 result check_text(text) print(result) # 输出包含敏感词A. 语义分析B. 模式匹配C. 机器学习D. 词性匹配16. 以下哪项不属于通义千问Qwen-VL-Max的能力A. 识别图像中的物体并进行描述B. 将图像中的数据图表转化为可编辑表格C. 基于图像内容创作故事D. 实时语音通话功能17. 以下哪个代码片段正确地使用了 system 角色来指示模型扮演一个友好的客服代表A. python messages [ {role: system, content: 你是一位友好的客服代表随时准备帮助客户解决问题。} ]B. python messages [ {role: assistant, content: 您好请问有什么可以帮您的} ]C. python messages [ {role: user, content: 我想咨询一下退货流程。} ]D. python messages [ {role: system, content: 用户想咨询退货流程。} ]18. 在意图识别中以下哪种方法不需要修改模型本身的参数A. 使用提示词B. 对模型进行微调C. 增加模型的训练数据19. 用户对你开发的聊天机器人提了反馈总是要等 10s 以上才能看到答案。你考虑是否要采取流式输出策略。以下想法正确的是A. 可以采取流式输出但是我要在原有基础上调整一下 temperature 和 top_p 等参数B. 不能采取流式输出将实时返回的结果立刻返回给前端界面是一件很难做到的事情C. 不能采取流式输出我调了好久的 prompt 在流式输出时效果肯定会下降D. 可以采取流式输出但是我要修改一下返回层面的代码比如适配流式输出的数据格式并且将 return 改为 yield20. Ragas 提供的以下哪些指标用于评估整体回答质量A. Answer CorrectnessB. Answer RelevancyC. Faithfulness21. 请问这段代码的主要作用是A. 对召回的文本段进行 rerank 后输入大模型进行回复B. 在句子窗口检索中将扩展后的句子传入上下文并进行回复C. 在自动合并检索中判断父节点是否有超过半数的子节点被召回D. 加载本地索引对 query 进行回复22. 在优化检索效果时以下哪种方法可以提升文档的层次分明性A. 使用 Markdown 格式B. 增加模型的训练数据C. 减少模型的推理时间23. 在控制大模型生成内容的随机性时temperature参数的作用是什么A. 调整候选Token的概率分布B. 增加候选Token的数量C. 减少候选Token的数量24. 在切片向量化与存储阶段以下哪种方法用于执行比较A. compare_embeddings 函数B. 增加模型的训练数据C. 减少模型的推理时间25. 在 context recall 的计算过程中以下哪个步骤是必要的A. 由大模型判断每个观点是否能在 contexts 中找到依据B. 增加模型的训练数据C. 减少模型的推理时间26. 在构建 RAG 应用时以下哪种向量存储方案按量付费、自动扩容A. 云服务向量存储B. 内存向量存储C. 本地向量数据库27. 以下代码片段中temperature 参数设置为 0.6其主要作用是什么 A. 控制模型使用的 GPU 数量。B. 控制模型加载的权重数量。C. 控制模型生成文本的多样性。D. 控制模型生成文本的长度。28. def set_default_model(): EMBED_MODEL DashScopeEmbedding( model_nameDashScopeTextEmbeddingsModels.TEXT_EMBEDDING_V2, type_nameDashScopeTextEmbeddingType.TEXT_TYPE_DOCUMENT, ) LLM_MODEL DashScope(model_nameqwen-plus) Settings.embed_model EMBED_MODEL Settings.llm LLM_MODEL ...A. 使得 llm 可以流式输出B. 使得 embedding 模型可以参与 llm 的生成过程中C. 使得有关 Llamaindex 的后续步骤中无需再次指定 llm 与 embed_modelD. 定义了 EMBED_MODEL 与 LLM_MODEL29. Ragas 提供的 Context Precision 指标用于评估什么A. contexts 中与准确答案相关的条目是否排名靠前、占比高B. RAG 应用生成答案的准确度C. 生成答案与问题的相关性30. 你是某公司IT部门主管想使用大模型生成符合公司内部编码规范的Java代码模板请问以下哪个提示词更合适A. 请帮我生成一份 java 代码用于……B. 请帮我生成一份 java 代码需求是要求是符合下列编码规范C. 请逐步分析需求然后生成一份 java 代码需求是D. 请参考开源社区流行的编码风格生成一份 java 代码31. 你在阿里云百炼上搭建了一个智能应用为用户提供美食推荐服务你希望能记住用户的喜好、避免推荐之前用户提及过的忌口食物。以下哪个方案能以低成本满足这一诉求A. 构建独立的历史对话知识库通过 RAG 在每次请求时检索用户全部聊天记录并持续维护知识库更新与索引优化B. 在应用侧硬编码用户提供忌口信息C. 构建基于向量数据库的实时对话语义检索系统检索常见忌口信息D. 使用长期记忆功能让智能体不断积累用户偏好信息32. 在问题改写中以下哪种方法用假设文档来增强检索A. 用假设文档来增强检索HyDEB. 重排序C. 滑动窗口检索33. 以下哪种做法不符合利用大模型提升开发效率的思路A. 对于所有类型的图片都使用视觉模型进行深层次解析以确保信息的完整性。B. 使用 DashScopeParse 解析文档而不是自己编写复杂的解析逻辑。C. 将复杂的文档处理任务拆分成多个子任务分别使用不同的模型或工具处理。D. 对于简单的文本替换操作使用正则表达式而不是调用大模型 API。34. 在文档切片过程中以下哪种切片方法适合模型总是报 Token 超限的场景A. Token 切片B. 句子切片C. 句子窗口切片35. 在文档切片过程中以下哪种切片方法是默认的切片策略A. 句子切片B. Token 切片C. 句子窗口切片36. 以下关于 LoRA 的描述哪一项是错误的A. LoR可以有效降低微调大型语言模型的成本。B. LoR会修改被微调模型的原始权重。C. LoR的实现相对简单易于集成。37. 在提示词框架中受众Audience的主要作用是什么A. 明确大模型针对的特定受众B. 提供任务的背景信息C. 定义大模型扮演的角色38. 在切片向量化与存储阶段以下哪种方法用于准备测试数据A. compare_embeddings 函数B. 增加模型的训练数据C. 减少模型的推理时间39. 在意图识别中以下哪种方法涉及调整模型的部分或全部参数A. 对模型进行微调B. 使用提示词C. 增加模型的训练数据40. 请问这个函数的主要作用是A. 定义了 EMBED_MODEL 与 LLM_MODELB. 使得 embedding 模型可以参与 LLM 的生成过程中C. 使得 LLM 可以流式输出D. 使得有关 LlamalIndex 的后续步骤中无需再次指定 LLM 与 embed_model41. 设计程序时一般不会设计为调用一次大模型就处理完所有任务。下列关于如上说法的分析中错误的是哪一项A. 单个大模型无法处理多种格式的文件。B. 可以根据任务特点选择合适的模型和参数。C. 难以同时保证每项工作的质量。D. 可以分步优化提高整体处理效率和成本42. 在 RAG 应用中进行多轮对话应该如何进行检索A. 在检索阶段输入完整的历史对话信息B. 结合历史对话信息对输入问题改写后进入检索阶段C. 在检索阶段输入最新的输入问题43. 如果你想快速构建一个效果不错的 RAG 应用可以参考哪篇文档A. 使用 LlamaIndex 构建 GraphRAG 应用B. 0代码构建私有知识问答应用C. 可视化工作流、智能体编排44. 以下代码片段旨在模拟RAG应用的向量检索过程。哪一行代码实现了计算用户问题向量与文档向量相似度的功能?A. import numpy as npB. query_embeddinnp.array([0.1,0.2,0.02])C. scores cosine_similarity(query_embedding45. 在 qwen2.5-1.5b 微调训练时训练损失、验证损失都收敛到较低水平不再明显波动变化你应该A. 模型开始过拟合应终止训练B. 模型处于欠拟合状态需要继续训练C. 训练失败重新调整训练策略D. 训练成功停止训练并进一步评估其效果46. 以下哪项可以最淮确地描述大语言模型与多模态模型之间的区别A. 大语言模型专门处理文本数据而多模态模型能够处理包括文本、图像、音频和视频在内的多种类型的数据并能理解这些模态间的关联B. 大语言模型仅能进行文本生成任务而多模态模型则专注于图像识别和视频分析两者在功能上完全不重叠C. 多模态模型的主要优势在于其文本处理能力远超大语言模型尤其是在语法和语义理解方面47. 在 RAG 工作流程中以下哪个阶段涉及将文档切片向量化并存储到向量数据库中A. 切片向量化与存储阶段B. 文档解析与切片阶段C. 检索召回48. 假设我们开发了一款基于多智能体协作的软件公司应用可以实现多智能体协作帮用户写应用软件的能力。为了衡量系统遵循用户需求开发软件的实际能力我们想设计一套评测体系。以下哪个选项不是构建该评测体系的关键考虑因素A. 用户体验的主观感受量化方法如通过情感分析评估交互满意度B. Agent间的协作效率指标确保多Agent系统整体运行流畅C. 交互界面的美观程度因为视觉吸引力直接影响用户参与度49. 如果想要发送“你好请介绍一下你自己”给大模型应该修改以下 import os from openai import OpenAI client OpenAI( api_keyos.getenv(DASHSCOPE_API_KEY), base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1 ) completion client.chat.completions.create( modelqwen-max, messages[{role: user, content: 你是谁?}] ) print(completion.choices[0].message.content)A. messages[{role: user, content: 你是谁?}]B. api_keyos.getenv(DASHSCOPE_API_KEY)C. base_urlhttps://dashscope.aliyuncs.com/compatible-mode/vlD. modelqwen-max50. 在以下代码片段中DashScopeRenank(top_n3,modelgte-renank)的作用是什么A. 从召回的切片中重排序并选择最相关的3条B. 设置相似度阈值C. 设置召回切片的最大数量51. 多Agent系统就是让机器模拟或利用多个Al实例来协作解决问题。设计巧妙的Agent之间共享信息的方法往往能提升多Agent系统的搜索效率。在一个多Agent搜救场景中若要最大化搜索效率以下哪种策略最不合理A. 根据已探索区域的信息动态调整各Agent的搜索路径B. 各Agent独立行动完全不共享发现的遇险信号信息C. 设计一种机制让Agent在遇到困难时能请求附近Agent的协助52. 在RAG应用中检索生成阶段包括以下哪些步骤A. 检索与生成B. 文档解析与文本分段C. 文本向量化与存储索引53. 在提示词框架中以下哪些要素可以用于提供任务的背景信息A. 上下文ContextB. 样例SampleC. 任务目标Object54. 在问题改写中以下哪种方法通过分解复杂问题为多个子问题来解决问题A. 将单一查询改写为多步骤查询B. 重排序C. 滑动窗口检索55. 在构建 RAG 应用时以下哪种向量存储方案最简单A. 内存向量存储B. 本地向量数据库C. 云服务向量存储56. 你是某金融APP的智能投顾系统负责人发现用户存在恶意咨询的情况如涉及“内幕消息”等敏感词。为了在检测到敏感词时立即返回固定话术以下哪种方案最能满足需求A. 在生成回答后追加合规性二次审核B. 对知识库文档进行预筛查标记C. 在用户提问时启用敏感词实时检测57. 以下哪种方式可以更好地处理大语言模型返回结果中可能存在的错误或异常?A. 假设大模型总是返回正确的结果。B. 使用 try-except 块捕获潜在的异常。C. 在调用大模型之前进行输入验证。D. 不处理直接使用返回结果。58. 在以下代码片段中SimilarityPostprocessor(similarity_cutoff0.2)的作用是什么A. 过滤掉相似度低于0.2的切片B. 设置召回切片的最大数量C. 设置重排序的切片数量59. 在切片向量化与存储阶段以下哪种模型用于将文本转换为高维向量A. Embedding 模型B. 大模型C. 增加模型的训练数据60. 大语言模型预训练与微调之间的关系是什么A. 微调发生在预训练之前用于准备数据B. 预训练和微调是相互独立的过程C. 微调是对预训练模型的初次训练D. 微调是在预训练模型基础上进行的调整优化61. 在以下代码片段中client.chat.completions.create的作用是什么A. 调用API进行标签提取B. 调用API进行模型训练C. 调用API进行文档检索62. 在RAG应用的多轮对话中业界常用的解决方法是什么A. 增加模型的训练数据B. 使用大模型将用户问题改写为包含历史对话关键信息的新queryC. 减少模型的推理时间63. 相较于从头全新训练一个模型下列对大语言模型微调的描述中正确的是哪一项?A. 需要更多计算资源以及更多的时间成本B. 需要较少的计算资源但训练时间相对较长C. 复用模型通过预训练学习的知识和模式64. 在调用大语言模型对话的API过程中以下哪个代码片段展示了正确的用户(user)提问方式?A. messages [{role: assistant, content: 你是一个诗歌生成器.}, {role: user, content: 请告诉我你想写一首关于什么的诗.}]B. messages [{role: system, content: 你是一个诗歌生成器.}, {role: user, content: 我想写一首关于秋天的诗.}]C. messages [{role: user, content: 你是一个诗歌生成器.}, {role: system, content: 我想写一首关于秋天的诗.}]65. 在创建提问引擎时index.as_query_engine方法的主要作用是什么A. 将指定文件夹中的文件加载为document对象B. 创建用于提问的引擎C. 将文本向量化66. Qwen-Max线上模型可能指的是以下哪一种情况?A. 经过大规模预训练的原始模型B. 针对特定任务经过充分微调的模型C. 经过大量在线交互不断优化的模型67. Ragas 提供的 Answer Correctness 指标用于评估什么A. RAG 应用生成答案的准确度B. 生成答案与问题的相关性C. 生成答案与检索资料的事实一致性68. 以下哪项技术是通过从更广泛的数据源获取信息以补充知识库不足的A. Sentence Sliding Window句子滑窗B. CRAG方法C. BGE嵌入模型69. 在使用Assistant API创建一个Assistant实例时下列哪个参数用于指定使用的模型?A. modelB. nameC. description70. 在大模型调用外部 API 工具时工具函数的描述description起到的关键作用是什么A. 帮助大模型理解何时以及如何调用该函数B. 减少 API 调用过程中的内存占用C. 加密 API 请求中的敏感数据D. 提高 API 调用的速度二多选题30 题 × 1 分 30 分1. 在检索召回阶段以下哪些方法通过增加更多信息让检索结果更全面A. 问题扩写B. 基于用户画像扩展上下文C. 问题改写2. 关于Loss function Cost function下面描述正确的是A. 拟合任意复杂函数B. 用于度量当前所设置的参数是否合适C. 决定神经元是否被激活并传递信息D. 帮助寻找函数的参数最优解3. 在优化 answer correctness 指标时以下哪些措施是可行的A. 优化 promptB. 调整大模型生成的超参数如 temperatureC. 更换性能更加强劲的大模型4. 在ask_llm_route函数中以下哪些是可能的处理流程A. 使用reviewed_prompt进行文档审查B. 使用ra ask进行公司内部文档查询C. 使用translate_prompt进行内容翻译D. 返回“未能识别问题类型请重新输入。”5. 在以下代码片段中哪些操作有助于生成更具确定性的文本A. 降低temperature值B. 减少max_tokens值C. 降低presence_penalty值6. 把API Key配置到环境变量里有哪些优点A. 提高大模型的回复速度B. 提高大模型的回复准确率C. 降低泄漏风险D. 在其它代码中也可以直接加载环境变量无需记住又长又复杂的 API Key7. APIAssistantAgent 示例代码 query 函数中哪些步骤与大语言模型交互A. 调用 forward_and_submit_outputs 函数B. 调用 dashscope.Runs.wait 函数C. 创建 message 对象D. 调用 dashscope.Messages.list 函数E. 解析 msgs 获取最终答案F. 调用 dashscope.Runs.create 函数8. 在优化后的答疑机器人中以下哪些是提示词中规定的角色背景A. 文档纠错专家B. 翻译专家C. 增加模型的训练数据9. 基于字符的文档切片方法有哪些潜在的缺点?A. 难以实现B. 可能导致语义分离C. 需要大量的存储空间D. 计算复杂度高E. 切片大小不均匀F. 可能导致上下文丢失10. 在监控大语言模型训练性能时哪些指标是常用的A. 训练时间B. 生成速度C. batch sizeD. 精准率E. 损失函数值F. 准确率11. 你和同事在设计一个知识库答疑机器人他提出了以下路线哪两个是合理的A. 大模型能力很强我们把所有知识文件的内容丢给大模型让它总结。B. 我们可以通过人工与大模型对公司的知识文件生成很多问答对再使用问答对微调大模型使大模型了解我们公司的知识。C. 相信大模型的能力无需外部知识库支持因为大模型已经预训练了海量数据。D. 大模型最大输入长度有限应该使用 RAG先召回最相关的文本段将文本段与输入问题进行拼接后输入大模型。12. 在文档切片过程中以下哪些切片方法适合处理逻辑性强、内容专业的文档A. 语义切片B. 句子窗口切片C. Token 切片13. 在 context recall 的计算过程中以下哪些步骤是必要的A. 由大模型将 ground_trut分解成观点列表B. 由大模型判断每个观点是否能在 contexts 中找到依据C. 增加模型的训练数据14. 在ask_llm_route函数中以下哪些是可能的输出A. 文档审查结果B.公司内部文档查询结果C. 内容翻译结果D. “未能识别问题类型请重新输入。”15. 在RAG应用的生成阶段主要步骤包括哪些A. 召回最相关的文本段B. 将问题与召回文本段通过提示词模板生成最终提示词C. 由大模型生成回复16. 在进行 RAGAS 评测时使用通过自定义 API 封装的 langchain LLM 对象主要有哪些优点A. 可以在 API 中定义 langchain LLM 类中不支持指定的参数B. 由于 langchain 官方封装好的模型有限因此通过自定义方法选择更多模型C. 可以打印出中间结果帮助评测人员了解分数来源D. 无需输入 API Key 即可使用大模型17. 某团队计划为法律咨询场景微调一个大模型。在正式启动微调前团队需优先评估以下哪三点A. 通过设计专业法律术语提示词优化输出结果B. 使用法律条文数据库构建知识检索增强生成RAG系统C. 验证现有法律案例数据量是否满足微调的数据规模要求18. 如果将 RAG 与开卷考试相类比下列哪两项描述最符合它们的相同之处A. 都是通过引入外部知识来增强输出B. 人的思维与大模型的权重参数都会随着外部知识的输入而发生改变C. 都需要提前对知识作出标记来帮助检索D. 都不需要对问题本身进行理解即可回答19. 在意图识别中以下哪些方法可以帮助大模型进行意图识别A. 使用提示词B. 对模型进行微调C. 增加模型的训练数据20. 你在开发的招聘答疑机器人在回答“产品经理的岗位职责有哪些”时输出的职责经常包含客户经理的工作职责。经排查发现不同岗位的说明文档使用了相同的模板文档切片时经常将#客户经理#岗位和#产品经理#岗位的职责主要是这样描述的。以下哪两种方法能有效解决这个问题A. 使用 ReRank 对检索结果再次排序B. 在处理文档时对于文档中的二级标题自动拼接文档名称如##岗位职责会被拼接为##客户经理岗位职责C. 在建立索引时以文档名称建立标签检索阶段使用标签向量混合检索D. 调高大模型 temperature 参数提高大模型匹配正确答案数据的概率21. 在优化 context recall 指标时以下哪些是使用大模型改写 query 的好处A. 提升召回的准确率B. 处理缺少信息的用户提问C. 增加模型的训练数据22. 关于多模态技术底层原理正确的说法是A. 图像理解模型也需要先将视频或图像分词化再做处理B. 实现「方言语音合成」需要训练模型建立方言音素与标准发音的映射关系C. 视频合成所花费的时间与可用的算力呈负相关D. 文生图模型生成不同尺寸图像时必须重新训练模型23. 某教育类AI产品出现以下现象哪些属于“幻觉”风险A. 回答“泰坦尼克号唯一幸存者”时虚构人物B. 理解作文题意自动生成800字高考作文C. 将”牛顿三大定律“解释为四条定律24. 在 RAG 工作流程中以下哪些是关键步骤A. 文档解析与切片阶段B. 向量存储C. 检索召回25. 在以下代码片段中哪些参数可以影响生成文本的多样性A. temperatureB. max_tokensC. presence_penalty26. 在提示词框架中以下哪些要素可以用于明确输出的格式A. 输出格式Output FormatB. 样例SampleC. 任务目标ObjectD. 上下文Context27. 在以下代码片段中哪些操作有助于提高检索的准确性A. 设置较大的召回切片数量B. 使用重排序模型选择最相关的切片C. 设置相似度阈值过滤不相关的切片28. 以下哪些任务可以使用 ffmpeg 完成?A. 提取视频中的音频。B. 调整视频的分辨率。C. 训练一个语音识别模型。D. 将多个视频片段合并成一个视频。E. 为视频添加水印。F. 转换视频格式例如 mp4 到 avi29. 以下哪个参数的设置会影响训练时显存占用峰值的大小A. 批量大小batch_sizeB. 验证损失计算步数evaluation_stepC. 训练集迭代次数epochD. LoRA 秩lora_rank30. RAG 应用在检索时共召回了 10 条切片其中 3 条高度相关但这 3 条内容都来自相邻段落却被系统拆分成不同切片从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度A. 使用按照语义的切片策略切分出语义更完整的切片B. 调整切片大小使其覆盖完整更大段落范围C. 采用滑动窗口策略生成重叠的文本切片D. 提高 temperature 参数控制生成多样性