目录一、大模型LLM ACA - ACP认证考试二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 以下哪种说法最能体现RAG的核心思想?2. 为了控制生成内容的随机性通常使用哪两个参数进行调整3. 零样本提示 (Zero-Shot Prompt允许模型在没有见过特定任务或数据集的情况下完成新任务这主要归功于以下哪一个选项4. 在检索召回阶段以下哪些方法通过滑动窗口检索补充相邻切片5. 在以下代码片段中extract_tags函数的作用是什么6. 你在开发一个内部IT 系统希望能够自动处理员工的请求“我的投影仪故障了请安排维修并通知下午会议改线上”。以下哪种技术方案有效、且能尽量減少人力投入7. 在构建 RAG 应用时以下哪些是本地向量数据库的适用场景8. 在优化 context precision 指标时以下哪些是 rerank重排序的好处9. 在优化后的答疑机器人中以下哪种问题需要经过RAG链路10. 在 context recall 的计算过程中以下哪个步骤是必要的11. 以下哪种方式可以更好地处理大语言模型返回结果中可能存在的错误或异常?12. 请问这段代码的主要作用是13. 在Llamaindex中默认情况下加载的数据是如何存储的?14. 在以下代码片段中max_tokens512的作用是什么15. 以下哪项不是少样本提示的应用场景16. 在RAG应用的多轮对话中custom_prompt模板的主要作用是什么17. RAG应用的文本合规检查过程中使用规则匹配方法的主要缺点是什么?18. 在开发智能餐厅点餐助手时测试发现用户语音下单如“来一份宫保鸡丁数量两份”时系统生成错误的调用参数导致订单出错。经排查原因在于“下单工具“描述中末明确规定输入参数如“菜品名称“和“数量”的类型、属性及必选项。请问哪项改进最能提高调用参数的准确性19. 大语言模型微调相比重头训练的主要优势是什么20. 用户向基于 RAG 的智能答疑机器人提交了一张包含敏感信息的图片进行咨询。根据最佳实践最早应该在哪个阶段进行内容安全合规检查以阻止敏感信息泄露21. 以下哪项插件功能最可能通过大模型API及百炼应用API结合实现以辅助日常办公22. 以下哪个代码片段最能体现大语言模型的优势23. 在代码中evaluate 函数的主要作用是什么24. 关于LLM少样本提示Few-Shot Prompting的主要局限性之一是25. ModelScope-Agent如何实现对复杂任务的处理26. 在以下代码片段中client.chat.completions.create的作用是什么27. 在创建索引时VectorStoreIndex.from_documents方法包含哪些步骤28. 在 Answer Correctness 的计算过程中以下哪种方法用于计算向量相似度29. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量30. 多Agent系统通过模拟或利用多个交互的智能体 (Agents来解决复杂问题。如果在一个复杂的金融交易市场模拟中使用多Agent系统的优势不包括31. 相较于从头全新训练一个模型下列对大语言模型微调的描述中正确的是哪一项?32. 在RAG应用的生成阶段大模型的主要作用是什么33. 在LLM提示词中思维链技术与标准提示相比主要优势是什么34. 你正在基于某视觉理解大模型开发一个门店巡检系统检查垃圾桶是否盖好、操作是否整洁、水池是否洗干净等但发现用大模型同时识别判断场景、给出判断结果的效果总是不好以下哪种改进方案能更低成本地解决这一问题35. 在 context precision 的计算过程中以下哪个步骤是必要的36. 为了将不同长度的文本序列调整为统一长度以便模型处理通常会采取哪种措施37. 在RAG系统中将文档拆分成多个分块 (chunks) 的主要目的是什么?38. 在确保计算资源与基础设施满足大模型微调需求时哪项不是关键考量指标?39. 以下哪个任务最适合使用大语言模型?40. 如果我们让大模型系统设计一个分阶段、分批次的投资策略大模型系统需要考虑各种不同的资产组合、投资策略综合考虑成本、风险、收益之后生成最优的投资策略。那么在设计大模型系统应对多路径策略规划时以下哪种方式不能有效避免策略冲突和资源浪费?41. 在 RAGAS 评分之后你对其中一些指标有些疑问你可以查看哪个字段来追溯大模型评分的原因42. 在以下代码片段中query_engine index.as_query_engine(...)的作用是什么43. 以下哪个RAG应用场景最适合使用规则匹配的文本合规检测?44. 在RAG应用的检索生成阶段检索阶段的主要任务是什么45. 检查以下代码如果需要添加一个新的意图类别例如 “入职流程”需要修改哪一部分代码 # 获取用户意图的核心算法 def get_purpose(document): prompt_template【角色背景】 你是一个专业的管理者你将阅读一条用户的问题并进行用户意图分类 【任务要求】 我们需要将用户的意图分成如下几类 请假政策福利待遇绩效考核工作职责开发规范 【输出要求】请以 json 格式输出不要输出其他内容 格式如{purpose:请假政策,query:请假流程是怎样的需要提前多久申请} 其中purpose 是你识别出的意图query 是用户输入的原始文本 【用户输入】 query prompt_template document46. RAG 系统在回答时返回了多位同名员工的信息无法区分他们最合理的改进方式是什么47. 关于技术团队在大模型微调项目中的作用下列哪一项描述不够准确?48. 在切片向量化与存储阶段以下哪些是 compare_embedding_models 函数的作用49. 以下哪个分隔符形式不常用于提示词中50. 在大语言模型微调的数据准备阶段哪个操作是为了将文本拆分成单词或词汇单元51. 一家新创公司计划开发一个创新的智能助手应用该应用需要能够与用户自然地交流并理解多种类型的输入数据。若该公司只能选择一种技术作为其核心功能的基础以下哪项技术最合适作为这个智能助手的基础52. 你开发了一个RAG应用用户反馈说回复效果不佳。你通过后台日志发现用户的输入有时缺少信息如“教研部”、“请假”你应该优先进行哪方面的优化53. 在LLM使用中如何通过提示词来优化模型的推理能力和内容生成的逻辑性54. 在问题改写中以下哪些方法通过分解复杂问题为多个子问题来解决问题55. 在 RAG 的建立索引过程中以下哪一点是将源知识文件分割成文本段的主要原因56. StorageContext.from_defaultspersist_dirPERSIST_DIR的作用是什么57. 你使用阿里云百炼平台的通义千问 API 开发了聊天机器人用户反馈提问某地天气时模型总是无法回答。如何快速解决这个问题58. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量59. LoRA 微调对数据量要求的说法错误的是60. RLHF (Reinforcement Learning from Human Feedback 的主要目的是什么61. 某团队需要翻译一份文档其中包含 30 条机构内部术语的英文缩写为了确保翻译的高准确性以下哪种方案能解决这一问题62. 在使用通义千问 API 自动完成文本处理任务时哪种方式能够批量处理上万个调查问卷63. 大语言模型RAG应用建立索引阶段需要先对文本进行切片以下哪种文本切片方法最有可能保留完整的语义信息?64. 在文档切片过程中以下哪种切片方法适合文档逻辑性强、内容专业的场景65. 在 RAG 流程中如何提高检索的效率66. 在构建 RAG 应用时以下哪种向量存储方案按量付费、自动扩容67. 在以下代码片段中similarity_top_k20的作用是什么68. 测试时发现RAG 应用的答案中仍包含大量无用细节导致阅读困难。哪种做法可以最直接地减少无关细节69. 在切片向量化与存储阶段以下哪种 Embedding 模型是较旧的版本70. 在文档切片过程中以下哪些切片方法适合刚开始接触 RAG 的用户二多选题30 题 × 1 分 30 分1. 关于 Qwen-Max、CosyVoice 和 moviepy 的协同使用以下哪些说法是正确的2. 为了尽量减少大模型应用的幻觉以下哪些措施是有效的3. 关于大模型的工作流程以下哪三个描述是正确的4. 你发现检索到的切片里常常遗漏上下文导致回答片段化。下列哪些是有效且合理的改进措施5. 在使用大模型提炼图文课程内容时以下哪些指导原则是正确的6. 以下哪些措施可以提高大模型在私域场景下的安全性7. 用户多次反馈 “AI 回答中有捏造内容”排查后发现是当知识库没有相关内容时大模型直接虚构答案。为减少此情况你可以怎么做8. 你正在开发一个机器学习领域的答疑机器人辅助学生学习但你对该领域专业知识掌握有限以下哪些策略更有助于你改进提示词设计9. 在优化 context recall 指标时以下哪些是必要的步骤10. 你发现大量员工信息都存放在 PDF、Word 文档里部分还包含表格和图片RAG 无法正确提取关键信息。你可以怎么处理11. 在自定义提示词模板中以下哪些是预设的部分信息12. 你在构建一个RAG应用以下哪些提示词模板是合理的的13. 在示例中以下哪些是知识库中召回的内容14. 你写了一个提示词“请用适合简报的形式以每篇100字的篇幅总结今早的十大新闻”你希望大模型能按照提示词完成任务以下哪些方案可行15. 在构建 RAG 应用时以下哪些是云服务向量存储的特点16. top_p参数如何影响候选Token的筛选17. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作18. 在以下代码段中哪些是设置模型训练参数的例子19. 通过 LlamalIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤20. 在文档切片过程中以下哪些切片方法适合处理长文档且需要保持上下文21. 在切片向量化与存储阶段以下哪些是余弦相似度的计算方法22. 下列关于将 AgentModule 类设计为基类的原因正确的有哪些23. 在大语言模型微调的训练循环中哪些步骤是必须包含的24. 构建高质量的数学题微调数据集应包含哪些要素25. 你正在优化一个 RAG 系统发现某些相似文本对的向量相似度较低以下哪两种方法可以改善这种情况26. 在以下代码片段中哪些参数可以影响生成文本的多样性27. 在评测机制里你发现自动化评分一直偏高但实际用户反馈一般。以下哪三项有可能提高评测的可信度28. 在构建 RAG 应用时哪些高级 RAG 课题值得探索29. APIAssistantAgent 示例代码 query 函数中哪些步骤与大语言模型交互30. 以下哪些场景适合设置较低的top_p值一、大模型LLM ACA - ACP认证考试探索未来智能的钥匙——ACA-ACP大模型工程师认证专栏导读 含十套模拟真题和真题精选请认真阅读考试须知后准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。答题开始即开始计时中途不可暂停如超时则自动提交1、考试共 (100) 道题总分100分及格分数80分。模拟试题库对应模拟试题按70:30-单选题-多选题真题一般50:252、考试需在120分钟内交卷过程中无法暂停请提前安排好时间如未及时交卷则本次考试作废3、推荐使用 Chrome 浏览器版本73及以上的正式版本或Firefox浏览器版本66及以上的正式版本)4、开始答题前会进行身份验证需要您拍摄并上传身份证人像面照片并按照系统要求开启摄像头进行面部识别5、考试过程中请保持摄像头开启并对准面部系统会不定时进行抓拍并与身份证照片做对比如发现作弊行为您的考试成绩将作废6、考试过程中系统将判断您的浏览器状态如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为以及弹出广告弹窗将会给出警告。如果次数过多您的考试成绩将作废7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件以免影响您的考试祝大家一次上岸顺利拿证未来在云赛道上越走越宽、越走越远 ✨二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 以下哪种说法最能体现RAG的核心思想?A. RAG 是一种利用大语言模型进行知识图谱构建的技术。B. RAG 是一种通过微调大语言模型来适应特定领域问答的技术。C. RAG 是一种利用大语言模型直接生成最终答案的技术。D. RAG 是一种将大语言模型与外部知识库结合提升模型问答能力的技术2. 为了控制生成内容的随机性通常使用哪两个参数进行调整A. temperature和top_pB. learning_rate和dropoutC. batch_size和epochs3. 零样本提示 (Zero-Shot Prompt允许模型在没有见过特定任务或数据集的情况下完成新任务这主要归功于以下哪一个选项A. 预训练B. 微调C. 监督学习4. 在检索召回阶段以下哪些方法通过滑动窗口检索补充相邻切片A. 滑动窗口检索B. 问题改写C. 重排序5. 在以下代码片段中extract_tags函数的作用是什么A. 从文本中提取标签B. 从文本中提取关键词C. 从文本中提取句子6. 你在开发一个内部IT 系统希望能够自动处理员工的请求“我的投影仪故障了请安排维修并通知下午会议改线上”。以下哪种技术方案有效、且能尽量減少人力投入A. 通过提示词引导大模型拆解任务为多步骤然后自动调用维修系统和会议系统 API 完成操作。B. 通过提示词引导大模型直接生成维修工单和会议调整结果无需调用现有系统。C. 通过大模型判断接单人自动将任务指派给接单人通知其创建维修工单并调整会议。D. 识别请求中的关键字如 “投影仪故障” “会议改线上”匹配规则系统后调用 API 完成任务。7. 在构建 RAG 应用时以下哪些是本地向量数据库的适用场景A. 小规模应用B. 开发测试C. 生产环境8. 在优化 context precision 指标时以下哪些是 rerank重排序的好处A. 提升相关文本段的排名B. 增加模型的训练数据C. 减少模型的推理时间9. 在优化后的答疑机器人中以下哪种问题需要经过RAG链路A. 公司内部文档查询B. 检查文档错误C. 增加模型的训练数据10. 在 context recall 的计算过程中以下哪个步骤是必要的A. 由大模型将 ground_trut分解成观点列表B. 增加模型的训练数据C. 减少模型的推理时间11. 以下哪种方式可以更好地处理大语言模型返回结果中可能存在的错误或异常?A. 假设大模型总是返回正确的结果。B. 使用 try-except 块捕获潜在的异常。C. 在调用大模型之前进行输入验证。D. 不处理直接使用返回结果。12. 请问这段代码的主要作用是A. 对召回的文本段进行 rerank 后输入大模型进行回复B. 在句子窗口检索中将扩展后的句子传入上下文并进行回复C. 在自动合并检索中判断父节点是否有超过半数的子节点被召回D. 加载本地索引对 query 进行回复13. 在Llamaindex中默认情况下加载的数据是如何存储的?A. 存储在云服务中B. 存储在文件系统中的特定目录C. 直接写入数据库D. 存储在内存中作为一系列向量嵌入14. 在以下代码片段中max_tokens512的作用是什么A. 控制输出长度B. 增加输出的多样性C. 使输出更具确定性15. 以下哪项不是少样本提示的应用场景A. 数据稀缺或需要快速适应新任务的场景B. 需要深度专业知识的任务C. 需要快速原型设计的场景16. 在RAG应用的多轮对话中custom_prompt模板的主要作用是什么A. 定义如何将用户问题改写为独立的问题B. 增加模型的训练数据C. 减少模型的推理时间17. RAG应用的文本合规检查过程中使用规则匹配方法的主要缺点是什么?A. 计算复杂度高,处理速度慢B. 需要大量的训练数据C. 缺乏泛化能力18. 在开发智能餐厅点餐助手时测试发现用户语音下单如“来一份宫保鸡丁数量两份”时系统生成错误的调用参数导致订单出错。经排查原因在于“下单工具“描述中末明确规定输入参数如“菜品名称“和“数量”的类型、属性及必选项。请问哪项改进最能提高调用参数的准确性A. 在工具描述中详细定义parameters字段明确说明相关参数的类型、属性描述及必选要求B. 在工具描述中增加更多辅助说明如功能介绍和使用场景增强工具的吸引力C. 修改工具返回数据格式使其自动生成标准订单编号19. 大语言模型微调相比重头训练的主要优势是什么A. 训练时间更长B. 可以利用预训练学到的通用知识C. 需要更多计算资源D. 对特定任务的表现不如从头训练的模型20. 用户向基于 RAG 的智能答疑机器人提交了一张包含敏感信息的图片进行咨询。根据最佳实践最早应该在哪个阶段进行内容安全合规检查以阻止敏感信息泄露A. 机器人根据用户图片检索时B. 机器人响应返回答案之后检查C. 在机器人处理图片之前检查D. 将答案返回给用户之前检查21. 以下哪项插件功能最可能通过大模型API及百炼应用API结合实现以辅助日常办公A. 高级图像识别与编辑B. 实时多语言翻译服务C. 复杂的3D建模与渲染22. 以下哪个代码片段最能体现大语言模型的优势A. python from scipy.stats import pearsonr x [1, 2, 3, 4, 5] y [2.4, 6.8, 10] correlation pearsonr(x, y) print(correlation)B. python text 我非常喜欢这款产品 sentiment analyze_sentiment(text) # 调用大模型接口 print(sentiment) # 输出积极C. python data [1, 2, 3, 4, 5] sum_of_data sum(data) print(sum_of_data)D. python import numpy as np data [1, 2, 3, 4, 5, 100] std_dev np.std(data) print(std_dev)23. 在代码中evaluate 函数的主要作用是什么A. 评估数据集中的答案正确性B. 增加模型的训练数据C. 减少模型的推理时间24. 关于LLM少样本提示Few-Shot Prompting的主要局限性之一是A. 需要大量的样本数据B. 样本的质量和数量对模型的影响较大C. 模型无法从示例中学习新任务25. ModelScope-Agent如何实现对复杂任务的处理A. 通过预设的有限状态机直接执行固定流程不支持动态调整B. 将大任务拆分为一系列小任务并按顺序自动调度执行这些子任务C. 需要人工干预来规划每个子任务的执行顺序和方式26. 在以下代码片段中client.chat.completions.create的作用是什么A. 调用API进行标签提取B. 调用API进行模型训练C. 调用API进行文档检索27. 在创建索引时VectorStoreIndex.from_documents方法包含哪些步骤A. 文档解析和文本分段B. 文本分段和建立索引C. 文本向量化和存储索引28. 在 Answer Correctness 的计算过程中以下哪种方法用于计算向量相似度A. 余弦相似度B. 欧氏距离C. 曼哈顿距离29. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量A. 预训练B. SFTC. RLHF30. 多Agent系统通过模拟或利用多个交互的智能体 (Agents来解决复杂问题。如果在一个复杂的金融交易市场模拟中使用多Agent系统的优势不包括A. 能够模拟多个投资者的独立决策过程增加市场仿真度B. 通过Agent间的竞争与合作模型更准确地反映市场动态C. 单一Agent即可处理所有市场参与者的策略制定与执行简化系统设计31. 相较于从头全新训练一个模型下列对大语言模型微调的描述中正确的是哪一项?A. 需要更多计算资源以及更多的时间成本B. 需要较少的计算资源但训练时间相对较长C. 复用模型通过预训练学习的知识和模式32. 在RAG应用的生成阶段大模型的主要作用是什么A. 召回与问题最相关的文本段B. 根据召回文本段和问题生成最终回答C. 增加模型的训练数据33. 在LLM提示词中思维链技术与标准提示相比主要优势是什么A. 更快的响速度B. 更高的推理透明度和可验证性C. 更低的计算资源消耗34. 你正在基于某视觉理解大模型开发一个门店巡检系统检查垃圾桶是否盖好、操作是否整洁、水池是否洗干净等但发现用大模型同时识别判断场景、给出判断结果的效果总是不好以下哪种改进方案能更低成本地解决这一问题A. 增加更多的监控摄像头给大模型更多的输入信息B. 收集一批高质量的监控画面数据面向巡检任务微调大模型C. 改进当前的数据输入减少监控画面的分辨率避免引入干扰信息D. 用物体分割小模型圈出识别区域然后抠图输入给大模型检测状态35. 在 context precision 的计算过程中以下哪个步骤是必要的A. 按顺序读取 contexts 中的 contexti判断其是否相关B. 增加模型的训练数据C. 减少模型的推理时间36. 为了将不同长度的文本序列调整为统一长度以便模型处理通常会采取哪种措施A. 删除过长的句子B. 忽略长度差异C. 截断过短的句子D. 填充序列到固定长度Padding37. 在RAG系统中将文档拆分成多个分块 (chunks) 的主要目的是什么?A. 适配大模型的输入限制并提高检索的准确性和相关性。B. 减小存储空间提高检索效率。C. 方便用户浏览提升用户体验。D. 简化文档预处理流程降低开发成本。38. 在确保计算资源与基础设施满足大模型微调需求时哪项不是关键考量指标?A. GPU的数量和型号以支持大规模并行计算B. 存储容量以保存庞大的预训练模型及训练过程中的中间状态C. 网络带宽以便快速传输训练所需的大规模数据集D. 显示器分辨率以提供更清晰的训练过程可视化效果39. 以下哪个任务最适合使用大语言模型?A. 对一组图像进行精确的像素级分割B. 计算一组数据的标准差C. 在一个大型数据集上训练一个复杂的机器学习模型例如深度神经网络D. 检测一组销售数据中的异常值40. 如果我们让大模型系统设计一个分阶段、分批次的投资策略大模型系统需要考虑各种不同的资产组合、投资策略综合考虑成本、风险、收益之后生成最优的投资策略。那么在设计大模型系统应对多路径策略规划时以下哪种方式不能有效避免策略冲突和资源浪费?A. 建立中心化协调机制监控并调度各Agent的行动策略B. 采用博弈论模型预测并解决潜在的策略冲突C. 强制所有Agent采用相同的决策逻辑和目标函数以保证一致性41. 在 RAGAS 评分之后你对其中一些指标有些疑问你可以查看哪个字段来追溯大模型评分的原因A. sourceB. reasonC. json_objectD. source_node42. 在以下代码片段中query_engine index.as_query_engine(...)的作用是什么A. 创建查询引擎B. 设置召回切片的最大数量C. 设置重排序的切片数量43. 以下哪个RAG应用场景最适合使用规则匹配的文本合规检测?A. 理解用户提问的深层含义B. 判断用户评论是否包含特定品牌的广告信息C. 识别文章中蕴含的复杂情感D. 检测用户上传的文本是否包含明确的违禁词汇44. 在RAG应用的检索生成阶段检索阶段的主要任务是什么A. 生成最终的回答B. 召回与问题最相关的文本段C. 增加模型的训练数据45. 检查以下代码如果需要添加一个新的意图类别例如 “入职流程”需要修改哪一部分代码 # 获取用户意图的核心算法 def get_purpose(document): prompt_template【角色背景】 你是一个专业的管理者你将阅读一条用户的问题并进行用户意图分类 【任务要求】 我们需要将用户的意图分成如下几类 请假政策福利待遇绩效考核工作职责开发规范 【输出要求】请以 json 格式输出不要输出其他内容 格式如{purpose:请假政策,query:请假流程是怎样的需要提前多久申请} 其中purpose 是你识别出的意图query 是用户输入的原始文本 【用户输入】 query prompt_template documentA. 只需要修改输入的用户 query 列表B. 需要修改输出格式要求。C. 需要修改 prompt_template 中的【任务要求】部分以及可能需要更新 get_purpose 函数中的逻辑。D. 只需要修改 大模型 query 函数 Q_S_Line46. RAG 系统在回答时返回了多位同名员工的信息无法区分他们最合理的改进方式是什么A. 在检索前自动补充标签例如 “姓名张伟IT 部”B. 简单将 “张伟” 替换成 “张伟唯一”C. 大幅提高大模型的温度D. 默认检索 100 条切片手动让用户筛选47. 关于技术团队在大模型微调项目中的作用下列哪一项描述不够准确?A. 确保团队成员掌握深度学习、自然语言处理等相关技术B. 仅需关注模型训练过程模型部署与维护由其他部门负责C. 负责实现模型微调过程中的技术细节调整和优化48. 在切片向量化与存储阶段以下哪些是 compare_embedding_models 函数的作用A. 比较不同 Embeddin模型在 RA中的表现B. 增加模型的训练数据C. 减少模型的推理时间49. 以下哪个分隔符形式不常用于提示词中A. plaintext ...B. plaintext ... Part 1 Part 2C. plaintext Section 1 Section 2D. plaintext ##Title Content50. 在大语言模型微调的数据准备阶段哪个操作是为了将文本拆分成单词或词汇单元A. 文本翻译B. 数据去重C. 分词(Tokenization)D. 文本摘要51. 一家新创公司计划开发一个创新的智能助手应用该应用需要能够与用户自然地交流并理解多种类型的输入数据。若该公司只能选择一种技术作为其核心功能的基础以下哪项技术最合适作为这个智能助手的基础A. 计算机视觉模型因为这能让智能助手解析和理解用户提供的视觉信息这是用户交流的主要方式B. 多模态模型可以使智能助手处理多种类型的输入数据如文本、图片和音频这样的综合能力能提供更丰富的用户体验C. 音频处理模型因其可将用户的语音转换为文本让智能助手在不需要视觉信息的情况下依然可以与用户进行交流52. 你开发了一个RAG应用用户反馈说回复效果不佳。你通过后台日志发现用户的输入有时缺少信息如“教研部”、“请假”你应该优先进行哪方面的优化A. 优化文档切分策略B. 更换检索速度更快的向量数据库C. 调整大模型的 top_p 参数D. 结合历史常见问题使用大模型对 query 进行改写53. 在LLM使用中如何通过提示词来优化模型的推理能力和内容生成的逻辑性A. 仅提供非常简短的提示让模型自由发挥不加任何约束B. 使用思维链技术引导模型逐步展示其推理步骤C. 忽略提示词的上下文信息依赖模型自身去推断任务要求54. 在问题改写中以下哪些方法通过分解复杂问题为多个子问题来解决问题A. 将单一查询改写为多步骤查询B. 使用大模型扩充用户问题C. 用假设文档来增强检索HyDe55. 在 RAG 的建立索引过程中以下哪一点是将源知识文件分割成文本段的主要原因A. 让大模型输出更加多样B. 提高检索精度更快速定位相关段落C. 减少数据存储空间D. 减少索引构建时间56. StorageContext.from_defaultspersist_dirPERSIST_DIR的作用是什么A. 创建一个新的 StorageContext 对象并使用默认配置但指定持久化目录。B. 将 StorageContext 对象保存到 PERSIST_DIR。C. 从 PERSIST_DIR 加载 StorageContext 对象。D. 创建一个默认的 StorageContext 对象并忽略 PERSIST_DIR。57. 你使用阿里云百炼平台的通义千问 API 开发了聊天机器人用户反馈提问某地天气时模型总是无法回答。如何快速解决这个问题A. 提前设置话术在面对类似问题时可以直接将话术返回给用户B. 通过复杂的工程手段对用户的输入提取关键词集成第三方搜索引擎并将搜索结果返回给大模型C. 设置 enable_search联网搜索参数为通义千问 API 引入联网能力D. 在聊天界面显眼位置标注限制不建议用户输入类似问题58. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量A. 预训练B. SFTC. RLHF59. LoRA 微调对数据量要求的说法错误的是A. 微调数据量较小时应增大 LoRA 的秩以提升模型表达能力B. 在数据质量有保障时增大数据量、多样化通常能提升微调效果C. LoRA 微调需求数据量比预训练要小D. 同等数据量下1000 条LoRA 微调效果接近全参微调60. RLHF (Reinforcement Learning from Human Feedback 的主要目的是什么A. 提升模型的泛化能力B. 让模型输出更加贴近人类的偏好和价值观C. 增加模型的参数量61. 某团队需要翻译一份文档其中包含 30 条机构内部术语的英文缩写为了确保翻译的高准确性以下哪种方案能解决这一问题A. 在提示词中提供 30 条对应术语缩写与翻译示例B. 提供前 5 条翻译示例要求模型类推处理剩余条目C. 直接让大模型翻译大模型能够完成这类任务D. 使用支持联网搜索的大模型 API 完成此任务62. 在使用通义千问 API 自动完成文本处理任务时哪种方式能够批量处理上万个调查问卷A. 手工处理B. Excel操作C. 代码调用大模型63. 大语言模型RAG应用建立索引阶段需要先对文本进行切片以下哪种文本切片方法最有可能保留完整的语义信息?A. 按字符数分割,每50个字符为一个chunkB. 按token长度分割,每100个token为一个chunkC. 按标点符号分割64. 在文档切片过程中以下哪种切片方法适合文档逻辑性强、内容专业的场景A. 语义切片B. Token 切片C. 句子切片65. 在 RAG 流程中如何提高检索的效率A. 增加 embedding 的维度B. 使用更大的预训练语言模型。C. 对向量数据库中的向量构建索引。D. 增加文档切片的粒度(例如将段落切成更小的片段)66. 在构建 RAG 应用时以下哪种向量存储方案按量付费、自动扩容A. 云服务向量存储B. 内存向量存储C. 本地向量数据库67. 在以下代码片段中similarity_top_k20的作用是什么A. 设置召回切片的最大数量B. 设置重排序的切片数量C. 设置相似度阈值68. 测试时发现RAG 应用的答案中仍包含大量无用细节导致阅读困难。哪种做法可以最直接地减少无关细节A. 在检索后用 ReRank 且设置更小的 Top NB. 把索引文件放进 Redis 数据库C. 增加大模型的 “max_tokens”D. 强制用户只提简单问题69. 在切片向量化与存储阶段以下哪种 Embedding 模型是较旧的版本A. text-embedding-v2B. text-embedding-v3C. 增加模型的训练数据70. 在文档切片过程中以下哪些切片方法适合刚开始接触 RAG 的用户A. 句子切片B. Token 切片C. 句子窗口切片二多选题30 题 × 1 分 30 分1. 关于 Qwen-Max、CosyVoice 和 moviepy 的协同使用以下哪些说法是正确的A. CosyVoice 可以将文本转换为音频。B. CosyVoice 的主要功能是视频剪辑。C. moviepy 可以直接将文本转换为视频。D. Qwen-Max 主要用于生成视频字幕。E. moviepy 可以用来获取音频文件的持续时间用于生成字幕。F. 使用这三个工具的典型流程是Qwen-Max → CosyVoice → moviepy。2. 为了尽量减少大模型应用的幻觉以下哪些措施是有效的A. 对生成内容进行后处理和验证B. 使用参数量小更适合本地部署的模型C. 引入知识库补充大模型缺少的行业知识D. 在提示词中要求禁止虚构内容遇到无法回答的问题可以直接回复不知道3. 关于大模型的工作流程以下哪三个描述是正确的A. 输入文本需要先分词化为 TokenB. 只要每次输入的问题一样每次输出的Token也会一样C. 大模型推理阶段会根据候选 Token 的概率选择输出内容D. Token 向量化是为了让计算机能够理解自然语言4. 你发现检索到的切片里常常遗漏上下文导致回答片段化。下列哪些是有效且合理的改进措施A. 改用 “句子窗口切片” 或 “滑动窗口检索”B. 增大 chunk_overlapC. 避免切片将文档完整的拼接到提示词中D. 适当调大召回文档切片数量例如从 Top3 调整为 Top55. 在使用大模型提炼图文课程内容时以下哪些指导原则是正确的A. 提炼关键信息,避免冗长段落B. 使用简短标题,聚焦于要点C. 内容应尽量详细和全面D. 不做任何修改6. 以下哪些措施可以提高大模型在私域场景下的安全性A. 对相关人员进行安全培训B. 建立完善的安全 incident 响应机制C. 使用开源的数据管理软件D. 将所有数据存储在云端E. 定期更新大模型和相关软件F. 对大模型进行持续的安全评估和测试7. 用户多次反馈 “AI 回答中有捏造内容”排查后发现是当知识库没有相关内容时大模型直接虚构答案。为减少此情况你可以怎么做A. 在百炼 RAG 应用中将回答范围设置为 “仅知识库范围”B. 调高 temperature 值C. 使用 ReRank 对检索结果再次排序D. 使用提示词无匹配就明确回复 “无法回答”8. 你正在开发一个机器学习领域的答疑机器人辅助学生学习但你对该领域专业知识掌握有限以下哪些策略更有助于你改进提示词设计A. 邀请机器学习课程助教一起审核和改进提示词要求其按照一定的结构来回答问题B. 要求大模型扮演「机器学习教授」结合学生认知水平重新写出更结构化的提示词C. 按照自己的理解要求大模型按照一定的结构来回答问题D. 保持提示词简单避免引入错误的信息9. 在优化 context recall 指标时以下哪些是必要的步骤A. 对比知识库内容与测试样本B. 更换 embeddin模型C. 使用大模型改写 query10. 你发现大量员工信息都存放在 PDF、Word 文档里部分还包含表格和图片RAG 无法正确提取关键信息。你可以怎么处理A. 手动复制粘贴所有文档内容B. 使用 OCR 技术识别并提取图片中的文字C. 强制用户只上传纯文本D. 使用 DashScopeParse 等工具对 PDF/Word 进行结构化解析11. 在自定义提示词模板中以下哪些是预设的部分信息A. 大模型的角色B. 注意事项C. 用户的问题D. 输出的格式12. 你在构建一个RAG应用以下哪些提示词模板是合理的的A. 检索到的相关内容为{检索到的文本段} 用户的问题是{用户问题} 请结合以上信息给出准确且简洁的回答。B. 以下是用户的问题{用户问题}C. 以下是与问题相关的背景信息{检索到的文本段} 问题是{用户问题} 请基于背景信息提供一个合理且完整的答案。D. 以下是检索到的内容{检索到的文本段}13. 在示例中以下哪些是知识库中召回的内容A. 内容研究与分析B. 教材和课程开发C. 增加模型的训练数据D. 减少模型的推理时间14. 你写了一个提示词“请用适合简报的形式以每篇100字的篇幅总结今早的十大新闻”你希望大模型能按照提示词完成任务以下哪些方案可行A. 设计提示词明确要求大模型要基于今天最新的新闻来总结避免基于历史新闻总结B. 设计提示词结合 function call让大模型回答时效性问题时调用搜索工具C. 整理历史新闻库构建一个 RAG 应用让大模型回答时参考知识库中的新闻D. 使用阿里云百炼平台的 qwen-plus并且调用 API 时设置 enable_searchTrue15. 在构建 RAG 应用时以下哪些是云服务向量存储的特点A. 无需关注运维B. 自动扩容C. 提供完善的监控和管理工具D. 按量付费16. top_p参数如何影响候选Token的筛选A. 高top_p值增加候选Token的范围B. 低top_p值减少候选Token的范围C. 高top_p值减少候选Token的范围17. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作A. 列举B. 剪切C. 复制D. 删除E. 更新F. 创建18. 在以下代码段中哪些是设置模型训练参数的例子A. learning_rate 0.001B. modelqwen-7b - chatC. device torch.device(cuda if torch.cuda.is_available() else cpu)D. optimizer AdamW(model.parameters(), lrlearning_rate)E. num_epochs 3F. batch_size 6419. 通过 LlamalIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤A. 用 index 的 update_prompts 方法将新的 prompt 同步上去B. 定义新的 prompt 字符串将 chunk 和 query 的位置空出来C. 对新的 prompt 进行保存使得 LlamalIndex 中的源码 prompt 也变成中文D. 使用新的 prompt 初始化一个 PromptTemplate 对象20. 在文档切片过程中以下哪些切片方法适合处理长文档且需要保持上下文A. 句子窗口切片B. 语义切片C. Token 切片21. 在切片向量化与存储阶段以下哪些是余弦相似度的计算方法A. 计算向量之间的夹角B. 计算向量的点积C. 增加模型的训练数据D. 减少模型的推理时间22. 下列关于将 AgentModule 类设计为基类的原因正确的有哪些A. 简化子类中的构造函数减少重复代码B. 由于 Python 不支持多重继承因此需要这样设计C. 允许每个子类定义自己的 query 方法增加灵活性D. 作为一个基类可以方便地隐藏私有属性保护数据E. 提供统一的 call 方法以便通过相同的方式调用所有子类F. 使得多个不同的代理模块可以共享相同的接口实现代码复用23. 在大语言模型微调的训练循环中哪些步骤是必须包含的A. 超参数调整B. 模型保存C. 正向传播D. 梯度更新E. 梯度裁剪F. 反向传播24. 构建高质量的数学题微调数据集应包含哪些要素A. 包含详细分步推导B. 统一使用 LaTeX 公式或 Markdown 格式输出公式C. 大量的数学题解题数据D. 覆盖多种解题思路25. 你正在优化一个 RAG 系统发现某些相似文本对的向量相似度较低以下哪两种方法可以改善这种情况A. 更换效果更好的 embedding 模型B. 将索引保存到本地并在运行时加载C. 减少向量数据库的存储容量D. 通过对比学习让相关文本对的向量相似度更高26. 在以下代码片段中哪些参数可以影响生成文本的多样性A. temperatureB. max_tokensC. presence_penalty27. 在评测机制里你发现自动化评分一直偏高但实际用户反馈一般。以下哪三项有可能提高评测的可信度A. 基于现有的评测集增加自动化评测的频次B. 在构建测试集时增加业务专家的打分环节C. 根据线上用户问题类型的分布修正测试样本集的问题分布D. 调整自动化评测工程的提示词及阈值让其更接近真实用户判断标准28. 在构建 RAG 应用时哪些高级 RAG 课题值得探索A. GraphRAG 技术B. 可视化工作流C. 智能体编排29. APIAssistantAgent 示例代码 query 函数中哪些步骤与大语言模型交互A. 调用 forward_and_submit_outputs 函数B. 调用 dashscope.Runs.wait 函数C. 创建 message 对象D. 调用 dashscope.Messages.list 函数E. 解析 msgs 获取最终答案F. 调用 dashscope.Runs.create 函数30. 以下哪些场景适合设置较低的top_p值A. 新闻初稿B. 代码生成C. 创意写作
大模型LLM ACA - ACP认证考试模拟试卷九
发布时间:2026/5/26 16:32:01
目录一、大模型LLM ACA - ACP认证考试二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 以下哪种说法最能体现RAG的核心思想?2. 为了控制生成内容的随机性通常使用哪两个参数进行调整3. 零样本提示 (Zero-Shot Prompt允许模型在没有见过特定任务或数据集的情况下完成新任务这主要归功于以下哪一个选项4. 在检索召回阶段以下哪些方法通过滑动窗口检索补充相邻切片5. 在以下代码片段中extract_tags函数的作用是什么6. 你在开发一个内部IT 系统希望能够自动处理员工的请求“我的投影仪故障了请安排维修并通知下午会议改线上”。以下哪种技术方案有效、且能尽量減少人力投入7. 在构建 RAG 应用时以下哪些是本地向量数据库的适用场景8. 在优化 context precision 指标时以下哪些是 rerank重排序的好处9. 在优化后的答疑机器人中以下哪种问题需要经过RAG链路10. 在 context recall 的计算过程中以下哪个步骤是必要的11. 以下哪种方式可以更好地处理大语言模型返回结果中可能存在的错误或异常?12. 请问这段代码的主要作用是13. 在Llamaindex中默认情况下加载的数据是如何存储的?14. 在以下代码片段中max_tokens512的作用是什么15. 以下哪项不是少样本提示的应用场景16. 在RAG应用的多轮对话中custom_prompt模板的主要作用是什么17. RAG应用的文本合规检查过程中使用规则匹配方法的主要缺点是什么?18. 在开发智能餐厅点餐助手时测试发现用户语音下单如“来一份宫保鸡丁数量两份”时系统生成错误的调用参数导致订单出错。经排查原因在于“下单工具“描述中末明确规定输入参数如“菜品名称“和“数量”的类型、属性及必选项。请问哪项改进最能提高调用参数的准确性19. 大语言模型微调相比重头训练的主要优势是什么20. 用户向基于 RAG 的智能答疑机器人提交了一张包含敏感信息的图片进行咨询。根据最佳实践最早应该在哪个阶段进行内容安全合规检查以阻止敏感信息泄露21. 以下哪项插件功能最可能通过大模型API及百炼应用API结合实现以辅助日常办公22. 以下哪个代码片段最能体现大语言模型的优势23. 在代码中evaluate 函数的主要作用是什么24. 关于LLM少样本提示Few-Shot Prompting的主要局限性之一是25. ModelScope-Agent如何实现对复杂任务的处理26. 在以下代码片段中client.chat.completions.create的作用是什么27. 在创建索引时VectorStoreIndex.from_documents方法包含哪些步骤28. 在 Answer Correctness 的计算过程中以下哪种方法用于计算向量相似度29. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量30. 多Agent系统通过模拟或利用多个交互的智能体 (Agents来解决复杂问题。如果在一个复杂的金融交易市场模拟中使用多Agent系统的优势不包括31. 相较于从头全新训练一个模型下列对大语言模型微调的描述中正确的是哪一项?32. 在RAG应用的生成阶段大模型的主要作用是什么33. 在LLM提示词中思维链技术与标准提示相比主要优势是什么34. 你正在基于某视觉理解大模型开发一个门店巡检系统检查垃圾桶是否盖好、操作是否整洁、水池是否洗干净等但发现用大模型同时识别判断场景、给出判断结果的效果总是不好以下哪种改进方案能更低成本地解决这一问题35. 在 context precision 的计算过程中以下哪个步骤是必要的36. 为了将不同长度的文本序列调整为统一长度以便模型处理通常会采取哪种措施37. 在RAG系统中将文档拆分成多个分块 (chunks) 的主要目的是什么?38. 在确保计算资源与基础设施满足大模型微调需求时哪项不是关键考量指标?39. 以下哪个任务最适合使用大语言模型?40. 如果我们让大模型系统设计一个分阶段、分批次的投资策略大模型系统需要考虑各种不同的资产组合、投资策略综合考虑成本、风险、收益之后生成最优的投资策略。那么在设计大模型系统应对多路径策略规划时以下哪种方式不能有效避免策略冲突和资源浪费?41. 在 RAGAS 评分之后你对其中一些指标有些疑问你可以查看哪个字段来追溯大模型评分的原因42. 在以下代码片段中query_engine index.as_query_engine(...)的作用是什么43. 以下哪个RAG应用场景最适合使用规则匹配的文本合规检测?44. 在RAG应用的检索生成阶段检索阶段的主要任务是什么45. 检查以下代码如果需要添加一个新的意图类别例如 “入职流程”需要修改哪一部分代码 # 获取用户意图的核心算法 def get_purpose(document): prompt_template【角色背景】 你是一个专业的管理者你将阅读一条用户的问题并进行用户意图分类 【任务要求】 我们需要将用户的意图分成如下几类 请假政策福利待遇绩效考核工作职责开发规范 【输出要求】请以 json 格式输出不要输出其他内容 格式如{purpose:请假政策,query:请假流程是怎样的需要提前多久申请} 其中purpose 是你识别出的意图query 是用户输入的原始文本 【用户输入】 query prompt_template document46. RAG 系统在回答时返回了多位同名员工的信息无法区分他们最合理的改进方式是什么47. 关于技术团队在大模型微调项目中的作用下列哪一项描述不够准确?48. 在切片向量化与存储阶段以下哪些是 compare_embedding_models 函数的作用49. 以下哪个分隔符形式不常用于提示词中50. 在大语言模型微调的数据准备阶段哪个操作是为了将文本拆分成单词或词汇单元51. 一家新创公司计划开发一个创新的智能助手应用该应用需要能够与用户自然地交流并理解多种类型的输入数据。若该公司只能选择一种技术作为其核心功能的基础以下哪项技术最合适作为这个智能助手的基础52. 你开发了一个RAG应用用户反馈说回复效果不佳。你通过后台日志发现用户的输入有时缺少信息如“教研部”、“请假”你应该优先进行哪方面的优化53. 在LLM使用中如何通过提示词来优化模型的推理能力和内容生成的逻辑性54. 在问题改写中以下哪些方法通过分解复杂问题为多个子问题来解决问题55. 在 RAG 的建立索引过程中以下哪一点是将源知识文件分割成文本段的主要原因56. StorageContext.from_defaultspersist_dirPERSIST_DIR的作用是什么57. 你使用阿里云百炼平台的通义千问 API 开发了聊天机器人用户反馈提问某地天气时模型总是无法回答。如何快速解决这个问题58. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量59. LoRA 微调对数据量要求的说法错误的是60. RLHF (Reinforcement Learning from Human Feedback 的主要目的是什么61. 某团队需要翻译一份文档其中包含 30 条机构内部术语的英文缩写为了确保翻译的高准确性以下哪种方案能解决这一问题62. 在使用通义千问 API 自动完成文本处理任务时哪种方式能够批量处理上万个调查问卷63. 大语言模型RAG应用建立索引阶段需要先对文本进行切片以下哪种文本切片方法最有可能保留完整的语义信息?64. 在文档切片过程中以下哪种切片方法适合文档逻辑性强、内容专业的场景65. 在 RAG 流程中如何提高检索的效率66. 在构建 RAG 应用时以下哪种向量存储方案按量付费、自动扩容67. 在以下代码片段中similarity_top_k20的作用是什么68. 测试时发现RAG 应用的答案中仍包含大量无用细节导致阅读困难。哪种做法可以最直接地减少无关细节69. 在切片向量化与存储阶段以下哪种 Embedding 模型是较旧的版本70. 在文档切片过程中以下哪些切片方法适合刚开始接触 RAG 的用户二多选题30 题 × 1 分 30 分1. 关于 Qwen-Max、CosyVoice 和 moviepy 的协同使用以下哪些说法是正确的2. 为了尽量减少大模型应用的幻觉以下哪些措施是有效的3. 关于大模型的工作流程以下哪三个描述是正确的4. 你发现检索到的切片里常常遗漏上下文导致回答片段化。下列哪些是有效且合理的改进措施5. 在使用大模型提炼图文课程内容时以下哪些指导原则是正确的6. 以下哪些措施可以提高大模型在私域场景下的安全性7. 用户多次反馈 “AI 回答中有捏造内容”排查后发现是当知识库没有相关内容时大模型直接虚构答案。为减少此情况你可以怎么做8. 你正在开发一个机器学习领域的答疑机器人辅助学生学习但你对该领域专业知识掌握有限以下哪些策略更有助于你改进提示词设计9. 在优化 context recall 指标时以下哪些是必要的步骤10. 你发现大量员工信息都存放在 PDF、Word 文档里部分还包含表格和图片RAG 无法正确提取关键信息。你可以怎么处理11. 在自定义提示词模板中以下哪些是预设的部分信息12. 你在构建一个RAG应用以下哪些提示词模板是合理的的13. 在示例中以下哪些是知识库中召回的内容14. 你写了一个提示词“请用适合简报的形式以每篇100字的篇幅总结今早的十大新闻”你希望大模型能按照提示词完成任务以下哪些方案可行15. 在构建 RAG 应用时以下哪些是云服务向量存储的特点16. top_p参数如何影响候选Token的筛选17. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作18. 在以下代码段中哪些是设置模型训练参数的例子19. 通过 LlamalIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤20. 在文档切片过程中以下哪些切片方法适合处理长文档且需要保持上下文21. 在切片向量化与存储阶段以下哪些是余弦相似度的计算方法22. 下列关于将 AgentModule 类设计为基类的原因正确的有哪些23. 在大语言模型微调的训练循环中哪些步骤是必须包含的24. 构建高质量的数学题微调数据集应包含哪些要素25. 你正在优化一个 RAG 系统发现某些相似文本对的向量相似度较低以下哪两种方法可以改善这种情况26. 在以下代码片段中哪些参数可以影响生成文本的多样性27. 在评测机制里你发现自动化评分一直偏高但实际用户反馈一般。以下哪三项有可能提高评测的可信度28. 在构建 RAG 应用时哪些高级 RAG 课题值得探索29. APIAssistantAgent 示例代码 query 函数中哪些步骤与大语言模型交互30. 以下哪些场景适合设置较低的top_p值一、大模型LLM ACA - ACP认证考试探索未来智能的钥匙——ACA-ACP大模型工程师认证专栏导读 含十套模拟真题和真题精选请认真阅读考试须知后准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。答题开始即开始计时中途不可暂停如超时则自动提交1、考试共 (100) 道题总分100分及格分数80分。模拟试题库对应模拟试题按70:30-单选题-多选题真题一般50:252、考试需在120分钟内交卷过程中无法暂停请提前安排好时间如未及时交卷则本次考试作废3、推荐使用 Chrome 浏览器版本73及以上的正式版本或Firefox浏览器版本66及以上的正式版本)4、开始答题前会进行身份验证需要您拍摄并上传身份证人像面照片并按照系统要求开启摄像头进行面部识别5、考试过程中请保持摄像头开启并对准面部系统会不定时进行抓拍并与身份证照片做对比如发现作弊行为您的考试成绩将作废6、考试过程中系统将判断您的浏览器状态如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为以及弹出广告弹窗将会给出警告。如果次数过多您的考试成绩将作废7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件以免影响您的考试祝大家一次上岸顺利拿证未来在云赛道上越走越宽、越走越远 ✨二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 以下哪种说法最能体现RAG的核心思想?A. RAG 是一种利用大语言模型进行知识图谱构建的技术。B. RAG 是一种通过微调大语言模型来适应特定领域问答的技术。C. RAG 是一种利用大语言模型直接生成最终答案的技术。D. RAG 是一种将大语言模型与外部知识库结合提升模型问答能力的技术2. 为了控制生成内容的随机性通常使用哪两个参数进行调整A. temperature和top_pB. learning_rate和dropoutC. batch_size和epochs3. 零样本提示 (Zero-Shot Prompt允许模型在没有见过特定任务或数据集的情况下完成新任务这主要归功于以下哪一个选项A. 预训练B. 微调C. 监督学习4. 在检索召回阶段以下哪些方法通过滑动窗口检索补充相邻切片A. 滑动窗口检索B. 问题改写C. 重排序5. 在以下代码片段中extract_tags函数的作用是什么A. 从文本中提取标签B. 从文本中提取关键词C. 从文本中提取句子6. 你在开发一个内部IT 系统希望能够自动处理员工的请求“我的投影仪故障了请安排维修并通知下午会议改线上”。以下哪种技术方案有效、且能尽量減少人力投入A. 通过提示词引导大模型拆解任务为多步骤然后自动调用维修系统和会议系统 API 完成操作。B. 通过提示词引导大模型直接生成维修工单和会议调整结果无需调用现有系统。C. 通过大模型判断接单人自动将任务指派给接单人通知其创建维修工单并调整会议。D. 识别请求中的关键字如 “投影仪故障” “会议改线上”匹配规则系统后调用 API 完成任务。7. 在构建 RAG 应用时以下哪些是本地向量数据库的适用场景A. 小规模应用B. 开发测试C. 生产环境8. 在优化 context precision 指标时以下哪些是 rerank重排序的好处A. 提升相关文本段的排名B. 增加模型的训练数据C. 减少模型的推理时间9. 在优化后的答疑机器人中以下哪种问题需要经过RAG链路A. 公司内部文档查询B. 检查文档错误C. 增加模型的训练数据10. 在 context recall 的计算过程中以下哪个步骤是必要的A. 由大模型将 ground_trut分解成观点列表B. 增加模型的训练数据C. 减少模型的推理时间11. 以下哪种方式可以更好地处理大语言模型返回结果中可能存在的错误或异常?A. 假设大模型总是返回正确的结果。B. 使用 try-except 块捕获潜在的异常。C. 在调用大模型之前进行输入验证。D. 不处理直接使用返回结果。12. 请问这段代码的主要作用是A. 对召回的文本段进行 rerank 后输入大模型进行回复B. 在句子窗口检索中将扩展后的句子传入上下文并进行回复C. 在自动合并检索中判断父节点是否有超过半数的子节点被召回D. 加载本地索引对 query 进行回复13. 在Llamaindex中默认情况下加载的数据是如何存储的?A. 存储在云服务中B. 存储在文件系统中的特定目录C. 直接写入数据库D. 存储在内存中作为一系列向量嵌入14. 在以下代码片段中max_tokens512的作用是什么A. 控制输出长度B. 增加输出的多样性C. 使输出更具确定性15. 以下哪项不是少样本提示的应用场景A. 数据稀缺或需要快速适应新任务的场景B. 需要深度专业知识的任务C. 需要快速原型设计的场景16. 在RAG应用的多轮对话中custom_prompt模板的主要作用是什么A. 定义如何将用户问题改写为独立的问题B. 增加模型的训练数据C. 减少模型的推理时间17. RAG应用的文本合规检查过程中使用规则匹配方法的主要缺点是什么?A. 计算复杂度高,处理速度慢B. 需要大量的训练数据C. 缺乏泛化能力18. 在开发智能餐厅点餐助手时测试发现用户语音下单如“来一份宫保鸡丁数量两份”时系统生成错误的调用参数导致订单出错。经排查原因在于“下单工具“描述中末明确规定输入参数如“菜品名称“和“数量”的类型、属性及必选项。请问哪项改进最能提高调用参数的准确性A. 在工具描述中详细定义parameters字段明确说明相关参数的类型、属性描述及必选要求B. 在工具描述中增加更多辅助说明如功能介绍和使用场景增强工具的吸引力C. 修改工具返回数据格式使其自动生成标准订单编号19. 大语言模型微调相比重头训练的主要优势是什么A. 训练时间更长B. 可以利用预训练学到的通用知识C. 需要更多计算资源D. 对特定任务的表现不如从头训练的模型20. 用户向基于 RAG 的智能答疑机器人提交了一张包含敏感信息的图片进行咨询。根据最佳实践最早应该在哪个阶段进行内容安全合规检查以阻止敏感信息泄露A. 机器人根据用户图片检索时B. 机器人响应返回答案之后检查C. 在机器人处理图片之前检查D. 将答案返回给用户之前检查21. 以下哪项插件功能最可能通过大模型API及百炼应用API结合实现以辅助日常办公A. 高级图像识别与编辑B. 实时多语言翻译服务C. 复杂的3D建模与渲染22. 以下哪个代码片段最能体现大语言模型的优势A. python from scipy.stats import pearsonr x [1, 2, 3, 4, 5] y [2.4, 6.8, 10] correlation pearsonr(x, y) print(correlation)B. python text 我非常喜欢这款产品 sentiment analyze_sentiment(text) # 调用大模型接口 print(sentiment) # 输出积极C. python data [1, 2, 3, 4, 5] sum_of_data sum(data) print(sum_of_data)D. python import numpy as np data [1, 2, 3, 4, 5, 100] std_dev np.std(data) print(std_dev)23. 在代码中evaluate 函数的主要作用是什么A. 评估数据集中的答案正确性B. 增加模型的训练数据C. 减少模型的推理时间24. 关于LLM少样本提示Few-Shot Prompting的主要局限性之一是A. 需要大量的样本数据B. 样本的质量和数量对模型的影响较大C. 模型无法从示例中学习新任务25. ModelScope-Agent如何实现对复杂任务的处理A. 通过预设的有限状态机直接执行固定流程不支持动态调整B. 将大任务拆分为一系列小任务并按顺序自动调度执行这些子任务C. 需要人工干预来规划每个子任务的执行顺序和方式26. 在以下代码片段中client.chat.completions.create的作用是什么A. 调用API进行标签提取B. 调用API进行模型训练C. 调用API进行文档检索27. 在创建索引时VectorStoreIndex.from_documents方法包含哪些步骤A. 文档解析和文本分段B. 文本分段和建立索引C. 文本向量化和存储索引28. 在 Answer Correctness 的计算过程中以下哪种方法用于计算向量相似度A. 余弦相似度B. 欧氏距离C. 曼哈顿距离29. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量A. 预训练B. SFTC. RLHF30. 多Agent系统通过模拟或利用多个交互的智能体 (Agents来解决复杂问题。如果在一个复杂的金融交易市场模拟中使用多Agent系统的优势不包括A. 能够模拟多个投资者的独立决策过程增加市场仿真度B. 通过Agent间的竞争与合作模型更准确地反映市场动态C. 单一Agent即可处理所有市场参与者的策略制定与执行简化系统设计31. 相较于从头全新训练一个模型下列对大语言模型微调的描述中正确的是哪一项?A. 需要更多计算资源以及更多的时间成本B. 需要较少的计算资源但训练时间相对较长C. 复用模型通过预训练学习的知识和模式32. 在RAG应用的生成阶段大模型的主要作用是什么A. 召回与问题最相关的文本段B. 根据召回文本段和问题生成最终回答C. 增加模型的训练数据33. 在LLM提示词中思维链技术与标准提示相比主要优势是什么A. 更快的响速度B. 更高的推理透明度和可验证性C. 更低的计算资源消耗34. 你正在基于某视觉理解大模型开发一个门店巡检系统检查垃圾桶是否盖好、操作是否整洁、水池是否洗干净等但发现用大模型同时识别判断场景、给出判断结果的效果总是不好以下哪种改进方案能更低成本地解决这一问题A. 增加更多的监控摄像头给大模型更多的输入信息B. 收集一批高质量的监控画面数据面向巡检任务微调大模型C. 改进当前的数据输入减少监控画面的分辨率避免引入干扰信息D. 用物体分割小模型圈出识别区域然后抠图输入给大模型检测状态35. 在 context precision 的计算过程中以下哪个步骤是必要的A. 按顺序读取 contexts 中的 contexti判断其是否相关B. 增加模型的训练数据C. 减少模型的推理时间36. 为了将不同长度的文本序列调整为统一长度以便模型处理通常会采取哪种措施A. 删除过长的句子B. 忽略长度差异C. 截断过短的句子D. 填充序列到固定长度Padding37. 在RAG系统中将文档拆分成多个分块 (chunks) 的主要目的是什么?A. 适配大模型的输入限制并提高检索的准确性和相关性。B. 减小存储空间提高检索效率。C. 方便用户浏览提升用户体验。D. 简化文档预处理流程降低开发成本。38. 在确保计算资源与基础设施满足大模型微调需求时哪项不是关键考量指标?A. GPU的数量和型号以支持大规模并行计算B. 存储容量以保存庞大的预训练模型及训练过程中的中间状态C. 网络带宽以便快速传输训练所需的大规模数据集D. 显示器分辨率以提供更清晰的训练过程可视化效果39. 以下哪个任务最适合使用大语言模型?A. 对一组图像进行精确的像素级分割B. 计算一组数据的标准差C. 在一个大型数据集上训练一个复杂的机器学习模型例如深度神经网络D. 检测一组销售数据中的异常值40. 如果我们让大模型系统设计一个分阶段、分批次的投资策略大模型系统需要考虑各种不同的资产组合、投资策略综合考虑成本、风险、收益之后生成最优的投资策略。那么在设计大模型系统应对多路径策略规划时以下哪种方式不能有效避免策略冲突和资源浪费?A. 建立中心化协调机制监控并调度各Agent的行动策略B. 采用博弈论模型预测并解决潜在的策略冲突C. 强制所有Agent采用相同的决策逻辑和目标函数以保证一致性41. 在 RAGAS 评分之后你对其中一些指标有些疑问你可以查看哪个字段来追溯大模型评分的原因A. sourceB. reasonC. json_objectD. source_node42. 在以下代码片段中query_engine index.as_query_engine(...)的作用是什么A. 创建查询引擎B. 设置召回切片的最大数量C. 设置重排序的切片数量43. 以下哪个RAG应用场景最适合使用规则匹配的文本合规检测?A. 理解用户提问的深层含义B. 判断用户评论是否包含特定品牌的广告信息C. 识别文章中蕴含的复杂情感D. 检测用户上传的文本是否包含明确的违禁词汇44. 在RAG应用的检索生成阶段检索阶段的主要任务是什么A. 生成最终的回答B. 召回与问题最相关的文本段C. 增加模型的训练数据45. 检查以下代码如果需要添加一个新的意图类别例如 “入职流程”需要修改哪一部分代码 # 获取用户意图的核心算法 def get_purpose(document): prompt_template【角色背景】 你是一个专业的管理者你将阅读一条用户的问题并进行用户意图分类 【任务要求】 我们需要将用户的意图分成如下几类 请假政策福利待遇绩效考核工作职责开发规范 【输出要求】请以 json 格式输出不要输出其他内容 格式如{purpose:请假政策,query:请假流程是怎样的需要提前多久申请} 其中purpose 是你识别出的意图query 是用户输入的原始文本 【用户输入】 query prompt_template documentA. 只需要修改输入的用户 query 列表B. 需要修改输出格式要求。C. 需要修改 prompt_template 中的【任务要求】部分以及可能需要更新 get_purpose 函数中的逻辑。D. 只需要修改 大模型 query 函数 Q_S_Line46. RAG 系统在回答时返回了多位同名员工的信息无法区分他们最合理的改进方式是什么A. 在检索前自动补充标签例如 “姓名张伟IT 部”B. 简单将 “张伟” 替换成 “张伟唯一”C. 大幅提高大模型的温度D. 默认检索 100 条切片手动让用户筛选47. 关于技术团队在大模型微调项目中的作用下列哪一项描述不够准确?A. 确保团队成员掌握深度学习、自然语言处理等相关技术B. 仅需关注模型训练过程模型部署与维护由其他部门负责C. 负责实现模型微调过程中的技术细节调整和优化48. 在切片向量化与存储阶段以下哪些是 compare_embedding_models 函数的作用A. 比较不同 Embeddin模型在 RA中的表现B. 增加模型的训练数据C. 减少模型的推理时间49. 以下哪个分隔符形式不常用于提示词中A. plaintext ...B. plaintext ... Part 1 Part 2C. plaintext Section 1 Section 2D. plaintext ##Title Content50. 在大语言模型微调的数据准备阶段哪个操作是为了将文本拆分成单词或词汇单元A. 文本翻译B. 数据去重C. 分词(Tokenization)D. 文本摘要51. 一家新创公司计划开发一个创新的智能助手应用该应用需要能够与用户自然地交流并理解多种类型的输入数据。若该公司只能选择一种技术作为其核心功能的基础以下哪项技术最合适作为这个智能助手的基础A. 计算机视觉模型因为这能让智能助手解析和理解用户提供的视觉信息这是用户交流的主要方式B. 多模态模型可以使智能助手处理多种类型的输入数据如文本、图片和音频这样的综合能力能提供更丰富的用户体验C. 音频处理模型因其可将用户的语音转换为文本让智能助手在不需要视觉信息的情况下依然可以与用户进行交流52. 你开发了一个RAG应用用户反馈说回复效果不佳。你通过后台日志发现用户的输入有时缺少信息如“教研部”、“请假”你应该优先进行哪方面的优化A. 优化文档切分策略B. 更换检索速度更快的向量数据库C. 调整大模型的 top_p 参数D. 结合历史常见问题使用大模型对 query 进行改写53. 在LLM使用中如何通过提示词来优化模型的推理能力和内容生成的逻辑性A. 仅提供非常简短的提示让模型自由发挥不加任何约束B. 使用思维链技术引导模型逐步展示其推理步骤C. 忽略提示词的上下文信息依赖模型自身去推断任务要求54. 在问题改写中以下哪些方法通过分解复杂问题为多个子问题来解决问题A. 将单一查询改写为多步骤查询B. 使用大模型扩充用户问题C. 用假设文档来增强检索HyDe55. 在 RAG 的建立索引过程中以下哪一点是将源知识文件分割成文本段的主要原因A. 让大模型输出更加多样B. 提高检索精度更快速定位相关段落C. 减少数据存储空间D. 减少索引构建时间56. StorageContext.from_defaultspersist_dirPERSIST_DIR的作用是什么A. 创建一个新的 StorageContext 对象并使用默认配置但指定持久化目录。B. 将 StorageContext 对象保存到 PERSIST_DIR。C. 从 PERSIST_DIR 加载 StorageContext 对象。D. 创建一个默认的 StorageContext 对象并忽略 PERSIST_DIR。57. 你使用阿里云百炼平台的通义千问 API 开发了聊天机器人用户反馈提问某地天气时模型总是无法回答。如何快速解决这个问题A. 提前设置话术在面对类似问题时可以直接将话术返回给用户B. 通过复杂的工程手段对用户的输入提取关键词集成第三方搜索引擎并将搜索结果返回给大模型C. 设置 enable_search联网搜索参数为通义千问 API 引入联网能力D. 在聊天界面显眼位置标注限制不建议用户输入类似问题58. 哪一种微调方法不仅根据特定任务的数据调整模型还会通过人类反馈对模型的回答进行奖动或惩罚从而优化生成的对话质量A. 预训练B. SFTC. RLHF59. LoRA 微调对数据量要求的说法错误的是A. 微调数据量较小时应增大 LoRA 的秩以提升模型表达能力B. 在数据质量有保障时增大数据量、多样化通常能提升微调效果C. LoRA 微调需求数据量比预训练要小D. 同等数据量下1000 条LoRA 微调效果接近全参微调60. RLHF (Reinforcement Learning from Human Feedback 的主要目的是什么A. 提升模型的泛化能力B. 让模型输出更加贴近人类的偏好和价值观C. 增加模型的参数量61. 某团队需要翻译一份文档其中包含 30 条机构内部术语的英文缩写为了确保翻译的高准确性以下哪种方案能解决这一问题A. 在提示词中提供 30 条对应术语缩写与翻译示例B. 提供前 5 条翻译示例要求模型类推处理剩余条目C. 直接让大模型翻译大模型能够完成这类任务D. 使用支持联网搜索的大模型 API 完成此任务62. 在使用通义千问 API 自动完成文本处理任务时哪种方式能够批量处理上万个调查问卷A. 手工处理B. Excel操作C. 代码调用大模型63. 大语言模型RAG应用建立索引阶段需要先对文本进行切片以下哪种文本切片方法最有可能保留完整的语义信息?A. 按字符数分割,每50个字符为一个chunkB. 按token长度分割,每100个token为一个chunkC. 按标点符号分割64. 在文档切片过程中以下哪种切片方法适合文档逻辑性强、内容专业的场景A. 语义切片B. Token 切片C. 句子切片65. 在 RAG 流程中如何提高检索的效率A. 增加 embedding 的维度B. 使用更大的预训练语言模型。C. 对向量数据库中的向量构建索引。D. 增加文档切片的粒度(例如将段落切成更小的片段)66. 在构建 RAG 应用时以下哪种向量存储方案按量付费、自动扩容A. 云服务向量存储B. 内存向量存储C. 本地向量数据库67. 在以下代码片段中similarity_top_k20的作用是什么A. 设置召回切片的最大数量B. 设置重排序的切片数量C. 设置相似度阈值68. 测试时发现RAG 应用的答案中仍包含大量无用细节导致阅读困难。哪种做法可以最直接地减少无关细节A. 在检索后用 ReRank 且设置更小的 Top NB. 把索引文件放进 Redis 数据库C. 增加大模型的 “max_tokens”D. 强制用户只提简单问题69. 在切片向量化与存储阶段以下哪种 Embedding 模型是较旧的版本A. text-embedding-v2B. text-embedding-v3C. 增加模型的训练数据70. 在文档切片过程中以下哪些切片方法适合刚开始接触 RAG 的用户A. 句子切片B. Token 切片C. 句子窗口切片二多选题30 题 × 1 分 30 分1. 关于 Qwen-Max、CosyVoice 和 moviepy 的协同使用以下哪些说法是正确的A. CosyVoice 可以将文本转换为音频。B. CosyVoice 的主要功能是视频剪辑。C. moviepy 可以直接将文本转换为视频。D. Qwen-Max 主要用于生成视频字幕。E. moviepy 可以用来获取音频文件的持续时间用于生成字幕。F. 使用这三个工具的典型流程是Qwen-Max → CosyVoice → moviepy。2. 为了尽量减少大模型应用的幻觉以下哪些措施是有效的A. 对生成内容进行后处理和验证B. 使用参数量小更适合本地部署的模型C. 引入知识库补充大模型缺少的行业知识D. 在提示词中要求禁止虚构内容遇到无法回答的问题可以直接回复不知道3. 关于大模型的工作流程以下哪三个描述是正确的A. 输入文本需要先分词化为 TokenB. 只要每次输入的问题一样每次输出的Token也会一样C. 大模型推理阶段会根据候选 Token 的概率选择输出内容D. Token 向量化是为了让计算机能够理解自然语言4. 你发现检索到的切片里常常遗漏上下文导致回答片段化。下列哪些是有效且合理的改进措施A. 改用 “句子窗口切片” 或 “滑动窗口检索”B. 增大 chunk_overlapC. 避免切片将文档完整的拼接到提示词中D. 适当调大召回文档切片数量例如从 Top3 调整为 Top55. 在使用大模型提炼图文课程内容时以下哪些指导原则是正确的A. 提炼关键信息,避免冗长段落B. 使用简短标题,聚焦于要点C. 内容应尽量详细和全面D. 不做任何修改6. 以下哪些措施可以提高大模型在私域场景下的安全性A. 对相关人员进行安全培训B. 建立完善的安全 incident 响应机制C. 使用开源的数据管理软件D. 将所有数据存储在云端E. 定期更新大模型和相关软件F. 对大模型进行持续的安全评估和测试7. 用户多次反馈 “AI 回答中有捏造内容”排查后发现是当知识库没有相关内容时大模型直接虚构答案。为减少此情况你可以怎么做A. 在百炼 RAG 应用中将回答范围设置为 “仅知识库范围”B. 调高 temperature 值C. 使用 ReRank 对检索结果再次排序D. 使用提示词无匹配就明确回复 “无法回答”8. 你正在开发一个机器学习领域的答疑机器人辅助学生学习但你对该领域专业知识掌握有限以下哪些策略更有助于你改进提示词设计A. 邀请机器学习课程助教一起审核和改进提示词要求其按照一定的结构来回答问题B. 要求大模型扮演「机器学习教授」结合学生认知水平重新写出更结构化的提示词C. 按照自己的理解要求大模型按照一定的结构来回答问题D. 保持提示词简单避免引入错误的信息9. 在优化 context recall 指标时以下哪些是必要的步骤A. 对比知识库内容与测试样本B. 更换 embeddin模型C. 使用大模型改写 query10. 你发现大量员工信息都存放在 PDF、Word 文档里部分还包含表格和图片RAG 无法正确提取关键信息。你可以怎么处理A. 手动复制粘贴所有文档内容B. 使用 OCR 技术识别并提取图片中的文字C. 强制用户只上传纯文本D. 使用 DashScopeParse 等工具对 PDF/Word 进行结构化解析11. 在自定义提示词模板中以下哪些是预设的部分信息A. 大模型的角色B. 注意事项C. 用户的问题D. 输出的格式12. 你在构建一个RAG应用以下哪些提示词模板是合理的的A. 检索到的相关内容为{检索到的文本段} 用户的问题是{用户问题} 请结合以上信息给出准确且简洁的回答。B. 以下是用户的问题{用户问题}C. 以下是与问题相关的背景信息{检索到的文本段} 问题是{用户问题} 请基于背景信息提供一个合理且完整的答案。D. 以下是检索到的内容{检索到的文本段}13. 在示例中以下哪些是知识库中召回的内容A. 内容研究与分析B. 教材和课程开发C. 增加模型的训练数据D. 减少模型的推理时间14. 你写了一个提示词“请用适合简报的形式以每篇100字的篇幅总结今早的十大新闻”你希望大模型能按照提示词完成任务以下哪些方案可行A. 设计提示词明确要求大模型要基于今天最新的新闻来总结避免基于历史新闻总结B. 设计提示词结合 function call让大模型回答时效性问题时调用搜索工具C. 整理历史新闻库构建一个 RAG 应用让大模型回答时参考知识库中的新闻D. 使用阿里云百炼平台的 qwen-plus并且调用 API 时设置 enable_searchTrue15. 在构建 RAG 应用时以下哪些是云服务向量存储的特点A. 无需关注运维B. 自动扩容C. 提供完善的监控和管理工具D. 按量付费16. top_p参数如何影响候选Token的筛选A. 高top_p值增加候选Token的范围B. 低top_p值减少候选Token的范围C. 高top_p值减少候选Token的范围17. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作A. 列举B. 剪切C. 复制D. 删除E. 更新F. 创建18. 在以下代码段中哪些是设置模型训练参数的例子A. learning_rate 0.001B. modelqwen-7b - chatC. device torch.device(cuda if torch.cuda.is_available() else cpu)D. optimizer AdamW(model.parameters(), lrlearning_rate)E. num_epochs 3F. batch_size 6419. 通过 LlamalIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤A. 用 index 的 update_prompts 方法将新的 prompt 同步上去B. 定义新的 prompt 字符串将 chunk 和 query 的位置空出来C. 对新的 prompt 进行保存使得 LlamalIndex 中的源码 prompt 也变成中文D. 使用新的 prompt 初始化一个 PromptTemplate 对象20. 在文档切片过程中以下哪些切片方法适合处理长文档且需要保持上下文A. 句子窗口切片B. 语义切片C. Token 切片21. 在切片向量化与存储阶段以下哪些是余弦相似度的计算方法A. 计算向量之间的夹角B. 计算向量的点积C. 增加模型的训练数据D. 减少模型的推理时间22. 下列关于将 AgentModule 类设计为基类的原因正确的有哪些A. 简化子类中的构造函数减少重复代码B. 由于 Python 不支持多重继承因此需要这样设计C. 允许每个子类定义自己的 query 方法增加灵活性D. 作为一个基类可以方便地隐藏私有属性保护数据E. 提供统一的 call 方法以便通过相同的方式调用所有子类F. 使得多个不同的代理模块可以共享相同的接口实现代码复用23. 在大语言模型微调的训练循环中哪些步骤是必须包含的A. 超参数调整B. 模型保存C. 正向传播D. 梯度更新E. 梯度裁剪F. 反向传播24. 构建高质量的数学题微调数据集应包含哪些要素A. 包含详细分步推导B. 统一使用 LaTeX 公式或 Markdown 格式输出公式C. 大量的数学题解题数据D. 覆盖多种解题思路25. 你正在优化一个 RAG 系统发现某些相似文本对的向量相似度较低以下哪两种方法可以改善这种情况A. 更换效果更好的 embedding 模型B. 将索引保存到本地并在运行时加载C. 减少向量数据库的存储容量D. 通过对比学习让相关文本对的向量相似度更高26. 在以下代码片段中哪些参数可以影响生成文本的多样性A. temperatureB. max_tokensC. presence_penalty27. 在评测机制里你发现自动化评分一直偏高但实际用户反馈一般。以下哪三项有可能提高评测的可信度A. 基于现有的评测集增加自动化评测的频次B. 在构建测试集时增加业务专家的打分环节C. 根据线上用户问题类型的分布修正测试样本集的问题分布D. 调整自动化评测工程的提示词及阈值让其更接近真实用户判断标准28. 在构建 RAG 应用时哪些高级 RAG 课题值得探索A. GraphRAG 技术B. 可视化工作流C. 智能体编排29. APIAssistantAgent 示例代码 query 函数中哪些步骤与大语言模型交互A. 调用 forward_and_submit_outputs 函数B. 调用 dashscope.Runs.wait 函数C. 创建 message 对象D. 调用 dashscope.Messages.list 函数E. 解析 msgs 获取最终答案F. 调用 dashscope.Runs.create 函数30. 以下哪些场景适合设置较低的top_p值A. 新闻初稿B. 代码生成C. 创意写作