大模型LLM ACA - ACP认证考试模拟试卷三 目录一、大模型LLM ACA - ACP认证考试二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 下列Assistant API示例代码中forward_and_submit_outputs函数的核心功能是什么?2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常并打印错误信息 处理 classify_intent 函数可能抛出的异常并打印错误信息3. 大模型在处理输入文本时第一步通常执行的操作是4. 在检索阶段embedding模型如何找到与用户问题最相似的文本段5. 在大语言模型的安全风险中〝不安全的插件设计“可能导致哪些后果6. 你想使用 Qwen - Max 从一段冗长的课程文本中提炼出关键信息用于创建 PPT 脚本。以下哪个提示词最合适7. 在切片向量化与存储阶段以下哪种 Embedding 模型通常表现更好8. 在 qwen2.5-1.5b 模型微调时训练损失快速震荡甚至开始上升说明模型当前处于9. 在进行大模型微调项目调研和业务可行性研究阶段以下哪个角色对项目的成功尤为关键10. 在大模型的使用过程中以下哪项属于其主要的安全合规风险11. 在问题改写中以下哪种方法通过生成假想文档来增强检索效果12. 在RAG应用的多轮对话中直接将用户输入与文本段进行相似度比较可能会导致什么问题13. 为什么我们要在微调中使用早停法14. 以下哪项是流式输出的主要优势15. 在大模型推理阶段模型如何选择下一个输出的Token16. 如果你想深入了解如何实际运用 GraphRAG可以参考哪个教程17. top_pnucleus sampling参数的主要作用是什么18. 在示例中提示词明确的任务需求是什么19. 在设计LLM提示词时要求模型生成特定风格的文档时以下哪项不是必要的20. 在示例中COT方法如何帮助大模型计算总差旅费用21. 大模型如通义千问API在自动处理文本任务时主要优势在于22. 在大型语言模型中为什么需要对模型生成的内容进行检查23. 在下列描述中哪一个不是斯坦福小镇项目的特点24. 开发医疗问答系统时发现模型频繁产生”幻觉”应优先采取哪种优化组合25. 以下哪个代码片段最适合帮助RAG应用将文本片段转换为向量表示?26. 关于输入数据的描述以下哪项是正确的27. 以下哪个选项最适合用于请求大模型总结一篇文章的主要内容28. 在大模型调用外部 API 工具时你发现 agent 经常调用错误的工具。经过调查最可能的原因是什么29. 大模型应用中处理个人信息的人员变更时以下哪个选项是要首先执行的30. 大模型如何判断什么时候应该停止输出31. 在低温度temperature0.1设置下大模型的输出会有什么特点32. 你开发了一个 RAG 应用发现用户经常连续提问多轮对话但是当前应用还不支持多轮对话你应该怎么改造检索步骤来进行适配 选项33. 下列Assistant API示例代码中verify_status_code函数的作用是什么?34. 在需要生成明确答案的场景中建议如何设置temperature参数35. 在代码中score.to_pandas() 的主要作用是什么36. 在私有知识问答场景中直接传入私域知识相关的参考信息的缺点是什么37. 在文档审阅中为什么不建议一次输出所有的结果38. 在RAG应用的建立索引阶段主要目的是什么39. 在检索召回阶段以下哪种方法用于在检索前还原用户真实意图40. 在一个电商客服 RAG 系统中如果过度追求召回率可能会导致哪些问题41. 以下哪个选项属于我们在本教程中介绍的RAG应用范围42. 在开发基于大语言模型的RAG应用过程中下哪种做法不能保证关键数据的语义独立性与完整性?43. RAGRetrieval Augmented Generation的主要目的是什么44. 多Agent系统通过模拟或利用多个交互的智能体 Agents 来解決复杂问题具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高45. 在ask_llm_route函数中如果问题类型是“内容翻译”会使用哪个提示词46. 以下哪种情况最适合将文档拆分成更小的分块47. 在切片向量化与存储阶段以下哪些是 compare_embeddings 函数的作用48. 在代码中evaluate 函数的主要作用是什么49. 在构建 RAG 应用时以下哪种向量存储方案适合生产环境50. 在切片向量化与存储阶段以下哪种方法用于比较不同 Embedding 模型的文本相似度51. 某大学为学生提供一款问答机器人能回答课程安排和考试时间。学校想新增“自助预定自习室功能需要查询并预定教室资源。要使这个功能能与现有问答无缝集成合适的做法是什么52. 在优化检索效果时以下哪种方法可以提升文档的结构性53. 检索增强式生成RAG应用的主要优势是什么54. 以下哪个用户查询语句无法有效地指导大语言模型进行文本摘要?55. 为缩短响应时延你想在索引前减少切片数量每个切片包含 2-3 页内容。结果发现回答容易混进无关信息。导致无关信息的根本原因是什么56. 要将索引持久化到磁盘应使用以下哪个方法57. 觉得提示词模板怎么设计效果最好假设chunk为召回的知识库文本块query为用户问题。58. 在示例中答疑机器人没有理解用户的意图主要原因是什么59. 在设计大模型提示词时以下哪项原则最重要60. 生成式大模型可能会引发内容安全风险以下哪个选项不属于内容安全风险?61. 在调用大语言模型对话的API过程中以下哪个代码片段正确地使用了system角色来指示模型扮演一个友好的客服代表?62. 以下哪种方式有助于在大模型多轮对话场景中保障生成内容质量的同时降低成本并提升响应速度63. 在优化检索效果时以下哪些方法可以增加召回的文档切片数量64. 在多模态协同学习框架下不同模态的数据如何协作以提升学习效果65. 你在调用通义干问 API 时设置了 temperature温度参数以下哪种说法是正确的66. 在以下代码片段中is_chat_modelTrue的作用是什么67. 检查以下代码如果需要添加一个新的意图类别例如 “入职流程”需要修改哪一部分代码 # 获取用户意图的核心算法 def get_purpose(document): prompt_template”【角色背景】 你是一个专业的管理者你将阅读一条用户的问题并进行用户意图分类 【任务要求】 我们需要将用户的意图分成如下几类 请假政策福利待遇绩效考核工作职责开发规范 【输出要求】请以 json 格式输出不要输出其他内容 格式如{purpose:请假政策,query:请假流程是怎样的需要提前多久申请} 其中purpose 是你识别出的意图query 是用户输入的原始文本 【用户输入】 query prompt_template document“68. 以下哪种存储最适合用于区分不同的对话轮次或历史记录69. 在大语言模型微调的数据准备阶段哪个操作是为了将文本拆分成单词或词汇单元70. 在一次评审会上大家针对同一条问答的准确性产生分歧工程师认为回答和问题语义相似度高业务负责人则认为回答中有错误细节。该争议主要反映了什么二多选题30 题 × 1 分 30 分1. 在提示词框架中以下哪些要素是必要的2. 通过 LlamaIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤3. 在下面的代码片段中哪些是微调大语言模型训练循环中必要的步骤4. 在构建 RAG 应用时大模型可以用于哪些其他应用场景5. 在优化后的答疑机器人中以下哪种问题不需要经过RAG链路6. 在构建 RAG 应用时哪些高级 RAG 课题值得探索7. 你负责的短视频平台在接入多模态技术后出现故障。 1: 用户输入 “生成夏日海滩 vlog 背景” 时系统返回静态图片而非视频 2视频自动剪辑功能无法识别冲浪板等特定物体 3添加的 AI 解说语音与动画动作不同步 需要重点检查的技术环节是8. 在自定义提示词模板中以下哪些是用于约束大模型行为的注意事项9. 你正在开发一个机器学习领域的答疑机器人辅助学生学习但你对该领域专业知识掌握有限以下哪些策略更有助于你改进提示词设计10. 你发现检索到的切片里常常遗漏上下文导致回答片段化。下列哪些是有效且合理的改进措施11. RAG 应用在检索时共召回了 10 条切片其中 3 条高度相关但 3 条内容都来自相邻段落却被系统拆分成不同切片从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度12. 在优化后的答疑机器人中以下哪些是提示词中规定的任务要求13. 在提取标签的过程中以下哪些标签类型是支持的14. 某教育问答系统上线后你通过监控日志发现模型有时会返回个人隐私信息为防止此类敏感信息泄露可以采取以下哪三项措施15. 在决定模型微调前你应该考虑以下哪些事情16. 以下哪些代码片段可以有效地对用户输入进行清洗和预处理以提高大模型应用的安全性17. 以下哪三种场景更需要防范AI模型幻觉的风险18. 你要给多个未归档的 Keynote 文档创建索引这些文档中包括表格、流程图等复杂内容。在“文档解析”环节你可以怎么做19. 如果你的业务流程比较复杂可以借助百炼上的哪些工具来构建更强大的应用20. 在 Ragas 中以下哪些指标用于评估检索召回效果21. 在大模型的问答工作流程中以下哪些阶段涉及模型的推理过程22. 你正在优化一个 RAG 系统发现某些相似文本对的向量相似度较低以下哪两种方法可以改善这种情况23. 微调 qwen2.5 - 1.5b 模型过程中发现模型开始欠拟合可采取的优化措施包括24. faithfulness、answer_relevancy、context_recall、context_precision 这些指标中哪些指标仅评估检索阶段的性能25. 在切片向量化与存储阶段以下哪些是更新的 Embedding 模型26. 某跨境电商平台的客服系统需要处理多语言用户咨询在进行文本合规检查时发现部分违规内容无法被检测出来。哪两个方案能提供多语言文本的合规检查效果27. 在 context precision 的计算过程中以下哪些步骤是必要的28. 以下哪些代码片段可以用于检测用户输入中是否包含敏感词29. 在使用大语言模型时什么是“样例”的作用30. 大语言模型微调相比预训练的优势有哪些?一、大模型LLM ACA - ACP认证考试探索未来智能的钥匙——ACA-ACP大模型工程师认证专栏导读 含十套模拟真题和真题精选请认真阅读考试须知后准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。答题开始即开始计时中途不可暂停如超时则自动提交1、考试共 (100) 道题总分100分及格分数80分。模拟试题库对应模拟试题按70:30-单选题-多选题真题一般50:252、考试需在120分钟内交卷过程中无法暂停请提前安排好时间如未及时交卷则本次考试作废3、推荐使用 Chrome 浏览器版本73及以上的正式版本或Firefox浏览器版本66及以上的正式版本)4、开始答题前会进行身份验证需要您拍摄并上传身份证人像面照片并按照系统要求开启摄像头进行面部识别5、考试过程中请保持摄像头开启并对准面部系统会不定时进行抓拍并与身份证照片做对比如发现作弊行为您的考试成绩将作废6、考试过程中系统将判断您的浏览器状态如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为以及弹出广告弹窗将会给出警告。如果次数过多您的考试成绩将作废7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件以免影响您的考试祝大家一次上岸顺利拿证未来在云赛道上越走越宽、越走越远 ✨二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 下列Assistant API示例代码中forward_and_submit_outputs函数的核心功能是什么?A. 创建新的AssistantB. 向Assistant提交用户queryC. 执行function call并将结果提交给服务器D. 创建新的ThreadE. 等待Run完成2. 以下哪个代码片段能够正确处理 classify_intent 函数可能抛出的异常并打印错误信息 处理 classify_intent 函数可能抛出的异常并打印错误信息A. python for id, query in feedback_list: try: intent classify_intent(query) print(fID: {id}, Intent: {intent}) finally: print(Finished processing query.)B. python for id, query in feedback_list: intent classify_intent(query) print(fID: {id}, Intent: {intent}) except Exception as e: print(fError: {e})C. python for id, query in feedback_list: try: intent classify_intent(query) print(fID: {id}, Intent: {intent}) except Exception as e: print(fError processing query {id}: {e})D. python for id, query in feedback_list: if classify_intent(query): intent classify_intent(query) print(fID: {id}, Intent: {intent}) else:print(Error processing query.)3. 大模型在处理输入文本时第一步通常执行的操作是A. 计算候选 Token 概率B. Token 可量化C. 计算 Embedding 后的向量D. 对输入文本进行分词Tokenize4. 在检索阶段embedding模型如何找到与用户问题最相似的文本段A. 将用户问题转化为向量并在向量数据库中找出最相似的向量B. 增加模型的训练数据C. 减少模型的推理时间5. 在大语言模型的安全风险中〝不安全的插件设计“可能导致哪些后果A. 模型生成的文本含有歧视性内容B. 模型无法处理政治敏感话题C. 插件可能存在不安全的输入和不足的访问控制6. 你想使用 Qwen - Max 从一段冗长的课程文本中提炼出关键信息用于创建 PPT 脚本。以下哪个提示词最合适A. 用更少的字概括这段文字B. 缩短这段文字C. 从以下课程文本中提取关键信息生成一个简洁的 PPT 脚本大纲突出重点内容并控制在 5 个要点以内。D. 把这段文字变成 PPT7. 在切片向量化与存储阶段以下哪种 Embedding 模型通常表现更好A. 更新的 Embedding 模型B. 旧的 Embedding 模型C. 增加模型的训练数据8. 在 qwen2.5-1.5b 模型微调时训练损失快速震荡甚至开始上升说明模型当前处于A. 过拟合B. 训练成功C. 训练失败D. 欠拟合9. 在进行大模型微调项目调研和业务可行性研究阶段以下哪个角色对项目的成功尤为关键A. 数据工程师负责数据预处理和清洗B. 机器学习工程师专注于模型架构调整和训练C. 如营销、运营等业务工作者提供业务领域知识指导数据集构建和评估10. 在大模型的使用过程中以下哪项属于其主要的安全合规风险A. 个人信息风险B. 数据存储成本风险C. 数据压缩风险11. 在问题改写中以下哪种方法通过生成假想文档来增强检索效果A. 用假设文档来增强检索HyDEB. 重排序C. 滑动窗口检索12. 在RAG应用的多轮对话中直接将用户输入与文本段进行相似度比较可能会导致什么问题A. 检索结果不准确B. 检索速度变慢C. 模型无法理解用户输入13. 为什么我们要在微调中使用早停法A. 因为模型微调容易出现过拟合现象B. 因为 eval_step 设计太大会导致过拟合C. 微调学习率太小导致模型参数更新太慢D. 微调轮次过少可能导致模型欠拟合14. 以下哪项是流式输出的主要优势A. 降低模型推理错误率B. 避免使用负载均衡C. 提升用户感知的响应速度D. 减少服务器计算资源消耗15. 在大模型推理阶段模型如何选择下一个输出的TokenA. 随机选择一个TokenB. 根据候选Token的概率进行选择C. 选择第一个候选Token16. 如果你想深入了解如何实际运用 GraphRAG可以参考哪个教程A. 使用 LlamaIndex 构建 GraphRAG 应用B. 0代码构建私有知识问答应用C. 可视化工作流、智能体编排17. top_pnucleus sampling参数的主要作用是什么A. 控制模型使用的 CPU 核心数量。B. 控制模型生成文本的长度。C. 控制模型输出的格式。D. 控制模型只考虑概率最高的几个词例如这里设置 0.9则模型只考虑累积概率前 90% 的词18. 在示例中提示词明确的任务需求是什么A. 对文本进行扩写和润色B. 增加模型的训练数据C. 减少模型的推理时间19. 在设计LLM提示词时要求模型生成特定风格的文档时以下哪项不是必要的A. 提供风格的具体定义B. 列举与风格相关的形容词或短语C. 要求模型忽略上下文信息20. 在示例中COT方法如何帮助大模型计算总差旅费用A. 将问题分解为子问题并逐步推导B. 增加模型的训练数据C. 减少模型的推理时间21. 大模型如通义千问API在自动处理文本任务时主要优势在于A. 需要大量人工预先编程每个细节B. 能够理解并生成自然语言适合处理大规模文本数据C. 仅能处理简单的数学计算无法进行复杂文本分析22. 在大型语言模型中为什么需要对模型生成的内容进行检查A. 为了确保内容的多样性B. 为了确保没有不适宜、冒犯性或有害信息C. 为了增加模型的复杂性23. 在下列描述中哪一个不是斯坦福小镇项目的特点A. 虚拟小镇中的人是智能体在形式上他们可以规划自己的一天的主要日程。B. 虚拟小镇中的人可以实现两两对话由于设计限制不能实现多人小组讨论。C. 每个智能体都有自己的角色设定从而让大模型参考生成该智能体的日程规划。24. 开发医疗问答系统时发现模型频繁产生”幻觉”应优先采取哪种优化组合A. 降低 LoRA 秩值 增大学习率B. 增加训练 epoch 提高相似度阈值C. RAG 增强知识库 LoRA 微调领域数据D. 更换主参微调 减少 batch_size25. 以下哪个代码片段最适合帮助RAG应用将文本片段转换为向量表示?A. python from sentence_transformers import SentenceTransformer model SentenceTransformer(all-mpnet-base-v2) def embed_text(text): return model.encode(text)B. python def embed_text(text): return len(text)C. python import hashlib def embed_text(text): return hashlib.sha256(text.encode()).hexdigest()D. python import numpy as np def embed_text(text): return np.random.rand(100) # 随机生成一个100维向量26. 关于输入数据的描述以下哪项是正确的A. 输入数据应当明确具体含义及其用途B. 输入数据不影响模型输出格式C. 输入数据是可选的D. 输入数据仅用于生成样例E. 输入数据无需说明F. 输入数据可以通过模糊的引导词来定义其作用27. 以下哪个选项最适合用于请求大模型总结一篇文章的主要内容A. 用简洁的语言概括以下文章的核心观点(文章内容)B. 文章的主要内容是什么(文章内容)C. 重写这篇文章。D. 这篇文章写了什么28. 在大模型调用外部 API 工具时你发现 agent 经常调用错误的工具。经过调查最可能的原因是什么A. 大模型缺乏足够的并行处理能力B. 网络延迟导致工具调用超时C. 工具函数调用过程中存在严重的内存泄漏D. 工具函数描述信息不够明确未能准确说明调用时机和用途29. 大模型应用中处理个人信息的人员变更时以下哪个选项是要首先执行的A. 重新取得用户同意B. 提供数据备份C. 通知相关机构30. 大模型如何判断什么时候应该停止输出A. 只会在输出长度达到阈值时停止B. 需要用户手动打断C. 在输出长度达到阈值或输出特殊 Token如end of sentence即句子结束标记D. 当模型检测到生成内容与输入主题无关时自动停止31. 在低温度temperature0.1设置下大模型的输出会有什么特点A. 输出内容非常多样化B. 输出内容相对单一C. 输出内容完全随机32. 你开发了一个 RAG 应用发现用户经常连续提问多轮对话但是当前应用还不支持多轮对话你应该怎么改造检索步骤来进行适配 选项A. 检索时先用大模型对历史对话以及用户输入进行总结生成一个新的 query然后用新query 输入向量数据库进行检索B. 检索时由大模型判断哪些文本段是相关的C. 检索时将历史对话信息输入向量数据库进行检索D. 检索时将用户的问题输入向量数据库进行检索33. 下列Assistant API示例代码中verify_status_code函数的作用是什么?A. 验证用户输入的query是否合法B. 验证function call的参数是否正确C. 验证API调用的返回状态码是否为200D. 验证Assistant是否成功创建E. 验证Thread是否成功创建34. 在需要生成明确答案的场景中建议如何设置temperature参数A. 设置较高的温度值B. 设置较低的温度值C. 使用默认温度值35. 在代码中score.to_pandas() 的主要作用是什么A. 将评估结果转换为 Pandas 数据框B. 增加模型的训练数据C. 减少模型的推理时间36. 在私有知识问答场景中直接传入私域知识相关的参考信息的缺点是什么A. 模型处理效率降低B. 提示词长度有限C. 模型无法理解私域知识37. 在文档审阅中为什么不建议一次输出所有的结果A. 只需关注营销表达B. 大模型可能会漏掉一些错误C. 内容错误不需要处理D. 信息量过大难以理解38. 在RAG应用的建立索引阶段主要目的是什么A. 将私有知识文档转换为高效检索的形式B. 增加模型的训练数据C. 提高模型的推理速度39. 在检索召回阶段以下哪种方法用于在检索前还原用户真实意图A. 问题改写B. 重排序C. 滑动窗口检索40. 在一个电商客服 RAG 系统中如果过度追求召回率可能会导致哪些问题A. 检索结果数量不足用户无法获得足够推荐。B. 检索结果过少用户找不到相关商品。C. 检索条件过于严格用户查询失败率增加。D. 检索结果包含大量无关商品信息影响用户体验。41. 以下哪个选项属于我们在本教程中介绍的RAG应用范围A. 向大模型输入“请介绍一下自己”B. 向大模型输入“现在几点了”C. 上传知识库文件后输入“我如果发表了专利可以得到公司的什么奖励”42. 在开发基于大语言模型的RAG应用过程中下哪种做法不能保证关键数据的语义独立性与完整性?A. 将标题下的所有文本合成一个段落B. 针对表格中每一行单元格的数据C. 确保每个语义单元都有清晰的边界和完整的上下文信息43. RAGRetrieval Augmented Generation的主要目的是什么A. 增加模型的训练数据B. 为大模型提供参考资料以提高回答质量C. 减少模型的推理时间44. 多Agent系统通过模拟或利用多个交互的智能体 Agents 来解決复杂问题具有分布性、适应性、和动态性。以下哪个场景适合采用多Agent系统比单Agent系统效率更高A. 简单的垃圾分类机器人仅需识别并分拣几种固定类型的垃圾B. 单一目标的军事侦察任务如无人机监控C. 大型物流仓库的自动化管理需要同时调度上千台机器人45. 在ask_llm_route函数中如果问题类型是“内容翻译”会使用哪个提示词A. translate_promptB. reviewed_promptC. query_engine46. 以下哪种情况最适合将文档拆分成更小的分块A. 文档格式简单例如纯文本文件。B. 文档内容包含多个主题信息量较大。C. 文档内容非常简短总共只有几句话。D. 文档内容高度相关主题单一。47. 在切片向量化与存储阶段以下哪些是 compare_embeddings 函数的作用A. 比较不同 Embeddin模型的文本相似度B. 增加模型的训练数据C. 减少模型的推理时间48. 在代码中evaluate 函数的主要作用是什么A. 评估数据集中的答案正确性B. 增加模型的训练数据C. 减少模型的推理时间49. 在构建 RAG 应用时以下哪种向量存储方案适合生产环境A. 云服务向量存储B. 内存向量存储C. 本地向量数据库50. 在切片向量化与存储阶段以下哪种方法用于比较不同 Embedding 模型的文本相似度A. compare_embeddings 函数B. 增加模型的训练数据C. 减少模型的推理时间51. 某大学为学生提供一款问答机器人能回答课程安排和考试时间。学校想新增“自助预定自习室功能需要查询并预定教室资源。要使这个功能能与现有问答无缝集成合适的做法是什么A. 在模型系统消息中提供大量备用的数据B. 使用一个专门的 Agent 调用内部预定 APIC. 仅通过提示让模型推测当前可用教室D. 在 Prompt 中写死可预约教室列表52. 在优化检索效果时以下哪种方法可以提升文档的结构性A. 使用 Markdown 格式B. 增加模型的训练数据C. 减少模型的推理时间53. 检索增强式生成RAG应用的主要优势是什么A. 避免传入大量背景信息B. 提高模型训练速度C. 减少模型推理时间54. 以下哪个用户查询语句无法有效地指导大语言模型进行文本摘要?A. 请总结以下文章的主要内容...B. 提取以下文本的关键词...C. 请翻译以下文章...D. 将以下文章压缩到 100 字以内...E. 用一句话概括以下文字55. 为缩短响应时延你想在索引前减少切片数量每个切片包含 2-3 页内容。结果发现回答容易混进无关信息。导致无关信息的根本原因是什么A. 文档内没有标题B. 切片过大且主题混杂C. 切片过短信息量不足D. 大模型出现故障56. 要将索引持久化到磁盘应使用以下哪个方法A. index.store()B. index.persist()C. index.save()D. index.storage_context.persist()57. 觉得提示词模板怎么设计效果最好假设chunk为召回的知识库文本块query为用户问题。A. 请回答{query}B. 请仔细阅读以下内容{chunk}回答问题{query}58. 在示例中答疑机器人没有理解用户的意图主要原因是什么A. 知识库中的上下文干扰B. 增加模型的训练数据C. 减少模型的推理时间59. 在设计大模型提示词时以下哪项原则最重要A. 简洁明确B. 生动形象C. 语言华丽60. 生成式大模型可能会引发内容安全风险以下哪个选项不属于内容安全风险?A. 生成违法信息B. 生成虚假内容C. 生成不相关内容61. 在调用大语言模型对话的API过程中以下哪个代码片段正确地使用了system角色来指示模型扮演一个友好的客服代表?A. messages [{role: system, content: 我想咨询一下退货流程.}]B. messages [{role: system, content: 您好,请问有什么可以帮您的?}]C. messages [{role: system, content: 你是一位友好的客服代表,随时准备帮助客户解决问题.}]62. 以下哪种方式有助于在大模型多轮对话场景中保障生成内容质量的同时降低成本并提升响应速度A. 使用 Batch APIB. 并行调用大模型 APIC. 使用支持上下文缓存的大模型 APID. 使用经过量化的模型63. 在优化检索效果时以下哪些方法可以增加召回的文档切片数量A. 调整 similarity_top_k 参数B. 增加模型的训练数据C. 减少模型的推理时间64. 在多模态协同学习框架下不同模态的数据如何协作以提升学习效果A. 通过独立学习各自模态的特征后直接合并B. 利用一种模态的信号作为另一模态学习的辅助或引导C. 仅依赖单一最强模态的数据进行训练65. 你在调用通义干问 API 时设置了 temperature温度参数以下哪种说法是正确的A. 温度参数越高候选 Token 的概率值之间的差距会变大从而带来更高的随机性B. 温度参数越高低概率的候选 Token 有概率超过高概率的候选 Token 的概率C. 温度参数越高候选 Token 的概率值会越接近从而带来更高的随机性D. 温度参数越高越适合撰写技术报告、代码等有较高确定性需求的场景66. 在以下代码片段中is_chat_modelTrue的作用是什么A. 指定模型为聊天模型B. 增加输出的多样性C. 使输出更具确定性67. 检查以下代码如果需要添加一个新的意图类别例如 “入职流程”需要修改哪一部分代码 # 获取用户意图的核心算法 def get_purpose(document): prompt_template”【角色背景】 你是一个专业的管理者你将阅读一条用户的问题并进行用户意图分类 【任务要求】 我们需要将用户的意图分成如下几类 请假政策福利待遇绩效考核工作职责开发规范 【输出要求】请以 json 格式输出不要输出其他内容 格式如{purpose:请假政策,query:请假流程是怎样的需要提前多久申请} 其中purpose 是你识别出的意图query 是用户输入的原始文本 【用户输入】 query prompt_template document“A. 只需要修改输入的用户 query 列表B. 需要修改输出格式要求。C. 需要修改 prompt_template 中的【任务要求】部分以及可能需要更新 get_purpose 函数中的逻辑。D. 只需要修改 大模型 query 函数 Q_S_Line68. 以下哪种存储最适合用于区分不同的对话轮次或历史记录A. plaintext 用户 你好 机器人 你好有什么可以帮你B. plaintext 用户你好 机器人你好有什么可以帮你C. plaintext ## 用户 你好 ## 机器人 你好有什么可以帮你D. plaintext 用户 你好 机器人 你好有什么可以帮你69. 在大语言模型微调的数据准备阶段哪个操作是为了将文本拆分成单词或词汇单元A. 文本翻译B. 数据去重C. 分词(Tokenization)D. 文本摘要70. 在一次评审会上大家针对同一条问答的准确性产生分歧工程师认为回答和问题语义相似度高业务负责人则认为回答中有错误细节。该争议主要反映了什么A. 词法分析不完善B. 纯粹的向量相似度不足以衡量业务正确性C. 检索速度过慢D. 大模型对中文支持度不足二多选题30 题 × 1 分 30 分1. 在提示词框架中以下哪些要素是必要的A. 任务目标ObjectB. 上下文ContextC. 角色RoleD. 受众Audience2. 通过 LlamaIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤A. 定义新的 prompt 字符串将 chunk 和 query 的位置空出来B. 使用新的 prompt 初始化一个 PromptTemplate 对象C. 对新的 prompt 进行保存使得 LlamaIndex 中的源代码 prompt 也变成中文D. 用 index 的 update_prompts 方法将新的 prompt 同步上去3. 在下面的代码片段中哪些是微调大语言模型训练循环中必要的步骤A. model.train()B. loss criterion(predictions, targets)C. predictions model(inputs)D. optimizer.step()E. optimizer.zero_grad()F. loss.backward()4. 在构建 RAG 应用时大模型可以用于哪些其他应用场景A. 识别用户意图B. 提取结构化信息C. 提高模型训练速度5. 在优化后的答疑机器人中以下哪种问题不需要经过RAG链路A. 检查文档错误B. 公司内部文档查询C. 增加模型的训练数据6. 在构建 RAG 应用时哪些高级 RAG 课题值得探索A. GraphRAG 技术B. 可视化工作流C. 智能体编排7. 你负责的短视频平台在接入多模态技术后出现故障。 1: 用户输入 “生成夏日海滩 vlog 背景” 时系统返回静态图片而非视频 2视频自动剪辑功能无法识别冲浪板等特定物体 3添加的 AI 解说语音与动画动作不同步 需要重点检查的技术环节是A. 视频编辑时是否设置了正确的时间轴B. 图像理解模型可能缺少对特定场景的训练数据C. 仅使用了文生图模型来生成完整视频D. 语音合成模型采样率不合适导致视频音画不同步8. 在自定义提示词模板中以下哪些是用于约束大模型行为的注意事项A. 根据上下文信息而非先验知识来回答问题B. 提醒用户问题触及安全红线无法提供C. 只回答用户的问题不输出其他信息D. 增加模型的训练数据9. 你正在开发一个机器学习领域的答疑机器人辅助学生学习但你对该领域专业知识掌握有限以下哪些策略更有助于你改进提示词设计A. 邀请机器学习课程助教一起审核和改进提示词要求其按照一定的结构来回答问题B. 要求大模型扮演「机器学习教授」结合学生认知水平重新写出更结构化的提示词C. 按照自己的理解要求大模型按照一定的结构来回答问题D. 保持提示词简单避免引入错误的信息10. 你发现检索到的切片里常常遗漏上下文导致回答片段化。下列哪些是有效且合理的改进措施A. 改用 “句子窗口切片” 或 “滑动窗口检索”B. 增大 chunk_overlapC. 避免切片将文档完整的拼接到提示词中D. 适当调大召回文档切片数量例如从 Top3 调整为 Top511. RAG 应用在检索时共召回了 10 条切片其中 3 条高度相关但 3 条内容都来自相邻段落却被系统拆分成不同切片从而导致回答时缺失连贯的上下文信息。哪些方案可进一步提升答案准确度A. 采用滑动窗口策略生成重叠的文本切片B. 使用按照语义的切片策略切分出语义更完整的切片C. 提高 temperature 参数控制生成多样性D. 调整切片大小使其覆盖完整更大段落范围12. 在优化后的答疑机器人中以下哪些是提示词中规定的任务要求A. 文档纠错专家需要言简意赅的回复B. 翻译专家需要识别不同语言的文本并翻译为中文C. 增加模型的训练数据13. 在提取标签的过程中以下哪些标签类型是支持的A. 人名B. 部门名称C. 职位名称D. 技术领域E. 产品名称14. 某教育问答系统上线后你通过监控日志发现模型有时会返回个人隐私信息为防止此类敏感信息泄露可以采取以下哪三项措施A. 过滤用户提问避免诱导性问题B. 在问答系统流式返回内容时实时检测并过滤敏感信息C. 增加知识库内容的多样性减少隐私信息被召回的概率D. 对教育知识库的内容进行脱敏处理15. 在决定模型微调前你应该考虑以下哪些事情A. 训练数据量是否达到微调的最低标准B. 该任务是否更适合使用 RAGC. 提示词工程是否能达到预期效果D. 训练服务器资源的成本16. 以下哪些代码片段可以有效地对用户输入进行清洗和预处理以提高大模型应用的安全性A. 将用户输入中的 emoji 表情符号替换为文本描述。B. 将用户输入转换为小写。C. 限制用户输入的长度。D. 去除用户输入中的 HTML 标签。E. 将用户输入中的 URL 替换为特殊的占位符。F. 先把英文全部翻译为中文。17. 以下哪三种场景更需要防范AI模型幻觉的风险A. 医疗诊断报告生成系统B. 社交媒体趋势话题预测系统C. 法律合同条款自动生成器D. 教育领域历史知识问答系统18. 你要给多个未归档的 Keynote 文档创建索引这些文档中包括表格、流程图等复杂内容。在“文档解析”环节你可以怎么做A. 开发能解析 Keynote 的自定义 ReaderB. 先将 Keynote 转成 PDF再用 DashScopeParse 处理C. 调大 RAG 应用召回 chunk 的数量19. 如果你的业务流程比较复杂可以借助百炼上的哪些工具来构建更强大的应用A. 可视化工作流B. 智能体编排C. LlamaIndex 组件D. 自然语言处理模型20. 在 Ragas 中以下哪些指标用于评估检索召回效果A. context precisionB. context recallC. 增加模型的训练数据21. 在大模型的问答工作流程中以下哪些阶段涉及模型的推理过程A. Token向量化B. 大模型推理C. 输出TokenD. 输出文本22. 你正在优化一个 RAG 系统发现某些相似文本对的向量相似度较低以下哪两种方法可以改善这种情况A. 更换效果更好的 embedding 模型B. 将索引保存到本地并在运行时加载C. 减少向量数据库的存储容量D. 通过对比学习让相关文本对的向量相似度更高23. 微调 qwen2.5 - 1.5b 模型过程中发现模型开始欠拟合可采取的优化措施包括A. 增加训练数据量B. 增加训练集迭代次数epochC. 增加 lora_rank 值D. 学习率增加一倍24. faithfulness、answer_relevancy、context_recall、context_precision 这些指标中哪些指标仅评估检索阶段的性能A. context_precisionB. answer_relevancyC. context_recallD. faithfulness25. 在切片向量化与存储阶段以下哪些是更新的 Embedding 模型A. text-embedding-v3B. text-embedding-3-smallC. text-embedding-3-large26. 某跨境电商平台的客服系统需要处理多语言用户咨询在进行文本合规检查时发现部分违规内容无法被检测出来。哪两个方案能提供多语言文本的合规检查效果A. 强制要求用户使用英语提问其他语言咨询转入人工处理B. 建立多语言同义词库覆盖常见违规表述的变体如“免税代购”的谐音 / 缩写形式C. 使用跨语言语义理解模型识别违规意图而非依赖关键词匹配D. 将非英语内容翻译为英语后复用单语种审核规则27. 在 context precision 的计算过程中以下哪些步骤是必要的A. 按顺序读取 contexts 中的 contexti判断其是否相关B. 计算每个 context 的 precision 分C. 对每个 context 的 precision 分求和除以相关的 context 个数D. 增加模型的训练数据28. 以下哪些代码片段可以用于检测用户输入中是否包含敏感词A. python def detect_sensitive_words(text, sensitive_words): for word in text.split(): if word in sensitive_words: return True return FalseB. python def detect_sensitive_words(text, sensitive_words): return any(word in text for word in sensitive_words)C. python def detect_sensitive_words(text, sensitive_words): # added error handling try: return any(word in text.lower() for word in [w.lower() for w in sensitive_words]) except AttributeError: # in case text is not a string return FalseD. python import nltk def detect_sensitive_words(text, sensitive_words): tokens nltk.word_tokenize(text) return any(token in sensitive_words for token in tokens)E. python def detect_sensitive_words(text, sensitive_words): return text in sensitive_words29. 在使用大语言模型时什么是“样例”的作用A. 确定目标用户B. 辅助模型生成单一答案C. 明确限制模型的回答长度D. 提供有指导性的案例E. 设定模型的情感色彩F. 抽象出实现方案30. 大语言模型微调相比预训练的优势有哪些?A. 更容易发现和修正模型偏差B. 无需考虑模型的泛化能力C. 减少了对大量无标注数据的依赖D. 提高了模型在特定领域的准确性E. 减少了计算资源的需求F. 加快了模型收敛速度