开源项目WPS AI插件察元AI文档助手:段落截取:长度、重叠与策略枚举 摘要getChunkSettings 从 globalSettings 读取 chunkSettings并对 chunkLength、overlapLength 做上下界夹取。splitStrategy 支持 paragraph、sentence、char影响 documentChunker 的分割行为。关键词chunk;overlap;paragraph扩展阅读与维护提示本篇围绕「段落截取长度、重叠与策略枚举」组织材料。仓库内与主题最直接相关的检索词包括chunk、overlap、paragraph。建议在阅读正文所列片段后用 IDE 全局搜索这些符号沿 import 与调用栈向上追问「谁在什么时机调用」而不是只记住单文件路径。摘要所概括的要点为getChunkSettings 从 globalSettings 读取 chunkSettings并对 chunkLength、overlapLength 做上下界夹取。splitStrategy 支持 paragraph、sentence、char影响 documentChunker 的分割行为。落地到排障时可把现象粗分为三类交叉验证配置是否按预期写入持久化介质WPS COM 上下文是否可用例如是否缺少 ActiveDocument以及网络与证书策略是否拦截了 fetch。本篇涉及的模块通常只覆盖其中一两类需要与相邻篇目拼成完整拼图。教程文件名「13-chunkSettings-fenduan-yu-zhongdie.md」仅用于导航与排序不等价于源码模块名。若正文中的行号与本地分支不一致多半因合并导致行偏移此时应以函数名、导出名为锚重新检索团队若维护了生成脚本可在变更大段源码后重新运行以保持摘录大致对齐。本文刻意避免对产品能力做营销式承诺所述行为均以当前仓库可见实现为准。若组织策略要求离线或内网模型应在网关、证书与代理层收口而不是假设加载项能绕过浏览器安全模型。若你同时阅读 docs/chayuan-llm-chain-series可先对照其中的总体链路图理解「请求从 UI 到 chatApi」的次序再回到本教程看数据结构、默认值与修改风险面两者互补不重复堆砌功能列表。正文1. 默认值与读取未配置时返回 4000 字块长与 200 重叠的默认组合。阅读源码摘录时请把它当作「定位入口」而非完整实现同一函数可能在其他分支还有早退条件或 try/catch。修改默认行为前建议用最小文档手工走一遍相关助手或对话框并观察任务清单与日志中的字段是否与预期一致再决定是否做数据迁移或配置重置。// src/utils/chunkSettings.js 第8-28行constDEFAULT_CHUNK_LENGTH4000constDEFAULT_OVERLAP_LENGTH200constMIN_CHUNK_LENGTH500constMAX_CHUNK_LENGTH16000constMIN_OVERLAP0constMAX_OVERLAP_RATIO0.5/** * 获取段落截取配置 * returns {{ chunkLength: number, overlapLength: number, splitStrategy: string }} */exportfunctiongetChunkSettings(){constsettingsloadGlobalSettings()constrawsettings.chunkSettingsif(!raw||typeofraw!object){return{chunkLength:DEFAULT_CHUNK_LENGTH,overlapLength:DEFAULT_OVERLAP_LENGTH,splitStrategy:paragraph}}2. 合法策略非法值回退到 paragraph避免持久化损坏导致运行期异常。阅读源码摘录时请把它当作「定位入口」而非完整实现同一函数可能在其他分支还有早退条件或 try/catch。修改默认行为前建议用最小文档手工走一遍相关助手或对话框并观察任务清单与日志中的字段是否与预期一致再决定是否做数据迁移或配置重置。// src/utils/chunkSettings.js 第29-44行constchunkLengthclamp(parseInt(raw.chunkLength,10)||DEFAULT_CHUNK_LENGTH,MIN_CHUNK_LENGTH,MAX_CHUNK_LENGTH)constmaxOverlapMath.floor(chunkLength*MAX_OVERLAP_RATIO)constoverlapLengthclamp(parseInt(raw.overlapLength,10)||DEFAULT_OVERLAP_LENGTH,MIN_OVERLAP,maxOverlap)constsplitStrategy[paragraph,sentence,char].includes(raw.splitStrategy)?raw.splitStrategy:paragraphreturn{chunkLength,overlapLength,splitStrategy}}