下面是文档judicial-doc-quality-mcp v0.1.0司法裁判文书质量评估 MCP 服务器 — 桥接架构零 LLM 调用English | 中文概述judicial-doc-quality-mcp是一个基于 Model Context Protocol (MCP) 的裁判文书质量评估服务器采用**桥接架构Bridge Architecture**设计——服务器本身不调用任何 LLM而是提供结构化的评分 Prompt、规则引擎、异常检测联动和报告生成工具由 Agent如 Claude、GPT 等负责实际的 LLM 推理调用。本项目的核心价值将裁判文书质量评估的专业知识七维评分体系、扣分/加分规则、交叉一致性检查等封装为 MCP 工具使任何支持 MCP 的 AI Agent 都能对裁判文书进行系统化、标准化的质量评估。特点桥接架构服务器零 LLM 调用所有 AI 推理由 Agent 完成Token 消耗完全可控七维评分体系形式规范(3%)、事实清楚(12%)、证据确实充分(12%)、法律适用正确(18%)、说理充分透彻(22%)、实质解纷效果(25%)、语言精练流畅(8%)规则引擎 LLM 混合架构结构化异常由正则规则引擎初筛语义异常由 Agent 深度分析异常检测联动可选集成 judicial-doc-anomaly-mcp实现16维度异常检测与质量评估的联动扣分规避模式检测自动识别文书中的模糊主体、时间模糊、回避回应等规避责任写作模式时间线提取与异常检测从文书中提取时间线事件检测时间倒置等异常证据引用追踪追踪文书中的证据引用情况检测证据采信缺失民商事专项标准内置民商事裁判文书专项法律依据、审理经过必须交代事项、法条引用格式规范等交叉一致性检查自动检测各维度评分间的逻辑冲突如事实清楚高分但证据充分低分Token 预算估算在渲染 Prompt 前预估 Token 消耗避免上下文溢出批处理渲染支持多维度 Prompt 批量渲染减少 Agent 调用次数安装前置条件Python 3.11支持 MCP 的 AI 客户端如 Claude Desktop、Trae IDE 等从源码安装# 克隆仓库gitclone https://github.com/CSlawyer1985/judicial-doc-quality-mcp.gitcdjudicial-doc-quality-mcp# 安装依赖推荐使用虚拟环境python-mvenv .venv# Windows.venv\Scripts\activate# macOS/Linuxsource.venv/bin/activate pipinstall-e.# 可选安装异常检测联动依赖pipinstall-e.[anomaly]# 可选安装开发依赖pipinstall-e.[dev]配置# 复制环境变量模板cp.env.example .env# 编辑 .env 文件按需修改配置# 主要配置项# ANOMALY_MCP_AVAILABLEfalse # 是否启用异常检测联动# RULE_ENGINE_ENABLEDtrue # 是否启用规则引擎# EVASIVE_DETECTION_ENABLEDtrue # 是否启用规避模式检测MCP 客户端配置在 MCP 客户端如 Claude Desktop的配置文件中添加{mcpServers:{judicial-quality:{command:python,args:[-m,judicial_quality_mcp.server],cwd:/path/to/judicial-doc-quality-mcp}}}如需联动异常检测 MCP同时配置{mcpServers:{judicial-quality:{command:python,args:[-m,judicial_quality_mcp.server],cwd:/path/to/judicial-doc-quality-mcp},judicial-anomaly:{command:python,args:[-m,judicial_doc_anomaly.server],cwd:/path/to/judicial-doc-anomaly-mcp}}}使用工具列表17个 MCP 工具工具名称功能Token 消耗list_dimensions列出所有评分维度及元数据零extract_document_sections从文书全文提取核心段落零render_dimension_prompt渲染单个维度的评分 Prompt零输出供 Agent 使用render_dimension_prompt_batch批量渲染多个维度的评分 Prompt零parse_score_result解析 Agent 返回的评分结果零calculate_weighted_score计算加权总分零cross_check_consistency交叉一致性检查零apply_anomaly_deduction计算异常扣分零apply_innovation_bonus计算创新性加分零get_dimension_standards获取维度评分标准零estimate_token_budget预估 Token 消耗零generate_report生成质量评估报告零query_anomaly_mcp联动异常检测 MCP零桥接调用extract_timeline提取时间线并检测异常零trace_evidence_references追踪证据引用情况零detect_evasive_patterns检测规避责任写作模式零pipeline_progress查询评估流水线进度零典型评估流程1. extract_document_sections → 提取文书段落 2. estimate_token_budget → 预估 Token 消耗 3. render_dimension_prompt → 逐维度渲染评分 Prompt 4. [Agent 调用 LLM 评分] → Agent 自行调用 LLM 5. parse_score_result → 解析评分结果 6. cross_check_consistency → 交叉一致性检查 7. detect_evasive_patterns → 检测规避模式 8. extract_timeline → 提取时间线 9. trace_evidence_references → 追踪证据引用 10. calculate_weighted_score → 计算加权总分 11. generate_report → 生成评估报告七维评分体系维度权重核心评估内容形式规范3%案号、当事人信息、审理经过、法条引用格式事实清楚12%争议焦点归纳、事实认定完整性、时间线清晰度证据确实充分12%证据三性审查、举证责任分配、采信理由说明法律适用正确18%法条引用准确性、法律解释方法、涵摄过程说理充分透彻22%事理法理情理融合、对辩驳回应、逻辑严密性实质解纷效果25%服判息诉效果、裁判主文明确性、可执行性语言精练流畅8%语言规范性、法言法语准确性、冗余度项目结构judicial-doc-quality-mcp/ ├── src/judicial_quality_mcp/ # 核心源码 │ ├── server.py # MCP 服务器17个工具 │ ├── config.py # 配置管理 │ ├── models.py # 数据模型 │ ├── response_parser.py # 响应解析器 │ └── skill_runner.py # Skill 加载与渲染 ├── skills/ # 评分标准Skill 文件 │ ├── dimensions/ # 七维评分标准 │ │ ├── 01_formal_specification.md │ │ ├── 02_clear_facts.md │ │ ├── 03_sufficient_evidence.md │ │ ├── 04_correct_law_application.md │ │ ├── 05_reasoning.md │ │ ├── 06_substantive_resolution.md │ │ └── 07_concise_language.md │ ├── phases/ # 评估流程阶段 │ │ ├── 00_precheck.md │ │ ├── 01_quality_assessment.md │ │ ├── 02_anomaly_integration.md │ │ ├── 03_auxiliary_detection.md │ │ └── 04_report_generation.md │ ├── _system.md # 系统级指令 │ └── _output_format.md # 输出格式规范 ├── anchors/ # 锚定示例各维度评分范例 ├── tests/ # 单元测试 ├── .env.example # 环境变量模板 ├── pyproject.toml # 项目配置 └── test_new_tools.py # 集成测试局限性不直接调用 LLM本服务器采用桥接架构所有 AI 推理由 Agent 完成。服务器本身无法独立生成评估结论必须配合支持 MCP 的 AI 客户端使用。规则引擎的局限性基于正则表达式的规则引擎只能检测结构化、模式化的异常无法理解语义层面的复杂问题如法律适用错误、说理逻辑缺陷等。评分标准的主观性七维评分体系中的扣分/加分规则基于法律实务经验和学术研究但裁判文书质量评估本身具有一定主观性不同评估者可能得出不同结论。民商事侧重当前评分标准主要针对民商事裁判文书设计对刑事、行政裁判文书的适配性有限。异常检测联动依赖query_anomaly_mcp工具需要单独部署 judicial-doc-anomaly-mcp未配置时该工具返回空白结果不影响基本评估流程。Token 消耗估算为近似值estimate_token_budget基于字符数估算 Token 消耗实际消耗取决于具体 LLM 的分词器可能存在 10-20% 的偏差。时间线提取依赖日期格式extract_timeline工具基于正则匹配提取日期对非标准日期格式如近日“此后”的识别能力有限。证据引用追踪的局限trace_evidence_references基于关键词匹配无法理解证据的实质内容和证明力。免责声明本项目仅供学术研究和法律技术探索使用不构成法律意见或专业法律建议。非官方工具本项目与任何司法机关、仲裁机构均无关联不代表任何官方立场。评估结果仅供参考不应用于任何正式的法律程序或决策。评估结果的局限性本工具的评估结果基于预设的评分标准和规则可能无法全面反映裁判文书的实际质量。裁判文书的评价涉及复杂的法律判断本工具不能替代专业法律人士的审查。数据安全使用本工具处理裁判文书时请注意保护当事人隐私和案件敏感信息。建议在本地环境运行避免将文书内容传输至不可控的第三方服务。知识产权本项目使用的评分标准、法律依据和案例引用均来自公开的法律法规、司法解释和学术文献仅供学术研究使用。如有侵权请联系删除。适用法律本项目的评分标准基于中华人民共和国现行法律体系对其他法域的裁判文书不适用。无担保本项目按原样提供不作任何明示或暗示的担保包括但不限于适销性、特定用途的适用性和非侵权性。许可证MIT License
vibe coding效率高:一个新mcp server已经试运行尚可
发布时间:2026/5/19 4:44:06
下面是文档judicial-doc-quality-mcp v0.1.0司法裁判文书质量评估 MCP 服务器 — 桥接架构零 LLM 调用English | 中文概述judicial-doc-quality-mcp是一个基于 Model Context Protocol (MCP) 的裁判文书质量评估服务器采用**桥接架构Bridge Architecture**设计——服务器本身不调用任何 LLM而是提供结构化的评分 Prompt、规则引擎、异常检测联动和报告生成工具由 Agent如 Claude、GPT 等负责实际的 LLM 推理调用。本项目的核心价值将裁判文书质量评估的专业知识七维评分体系、扣分/加分规则、交叉一致性检查等封装为 MCP 工具使任何支持 MCP 的 AI Agent 都能对裁判文书进行系统化、标准化的质量评估。特点桥接架构服务器零 LLM 调用所有 AI 推理由 Agent 完成Token 消耗完全可控七维评分体系形式规范(3%)、事实清楚(12%)、证据确实充分(12%)、法律适用正确(18%)、说理充分透彻(22%)、实质解纷效果(25%)、语言精练流畅(8%)规则引擎 LLM 混合架构结构化异常由正则规则引擎初筛语义异常由 Agent 深度分析异常检测联动可选集成 judicial-doc-anomaly-mcp实现16维度异常检测与质量评估的联动扣分规避模式检测自动识别文书中的模糊主体、时间模糊、回避回应等规避责任写作模式时间线提取与异常检测从文书中提取时间线事件检测时间倒置等异常证据引用追踪追踪文书中的证据引用情况检测证据采信缺失民商事专项标准内置民商事裁判文书专项法律依据、审理经过必须交代事项、法条引用格式规范等交叉一致性检查自动检测各维度评分间的逻辑冲突如事实清楚高分但证据充分低分Token 预算估算在渲染 Prompt 前预估 Token 消耗避免上下文溢出批处理渲染支持多维度 Prompt 批量渲染减少 Agent 调用次数安装前置条件Python 3.11支持 MCP 的 AI 客户端如 Claude Desktop、Trae IDE 等从源码安装# 克隆仓库gitclone https://github.com/CSlawyer1985/judicial-doc-quality-mcp.gitcdjudicial-doc-quality-mcp# 安装依赖推荐使用虚拟环境python-mvenv .venv# Windows.venv\Scripts\activate# macOS/Linuxsource.venv/bin/activate pipinstall-e.# 可选安装异常检测联动依赖pipinstall-e.[anomaly]# 可选安装开发依赖pipinstall-e.[dev]配置# 复制环境变量模板cp.env.example .env# 编辑 .env 文件按需修改配置# 主要配置项# ANOMALY_MCP_AVAILABLEfalse # 是否启用异常检测联动# RULE_ENGINE_ENABLEDtrue # 是否启用规则引擎# EVASIVE_DETECTION_ENABLEDtrue # 是否启用规避模式检测MCP 客户端配置在 MCP 客户端如 Claude Desktop的配置文件中添加{mcpServers:{judicial-quality:{command:python,args:[-m,judicial_quality_mcp.server],cwd:/path/to/judicial-doc-quality-mcp}}}如需联动异常检测 MCP同时配置{mcpServers:{judicial-quality:{command:python,args:[-m,judicial_quality_mcp.server],cwd:/path/to/judicial-doc-quality-mcp},judicial-anomaly:{command:python,args:[-m,judicial_doc_anomaly.server],cwd:/path/to/judicial-doc-anomaly-mcp}}}使用工具列表17个 MCP 工具工具名称功能Token 消耗list_dimensions列出所有评分维度及元数据零extract_document_sections从文书全文提取核心段落零render_dimension_prompt渲染单个维度的评分 Prompt零输出供 Agent 使用render_dimension_prompt_batch批量渲染多个维度的评分 Prompt零parse_score_result解析 Agent 返回的评分结果零calculate_weighted_score计算加权总分零cross_check_consistency交叉一致性检查零apply_anomaly_deduction计算异常扣分零apply_innovation_bonus计算创新性加分零get_dimension_standards获取维度评分标准零estimate_token_budget预估 Token 消耗零generate_report生成质量评估报告零query_anomaly_mcp联动异常检测 MCP零桥接调用extract_timeline提取时间线并检测异常零trace_evidence_references追踪证据引用情况零detect_evasive_patterns检测规避责任写作模式零pipeline_progress查询评估流水线进度零典型评估流程1. extract_document_sections → 提取文书段落 2. estimate_token_budget → 预估 Token 消耗 3. render_dimension_prompt → 逐维度渲染评分 Prompt 4. [Agent 调用 LLM 评分] → Agent 自行调用 LLM 5. parse_score_result → 解析评分结果 6. cross_check_consistency → 交叉一致性检查 7. detect_evasive_patterns → 检测规避模式 8. extract_timeline → 提取时间线 9. trace_evidence_references → 追踪证据引用 10. calculate_weighted_score → 计算加权总分 11. generate_report → 生成评估报告七维评分体系维度权重核心评估内容形式规范3%案号、当事人信息、审理经过、法条引用格式事实清楚12%争议焦点归纳、事实认定完整性、时间线清晰度证据确实充分12%证据三性审查、举证责任分配、采信理由说明法律适用正确18%法条引用准确性、法律解释方法、涵摄过程说理充分透彻22%事理法理情理融合、对辩驳回应、逻辑严密性实质解纷效果25%服判息诉效果、裁判主文明确性、可执行性语言精练流畅8%语言规范性、法言法语准确性、冗余度项目结构judicial-doc-quality-mcp/ ├── src/judicial_quality_mcp/ # 核心源码 │ ├── server.py # MCP 服务器17个工具 │ ├── config.py # 配置管理 │ ├── models.py # 数据模型 │ ├── response_parser.py # 响应解析器 │ └── skill_runner.py # Skill 加载与渲染 ├── skills/ # 评分标准Skill 文件 │ ├── dimensions/ # 七维评分标准 │ │ ├── 01_formal_specification.md │ │ ├── 02_clear_facts.md │ │ ├── 03_sufficient_evidence.md │ │ ├── 04_correct_law_application.md │ │ ├── 05_reasoning.md │ │ ├── 06_substantive_resolution.md │ │ └── 07_concise_language.md │ ├── phases/ # 评估流程阶段 │ │ ├── 00_precheck.md │ │ ├── 01_quality_assessment.md │ │ ├── 02_anomaly_integration.md │ │ ├── 03_auxiliary_detection.md │ │ └── 04_report_generation.md │ ├── _system.md # 系统级指令 │ └── _output_format.md # 输出格式规范 ├── anchors/ # 锚定示例各维度评分范例 ├── tests/ # 单元测试 ├── .env.example # 环境变量模板 ├── pyproject.toml # 项目配置 └── test_new_tools.py # 集成测试局限性不直接调用 LLM本服务器采用桥接架构所有 AI 推理由 Agent 完成。服务器本身无法独立生成评估结论必须配合支持 MCP 的 AI 客户端使用。规则引擎的局限性基于正则表达式的规则引擎只能检测结构化、模式化的异常无法理解语义层面的复杂问题如法律适用错误、说理逻辑缺陷等。评分标准的主观性七维评分体系中的扣分/加分规则基于法律实务经验和学术研究但裁判文书质量评估本身具有一定主观性不同评估者可能得出不同结论。民商事侧重当前评分标准主要针对民商事裁判文书设计对刑事、行政裁判文书的适配性有限。异常检测联动依赖query_anomaly_mcp工具需要单独部署 judicial-doc-anomaly-mcp未配置时该工具返回空白结果不影响基本评估流程。Token 消耗估算为近似值estimate_token_budget基于字符数估算 Token 消耗实际消耗取决于具体 LLM 的分词器可能存在 10-20% 的偏差。时间线提取依赖日期格式extract_timeline工具基于正则匹配提取日期对非标准日期格式如近日“此后”的识别能力有限。证据引用追踪的局限trace_evidence_references基于关键词匹配无法理解证据的实质内容和证明力。免责声明本项目仅供学术研究和法律技术探索使用不构成法律意见或专业法律建议。非官方工具本项目与任何司法机关、仲裁机构均无关联不代表任何官方立场。评估结果仅供参考不应用于任何正式的法律程序或决策。评估结果的局限性本工具的评估结果基于预设的评分标准和规则可能无法全面反映裁判文书的实际质量。裁判文书的评价涉及复杂的法律判断本工具不能替代专业法律人士的审查。数据安全使用本工具处理裁判文书时请注意保护当事人隐私和案件敏感信息。建议在本地环境运行避免将文书内容传输至不可控的第三方服务。知识产权本项目使用的评分标准、法律依据和案例引用均来自公开的法律法规、司法解释和学术文献仅供学术研究使用。如有侵权请联系删除。适用法律本项目的评分标准基于中华人民共和国现行法律体系对其他法域的裁判文书不适用。无担保本项目按原样提供不作任何明示或暗示的担保包括但不限于适销性、特定用途的适用性和非侵权性。许可证MIT License