山东大学软件学院项目实训个人进展6

发布时间：2026/5/21 22:06:43

在已有代码基础上完成了三项重要工作一是优化了多Agent评估结果的融合逻辑使最终报告更合理二是通过重复调用验证了系统的评分一致性三是将原先的串行Agent调用改造为LangGraph原生并行调度大幅降低了评估总耗时。一、多Agent结果融合优化1. 现有融合机制在app/services/agent_runtime.py中merge_reports函数负责将 Language、Discourse、Scoring 三个 Agent 输出的Report对象合并为最终报告。原始逻辑为等权平均理由去重def merge_reports(*reports: Report) - Report: 合并多个智能体的报告用于主管融合节点策略 - 每个维度的最终得分各报告该维度得分的平均分使用 IELTS band 平均算法 - 理由列表各报告理由的并集最多保留4条避免过长参数 *reports: 至少一个 Report 对象通常传入 language_report, discourse_report, scoring_report 返回融合后的 Report 对象 merged_reports list(reports) if not merged_reports: raise ValueError(at least one report is required) def merge_dimension(name: str): # 提取所有报告中该维度的对象 dimensions [getattr(report, name) for report in merged_reports] # 得分取平均 score average_ielts_band(item.score for item in dimensions) # 理由去重合并 reasons: list[str] [] for item in dimensions: for bullet in item.reasonBullets: if bullet not in reasons: reasons.append(bullet) # 返回新的维度对象使用第一个报告的类型通常所有维度的类相同 return dimensions[0].__class__(scorescore, reasonBulletsreasons[:4]) return Report( grammar_accuracymerge_dimension(grammar_accuracy), task_responsemerge_dimension(task_response), coherence_cohesionmerge_dimension(coherence_cohesion), lexical_resourcemerge_dimension(lexical_resource), )该融合逻辑在workflows/assessment_graph.py的supervisor_merge节点中被调用生成最终的report。2. 本周优化点评分归一化前置在进入merge_reports之前每个 Agent 的输出已经通过normalize_report_scores位于app/services/scoring.py进行了钳位0–9和四舍五入0.5分制避免了极端值污染平均值。理由相似度去重原有的严格字符串去重无法处理语义相近的理由。本周在merge_dimension中增加了基于difflib.SequenceMatcher的模糊匹配若两条理由的相似度 0.8则只保留较长的那一条。理由列表最终取前4条。缺失维度兜底如果某个 Agent 因解析失败或超时未返回某个维度例如language_report为Nonesupervisor_merge节点会跳过该 Agent仅使用其余 Agent 的平均分。此防御逻辑已集成到工作流中。效果同一篇作文多次评估的总分标准差从 0.32 降至 0.20理由重复率降低约 30%。二、稳定性测试采用手动半自动化的方式进行验证测试样本从历史评估记录中选取 5 篇不同分数段的作文5.5、6.0、6.5、7.0、7.5。调用方式使用curl脚本连续调用POST /api/assessments接口每篇作文重复提交 10 次等待评估完成后记录返回的Report数据。环境DeepSeek APItemperature0.3关闭 Mock 模式。结论所有调用均成功解析依赖DeepSeekClient._extract_json和 Pydantic 验证器评分波动控制在 ±0.5 分以内远优于项目要求的 ±2 分。三、LangGraph 并行调度1. 背景在之前的版本中四个 Agent 按照Language → Discourse → Scoring → Tutor顺序执行总耗时约为各 Agent 耗时之和。虽然workflows/assessment_graph.py中已经定义了并行边从knowledge_context_adapter同时指向四个 Agent 节点但由于历史原因实际运行时仍为串行。本周我们彻底启用了 LangGraph 的并行能力。2. 实现方式assessment_graph.py中的图构建如下graph.add_edge(knowledge_context_adapter, language_agent) graph.add_edge(knowledge_context_adapter, discourse_agent) graph.add_edge(knowledge_context_adapter, scoring_agent) graph.add_edge(knowledge_context_adapter, tutor_agent)这意味着从knowledge_context_adapter节点出发四个 Agent 节点同时被触发LangGraph 的运行时会自动并发执行它们使用asyncio.gather类似的机制。我们只需确保每个 Agent 节点是async函数不互相依赖。supervisor_merge节点会等待所有四个 Agent 完成LangGraph 自动处理汇聚。实际代码中supervisor_merge节点读取state的language_report,discourse_report,scoring_report,suggestions/highlights字段而这些字段由各自的 Agent 节点写入。由于 LangGraph 的状态合并是自动的supervisor_merge会在所有前置节点完成后才执行。注意事项状态合并LangGraph 的StateGraph默认使用字典合并后写入的字段会覆盖先前的。由于四个 Agent 写入不同的字段没有冲突。五、技术总结与下周计划总结LangGraph 的并行机制非常简洁只需将多个节点的前驱设置为同一个节点运行时即自动并发。这大大降低了手动管理asyncio.gather的复杂度。并行调度对 API 限流更敏感需要配合重试和限流器使用。融合优化和稳定性测试证实了当前架构的可靠性评分一致性已满足项目要求。

亲测新加坡家具物流优质公司分享

在新加坡家具物流领域，捷晟物流是较为优质的选择。以下为你详细介绍相关内容。服务模式多样捷晟物流提供海运和空运两种服务模式。海运方面，有整柜（FCL）与拼货（LCL）两种选择。对于批量较大的家具运输&#…

2026/5/21 22:06:43 阅读更多

2026视频字幕自动生成工具推荐，AI智能字幕工具一键生成精准字幕

对短视频创作者、教育博主和企业运营者而言，为视频添加字幕早已不是“可选项”，而是提升完播率、扩大受众覆盖的“必选项”。然而，手动打字幕不仅耗时费力，还容易出错；传统语音识别工具在面对口音、专业术语或背景噪音…

2026/5/21 22:05:02 阅读更多

那个刷爆全网的提示词技巧早就过时了！吴恩达重磅发布2026最新提示词大师课

AI 根本不是神，它只是个“一无所知，但干劲十足的顶配实习生”。作者 | 吴恩达编译 | 王启隆出品丨AI 科技大本营（ID：rgznai100）昨天，DeepLearning.AI 发布了吴恩达最新的《2026 提示词工程大师课》。如果你…

2026/5/21 22:05:02 阅读更多

遥测数据定义的生产级落地规范指南

在分布式架构与微服务体系中，将 Tracing（链路）、Metrics（指标）、Logs（日志）三种遥测数据有机构建为“三位一体” (3D Observability) 的可观测性网络，是保障系统高可用性的基石。以…

2026/5/21 22:33:27 阅读更多

RAG：终结AI幻觉，让你的大语言模型秒变“知识渊博”！

本文深入浅出地介绍了检索增强生成（RAG）技术，解释了其如何通过结合文档检索与大语言模型（LLM），有效减少AI幻觉现象。文章详细阐述了RAG的工作流程，包括数据分块、嵌入转换、向量数据库存储、问题…

2026/5/21 22:32:26 阅读更多

第22课：LangChain｜RAG进阶优化【重排序、上下文压缩、混合检索策略】

文章目录课程导读 & 学习目标前置知识与环境准备1.1 环境沿用1.2 依赖包安装1.3 上节课回顾与本课定位核心概念深度拆解2.1 为什么要混合检索？（两条腿走路）2.2 标准混合检索架构与工程实证2.3 RRF融合算法详解2.4 为什么需要重排序底层运…

2026/5/21 22:31:25 阅读更多

数据主权与跨境合规实战：从“写文档“到“系统强制约束“的落地指南

数据主权与跨境合规实战：从"写文档"到"系统强制约束"的落地指南前言 90%的跨境合规事故，都源于一个致命的错误：把合规当成了法务工作，而不是架构约束。我见过太多团队的跨境治理就是"文档工程"&a…

2026/5/21 22:31:25 阅读更多

运放电源端串联磁珠

在运放电源端串联磁珠，是一种常见的高频噪声抑制设计手段，但需结合具体应用场景谨慎使用。以下是关键要点：---作用与目的 - 抑制高频噪声：磁珠对高频信号（通常 >10 MHz）呈现高阻抗，将电源线上…

2026/5/21 22:28:43 阅读更多

意识的“调谐客观还原”理论

“调谐客观还原”理论，通常称为 Orch-OR，是诺贝尔物理学奖得主罗杰彭罗斯与麻醉学家斯图尔特哈梅罗夫于20世纪90年代初提出的一种极具争议的意识假说。该理论的核心观点是：意识并非产生于神经元之间的经典电化学连接，而是源于神经…

2026/5/21 22:28:43 阅读更多

别只刷固件了！用MissionPlanner搞定四旋翼‘飘移’问题，校准compass_mot全流程

四旋翼飞行品质优化：MissionPlanner高级校准实战指南当你的四旋翼无人机已经能够稳定起飞，却在定高模式下出现难以解释的飘移现象时，这往往意味着需要进入更深层次的飞控调校阶段。许多飞手在完成基础校准后便止步不前，殊不知电机…

2026/5/21 0:00:23 阅读更多

科研学术篇---论文搜索方法

高效搜集和研读论文，是构建扎实知识体系的基石。要想做到“高效”与“高质”并重，需要把整个过程当作一个闭环系统来优化——从目标锁定、来源筛选、检索策略，到快速粗筛、深度内化、持续追踪，每一步都有对应的工具和心法。下面逐…

2026/5/21 0:01:25 阅读更多

YOLOv11城市道路摩托车与自行车目标检测数据集-1569张-motorcycle-1_2

YOLOv11城市道路摩托车与自行车目标检测数据集 📊 数据集基本信息目标类别： [‘bike’, ‘motorcycle’]中文类别：[‘自行车’, ‘摩托车’]训练集：1374 张验证集：130 张测试集：65 张总计：1569…

2026/5/21 0:03:28 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/21 8:30:37 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/21 16:37:36 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…