刷题统计与智能学习报告中心的设计与实现在完成了刷题模式下的 AI 错因分析、自适应主观题阅卷与相似题生成后系统已经在单道题目上形成了良好的教学闭环。然而当刷题量从几十道变成几百道乃至覆盖到 408 统考四大科目即数据结构、计算机组成原理、操作系统、计算机网络的庞大知识体系时零散的刷题记录需要被整合分析。 考生面对成百上千条对错记录依然无法看清自己的复习现状也难以在大后期制定出精确到天的冲刺计划。因此本阶段的核心任务是从零构建刷题统计与智能学习报告中心。以下是我在开发这些功能小点时需求推演、技术选型以及大模型落地过程中的真实思考。一、 基础量化构建核心数据统计1. 考生需求408 考研是一场持久战考生在复习中很容易产生两种极端心态1盲目乐观 刷了几十道简单题就觉得科目复习得差不多了。2过度焦虑 碰上几道复杂的大题连着错就觉得自己今年考不上了。为了打破这种主观盲目性考虑在统计页面要给考生提供几个重要的量化指标1累计刷题总数让考生对自己的总工作量心里有数。这里在后端我直接对做题记录表Record进行聚合统计通过对用户 ID 和考试模式进行计数。2综合平均正确率可以直观反映当前的掌握水平也是通过做题记录表进行计算统计的。3累计精力花费时长把做题数量转化为时间维度判断用户的精力与能力。为了强化复习进度的判断这里定义了一个简单合理的精力消耗公式总消耗分钟数 总刷题数 x 3。把冰冷的题目数字转化为专注时间在心理上能帮考生稳定备考心态踏踏实实看到自己的沉淀。2.近一周 408 刷题状态与正确率波动在核心统计之外对考生来说动态地统计最近 7 天的复习节奏与状态波动也是必要的。于是在这里设计了一个动态的折线柱状混合图表。1每日刷题数量量化柱状图提取近 7 天内该用户的所有做题记录初始化近7天的时间。将每天的答题总数聚合统计后映射为图表中的柱状高度。考生可以清晰看到周一到周日自己哪天刷题最猛哪天复习出现了懈怠。2每日正确率起伏走势折线图在柱状图的基础上叠加了一条折线图走势线用来反映每天的做题正确率变动趋势。通过柱状图与折线图的结合考生能一眼看出自己近期的掌握状态是质量和数量都保证的良性循环还是疲劳的低效刷题从而动态微调第二天的复习节奏。3. 408 四大科目复习刷题明细盘考虑到考生需要知道自己在数据结构、计组、操作系统、计网这四个科目中每个科目到底各自刷了多少道题各自的对错分布是什么样的。所以对做题表按照四大科目进行分组提取出每个科目下独立的总做题数、正确题目数和错误题目数。并计算了该科目的正确率。利用前端进度条进行可视化展示考生看到四大科目的阶梯差距彻底扫除复习时的盲区。二、 408科目正确率雷达图可视化在做数据结构、计组、操作系统、计网这四大科目的胜率雷达图时我遇到了问题新用户的数据极其稀疏。如果一个用户刚注册或者刚开始一轮复习如果直接拿数据库里的真实正确率去前端渲染雷达图图表会严重变形比如数据结构 100%其余全打底。这种图表不仅没有参考价值还很影响用户体验。这里解决方案是设计了一套基于 408 常规难度的自适应动态拟合算法。首先根据历年统考的难度分布设定了四大科目的初始基准线数据结构为75% 、计算机网络为70%、操作系统为60%和计算机组成原理为55%。引入了题量动态加权公式来计算最终的展示准确率当用户在系统中的总做题数 N 200道时我们认为样本较小容易失真。此时启用动态拟合当用户总做题数 N ≥200 道时自动衰减为 0系统完全展现百分之百由数据库采集的真实表现。最终展示正确率x 常规模拟基准线 (1 -) x 用户真实刷题正确率另外在科目分类上在采集数据时就已经严格清洗了剔除了其它这种边缘分类。因为 408 统考大纲只有四大硬核科目保持类别的纯净感能让报告显得更专业。在雷达图可视化上当用户鼠标悬浮在雷达图时动态气泡框会清晰展示各科目的正确率。三、 长期统计分析1. 12周自律打卡状态为了引导考生建立每日迭代的习惯我们在前端复刻了类似力扣的打卡热力图墙。 用户可以每天签到打卡系统提取用户近 90 天的真实轨迹根据每日的刷题数和签到动作映射为小色块。其中设置了四个不同浓度的绿色像素块。绿色变浓是刷题数的量化能给考生正向心理暗示而空白的色块则能警醒考生及时补上用视觉引导考生自律。2. 近期薄弱考点排行统计不仅要展示好的一面更要展示需要改进的刷题上的漏洞点。系统对知识点进行精细化聚合按照正确率升序、做题数降序的原则筛选出排名前5的严重薄弱点。同时设置了自适应诊断评级系统根据薄弱点的真实正确率划分了诊断评级与解决方法。评级包含薄弱和极度危险解决方法是启动薄弱知识点重做机制。 利用系统的 AI 相似题生成功能进行同考点、换参数的方法来加强薄弱知识点掌握。四、 大模型 AI 学情分析与自适应交互前期的统计是静态的无法动态说明复习路径。所以这里我考虑调用 AI 来做学习报告的决策和规划。1.ai动态学情分析传统的统计只能从数字分析无法动态给出后续采取的方法。所以我引入大模型来给出动态的分析把大模型包装成一名考研总复习规划专家实时提取底层的核心概览等结构化数据注入 Prompt让它给考生输出一份专业的学情分析与后续主线任务规划。2. Top1 薄弱点快捷互动指令除了针对薄弱和掌握点的学情分析报告又设计了Top1薄弱点的快捷互动泡泡。点击考点深度解剖按钮后大模型会调取该考点在历年真题中的考察题型与分值分布同时卡片下方会直接显示大模型给出的专项主线任务规划要求包含三个具体的复习阶段与时间节点真正实现了薄弱点挖掘--深度解剖--薄弱练习的闭环帮助考生看清未来的复习路径。总结在各个功能的落地中我最大的体会是工程逻辑与 AI 决策的互补性。不能盲目地把所有数据处理都推给大模型而是用传统的 SQL 聚合提供最精准的数字用数学公式解决数据稀疏等各类问题最后把高层次的文本分析、快捷泡泡互动以及专项组卷路径重组交给大模型发挥。这种结构设计既保证了系统的稳健又发挥了 AI 的自适应优势真正满足了考生长期复习 408 时的需求。
创新实训开发日志:研途Buddy(七)
发布时间:2026/6/6 12:30:41
刷题统计与智能学习报告中心的设计与实现在完成了刷题模式下的 AI 错因分析、自适应主观题阅卷与相似题生成后系统已经在单道题目上形成了良好的教学闭环。然而当刷题量从几十道变成几百道乃至覆盖到 408 统考四大科目即数据结构、计算机组成原理、操作系统、计算机网络的庞大知识体系时零散的刷题记录需要被整合分析。 考生面对成百上千条对错记录依然无法看清自己的复习现状也难以在大后期制定出精确到天的冲刺计划。因此本阶段的核心任务是从零构建刷题统计与智能学习报告中心。以下是我在开发这些功能小点时需求推演、技术选型以及大模型落地过程中的真实思考。一、 基础量化构建核心数据统计1. 考生需求408 考研是一场持久战考生在复习中很容易产生两种极端心态1盲目乐观 刷了几十道简单题就觉得科目复习得差不多了。2过度焦虑 碰上几道复杂的大题连着错就觉得自己今年考不上了。为了打破这种主观盲目性考虑在统计页面要给考生提供几个重要的量化指标1累计刷题总数让考生对自己的总工作量心里有数。这里在后端我直接对做题记录表Record进行聚合统计通过对用户 ID 和考试模式进行计数。2综合平均正确率可以直观反映当前的掌握水平也是通过做题记录表进行计算统计的。3累计精力花费时长把做题数量转化为时间维度判断用户的精力与能力。为了强化复习进度的判断这里定义了一个简单合理的精力消耗公式总消耗分钟数 总刷题数 x 3。把冰冷的题目数字转化为专注时间在心理上能帮考生稳定备考心态踏踏实实看到自己的沉淀。2.近一周 408 刷题状态与正确率波动在核心统计之外对考生来说动态地统计最近 7 天的复习节奏与状态波动也是必要的。于是在这里设计了一个动态的折线柱状混合图表。1每日刷题数量量化柱状图提取近 7 天内该用户的所有做题记录初始化近7天的时间。将每天的答题总数聚合统计后映射为图表中的柱状高度。考生可以清晰看到周一到周日自己哪天刷题最猛哪天复习出现了懈怠。2每日正确率起伏走势折线图在柱状图的基础上叠加了一条折线图走势线用来反映每天的做题正确率变动趋势。通过柱状图与折线图的结合考生能一眼看出自己近期的掌握状态是质量和数量都保证的良性循环还是疲劳的低效刷题从而动态微调第二天的复习节奏。3. 408 四大科目复习刷题明细盘考虑到考生需要知道自己在数据结构、计组、操作系统、计网这四个科目中每个科目到底各自刷了多少道题各自的对错分布是什么样的。所以对做题表按照四大科目进行分组提取出每个科目下独立的总做题数、正确题目数和错误题目数。并计算了该科目的正确率。利用前端进度条进行可视化展示考生看到四大科目的阶梯差距彻底扫除复习时的盲区。二、 408科目正确率雷达图可视化在做数据结构、计组、操作系统、计网这四大科目的胜率雷达图时我遇到了问题新用户的数据极其稀疏。如果一个用户刚注册或者刚开始一轮复习如果直接拿数据库里的真实正确率去前端渲染雷达图图表会严重变形比如数据结构 100%其余全打底。这种图表不仅没有参考价值还很影响用户体验。这里解决方案是设计了一套基于 408 常规难度的自适应动态拟合算法。首先根据历年统考的难度分布设定了四大科目的初始基准线数据结构为75% 、计算机网络为70%、操作系统为60%和计算机组成原理为55%。引入了题量动态加权公式来计算最终的展示准确率当用户在系统中的总做题数 N 200道时我们认为样本较小容易失真。此时启用动态拟合当用户总做题数 N ≥200 道时自动衰减为 0系统完全展现百分之百由数据库采集的真实表现。最终展示正确率x 常规模拟基准线 (1 -) x 用户真实刷题正确率另外在科目分类上在采集数据时就已经严格清洗了剔除了其它这种边缘分类。因为 408 统考大纲只有四大硬核科目保持类别的纯净感能让报告显得更专业。在雷达图可视化上当用户鼠标悬浮在雷达图时动态气泡框会清晰展示各科目的正确率。三、 长期统计分析1. 12周自律打卡状态为了引导考生建立每日迭代的习惯我们在前端复刻了类似力扣的打卡热力图墙。 用户可以每天签到打卡系统提取用户近 90 天的真实轨迹根据每日的刷题数和签到动作映射为小色块。其中设置了四个不同浓度的绿色像素块。绿色变浓是刷题数的量化能给考生正向心理暗示而空白的色块则能警醒考生及时补上用视觉引导考生自律。2. 近期薄弱考点排行统计不仅要展示好的一面更要展示需要改进的刷题上的漏洞点。系统对知识点进行精细化聚合按照正确率升序、做题数降序的原则筛选出排名前5的严重薄弱点。同时设置了自适应诊断评级系统根据薄弱点的真实正确率划分了诊断评级与解决方法。评级包含薄弱和极度危险解决方法是启动薄弱知识点重做机制。 利用系统的 AI 相似题生成功能进行同考点、换参数的方法来加强薄弱知识点掌握。四、 大模型 AI 学情分析与自适应交互前期的统计是静态的无法动态说明复习路径。所以这里我考虑调用 AI 来做学习报告的决策和规划。1.ai动态学情分析传统的统计只能从数字分析无法动态给出后续采取的方法。所以我引入大模型来给出动态的分析把大模型包装成一名考研总复习规划专家实时提取底层的核心概览等结构化数据注入 Prompt让它给考生输出一份专业的学情分析与后续主线任务规划。2. Top1 薄弱点快捷互动指令除了针对薄弱和掌握点的学情分析报告又设计了Top1薄弱点的快捷互动泡泡。点击考点深度解剖按钮后大模型会调取该考点在历年真题中的考察题型与分值分布同时卡片下方会直接显示大模型给出的专项主线任务规划要求包含三个具体的复习阶段与时间节点真正实现了薄弱点挖掘--深度解剖--薄弱练习的闭环帮助考生看清未来的复习路径。总结在各个功能的落地中我最大的体会是工程逻辑与 AI 决策的互补性。不能盲目地把所有数据处理都推给大模型而是用传统的 SQL 聚合提供最精准的数字用数学公式解决数据稀疏等各类问题最后把高层次的文本分析、快捷泡泡互动以及专项组卷路径重组交给大模型发挥。这种结构设计既保证了系统的稳健又发挥了 AI 的自适应优势真正满足了考生长期复习 408 时的需求。