学生用户画像-考勤主题扩展标签构建、可视化实验文档

发布时间：2026/5/27 5:34:08

学生用户画像考勤主题扩展标签构建与可视化一、实验名称实验课3学生用户画像-考勤主题扩展标签构建、可视化。二、实验目的基于 student_attendance_stats 学生考勤主题标签表使用 K-Means 对迟到、早退、请假、没穿校服等行为指标进行自动分群。将聚类簇编号解释为可理解的考勤群体标签并回写 cluster、attendance_group 扩展字段。在助睿 BI 中基于 se_group_20 私有库构建数据集、工作表和仪表盘完成纪律高危型学生画像分析。通过性别、年级、校区、班级等维度识别纪律高危型学生分布特征为精细化管理提供数据依据。三、实验环境项目说明平台贵兰 X 助睿实践教学平台https://lab.guilan.cn/教程https://community.uniplore.com/t/topic/76https://community.uniplore.com/t/topic/77项目使用继续使用已有“学生用户画像标签构建”项目未新建无关项目。数据库团队私有库 se_group_20不使用公共示例库作为最终数据源。核心表student_cluster、student_attendance_stats四、实验数据说明实验数据来自 se_group_20 中的学生考勤主题表。student_attendance_stats 汇总学生信息、班级、年级、校区类型、迟到次数、早退次数、请假次数、没穿校服次数等字段K-Means 输出写入 student_cluster 后再通过扩展标签转换流回写到 student_attendance_stats。表名用途raw_student_info学生基础信息来源表。raw_attendance学生考勤记录来源表。raw_attendance_type考勤类型字典表。student_clusterK-Means 聚类结果表保存学生ID、班级ID、Cluster。student_attendance_stats考勤主题标签表作为扩展标签回写和可视化分析的数据集来源。五、实验步骤1.进入已有项目登录平台后进入“数据集成”继续使用已有项目“学生用户画像标签构建”。该项目包含创建主题表、导入原始数据、学生考勤主题标签、增加考勤群体分类标签等转换流。图1 登录账号后进入数据集成项目列表。图2 进入已有项目中的“增加考勤群体分类标签”转换流。2. 构建考勤主题表与 K-Means 聚类先执行学生考勤主题标签转换流生成或更新 student_attendance_stats随后在人工智能模块配置 K-Means 工作流固定聚类数为 3并将结果写入 se_group_20.student_cluster。图3 学生考勤主题标签转换流画布。图4 转换流执行日志显示成功。图5 AI 工作流数据库加载、K-Means、数据入库。图6 K-Means 参数设置为固定 3 簇。图7 数据入库目标表配置为 se_group_20.student_cluster。图8 AI 工作流任务运行成功。图9 student_cluster 预览可见聚类输出结果。3.聚类解释与扩展标签回写教程 76 要求先观察聚类结果再将机器生成的 C1/C2/C3 转换为业务标签。本实验在可视化探索中配置六组“两两指标聚类簇编号”的聚类解释圆点图标记类型选择“圆”颜色编码选择“聚类簇编号”用于判断不同簇在迟到、早退、请假、没穿校服上的差异。图10 迟到次数与早退次数按聚类簇编号对照。图11 迟到次数与请假次数按聚类簇编号对照。图12 迟到次数与没穿校服次数按聚类簇编号对照。图13 早退次数与请假次数按聚类簇编号对照。图14 早退次数与没穿校服次数按聚类簇编号对照。图15 请假次数与没穿校服次数按聚类簇编号对照。按教程后续值映射步骤配置C1轻微波动型C2自律模范型C3纪律高危型以值映射组件最终配置为准。随后更新组件将 Cluster 与 attendance_group 回写到 student_attendance_stats。图16 值映射组件配置Cluster 映射为 attendance_group。图17 更新组件配置目标库 se_group_20目标表 student_attendance_stats。图18 更新组件关键字与更新字段配置。图19 数据视图验证聚类簇编号与考勤群体分类均已有实际值。4.配置 BI 数据源与数据集教程 77 的可视化数据集基于 se_group_20.student_attendance_stats。创建 MySQL 数据源并测试连接成功后在数据集中选择该表保存发布为“考勤画像数据集”。图20 MySQL 数据源配置指向团队私有库 se_group_20。图21 数据源连接测试成功。图22 数据集选择 se_group_20 中的 student_attendance_stats。图23 数据集字段和预览数据。图24 已发布的“考勤画像数据集”在数据集列表中可预览。5.纪律高危型可视化工作表可视化分析统一筛选 attendance_group 纪律高危型。人数类指标使用“学生ID”的去重计数避免将学生ID求和。图25 筛选器配置为仅选择“纪律高危型”。图26 纪律高危型总人数指标卡去重计数结果为 715。图27 纪律高危型性别占比饼图。图28 纪律高危型年级分布柱状图。图29 校区类型与年级交叉堆叠柱状图。图30 纪律高危型班级分布水平条图。图31 工作表发布/保存成功。6.综合仪表盘在仪表盘模块进入“纪律高危型学生画像综合仪表盘”将前述总人数、性别占比、校区年级交叉、年级分布和班级分布等内容集中到同一画布中。画布截图可同时看到多个组件列表预览截图用于证明发布后的综合效果分享入口截图用于证明仪表盘可按平台流程继续分享。图32 仪表盘编辑器左侧可见已保存的多个可视化工作表资源。图33 综合仪表盘编辑画布总人数、性别饼图、校区年级交叉图、年级柱状图和班级分布组件集中展示。图34 仪表盘发布保存后编辑时间更新且画布保持综合组件。图35 仪表盘列表预览效果可同时看到多个可视化组件。图36 仪表盘分享入口。六、关键配置说明配置项本实验配置说明目标数据库se_group_20使用本人小组私有库避免读取公共库或其他组数据。聚类输出表student_cluster保存 K-Means 输出的学生聚类簇。回写目标表student_attendance_stats最终画像主题表也是 BI 数据集来源。值映射C1轻微波动型C2自律模范型C3纪律高危型按教程后续值映射步骤和组件最终配置执行。可视化筛选attendance_group 纪律高危型聚焦教程 77 的目标学生群体。人数口径学生ID 去重计数用于指标卡、饼图、柱状图和条图的人数统计。七、查询/运行验证ETL 转换流和 AI 工作流均已运行成功student_cluster 可预览聚类结果student_attendance_stats 的数据视图可看到 cluster 与 attendance_group 的实际值。纪律高危型总人数为 715性别占比中未知性别占比较高男、女样本量较小说明基础信息中性别字段仍需进一步治理。在班级分布中高三(09)、高三(13)、高二(11)等班级人数较高说明纪律高危型学生存在一定班级聚集现象。八、可视化结果分析从性别看未知性别占比较高因此性别图更适合作为数据质量和画像维度完整性的提示正式管理分析前应补齐或规范性别字段。从年级看纪律高危型学生集中在高二、高三需要结合升学压力、课程安排和班级管理差异进一步分析。从校区与年级交叉看不同校区的高危学生分布存在差异可按校区配置不同的考勤管理策略。从班级看部分班级高危人数明显靠前后续可对这些班级进一步下钻到学生和异常考勤类型层面制定更具体的干预措施。九、实验总结本次实验的关键是把 K-Means 聚类、聚类解释、值映射、扩展标签回写、BI 数据集和可视化分析串成完整闭环。数据库必须使用 se_group_20 私有库数据集必须基于 student_attendance_stats人数统计必须使用学生ID去重计数。若误用公共库、其他小组库或学生ID求和都会导致数据异常。通过纪律高危型画像分析可以从总量、性别、年级、校区、班级等角度识别重点关注群体。聚类标签使原始考勤记录转化为可解释、可管理的学生画像标签为校园考勤管理和后续干预提供了数据支撑。

2026年，灵芝鸡蛋真的靠谱吗？揭秘营养价值与选购秘诀！

2026年，灵芝鸡蛋真的靠谱吗？揭秘营养价值与选购秘诀！在健康意识日益觉醒的当下，我们对日常饮食的追求，早已不再满足于温饱。从有机蔬菜到低脂牛奶，每一个餐桌上的选择，都承载着我们对更高品质生…

2026/5/27 5:33:07 阅读更多

进程与特殊进程

1. 进程基础概念进程的定义：进程是操作系统中的一次执行过程，它是操作系统进行资源分配和调度的最小单位。进程的核心特征1.动态性：进程的实质是程序在多道程序系统中的一次执行过程，进程是动态产生，动态消亡的&#x…

2026/5/27 5:31:25 阅读更多

火爆全网的“AI中医”，99%都没有这个证？

一文读懂AI中医赛道持证真相华为、问止、脉景……名字一个比一个响，但国家药监局官网一查，真正“持证上岗”的竟然只有个位数。近年来，“AI中医”成了资本与科技巨头争相布局的热门赛道。从“神农大脑”到“中医大脑”，从大模型到…

2026/5/27 5:31:25 阅读更多

基于Docsify构建AI智能体知识库：轻量级RAG数据源实践

1. 项目概述：为什么选择 Docsify 为 AI 智能体构建知识库？ 最近在折腾一个挺有意思的项目：为 AI 智能体（AI Agent）搭建一个专属的知识库。你可能听说过 RAG（检索增强生成），或者看过…

2026/5/27 6:26:36 阅读更多

非技术创始人实战：基于AI网关的LLM智能路由与成本优化

1. 项目概述：一个非技术背景创始人的AI网关构建之旅大家好，我是来自阿根廷的独立创业者。在开始之前，我想先坦诚地告诉大家：我不是工程师，甚至可以说我的技术背景几乎为零。但就在最近，我亲手构建了一个名为…

2026/5/27 6:26:36 阅读更多

神经形态计算与脑机接口的技术融合与应用

1. 神经形态计算与脑机接口的技术融合全景神经形态计算正经历从实验室原型到产业落地的关键转折期。根据Intel 2024年最新报告，其Loihi 2芯片已实现128个神经核心集成，支持超过100万个可编程神经元，能效比传统GPU提升达1000倍。这种突破性进展…

2026/5/27 6:26:15 阅读更多

基于Whisper与Ollama的本地语音AI助手：从原理到实践

1. 项目概述：让AI听懂你的话，并为你做事最近在折腾一个挺有意思的东西：一个完全在本地运行的、能听懂你说话并执行任务的AI助手。想象一下，你对着电脑说一句“帮我总结一下上周的销售报告”，它就能自动打开文档、分析内…

2026/5/27 6:25:35 阅读更多

对接LangSmith

1、配置和注册注册---点击设置---即可配置api key 配置---在env加入如下代码 # langsmith LANGSMITH_API_KEY LANGSMITH_TRACINGtrue #自动跟踪流程都可以健康 LANGSMITH_PROJECTlangchain-course #名称 2、本地部署 uv安装 uv add langgraph-cli[inmem] 如果是基于La…

2026/5/27 6:25:15 阅读更多

DynamIQ ACP访问机制与缓存一致性优化实践

1. ACP访问机制概述在DynamIQ共享单元(DSU)架构中，ACP(Accelerator Coherency Port)作为外部设备访问缓存子系统的关键接口，提供了两种不同的访问模式：常规(non-stashed)访问和stashed访问。这两种机制虽然最终都能实现对L3缓存的访问&#x…

2026/5/27 6:24:33 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/26 15:11:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/26 11:18:30 阅读更多

相关文章