实战演练：实现一个“声控”待办事项应用

发布时间：2026/6/8 20:41:38

推荐一个学习网站http://easelearningai.com 输入学习主题会根据你的知识背景帮你把学习内容讲得通俗易懂。实战演练实现一个“声控”待办事项应用引言从“点击”到“对话”的交互革命简单说声控待办应用就是让你的待办清单从“打字输入”变成“开口说话”。想象一下这个场景你正在厨房炒菜满手油污突然想起要提醒自己“明天下午三点开会”。传统做法是擦手→找手机→解锁→打开待办应用→找到添加按钮→打字输入→保存。整个过程至少需要10秒而且手还会弄脏手机。现在换一种方式你直接对着空气说一句“帮我记一下明天下午三点开会。”——浏览器立刻识别出你的声音自动提取出“明天下午三点”这个时间点和“开会”这个任务干净利落地添加到待办列表里。整个过程不到2秒你甚至不需要停下手中的锅铲。这就是从“点击”到“对话”的交互革命。传统前端交互就像你对着一个只会点头摇头的机器人而声控交互就像你有了一个随时待命的助理。3.1 项目初始化与基础设置简单说这一步就是给我们的“声控助理”搭建一个干净的工作台。从零开始就像搭积木想象你要建一个智能厨房首先得有个厨房HTML框架然后要有灶台和厨具CSS样式最后才是连接水电煤气JavaScript逻辑。我们的声控待办应用也是这个道理。第一步创建项目骨架!DOCTYPE html html langzh-CN head meta charsetUTF-8 meta nameviewport contentwidthdevice-width, initial-scale1.0 title声控待办 - 你的语音助手/title style /* 这里放样式让界面看起来干净、友好 */ /style /head body div idapp h1 声控待办/h1 div idvoice-status点击麦克风开始说话/div ul idtodo-list/ul /div script srcapp.js/script /body /html第二步准备“耳朵”和“嘴巴”在JavaScript里我们需要检查浏览器是否支持语音功能。就像检查厨房有没有通水电一样// 检查浏览器是否支持语音识别耳朵 if (!(webkitSpeechRecognition in window) !(SpeechRecognition in window)) { alert(抱歉你的浏览器还不支持语音识别请使用Chrome浏览器); } // 检查浏览器是否支持语音合成嘴巴 if (!(speechSynthesis in window)) { alert(你的浏览器不支持语音合成无法听到反馈); }关键点目前语音识别功能在Chrome浏览器上支持最好其他浏览器可能需要降级方案比如显示文字提示“请使用Chrome”。这就像有些菜谱需要特定厨具没有的话可以用替代方案。3.2 集成语音识别与合成简单说这一步就是给浏览器装上“耳朵”和“嘴巴”让它能听懂你说的话也能开口回应你。让浏览器“长耳朵”还记得小时候玩的对讲机吗按下按钮说话松开按钮听。语音识别也是类似的原理——我们通过一个按钮来控制“听”的开关。// 创建语音识别对象给浏览器装耳朵 const recognition new (window.SpeechRecognition || window.webkitSpeechRecognition)(); // 设置语言为中文 recognition.lang zh-CN; // 设置连续识别模式就像一直开着对讲机 recognition.continuous true; // 当浏览器“听到”声音时触发 recognition.onresult function(event) { // 获取识别到的文字 const transcript event.results[event.results.length - 1][0].transcript; console.log(你说的是, transcript); // 把文字显示在界面上 document.getElementById(voice-status).textContent 你说的是 transcript; // 接下来要处理这个指令 processCommand(transcript); }; // 点击按钮开始“听” document.getElementById(start-btn).addEventListener(click, function() { recognition.start(); document.getElementById(voice-status).textContent 正在听...; });生活类比这就像你给手机装了个“语音备忘录”功能——按下录音键它就开始听你说话然后把你说的话转成文字显示出来。让浏览器“长嘴巴”光能听还不够还得能回应。语音合成Speech Synthesis就是让浏览器开口说话// 让浏览器开口说话的函数 function speak(text) { // 创建一个语音合成对象 const utterance new SpeechSynthesisUtterance(text); // 设置中文语音 utterance.lang zh-CN; // 设置语速0.1最慢1正常10最快 utterance.rate 1.0; // 设置音调0最低2最高 utterance.pitch 1.0; // 让浏览器开口 window.speechSynthesis.speak(utterance); } // 使用示例 speak(好的任务已添加);生活类比这就像你手机里的导航语音——你输入目的地它就用语音告诉你“前方300米右转”。3.3 实现核心指令简单说这一步就是教浏览器理解你的“人话”把它变成它能执行的“机器指令”。指令解析从“人话”到“机器话”想象一下你对朋友说“帮我记一下明天下午三点开会。”朋友会怎么做他会提取出关键信息动作是“添加”内容是“开会”时间是“明天下午三点”。我们的程序也要做同样的事。但计算机不像人那么聪明它需要明确的规则// 待办事项数据 let todos []; // 处理语音指令的核心函数 function processCommand(transcript) { // 把语音转成的文字变成小写方便匹配 const command transcript.toLowerCase(); // 1. 添加任务指令 if (command.includes(添加) || command.includes(记一下) || command.includes(新增)) { // 提取任务内容去掉指令词剩下的就是任务 let taskContent command.replace(/添加|记一下|新增|帮我/g, ).trim(); if (taskContent) { addTodo(taskContent); speak(好的已添加任务 taskContent); } else { speak(请告诉我需要添加什么任务); } } // 2. 标记完成指令 else if (command.includes(完成) || command.includes(搞定) || command.includes(做完了)) { // 提取任务编号或内容 let taskNumber extractNumber(command); if (taskNumber) { completeTodo(taskNumber); speak(任务 taskNumber 已标记完成); } else { // 尝试匹配任务内容 let matchedTodo findTodoByContent(command); if (matchedTodo) { completeTodo(matchedTodo.id); speak(已标记完成 matchedTodo.content); } else { speak(没有找到对应的任务请再说一遍); } } } // 3. 删除指令 else if (command.includes(删除) || command.includes(移除) || command.includes(去掉)) { let taskNumber extractNumber(command); if (taskNumber) { deleteTodo(taskNumber); speak(已删除任务 taskNumber); } else { speak(请告诉我需要删除哪个任务比如“删除第一个”); } } // 4. 查看列表指令 else if (command.includes(查看) || command.includes(显示) || command.includes(有什么)) { if (todos.length 0) { speak(当前没有待办事项); } else { let todoList todos.map((todo, index) 第${index 1}个${todo.content}${todo.completed ? 已完成 : 未完成} ).join(); speak(当前有 todos.length 个任务 todoList); } } // 5. 模糊指令处理 else { speak(抱歉我没有理解您的指令。您可以尝试说添加任务、完成第一个、查看列表); } }生活类比这就像你给新来的实习生下指令。一开始他可能听不懂“把那个弄一下”但如果你说“请把第三行的数据复制到表格里”他就能准确执行。我们的程序也需要明确的指令格式。核心操作函数// 添加任务 function addTodo(content) { const todo { id: Date.now(), // 用当前时间作为唯一编号 content: content, completed: false, createdAt: new Date() }; todos.push(todo); renderTodoList(); // 刷新界面显示 } // 标记完成 function completeTodo(id) { const todo todos.find(t t.id id); if (todo) { todo.completed !todo.completed; // 切换完成状态 renderTodoList(); } } // 删除任务 function deleteTodo(id) { todos todos.filter(t t.id ! id); renderTodoList(); } // 渲染待办列表显示在网页上 function renderTodoList() { const list document.getElementById(todo-list); list.innerHTML ; todos.forEach((todo, index) { const li document.createElement(li); li.textContent ${index 1}. ${todo.content} ${todo.completed ? ✅ : ⬜}; list.appendChild(li); }); }3.4 添加可视化反馈与错误处理简单说这一步就是让用户知道“浏览器正在做什么”以及“出了什么问题”。为什么需要可视化反馈想象一下你对朋友说“帮我拿杯水”然后朋友一声不吭地走了。你会不会有点慌他听到了吗他去拿水了吗还是根本没理我同样当用户对浏览器说话时它需要给出明确的反馈正在听显示麦克风图标闪烁听懂了显示识别到的文字正在执行显示操作动画执行完成显示成功提示没听懂显示错误信息并引导重试实现反馈系统!-- 在HTML中添加反馈区域 -- div idfeedback-panel div idmic-status span idmic-icon/span span idmic-text点击开始说话/span /div div idrecognized-text styledisplay:none; 你说的是span idtext-display/span /div div idaction-feedback styledisplay:none; span idaction-icon✅/span span idaction-text/span /div div iderror-feedback styledisplay:none; color: #e74c3c; ⚠️ span iderror-text/span /div /div// 更新麦克风状态 function updateMicStatus(status) { const icon document.getElementById(mic-icon); const text document.getElementById(mic-text); switch(status) { case listening: icon.textContent ; text.textContent 正在听...; icon.style.animation pulse 1s infinite; // 脉冲动画 break; case processing: icon.textContent ; text.textContent 正在处理...; break; case idle: icon.textContent ; text.textContent 点击开始说话; icon.style.animation none; break; } } // 显示识别到的文字 function showRecognizedText(text) { document.getElementById(text-display).textContent text; document.getElementById(recognized-text).style.display block; // 3秒后自动隐藏 setTimeout(() { document.getElementById(recognized-text).style.display none; }, 3000); } // 显示操作反馈 function showActionFeedback(message, type success) { const icon document.getElementById(action-icon); const text document.getElementById(action-text); icon.textContent type success ? ✅ : ❌; text.textContent message; document.getElementById(action-feedback).style.display block; // 2秒后自动隐藏 setTimeout(() { document.getElementById(action-feedback).style.display none; }, 2000); } // 显示错误信息 function showError(message) { document.getElementById(error-text).textContent message; document.getElementById(error-feedback).style.display block; // 5秒后自动隐藏 setTimeout(() { document.getElementById(error-feedback).style.display none; }, 5000); } // 错误处理语音识别失败时 recognition.onerror function(event) { console.error(语音识别错误, event.error); updateMicStatus(idle); let errorMessage ; switch(event.error) { case no-speech: errorMessage 没有检测到语音请再试一次; break; case audio-capture: errorMessage 麦克风被禁用请在浏览器设置中允许麦克风权限; break; case not-allowed: errorMessage 麦克风权限被拒绝请点击地址栏左侧的锁图标开启权限; break; default: errorMessage 出现未知错误请刷新页面重试; } showError(errorMessage); speak(errorMessage); // 语音提示错误 };生活类比这就像你家的智能音箱——你说“播放音乐”它会先亮一圈蓝灯表示“听到了”然后说“好的正在播放周杰伦的歌曲”最后才开始播放。每一步都有明确的反馈让你知道系统正在做什么。完整工作流程现在让我们把所有的部分串联起来看看用户实际使用时的完整流程用户点击麦克风按钮→ 按钮变成红色显示“正在听...”麦克风图标开始脉冲闪烁用户说“添加任务明天下午三点开会”→ 浏览器实时将语音转成文字显示在屏幕上程序解析指令→ 识别出“添加”动作和“明天下午三点开会”内容执行操作→ 将任务添加到待办列表列表自动刷新显示新任务语音反馈→ 浏览器说“好的已添加任务明天下午三点开会”视觉反馈→ 新添加的任务高亮闪烁2秒然后恢复正常自动重置→ 麦克风自动恢复待命状态准备接收下一条指令这就是一个完整的“声控待办应用”的核心实现。你不需要任何特殊的硬件只需要一个支持Web Speech API的浏览器比如Chrome就能让你的待办应用从“手动挡”升级为“自动挡”。小结与思考通过这个实战演练你其实已经掌握了三个核心能力让浏览器听语音识别——把声音变成文字让浏览器懂指令解析——从文字中提取意图和参数让浏览器说语音合成——用声音反馈操作结果思考题如果你想让这个应用更智能比如支持“把第三个任务改成明天”这样的复杂指令你需要怎么改进指令解析逻辑提示可能需要引入更高级的自然语言处理技术比如用正则表达式提取时间信息或者用简单的NLP库进行意图分类。下一步你可以尝试给这个应用添加更多功能比如语音修改任务“把开会改成培训”语音查询任务“我今天有什么任务”语音排序任务“把最重要的放在最上面”记住技术的魅力不在于它有多复杂而在于它能让生活变得多简单。你现在已经掌握了让浏览器“听话”的魔法去创造更多让用户惊叹的体验吧

企业级多人开发框架（多界面websocket通信）

完整版 Qt5.9 + MSVC2015_64 企业级多人开发框架（可直接复制编译运行）包含：6 个模块 DLL + 主程序 + WebSocket 测试服务端，全套完整无缺失直接复制 → 新建文件 → 编译 → 运行一、总工程 EnterpriseDLL.pro qmake TEMPLATE = subdirs CONFIG += orderedSUBDIRS +…

2026/6/8 20:41:17 阅读更多

惠普暗影精灵笔记本硬件控制解决方案：OmenSuperHub深度技术解析

惠普暗影精灵笔记本硬件控制解决方案：OmenSuperHub深度技术解析【免费下载链接】OmenSuperHub Control Omen laptop performance, fan speeds, and keyboard lighting, and unlock power limits. 项目地址: https://gitcode.com/gh_mirrors/om/OmenSuperHub …

2026/6/8 20:40:17 阅读更多

告别复杂命令行：PortProxyGUI - Windows端口转发管理的终极图形化解决方案

告别复杂命令行：PortProxyGUI - Windows端口转发管理的终极图形化解决方案【免费下载链接】PortProxyGUI A manager of netsh interface portproxy which is to evaluate TCP/IP port redirect on windows. 项目地址: https://gitcode.com/gh_mirrors/po/PortPro…

2026/6/8 20:40:16 阅读更多

合并采集数据图片进展AI识别

数显千分表测量泵箱步进精度使用数显千分表矫正泵箱进程【合并采集数据图片】采集程序 #!/usr/local/bin/python # -*- coding: gbk -*- # # TEST1.PY -- by Dr. ZhuoQing 2026-06-08 # # Note: #from headm import * import serial from _ast import …

2026/6/8 21:57:53 阅读更多

摆脱论文困扰!2026年好用AI论文网站榜单，毕业论文免费写还合规

2026 年实测 10 款主流 AI 论文工具，千笔AI以全流程覆盖语义级降重免费查重领跑综合榜；ThouPen 稳坐留学生毕业全流程工具头把交椅；免费工具中DeepSeek Scholar、豆包学术版表现亮眼，30 分钟即可生成万字高质量初稿&#xff0…

2026/6/8 21:57:53 阅读更多

AI-Shoujo HF Patch终极指南：一站式游戏增强解决方案 [特殊字符]

AI-Shoujo HF Patch终极指南：一站式游戏增强解决方案 🎮 【免费下载链接】AI-HF_Patch Automatically translate, uncensor and update AI-Shoujo! 项目地址: https://gitcode.com/gh_mirrors/ai/AI-HF_Patch AI-Shoujo HF Patch是一款专为AI-Sho…

2026/6/8 21:57:53 阅读更多

九十年代至2000年初：底层沉默的苦难纪

九十年代至2000年初：底层沉默的苦难纪这是一段极少被详细记述，却刻在无数普通家庭骨血里的民间往事。改革开放放开人口流动，亿万农民第一次挣脱土地，奔赴城市、深山矿区、乡间小作坊讨生计。彼时没有智能手机、全域监控、全国联网…

2026/6/8 21:57:12 阅读更多

深入SM4算法S盒：用C语言手动实现查表与优化技巧

深入SM4算法S盒：用C语言手动实现查表与优化技巧在密码学领域，分组密码算法的核心组件往往决定了整个系统的安全性和性能。SM4作为我国自主设计的商用密码标准算法，其S盒（Substitution-box）作为唯一的非线性部件&#x…

2026/6/8 21:56:30 阅读更多

深入浅出图解HDFS透明加密：从KMS、EZ Key到EDEK，一次搞懂密钥流转全过程

深入浅出图解HDFS透明加密：从KMS、EZ Key到EDEK，一次搞懂密钥流转全过程在大数据生态系统中，数据安全始终是重中之重。想象一下，当你的数据节点被物理入侵，攻击者直接访问磁盘上的数据块时，如何确保敏感信息…

2026/6/8 21:56:10 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/8 9:43:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/8 9:43:23 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/8 9:43:30 阅读更多

相关文章

企业级多人开发框架（多界面websocket通信）

惠普暗影精灵笔记本硬件控制解决方案：OmenSuperHub深度技术解析

告别复杂命令行：PortProxyGUI - Windows端口转发管理的终极图形化解决方案

合并采集数据图片进展AI识别

摆脱论文困扰!2026年好用AI论文网站榜单，毕业论文免费写还合规

AI-Shoujo HF Patch终极指南：一站式游戏增强解决方案 [特殊字符]

九十年代至2000年初：底层沉默的苦难纪

深入SM4算法S盒：用C语言手动实现查表与优化技巧

深入浅出图解HDFS透明加密：从KMS、EZ Key到EDEK，一次搞懂密钥流转全过程

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因