中文医疗对话数据集破解医疗AI语料稀缺困局的技术突破与实践指南【免费下载链接】Chinese-medical-dialogue-dataChinese medical dialogue data 中文医疗对话数据集项目地址: https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data在人工智能与医疗健康深度融合的时代医疗大语言模型的发展正面临一个核心瓶颈高质量、大规模、专业化的中文医疗对话数据极度匮乏。传统医疗数据集往往规模有限、领域覆盖狭窄、专业深度不足严重制约了医疗AI模型的性能提升。中文医疗对话数据集的出现为这一困境提供了突破性的解决方案79.2万条真实医患对话构成的黄金语料库正在重新定义医疗AI的训练范式。技术挑战医疗AI发展的三大核心瓶颈数据稀缺性与专业性的矛盾医疗领域的特殊性决定了数据收集的困难性。一方面患者隐私保护法规严格限制了医疗数据的流通另一方面专业医疗知识需要医学专家参与标注成本高昂且效率低下。传统数据集往往只能覆盖单一科室或疾病类型难以支撑全科医疗AI模型的训练需求。对话质量与真实性的平衡医疗对话不仅需要专业准确性还需要体现真实的医患交流场景。如何在保证医学知识正确性的同时保持对话的自然流畅性是数据集构建的关键挑战。过度标准化会失去真实感过于随意则可能引入错误信息。多科室协同与知识融合医疗实践涉及多科室协作一个症状可能关联多个专科领域。如何构建既能体现专科深度又能支持跨科室知识迁移的对话数据集是技术实现上的重大难题。创新突破79.2万条对话的黄金语料库构建结构化数据架构设计中文医疗对话数据集采用精心设计的四字段结构每个问答对都构成了完整的诊疗单元# 数据架构核心设计 medical_dialogue { department: 心血管科, # 科室分类 title: 高血压患者能吃党参吗, # 问题标题 ask: 我有高血压这两天女婿来的时候给我拿了些党参泡水喝..., # 患者描述 answer: 高血压病人可以口服党参的。党参有降血脂... # 医生专业回复 }这种结构不仅便于模型训练更为构建医疗知识图谱提供了天然的三元组基础(科室, 症状, 治疗方案)。六大科室的均衡覆盖策略数据集通过科学的比例分配实现了广度与深度的完美平衡科室领域数据规模专业特性应用场景内科220,606条慢性病管理、综合诊断日常健康咨询、慢性病管理妇产科183,751条女性健康、孕产护理女性专科咨询、孕期指导外科115,991条手术治疗、创伤处理术后康复指导、创伤处理儿科101,602条儿童疾病、生长发育儿童健康管理、疾病预防男科94,596条男性专科、生殖健康男性健康咨询、生殖指导肿瘤科75,553条癌症诊疗、化疗方案肿瘤治疗方案咨询质量保障的三重过滤机制为确保数据质量项目团队实施了严格的质量控制流程专业术语标准化统一医学术语表述消除歧义对话长度优化问答对控制在200字符内确保信息密度上下文完整性验证每个问答对构成完整的诊疗逻辑链实战指南三步法构建高性能医疗对话系统第一步数据预处理与格式转换# 数据预处理实战代码 import pandas as pd import json def convert_to_training_format(input_csv, output_jsonl): 将原始CSV转换为模型训练格式 # 读取原始数据注意编码格式 df pd.read_csv(input_csv, encodinggbk) training_samples [] for _, row in df.iterrows(): # 构建指令微调格式 sample { instruction: f现在你是一名{row[department]}医生请根据患者的描述提供专业建议, input: f{row[title]} {row[ask]}, output: row[answer] } training_samples.append(sample) # 保存为JSONL格式 with open(output_jsonl, w, encodingutf-8) as f: for sample in training_samples: f.write(json.dumps(sample, ensure_asciiFalse) \n) return len(training_samples) # 批量处理所有科室数据 departments [内科, 妇产科, 外科, 儿科, 男科, 肿瘤科] total_samples 0 for dept in departments: csv_path fData_数据/{dept}_文件夹/{dept}_数据文件.csv jsonl_path fprocessed_data/{dept}_train.jsonl count convert_to_training_format(csv_path, jsonl_path) total_samples count print(f{dept}科室处理完成{count}条数据) print(f总计处理数据{total_samples}条)第二步参数高效微调技术选型在ChatGLM-6B模型上的实验表明参数高效微调技术能显著提升性能微调策略对比分析P-Tuning V2训练参数占比0.20%BLEU-4提升10.6%LoRA训练参数占比0.06%BLEU-4提升31.2%LoRA-INT8训练参数占比0.06%内存占用减少50%推荐配置方案# LoRA微调配置示例 lora_config { r: 8, # LoRA秩 lora_alpha: 32, # 缩放系数 target_modules: [query, key, value], # 目标模块 lora_dropout: 0.1, # Dropout率 bias: none # 偏置设置 } # 训练参数设置 training_args { per_device_train_batch_size: 4, gradient_accumulation_steps: 8, warmup_steps: 100, max_steps: 1000, learning_rate: 2e-4, fp16: True, # 混合精度训练 logging_steps: 10, save_strategy: steps }第三步部署架构与性能优化医疗对话系统三层架构├── 数据服务层 │ ├── 实时数据预处理 │ ├── 医疗知识检索 │ └── 对话历史管理 ├── 模型推理层 │ ├── 大语言模型引擎 │ ├── 多科室路由模块 │ └── 安全合规检查 └── 应用接口层 ├── RESTful API服务 ├── WebSocket实时对话 └── 批量处理接口性能优化关键技术动态批处理根据请求量自动调整批次大小模型量化INT8量化减少75%内存占用缓存机制常见问题答案缓存提升响应速度并发处理支持高并发医疗咨询场景创新应用医疗AI的四大前沿场景场景一智能分诊与科室推荐基于症状描述自动推荐就诊科室减少患者就医困惑def intelligent_triage(symptom_description): 智能分诊系统核心逻辑 # 症状特征提取 features extract_symptom_features(symptom_description) # 多科室匹配度计算 department_scores {} for dept in medical_knowledge_base.departments: score calculate_matching_score(features, dept) department_scores[dept] score # 排序并返回推荐结果 sorted_departments sorted(department_scores.items(), keylambda x: x[1], reverseTrue) return sorted_departments[:3] # 返回前3个推荐科室场景二慢性病管理助手为高血压、糖尿病等慢性病患者提供个性化管理方案慢性病管理流程 1. 症状监测 → 2. 用药提醒 → 3. 饮食建议 → 4. 运动指导 → 5. 复诊提醒场景三医学教育模拟训练为医学生提供真实的医患对话模拟训练环境class MedicalTrainingSimulator: def __init__(self, department): self.department department self.dialogue_history [] def simulate_consultation(self, patient_scenario): 模拟医患对话训练 # 基于真实对话数据生成训练场景 training_data self.load_training_data() # 动态生成患者描述 patient_desc self.generate_patient_description(patient_scenario) # 模型生成医生回复 doctor_response self.generate_medical_response(patient_desc) # 评估回复质量 quality_score self.evaluate_response(doctor_response) return { patient_scenario: patient_scenario, doctor_response: doctor_response, quality_score: quality_score, improvement_suggestions: self.get_suggestions(quality_score) }场景四多轮对话病情追踪支持连续多轮对话实现病情进展追踪多轮对话示例 患者我最近经常头痛 医生头痛持续多久了什么时间最明显 患者大概一周了下午比较明显 医生有没有伴随恶心、呕吐等症状 患者有时候会有点恶心 医生建议您测量一下血压如果持续需要神经内科就诊技术演进医疗AI的未来发展方向多模态融合技术未来医疗AI将整合文本、影像、实验室数据等多维度信息影像-文本对齐结合医学影像报告生成诊断建议实验室数据集成整合血常规、生化指标等检验数据时间序列分析追踪患者病程变化预测病情发展个性化医疗助手基于用户健康档案的个性化服务用药依从性管理个性化用药提醒与副作用监测生活方式干预基于个人习惯的健康建议风险评估预警早期疾病风险识别与预警隐私保护与联邦学习在保障数据安全的前提下实现模型优化# 联邦学习框架示例 class FederatedMedicalLearning: def __init__(self, hospitals): self.hospitals hospitals self.global_model None def federated_training(self): 联邦学习训练流程 # 1. 初始化全局模型 self.global_model initialize_medical_model() # 2. 分发模型到各医院 for hospital in self.hospitals: hospital.download_model(self.global_model) # 3. 本地训练数据不出院 local_updates [] for hospital in self.hospitals: update hospital.local_training() local_updates.append(update) # 4. 安全聚合更新 aggregated_update secure_aggregation(local_updates) # 5. 更新全局模型 self.global_model.update(aggregated_update)快速部署实战从数据到服务的完整流程环境准备与数据获取# 克隆项目仓库 git clone https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data # 安装依赖环境 pip install torch transformers pandas numpy pip install peft accelerate # LoRA相关依赖 # 数据预处理 python preprocess_data.py --input_dir Data_数据 --output_dir processed_data模型微调实战# 微调脚本核心代码 from transformers import AutoModelForCausalLM, AutoTokenizer from peft import get_peft_model, LoraConfig, TaskType # 加载基础模型 model AutoModelForCausalLM.from_pretrained(THUDM/chatglm-6b) tokenizer AutoTokenizer.from_pretrained(THUDM/chatglm-6b) # 配置LoRA peft_config LoraConfig( task_typeTaskType.CAUSAL_LM, inference_modeFalse, r8, lora_alpha32, lora_dropout0.1 ) # 应用LoRA model get_peft_model(model, peft_config) # 准备训练数据 train_dataset load_medical_dataset(processed_data/train.jsonl) # 开始训练 trainer Trainer( modelmodel, argstraining_args, train_datasettrain_dataset ) trainer.train()服务部署与监控# Docker部署配置 version: 3.8 services: medical-ai: image: medical-chatbot:latest ports: - 8000:8000 environment: - MODEL_PATH/models/medical-chatglm - DATABASE_URLpostgresql://user:passdb:5432/medical volumes: - ./models:/models - ./logs:/app/logs healthcheck: test: [CMD, curl, -f, http://localhost:8000/health] interval: 30s timeout: 10s retries: 3常见问题解答与技术排错Q1如何处理数据中的专业术语不一致问题解决方案建立医疗术语标准化词典在预处理阶段统一术语表达。可以使用基于规则和统计的方法识别同义词和变体表达。Q2模型生成的内容如何保证医学准确性安全机制知识边界限制设置医学知识边界超出范围的问题明确告知无法回答专业审核流程关键医学建议经过专家审核流程风险内容过滤识别高风险内容并触发人工审核Q3如何应对高并发医疗咨询场景性能优化策略模型量化使用INT8量化减少内存占用请求队列实现智能请求调度结果缓存常见问题答案缓存减少重复计算负载均衡多实例部署自动伸缩Q4如何评估医疗对话系统的效果评估指标体系医学准确性专家人工评估金标准对话流畅性BLEU、ROUGE等自动评估指标用户满意度用户反馈评分响应时间平均响应时间、P95响应时间技术展望医疗AI的下一站中文医疗对话数据集的开源发布标志着医疗AI发展进入了新的阶段。未来随着技术的不断演进我们期待看到跨语言医疗AI支持多语言医疗咨询服务全球患者实时学习系统能够从最新医学研究中持续学习更新个性化治疗建议基于基因组学、生活习惯的个性化医疗方案预防性健康管理从治疗转向预防的健康管理新模式通过中文医疗对话数据集开发者和研究者拥有了构建下一代医疗AI系统的强大基础。无论是学术研究还是商业应用这个数据集都将成为推动医疗AI技术发展的重要引擎。立即开始您的医疗AI之旅# 快速开始示例 git clone https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data cd Chinese-medical-dialogue-data # 查看数据示例 head -n 5 样例_内科5000-6000.csv # 开始您的医疗AI项目在医疗AI的星辰大海中高质量的数据是航行的燃料创新的技术是指引的灯塔。中文医疗对话数据集为这趟旅程提供了充足的燃料现在是时候扬帆起航了。【免费下载链接】Chinese-medical-dialogue-dataChinese medical dialogue data 中文医疗对话数据集项目地址: https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
中文医疗对话数据集:破解医疗AI语料稀缺困局的技术突破与实践指南
发布时间:2026/6/2 21:24:10
中文医疗对话数据集破解医疗AI语料稀缺困局的技术突破与实践指南【免费下载链接】Chinese-medical-dialogue-dataChinese medical dialogue data 中文医疗对话数据集项目地址: https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data在人工智能与医疗健康深度融合的时代医疗大语言模型的发展正面临一个核心瓶颈高质量、大规模、专业化的中文医疗对话数据极度匮乏。传统医疗数据集往往规模有限、领域覆盖狭窄、专业深度不足严重制约了医疗AI模型的性能提升。中文医疗对话数据集的出现为这一困境提供了突破性的解决方案79.2万条真实医患对话构成的黄金语料库正在重新定义医疗AI的训练范式。技术挑战医疗AI发展的三大核心瓶颈数据稀缺性与专业性的矛盾医疗领域的特殊性决定了数据收集的困难性。一方面患者隐私保护法规严格限制了医疗数据的流通另一方面专业医疗知识需要医学专家参与标注成本高昂且效率低下。传统数据集往往只能覆盖单一科室或疾病类型难以支撑全科医疗AI模型的训练需求。对话质量与真实性的平衡医疗对话不仅需要专业准确性还需要体现真实的医患交流场景。如何在保证医学知识正确性的同时保持对话的自然流畅性是数据集构建的关键挑战。过度标准化会失去真实感过于随意则可能引入错误信息。多科室协同与知识融合医疗实践涉及多科室协作一个症状可能关联多个专科领域。如何构建既能体现专科深度又能支持跨科室知识迁移的对话数据集是技术实现上的重大难题。创新突破79.2万条对话的黄金语料库构建结构化数据架构设计中文医疗对话数据集采用精心设计的四字段结构每个问答对都构成了完整的诊疗单元# 数据架构核心设计 medical_dialogue { department: 心血管科, # 科室分类 title: 高血压患者能吃党参吗, # 问题标题 ask: 我有高血压这两天女婿来的时候给我拿了些党参泡水喝..., # 患者描述 answer: 高血压病人可以口服党参的。党参有降血脂... # 医生专业回复 }这种结构不仅便于模型训练更为构建医疗知识图谱提供了天然的三元组基础(科室, 症状, 治疗方案)。六大科室的均衡覆盖策略数据集通过科学的比例分配实现了广度与深度的完美平衡科室领域数据规模专业特性应用场景内科220,606条慢性病管理、综合诊断日常健康咨询、慢性病管理妇产科183,751条女性健康、孕产护理女性专科咨询、孕期指导外科115,991条手术治疗、创伤处理术后康复指导、创伤处理儿科101,602条儿童疾病、生长发育儿童健康管理、疾病预防男科94,596条男性专科、生殖健康男性健康咨询、生殖指导肿瘤科75,553条癌症诊疗、化疗方案肿瘤治疗方案咨询质量保障的三重过滤机制为确保数据质量项目团队实施了严格的质量控制流程专业术语标准化统一医学术语表述消除歧义对话长度优化问答对控制在200字符内确保信息密度上下文完整性验证每个问答对构成完整的诊疗逻辑链实战指南三步法构建高性能医疗对话系统第一步数据预处理与格式转换# 数据预处理实战代码 import pandas as pd import json def convert_to_training_format(input_csv, output_jsonl): 将原始CSV转换为模型训练格式 # 读取原始数据注意编码格式 df pd.read_csv(input_csv, encodinggbk) training_samples [] for _, row in df.iterrows(): # 构建指令微调格式 sample { instruction: f现在你是一名{row[department]}医生请根据患者的描述提供专业建议, input: f{row[title]} {row[ask]}, output: row[answer] } training_samples.append(sample) # 保存为JSONL格式 with open(output_jsonl, w, encodingutf-8) as f: for sample in training_samples: f.write(json.dumps(sample, ensure_asciiFalse) \n) return len(training_samples) # 批量处理所有科室数据 departments [内科, 妇产科, 外科, 儿科, 男科, 肿瘤科] total_samples 0 for dept in departments: csv_path fData_数据/{dept}_文件夹/{dept}_数据文件.csv jsonl_path fprocessed_data/{dept}_train.jsonl count convert_to_training_format(csv_path, jsonl_path) total_samples count print(f{dept}科室处理完成{count}条数据) print(f总计处理数据{total_samples}条)第二步参数高效微调技术选型在ChatGLM-6B模型上的实验表明参数高效微调技术能显著提升性能微调策略对比分析P-Tuning V2训练参数占比0.20%BLEU-4提升10.6%LoRA训练参数占比0.06%BLEU-4提升31.2%LoRA-INT8训练参数占比0.06%内存占用减少50%推荐配置方案# LoRA微调配置示例 lora_config { r: 8, # LoRA秩 lora_alpha: 32, # 缩放系数 target_modules: [query, key, value], # 目标模块 lora_dropout: 0.1, # Dropout率 bias: none # 偏置设置 } # 训练参数设置 training_args { per_device_train_batch_size: 4, gradient_accumulation_steps: 8, warmup_steps: 100, max_steps: 1000, learning_rate: 2e-4, fp16: True, # 混合精度训练 logging_steps: 10, save_strategy: steps }第三步部署架构与性能优化医疗对话系统三层架构├── 数据服务层 │ ├── 实时数据预处理 │ ├── 医疗知识检索 │ └── 对话历史管理 ├── 模型推理层 │ ├── 大语言模型引擎 │ ├── 多科室路由模块 │ └── 安全合规检查 └── 应用接口层 ├── RESTful API服务 ├── WebSocket实时对话 └── 批量处理接口性能优化关键技术动态批处理根据请求量自动调整批次大小模型量化INT8量化减少75%内存占用缓存机制常见问题答案缓存提升响应速度并发处理支持高并发医疗咨询场景创新应用医疗AI的四大前沿场景场景一智能分诊与科室推荐基于症状描述自动推荐就诊科室减少患者就医困惑def intelligent_triage(symptom_description): 智能分诊系统核心逻辑 # 症状特征提取 features extract_symptom_features(symptom_description) # 多科室匹配度计算 department_scores {} for dept in medical_knowledge_base.departments: score calculate_matching_score(features, dept) department_scores[dept] score # 排序并返回推荐结果 sorted_departments sorted(department_scores.items(), keylambda x: x[1], reverseTrue) return sorted_departments[:3] # 返回前3个推荐科室场景二慢性病管理助手为高血压、糖尿病等慢性病患者提供个性化管理方案慢性病管理流程 1. 症状监测 → 2. 用药提醒 → 3. 饮食建议 → 4. 运动指导 → 5. 复诊提醒场景三医学教育模拟训练为医学生提供真实的医患对话模拟训练环境class MedicalTrainingSimulator: def __init__(self, department): self.department department self.dialogue_history [] def simulate_consultation(self, patient_scenario): 模拟医患对话训练 # 基于真实对话数据生成训练场景 training_data self.load_training_data() # 动态生成患者描述 patient_desc self.generate_patient_description(patient_scenario) # 模型生成医生回复 doctor_response self.generate_medical_response(patient_desc) # 评估回复质量 quality_score self.evaluate_response(doctor_response) return { patient_scenario: patient_scenario, doctor_response: doctor_response, quality_score: quality_score, improvement_suggestions: self.get_suggestions(quality_score) }场景四多轮对话病情追踪支持连续多轮对话实现病情进展追踪多轮对话示例 患者我最近经常头痛 医生头痛持续多久了什么时间最明显 患者大概一周了下午比较明显 医生有没有伴随恶心、呕吐等症状 患者有时候会有点恶心 医生建议您测量一下血压如果持续需要神经内科就诊技术演进医疗AI的未来发展方向多模态融合技术未来医疗AI将整合文本、影像、实验室数据等多维度信息影像-文本对齐结合医学影像报告生成诊断建议实验室数据集成整合血常规、生化指标等检验数据时间序列分析追踪患者病程变化预测病情发展个性化医疗助手基于用户健康档案的个性化服务用药依从性管理个性化用药提醒与副作用监测生活方式干预基于个人习惯的健康建议风险评估预警早期疾病风险识别与预警隐私保护与联邦学习在保障数据安全的前提下实现模型优化# 联邦学习框架示例 class FederatedMedicalLearning: def __init__(self, hospitals): self.hospitals hospitals self.global_model None def federated_training(self): 联邦学习训练流程 # 1. 初始化全局模型 self.global_model initialize_medical_model() # 2. 分发模型到各医院 for hospital in self.hospitals: hospital.download_model(self.global_model) # 3. 本地训练数据不出院 local_updates [] for hospital in self.hospitals: update hospital.local_training() local_updates.append(update) # 4. 安全聚合更新 aggregated_update secure_aggregation(local_updates) # 5. 更新全局模型 self.global_model.update(aggregated_update)快速部署实战从数据到服务的完整流程环境准备与数据获取# 克隆项目仓库 git clone https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data # 安装依赖环境 pip install torch transformers pandas numpy pip install peft accelerate # LoRA相关依赖 # 数据预处理 python preprocess_data.py --input_dir Data_数据 --output_dir processed_data模型微调实战# 微调脚本核心代码 from transformers import AutoModelForCausalLM, AutoTokenizer from peft import get_peft_model, LoraConfig, TaskType # 加载基础模型 model AutoModelForCausalLM.from_pretrained(THUDM/chatglm-6b) tokenizer AutoTokenizer.from_pretrained(THUDM/chatglm-6b) # 配置LoRA peft_config LoraConfig( task_typeTaskType.CAUSAL_LM, inference_modeFalse, r8, lora_alpha32, lora_dropout0.1 ) # 应用LoRA model get_peft_model(model, peft_config) # 准备训练数据 train_dataset load_medical_dataset(processed_data/train.jsonl) # 开始训练 trainer Trainer( modelmodel, argstraining_args, train_datasettrain_dataset ) trainer.train()服务部署与监控# Docker部署配置 version: 3.8 services: medical-ai: image: medical-chatbot:latest ports: - 8000:8000 environment: - MODEL_PATH/models/medical-chatglm - DATABASE_URLpostgresql://user:passdb:5432/medical volumes: - ./models:/models - ./logs:/app/logs healthcheck: test: [CMD, curl, -f, http://localhost:8000/health] interval: 30s timeout: 10s retries: 3常见问题解答与技术排错Q1如何处理数据中的专业术语不一致问题解决方案建立医疗术语标准化词典在预处理阶段统一术语表达。可以使用基于规则和统计的方法识别同义词和变体表达。Q2模型生成的内容如何保证医学准确性安全机制知识边界限制设置医学知识边界超出范围的问题明确告知无法回答专业审核流程关键医学建议经过专家审核流程风险内容过滤识别高风险内容并触发人工审核Q3如何应对高并发医疗咨询场景性能优化策略模型量化使用INT8量化减少内存占用请求队列实现智能请求调度结果缓存常见问题答案缓存减少重复计算负载均衡多实例部署自动伸缩Q4如何评估医疗对话系统的效果评估指标体系医学准确性专家人工评估金标准对话流畅性BLEU、ROUGE等自动评估指标用户满意度用户反馈评分响应时间平均响应时间、P95响应时间技术展望医疗AI的下一站中文医疗对话数据集的开源发布标志着医疗AI发展进入了新的阶段。未来随着技术的不断演进我们期待看到跨语言医疗AI支持多语言医疗咨询服务全球患者实时学习系统能够从最新医学研究中持续学习更新个性化治疗建议基于基因组学、生活习惯的个性化医疗方案预防性健康管理从治疗转向预防的健康管理新模式通过中文医疗对话数据集开发者和研究者拥有了构建下一代医疗AI系统的强大基础。无论是学术研究还是商业应用这个数据集都将成为推动医疗AI技术发展的重要引擎。立即开始您的医疗AI之旅# 快速开始示例 git clone https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data cd Chinese-medical-dialogue-data # 查看数据示例 head -n 5 样例_内科5000-6000.csv # 开始您的医疗AI项目在医疗AI的星辰大海中高质量的数据是航行的燃料创新的技术是指引的灯塔。中文医疗对话数据集为这趟旅程提供了充足的燃料现在是时候扬帆起航了。【免费下载链接】Chinese-medical-dialogue-dataChinese medical dialogue data 中文医疗对话数据集项目地址: https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考