一、文章主要内容总结本文介绍了双语(爱尔兰语-英语)大语言模型Qomhrá的开发过程、核心实验及成果,聚焦低资源语言(爱尔兰语)的LLM构建难题,提出了涵盖双语持续预训练(CPT)、指令微调、人类偏好对齐的完整流程:背景与动机:爱尔兰语作为官方语言,在语言技术领域滞后于其他欧洲语言,缺乏高质量标注数据和成熟LLM。现有研究(如gaBERT、UCCIX)未覆盖指令微调与偏好对齐环节,无法直接用于聊天机器人开发。核心方法:预训练:基于Qwen-3-8B模型,混合爱尔兰语(含UCCIX开源数据、国家语料库等)和英语(维基百科数据)语料进行双语CPT,避免灾难性遗忘;指令微调:通过评估6个闭源LLM的爱尔兰语生成能力,选定Gemini-2.5-Pro翻译Dolly V2数据集,构建3万条双语平行指令数据集,采用LoRA进行微调;人类偏好对齐:利用Gemini-2.5-Pro翻译LIMA数据集,生成1千条含"可接受/不可接受"响应的偏好数据集,验证其与爱尔兰语母语者判断的一致性。实验结果:预训练后,Qomhrá在爱尔兰语任务上较基线提升最高29%,英语任务提升44%,未出现显著灾难性遗忘;指令微调后,模型在翻译、世界知识等开放式任务上性能显著改善,响应长度更合理;Gemini-2.5-Pro生成的偏好数据与母语者判断一致性达98.9%(Cohen’s κ=0.
Qomhra: A Bilingual Irish-English Large Language Model
一、文章主要内容总结本文介绍了双语(爱尔兰语-英语)大语言模型Qomhrá的开发过程、核心实验及成果,聚焦低资源语言(爱尔兰语)的LLM构建难题,提出了涵盖双语持续预训练(CPT)、指令微调、人类偏好对齐的完整流程:背景与动机:爱尔兰语作为官方语言,在语言技术领域滞后于其他欧洲语言,缺乏高质量标注数据和成熟LLM。现有研究(如gaBERT、UCCIX)未覆盖指令微调与偏好对齐环节,无法直接用于聊天机器人开发。核心方法:预训练:基于Qwen-3-8B模型,混合爱尔兰语(含UCCIX开源数据、国家语料库等)和英语(维基百科数据)语料进行双语CPT,避免灾难性遗忘;指令微调:通过评估6个闭源LLM的爱尔兰语生成能力,选定Gemini-2.5-Pro翻译Dolly V2数据集,构建3万条双语平行指令数据集,采用LoRA进行微调;人类偏好对齐:利用Gemini-2.5-Pro翻译LIMA数据集,生成1千条含"可接受/不可接受"响应的偏好数据集,验证其与爱尔兰语母语者判断的一致性。实验结果:预训练后,Qomhrá在爱尔兰语任务上较基线提升最高29%,英语任务提升44%,未出现显著灾难性遗忘;指令微调后,模型在翻译、世界知识等开放式任务上性能显著改善,响应长度更合理;Gemini-2.5-Pro生成的偏好数据与母语者判断一致性达98.9%(Cohen’s κ=0.
相关文章
This is Going to Sound Crazy, But What If We Used Large Language Models to Boost Automatic Databa...
文章核心总结 主要内容 文章提出Booster框架,旨在解决现有数据库调优器(成本型、机器学习型、大语言模型型)难以适应环境变化(如工作负载漂移、跨模式迁移、硬件变更等)的问题。其核心逻辑是:将历史调优 artifacts 结构化為查询-配置(QConfig)对象,通过大语言模型(…
高效技巧怎么用 AI 做表格,搭配 AI 导出鸭一站式搞定表格生成与导出工作
引言 日常办公、数据整理场景里,手工制表、格式转换耗费大量时间,AI工具重塑表格制作流程,AI 导出鸭作为核心辅助工具,打通从生成到导出全流程,下文拆解完整实操体系。 一、项目核心痛点与市场需求 当下职场、学生、自…
KMR221与PIC18F46K80在嵌入式电压管理系统中的设计与优化
1. KMR221与PIC18F46K80的硬件选型解析在嵌入式电压管理系统中,芯片选型直接影响着最终方案的精度、稳定性和成本。KMR221作为一款同步降压转换器,与PIC18F46K80微控制器的组合,为精确电压控制提供了理想的硬件基础。1.1 KMR221的关键特性与应…
Spotube:基于Flutter的开源跨平台音乐流媒体架构深度解析
Spotube:基于Flutter的开源跨平台音乐流媒体架构深度解析 【免费下载链接】spotube 🎧 Open source music streaming app! Available for both desktop & mobile! 项目地址: https://gitcode.com/GitHub_Trending/sp/spotube Spotube是一款采…
如何快速清理Windows网盘图标:Drive Icon Manager终极指南
如何快速清理Windows网盘图标:Drive Icon Manager终极指南 【免费下载链接】Drive-Icon-Manager 可以轻松删除‘此电脑’及‘资源管理器侧边栏’中讨厌的网盘图标 项目地址: https://gitcode.com/gh_mirrors/dr/Drive-Icon-Manager 想要让Windows资源管理器界…
逆向解析iOS应用分发机制:ipatool如何实现App Store协议交互
逆向解析iOS应用分发机制:ipatool如何实现App Store协议交互 【免费下载链接】ipatool Command-line tool that allows searching and downloading app packages (known as ipa files) from the iOS App Store 项目地址: https://gitcode.com/GitHub_Trending/ip/…
ComfyUI-WanVideoWrapper:基于稀疏注意力与混合精度计算的视频生成性能突破
ComfyUI-WanVideoWrapper:基于稀疏注意力与混合精度计算的视频生成性能突破 【免费下载链接】ComfyUI-WanVideoWrapper 项目地址: https://gitcode.com/GitHub_Trending/co/ComfyUI-WanVideoWrapper 技术痛点与解决方案定位 在AI视频生成领域,开…
Spotube终极指南:打造你的专属开源音乐流媒体体验
Spotube终极指南:打造你的专属开源音乐流媒体体验 【免费下载链接】spotube 🎧 Open source music streaming app! Available for both desktop & mobile! 项目地址: https://gitcode.com/GitHub_Trending/sp/spotube Spotube是一款跨平台的开…
如何快速部署Redpill Recovery:面向初学者的完整引导工具指南
如何快速部署Redpill Recovery:面向初学者的完整引导工具指南 【免费下载链接】rr Redpill Recovery (arpl-i18n) 项目地址: https://gitcode.com/gh_mirrors/rr2/rr 还在为群晖系统部署和恢复问题而烦恼吗?Redpill Recovery(RR&#…
3步彻底解决Windows右键菜单混乱问题:ContextMenuManager使用全攻略
3步彻底解决Windows右键菜单混乱问题:ContextMenuManager使用全攻略 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾为Windows右键菜单中那些…
从GitHub安全案例解析常见漏洞与防护实践
1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用
# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…
3步彻底解决Windows右键菜单混乱问题:ContextMenuManager使用全攻略
3步彻底解决Windows右键菜单混乱问题:ContextMenuManager使用全攻略 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 你是否曾为Windows右键菜单中那些…
从GitHub安全案例解析常见漏洞与防护实践
1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用
# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…
FAE放射组学分析工具:医学影像特征探索的完整解决方案
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
0.69B参数实现中文多模态AI:揭秘Qwen3-SmVL模型融合技术的完整实战指南
0.69B参数实现中文多模态AI:揭秘Qwen3-SmVL模型融合技术的完整实战指南 【免费下载链接】happy-llm 📚 从零开始构建大模型 项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…
解锁AMD Ryzen处理器性能潜力的SMU调试神器:从新手到专家的完整指南
解锁AMD Ryzen处理器性能潜力的SMU调试神器:从新手到专家的完整指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…