大晓机器人发布全球首个全屋三维可交互世界模型 Kairos-HomeWorld 6月5日大晓机器人联合香港中文大学多媒体实验室、深圳河套学院发布最新世界模型研究成果 Kairos-HomeWorld这是全球首个实现全屋生成、个体物体全交互的世界模型统一框架。该技术突破了现有室内场景生成仅能覆盖单房间、缺乏全局一致性与可操作性的行业瓶颈能够一键生成结构连贯、物理合理、功能完整的全屋三维场景为具身人工智能与机器人训练提供了大规模、高保真的中国家庭场景可交互的实训场。具身智能的终极目标是走进千家万户但家庭环境的高度复杂性与个性化要求机器人必须在海量差异化真实场景中训练。为此研究团队同步开源全球规模最大、首个专为中国家庭打造的全屋 3D 数据集。该数据集包含 30 万套中国真实住宅平面图与 5千个完整带可交互家具和物体的仿真场景覆盖全国各类典型家居户型完整还原中国本土家庭居住特征为具身人工智能的国产化落地提供了核心数据与技术底座。此前北美机器人领军企业 Figure AI 与全球最大房地产持有者之一 Brookfield 达成战略合作依托Brookfield 超10万套的住宅单元进行机器人导航、交互、家务执行的训练这与 Kairos-HomeWorld 赋能本土机器人训练的思路形成全球呼应。与之相比Kairos—HomeWorld在家庭机器人训练方面成本低、效率高。依托模型就能批量生成多样化中国家庭仿真场景以及自带物理交互属性的物体。机器人可在虚拟环境完成各类家务训练新增场景近乎零边际成本省去场地运维、家具损耗等实景开支同时不受现实房源总量限制在训练效率与规模化拓展上优于实地采集路线。目前 Kairos-HomeWorld 已成功应用于大晓机器人的具身智能日常训练能够支持机器人完成跨房间导航、多房间物品整理等复杂长程家务任务的全流程仿真训练大幅缩短了从虚拟仿真到现实落地的迁移周期显著降低具身智能的研发门槛加速机器人在中国市场的规模化普及。首创全屋三维生成与物体级可交互 打破行业仿真数据天花板Kairos-HomeWorld 凭借四阶段分层生成架构全局结构—局部细节—闭环校验—交互增强首次实现从单句文本到结构全局一致、物理完全合规、物体可交互的完整住宅三维场景端到端生成彻底重构了室内场景生成的技术范式。该架构将复杂的全屋级生成任务解耦为四个阶段完美解决了传统方法全局一致性差、物理错误频发、场景不可交互的挑战。框架的第一阶段首创基于 K-D 树的平面图结构化表示方法将真实住宅平面图转化为大语言模型可高效学习的分层文本结构避免房间重叠、拓扑断裂等传统户型生成方法的缺陷。第二阶段采用俯视图全局初始化第一人称细节漫游的分层策略以一阶段生成的3D 建筑外壳锚定整个生成过程解决了 2D-3D 提升方法普遍存在的几何漂移问题。第三阶段通过微调视觉语言模型构建递归闭环校验机制自动检测并修正沙发挡门、物体穿墙等物理违规将家具布局碰撞率控制在行业最优水平。在物体级全交互层面Kairos-HomeWorld 是全球首个全屋可操作物体生成的统一框架这一标志性能力由架构第四阶段的表面中心物体放置算法实现。系统自动获取物体材质、密度、铰接结构等。最终生成的每个场景平均包含超过 15 个可操作物体足迹物体密度衡量家具表面上物体的密集程度与功能丰富度达4.16且所有物体可直接导入仿真引擎进行抓取、移动、堆叠等交互操作。该框架精准解决了房间动线混乱、功能邻接性缺失的全局一致性问题打破了生成场景 只能看不能用 的局限让虚拟环境真正具备支撑机器人导航、操作、任务执行的能力破解了 3D 仿真数据稀缺的瓶颈解决了合成数据不真实、扫描数据不可交互的矛盾。此次同步开源的大规模数据集将进一步加速具身人工智能的产业化落地。30万真实户型5千家庭全场景全球首个中国家庭专属全屋 3D 数据集发布大晓机器人联合香港中文大学多媒体实验室发布首个专为中国家庭居住场景打造的全屋 3D 数据集数据规模全球最大。该数据集包含30万张经过结构化标注的真实住宅平面图、5千个具有完整室内布局与家具布置的全屋仿真场景以及5万个支持物理仿真与交互操作的物体资产。彻底填补了国内缺乏大规模、高保真、符合本土居住习惯的室内场景数据的行业空白为中国家庭服务机器人的本土化训练提供了核心数据底座。在规模上该数据集实现了量级式突破。30万张真实住宅平面图全部来自中国市场真实房源经过多阶段自动化处理流程完成矢量化与结构化标注包含门窗位置、房间几何、功能分区、连通关系等全维度信息是目前全球最大的真实住宅平面图数据集是此前广泛使用 RPLAN 数据集包含8万张ResPlan 数据集仅包含1.7万张。在此基础上训练生成的带家具和物体的全屋仿真场景每户均包含完整的家具布局并借助Physx-Omni模型自动生成平均 15 个带物理属性包含密度、铰接、流形等的可交互对象且全部支持直接导入仿真引擎进行交互式训练。全球室内场景资源对比表其中各符号与术语的含义如下Rec. 代表基于重建的真实世界数据集S./H. 分别指代带家具场景数单个、通常为房间级别的独立区域与住宅数包含多个房间的统一完整住宅Sim-ready 即仿真就绪度用于衡量数据集是否提供可直接在仿真 / 渲染引擎中实例化、并支持物体级交互操作的完整 3D 场景MObj. 表示有数据可查时的单场景平均可操作物体数量n/r 指未报告相关数据“–” 表示该项不适用Collection 则代表由多个不同数据源整合而成的聚合类数据集。更具行业价值的是其中国家庭专属属性。此前全球主流的开源室内场景数据集均基于欧美居住习惯构建普遍存在房间布局和装饰欧美化、开放式厨房、缺乏阳台功能区等问题导致基于这些数据训练的机器人在进入中国家庭时出现 水土不服。Kairos-HomeWorld 数据集覆盖了全国不同城市、不同面积段的典型户型从 30㎡一居室刚需小户型到 200㎡以上改善型大户型完整还原了中国家庭特有的南北通透布局、封闭式厨房、独立生活阳台、干湿分离卫生间、玄关鞋柜等本土居住特征甚至包含老小区非矩形厨房、不规则客厅等常见复杂户型。此次数据集将面向学术界与产业界全面开源团队还计划在后续版本中持续扩充不同地域、不同装修风格的场景样本并加入更多中国家庭特有的物品与交互场景进一步降低具身 AI 的本土化训练门槛加速服务机器人在中国家庭的规模化落地。沉浸式演示一键生成中国家庭仿真场景加速机器人训练Kairos-HomeWorld 已成功应用于大晓机器人的具身智能日常训练。本次视频完整呈现了 Kairos-HomeWorld 从文本指令到可交互户型的全链路生成过程直观展现了其 一键生成、全局一致、物理合规 的核心能力。视频中只需输入 生成一套新中式 90 平米两室一厅 的文本提示模型首先基于中国真实户型数据与 K-D 树结构化表示快速生成符合本土居住习惯的空房间结构精准还原南北通透、功能分区合理的典型户型。随后通过 俯视图全局布局 第一人称细节填充 的分层策略自动生成风格统一的家具摆放接着通过Physx-Omni模型为桌面、台面等表面生成带完整物理属性的可交互物品资产例如铰接属性、密度、流形等。通过自然语言下达 全屋物品整理 的复杂指令机器人自动将其拆解为多个精准的子任务按照 客厅→阳台→厨房→主卧→餐厅→次卧 的完整全屋动线依次执行。在大规模中国家庭仿真环境训练的机器人可以识别不同物品、规划最优路径、完成精准抓取与放置的全过程包括将打开冰箱和柜门的铰接物体交互、倒洗衣液的流体交互、拉开窗帘的柔性物体交互、拿苹果的不规则物体交互以及放置零食的模拟重力属性交互等。相比传统仅能支持导航训练的仿真环境Kairos-HomeWorld 生成的场景具备全局一致的空间结构支持机器人跨房间连续导航所有物体均带有真实物理属性机器人可与超过 15 种不同类型的物品进行自然交互模拟真实世界的碰撞、重力与摩擦效果让机器人在虚拟世界中就能完成复杂家务任务的全流程训练大幅缩短了从仿真到现实的迁移周期。