机器之心发布
继去年 10 月帕西尼前瞻布局宣布将打造 “具身智能数据云商城”,帕西尼联合京东云、腾讯云、百度智能云共同打造的全球首个百亿级规模全模态具身智能数据云商城,即日起全面对外开放
携手京东云、腾讯云、百度智能云,共建 “具身智能数据绿洲”
作为一个集成了海量高质全模态实采数据与顶级云端算力的“进化服务引擎”,该平台旨在从底层解决具身智能泛化的核心瓶颈。依托帕西尼五大自有超级数据采集工厂集群的百亿级实采数据,与京东云、腾讯云、百度智能云三家顶尖的云端算力与存储能力,该平台将以 4 大核心维度定义服务标准,为全球具身智能研发、具身模型迭代及产业智能化升级注入全新动能,以 “具身智能数据绿洲” 破解 “数据荒漠” 难题。
全模态高维交互数据:独家提供全球自由度最高(82)的人类手部五指动作数据,融合 30 个六维触觉模组,首次构建 “视觉 - 触觉 - 语言 - 动作” 的全模态闭环。
工业级精度,开箱即用:数据经过严格时空对齐与校验,具备毫秒级精度,可直接训练出高成功率、高泛化的控制模型与预训练基座。
真机闭环验证,打通落地 “最后一公里”:数据源于并回归于真机交互,支持在多种机器人上完成端到端算法训练与部署验证,真正跨越 Sim2Real 鸿沟。
自有超级工厂,保障可持续的海量供给:依托全自建、全链可控的 5 大数据工厂,实现标准化、规模化采集与处理,为 Scaling Law 提供可靠、可定制的大规模数据基础设施。
全球首个!是数据云商城,更是端到端的智能引擎
具身智能进化引擎:端到端一站式服务,让模型进化步入 “快车道”
传统的数据获取方式赖线下拷贝、物理邮寄与繁琐的本地部署,一套流程动辄数周,成本高昂且极易出错。帕西尼携手京东云、腾讯云、百度智能云三家头部的云服务供应商,通过深度战略合作彻底改写了这一范式。如今,用户在线即可快速完成一站式数据采购,真正实现 “数据到手,开箱即训” 的服务体验。
科学分级透明选购:数据按应用场景与操作精细度进行科学分级,价格体系透明。用户可根据自身需求自由选择和组合不同级别的数据包,价格体系公开透明,选购体验高效便捷。
自助敏捷交付:用户只需登录数据云商城平台,即可在线完成数据选购、合同签署、支付与交付全流程。标准合同线上一站式便捷签署,下单即完成交付,购买即投入使用,大幅缩短数据获取周期。
模型线上即训:依托三家头部云服务商强大的云计算能力,用户可在购买数据后,可直接下载或一键迁移至客户自己的腾讯云账户,在云端完成数据预处理、模型训练与部署的全流程,无需担忧本地算力不足或存储瓶颈,真正实现 “数据到手,模型开训”。
全套工具链加持跨本体应用:数据格式兼容业界主流框架,支持转换为 LeRobot 等标准格式,用户无需在复杂的格式转换上耗费精力,可直接跨本体 Retargeting 使用。
帕西尼通过端到端的云端闭环服务,将数据服务从 “选购” 到 “使用” 的周期从数周压缩至分钟级,让开发者真正聚焦于模型创新。
帕西尼全模态具身智能数据云商城一站式便捷采购
数据质量高:全模态、高维度、可跨本体,全面提升模型泛化能力
基于自研高精度 6D 霍尔阵列式触觉传感技术,帕西尼打造了全球唯一具备高一致性物理交互数据获取能力的柔性力学传感器,并以此为核心,自研了整手全域触觉采集终端 PXCap,配合空间视觉矩阵,共同构建了全球首个 “以人为中心”(Human-Centered) 的全模态具身智能数据采集体系
这一自研的数采体系所形成的坚实技术底座,保障了数据产品的高质量与高可用性,并由此重新定义了具身智能数据的行业标准:
全模态具身智能数据:通过整手无盲区触觉覆盖的数采设备 + 空间视觉矩阵 + Neural Mesh 多模态神经织网等自研软硬件一体化采集系统 PMEC,可从无损高保真采集包括高精度整手多维触觉、多视角视觉、关节角度、自体感知、语音、文本等全维度人类物理交互行为的具身智能数据,从而为具身智能体提供更丰富、更全面的环境信息,使其能够更精准地理解任务、感知世界。
独家 82 高自由度五指动作数据:帕西尼自主研发的 PXCap V,是全球首款实现全五指无盲区触觉覆盖的穿戴式数据采集设备。其内置 30 个六维触觉模组,触觉点数密度高达 3015 个,搭配全球最小型自研抗磁磁编码器,可同步采集 15 种维度的触觉感知信息及手部姿态、关节运动,轨迹重建精度行业领先,可完整还原人类在真实操作中的交互过程,可赋予具身智能体极高的物理一致性与精细度。
高效率、低成本:通过真人佩戴 PXCap 设备进行人类日常行为效率的高效采集,以 3~6 倍于传统遥操作的效率,捕捉了人类自然、流畅且连续的日常行为数据。这种方式不仅摆脱了对昂贵机器人本体的依赖,更保留了人类在长程任务中试探、纠错等隐性策略与连贯性。
可跨本体使用:由多个视觉角度所采集的基于人类最高维度的行为与环境数据,不仅支持任意视角的模型训练,极大提升 Sim-to-Real 部署的鲁棒性,更可直接用于高精度的三维场景与物体重建。结合 SomaRedirect 体感重定向技术,数据被解耦为通用的运动表征,实现了跨机器人构型的低成本迁移。
全模态数据 5 ms 内同步:实现了相机间硬件同步与多模态间算法同步的双重保障,将系统延迟控制在 5ms 以内,确保了 “视觉感知 - 触觉接触 - 物体位移” 在时间轴上的绝对对齐,有效避免了因传感器时滞导致模型学习到错误的因果关联,为高精度的策略学习奠定了坚实基础。
科学化的场景设计:通过系统化的场景变量控制策略(Controlled Variables),不仅覆盖了刚体、柔性体(如织物)、透明 / 高反光体等物理对象 ,更对光照、背景干扰、物体位姿及抓握轨迹进行了多维度的随机化与对抗性设计,从而真正具备在非结构化真实环境中处理长序列任务的强泛化能力。
严苛的数据质量生命线:建立了一套标准化的全生命周期闭环管理系统,极大降低了数据清洗的成本,确保了数据的一致性与高质量,让算法工程师可专注于模型本身的迭代。
正是基于帕西尼这些核心技术与超高标准,由 Super EID Factory 所生产的亿级规模全模态具身智能数据集产品 OmniSharing DB于 2025 年 8 月在北京国际大数据交易所成功上架,并获得了官方出具的 “数据质量高,可直接使用” 的A 级数据质量标准评价,这也是国内具身智能数据产品首次获得此类权威认证。
数据体量全球最大:五大自有工厂、百亿级实采数据,从 “数据荒漠” 到 “富庶商城”
继 2025 年 6 月于天津落成全球首个全模态超级数据采集工厂后,帕西尼已累计采集数千万条高质量全模态数据。今年,帕西尼再建四座数采工厂,形成辐射华北、华东、华中、西南、华南的五大超级数据采集工厂战略纵深产业集群,以十万平实景基地、“百亿级” 实采数据,从源头破解了这一难题。
结合“in-the-wild” 理念,帕西尼可在全国五大地区采集更贴近真实生活与产业场景的数据。而依托全球首创的 “以人为中心” 数采体系优势,五大数采工厂单日的数据产出即可等效于人类一生的交互经验,日后,帕西尼也将以“一日一生” 的数采效率,源源不断地向数据云商城输送驱动具身智能泛化落地与规模应用的可靠 “燃料库”,推动具身智能从 “数据荒漠” 走向数据 “富庶” 时代
灵活供给模式:“通用场景 + 定制化” 并行,覆盖全场景数据需求
不同客户处于不同的研发阶段,对数据的需求千差万别。依托天津数采工厂标准化采集与其余四厂 “in the wild” 实采能力,可为帕西尼的全模态数据云商城提供“通用场景 + 定制化场景” 的数据服务,兼顾规模化效率生产与客户的个性化需求。
场景数据集:覆盖海量元动作与家庭生活、3C 制造、汽车装配、物流分拣、餐饮服务、医疗护理等 15 大核心领域的长序列场景,包含数千万条标准化、高质量的全模态数据,企业及科研机构可即买即用,快速启动模型训练。
定制化数据服务:针对客户的特定场景与任务需求,不仅支持定制化场景搭建与数据采集,更可结合全国五大工厂的地区产业特色与生活场景,践行 “in-the-wild” 理念。通过在真实、非结构化的生产与生活环境中进行实地采集,为模型注入高鲁棒性的真实数据,助力具身智能攻克复杂环境下的泛化难题。
目前,帕西尼数据云商城已上架 100+ SKU 的海量数据,并持续更新拓展,不断为具身智能大模型提供 “强泛化” 燃料。
效果验证:从实验室到真实场景,具身泛化开启 “倍速” 进化
高质量数据不是终点,让模型具备超强的泛化能力,让机器人真正学会 “像人一样干活” 才是核心目标。
帕西尼不仅在学术端印证了数据的有效性,更将商城数据直接注入自研的OmniVTLA 通用具身大模型,并部署于TORA 系列人形机器人进行实战测试。实测显示,模型在复杂任务中的操作成功率与跨场景适应性均达到行业领先水平。
学术前瞻验证
在帕西尼与上海交通大学、浙江大学联合发表的最新论文《RoboPaint: From Human Demonstration to Any Robot and Any View》中,便对帕西尼所采集的数据质量与效果进行了验证:
帕西尼提出了一种触觉感知重定向方法,通过几何与力引导优化,将人类手部状态映射至机器人灵巧手状态。实验表明:重定向的灵巧手轨迹在 10 种不同物体操作任务中成功率达 84%;
在逼真 Isaac Sim 环境中渲染重定向的机器人轨迹,构建机器人训练数据,仅基于帕西尼生成的数据所训练的 VLA 策略(Pi0.5)在三种代表性任务(即抓取与放置、推拉与倾倒)中平均成功率可达 80%。
学术成果有力证明:帕西尼“以人为中心” 的数采方案是一种可扩展且成本效益极高的数采方案,其方案下所采集的带有触觉模态的全模态数据,对于训练机器人复杂精细操作而言,其性能损失极小。此项学术验证体现出帕西尼所生产的数据集具有极高的实用价值。
*RoboPaint 数据流程:该数据流程能够基于从人类演示中采集的多模态数据 “绘制” 给具身智能体进行学习。通过 Dex-Tactile 重定向方法,能够有效解决人机之间的跨具身性问题。
以数据飞轮加速具身进化
帕西尼已构建起 一座“数据飞轮”:通过“硬件采集 → 数据增长 → 模型优化 → 场景落地” 的全栈闭环,每一条来自真实物理世界的实采数据都在反哺模型进化。伴随云商城海量实采数据的持续注入,帕西尼自研的 OmniVTLA 大模型在物理交互、精细操控与真实场景泛化方面的能力上限被不断拉升,赋予机器人类人化的精准操作与自适应决策能力。
这一飞轮效应也正在加速兑现:从药店取药结账到家庭收纳喂猫,从餐厅收台到办公整理。这些曾经难以触达的复杂长程任务,如今在百亿级实采数据的灌溉下,正从实验室测试加速转化为落地场景。数据越多,模型越强;模型越强,场景越广 —— 具身智能的 “倍速” 进化,已然开启
赋能千行百业:加速 “智能涌现” 时刻的到来
在智能体从 “数字世界” 跨越到 “物理世界” 的关键节点,全模态交互数据 —— 尤其是高精度触觉感知数据 —— 是连接虚拟与现实的重要桥梁。
帕西尼与京东云、腾讯云、百度智能云联手构筑的,不仅是一个云商城,更是具身智能时代的 “数字底座”。对于高校与科研机构,它提供了此前难以触及的大规模、高质量、全模态的研究数据,降低了前沿探索的门槛;对于机器人公司与开发者,它意味着可以将有限资源从昂贵、重复的基础数据采集中解放出来,极大加速研发周期。
通过标准化采集、云端化服务、场景化交付,帕西尼正将曾经稀缺的具身数据转化为像 “电力” 一样触手可及的工业资源,为全球具身智能的泛化能力跃迁提供核心支撑。
机器人在物理世界的智能涌现时刻,已加速到来。