• 稚晖君开源百万机器东说念主真机数据集

  • 发布日期:2025-01-30 05:31    点击次数:137

    稚晖君开源百万机器东说念主真机数据集

    衡宇 发自 凹非寺

    量子位 | 公众号 QbitAI

    年末大礼包,稚晖君他又双叒来开源了!

    百万真机数据集开源名堂AgiBot World,亦然全球首个基于全域真确场景、万能硬件平台、全程质料把控的大范围机器东说念主数据集。

    该名堂由稚晖君具身智能创业名堂智元机器东说念主,联袂上海AI Lab、国度方位共建东说念主形机器东说念主窜改中心以及上海库帕念念汇注发布。

    GitHub和抱抱脸上依然不错自取了(本文文末附纵贯车)~

    提及来,此前在该范围在全球内,不是莫得玩家作念过大范围的数据集:

    比如谷歌DeepMind曾构建过Open X-Embodiment数据集,数据整合自22种不同践诺的机器东说念主。

    但其中大部分数据穷乏协调圭臬化的网罗过程,且许多用于数据网罗的机器东说念主构型依然过期,数据质料步地杂沓不皆——这就可能在机器东说念主计谋学习过程中带来反作用。

    △谷歌DeepMind的Open X-Embodiment

    又比如此坦福、UC伯克利、谷歌等构建的DROID数据集,涵盖了相对丰富的场景与妙技,天然尽可能兑现步调化的数据网罗过程。

    但作家团队我方在后续商议中指出,DROID存在大宗低质料数据,反而让机器东说念主越学越迷濛。

    2024年以来,具身智能备受驻守,行业玩家纷纷表现,许多初创公司都基于自网罗的大范围高质料双臂机器东说念主数据考试的模子展现出了整理、分拣、洗衣等引申复杂四肢的才调。

    这天然进一步印证了高质料数据在现时具身智能范围商议阶段的伏击性,但这类数据集一般仅作私用。

    据先容,比拟于Open X-Embodiment数据集,这次开源的AgiBot World长程数据范围逾越10倍,场景范围阴私面扩大100倍,数据质料从实验室级上涨到工业级圭臬。

    全部来望望,这个数据集包含了些什么——

    日常生存中种种化任务,可多机器东说念主合作

    官方而已自大,AgiBot World数据集收录了80余种日常生存中的种种化妙技。

    从抓取、舍弃、推、拉等基础操作,到搅动、折叠、熨烫等精粹长程、双臂协同复杂交互,险些涵盖了日常生存所需的绝大多数四肢需求。

    底下举几个栗子~

    毫米级精粹限制。

    演示场景为插内存条。需要如神经纤维般灵敏的终局触觉传感器助力机器东说念主精确对接,稍有失慎可能导致建造损坏。

    繁琐长过程家务整理。

    该任务下演示场景1为整理洗碗机。

    画面中,勺筷碗盘层层堆叠在洗碗池里。在这条数据中,机器东说念主将错杂的餐具一一整理到洗碗机相应卡槽中。

    该任务下演示场景2为挂式熨烫衣物。

    机器东说念主通过双手合作,一只手收拢衬衫的一角,另一只手限制挂烫机与衣物的距离,熨烫衣物褶皱。

    搭建物体搬运。

    搬运大件物体这项任务,当今对单机器东说念主来说是个老浩劫。

    数据采集网罗的是双机器东说念主合作,分摊分量的同期,通过及时谐和位置与角度,确保物体搬运过程中的剖析安全。

    尽可能阴私日常坐蓐、生存全域场景

    团队先容,AgiBot World是从智元机器东说念主自建的大范围数据网罗工场与应用实验基地中网罗的,网罗空间总面积特出4000已往米,包含3000多种真确物品。

    为了尽可能阴私机器东说念主在坐蓐、生存中的典型应用需求,为机器东说念主提供高度真确的坐蓐生存环境,网罗环境包含特出100种真确场景、3000多种物品。

    其中,80%的任务为长程任务,时长采集在60s-150s之间,且涵盖多个原子妙技,是DROID和OpenX-Embodiment使命的5倍。

    值得一提的是,按照日常生存真确需求,团队主要复刻了5个中枢场景,诀别是:

    家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)。

    主打的即是通过多场景的高度回话与任务想象,为机器东说念主研发和测试构建一个粗略兑现具身智能的必要条目。

    当先,家居场景。

    主要再现真确住宅布局,包括卧室、客厅、厨房、卫生间等中枢空间。有助于考试机器东说念主家务清洁、物品整理和厨房任务等。

    在客厅,机器东说念主不错精确限制机械臂抓取花材,精笃定位花瓶的插孔,将花朵按缠绵插入允洽位置。

    也不错使用清扫器用对大地进行全面清洁,包括碎片、灰尘和液体等。

    还不错清算家居名义的灰尘和污垢,精确限制掸子或软布进行擦抹,幸免划伤名义。

    让咱们把视野从客厅谐和到厨房。

    在厨房,机器东说念主不错凭据食材种类和沙拉配方,完成切割、搀和和装盘操作,也不错限制清洁器用对瓶表里进行刷洗,去除污渍。

    要是再把场景切换到卫生间,机器东说念主不错精确限制机械臂使用刷子清洁卫生间马桶。

    其次,餐饮场景。

    主要兑现智能办事体验,模拟前厅、后厨与用餐区域,包括点餐台、备餐区、餐桌等。有助于考试机器东说念主兑现餐厅办事(点餐、上菜、清算餐桌)、食材传递、后厨合作等。

    再者,工业场景。

    主要模拟分拣与物流自动化,复刻工业仓库与坐蓐线,包括分拣系统、打包建造、传输带等。有助于考试机器东说念主兑现物料分拣、包装打包、物流搬运等。

    在工场,机器东说念主在活水线上应用机械臂精确限制将物品放入指定的包装盒中,兑现物品自动打包。

    还有商超场景。

    这一场景下,主要高度回话超市货架布局与收银区想象,包含生鲜、日用、冷冻等多个品类区域。有助于考试机器东说念主模拟物品上架、货色盘货、主顾带领、无东说念主结算等。

    在超市,机器东说念主不错精确限制扫码枪对待结算物品进行扫描和匡助宾客装袋。

    网罗践诺过硬+严控数据质料

    上头所提到的AgiBot World的所特等据,都是由底下这款机器东说念主网罗的:

    它具有以下几个本性:

    360°感知:8个录像头环绕式布局,及时全概念感知周围环境的动态变化。机灵操作:可配备具有6个主动解放度的机灵手,保险四肢精确且生动,完成多种复杂操作。终局精粹感知:标配终局六维力传感器,并可配备高精度视触觉传感器,粗略感知力的轻微变化,作念到“拿抓有度”。高解放度:全身最高32个解放度,应酬洗衣、作念饭、分拣、搬运等复杂任务。

    此外,由于AgiBot World的超大范围真确数据本性,团队通过专科培训、多级质料把控、全程东说念主工在环,以确保严格精粹化限制数据质料。

    在职务想象门径,AgiBot World从想象初稿到想象迭代过程,均邀请了学术、工业、消耗者来进行多视角任务把关。

    在数据网罗门径,由科罚体系下的专科科罚图那对来保险网罗员培训和网罗质料把控。

    在审核标注门径,当先会经过端云两侧,严格筛选网罗的数据,自动剔除不允洽要求的数据。

    此外专科审核员会东说念主工对全量数据进行逐帧审核,确保每一个四肢都允洽任务圭臬,并对重要帧和数据本性进行多维度标注。

    在算法考证门径,通过东说念主工审核的数据,还会由AgiBot World团队进一步通过算法进行考证。

    关于未能通过考证的数据,会重新想象任务进行数据补采,确保数据可用性。

    One More Thing

    这次开源AgiBot World数据集,是稚晖君在三个月内的第三次开源举动。

    第一次是9月底,开源了专为具身智能打造的轻量化、高性能通讯框架AimRT。

    上一次是10月24日(没错即是踩点1024),智元东说念主形机器东说念主灵犀X1全套而已全球开源,包括想象图纸和代码。

    至于下一步——

    量子位得来的音问是,开源,开源,如故开源(莫不是稚晖君想作念源神)。

    内幕音问一并放在这里,大家就等着他冉冉冉冉冉冉填坑吧,果真(诚挚脸.jpg)。

    百万真机全量数据将不息开源;千万仿真数据同步推送,赈济更泛化和更通用的大模子考试;发布具身基座大模子,赈济模子微调,赋能千行百业;发布全套器用链,兑现网罗、考试和评测竣工闭环;举办一系列AgiBot World Challenge。

    GitHub诱导:

    https://github.com/OpenDriveLab/AgiBot-World

    抱抱脸诱导:

    https://huggingface.co/agibot-world

    名堂主页:

    https://agibot-world.com/

    — 完 —

    量子位 QbitAI · 头条号签约

    原宥咱们,第一期间获知前沿科技动态