精確的物體姿態(tài)估計(jì)是指機(jī)器人同時(shí)確定物體的位置和方向的能力。這對機(jī)器人技術(shù)十分重要,尤其是在對制造和物流等行業(yè)非常關(guān)鍵的拾取和放置任務(wù)中。隨著機(jī)器人承擔(dān)的復(fù)雜操作任務(wù)越來越多,它們?nèi)找嫘枰哂芯_確定物體、位置和方向的六個(gè)自由度(6D姿態(tài))的能力,以確保能夠以可靠和安全的方式與物體進(jìn)行交互。盡管深度學(xué)習(xí)取得了進(jìn)步,但6D姿態(tài)估計(jì)算法的性能在很大程度上取決于其訓(xùn)練數(shù)據(jù)的質(zhì)量。
(圖片來源:芝浦工業(yè)大學(xué))
據(jù)外媒報(bào)道,在由日本芝浦工業(yè)大學(xué)(Shibaura Institute of Technology)副教授Phan Xuan Tan領(lǐng)導(dǎo)一項(xiàng)新研究中,研究人員引入精心設(shè)計(jì)的數(shù)據(jù)集,旨在提高6D姿態(tài)估計(jì)算法的性能。該數(shù)據(jù)集通過提供全面的資源,允許機(jī)器人在現(xiàn)實(shí)環(huán)境中以更高的精度和適應(yīng)性來執(zhí)行任務(wù),從而彌補(bǔ)機(jī)器人抓取和自動(dòng)化研究中的主要空白。該團(tuán)隊(duì)還包括來自河內(nèi)工業(yè)大學(xué)(Hanoi University of Industry)和河內(nèi)理工大學(xué)(Hanoi University of Science and Technology)的研究人員。
芝浦工業(yè)大學(xué)副教授Phan Xuan Tan表示:“研究人員的目標(biāo)是創(chuàng)建一個(gè)數(shù)據(jù)集,不僅可以推進(jìn)研究,而且可以解決工業(yè)機(jī)器人自動(dòng)化方面的實(shí)際挑戰(zhàn)。我們希望它能為研究人員和工程師提供寶貴的資源。”
該團(tuán)隊(duì)創(chuàng)建的數(shù)據(jù)集不僅可以滿足研究社區(qū)的需求,而且適用于實(shí)際的工業(yè)環(huán)境。使用Intel RealSense depth D435攝像頭,它們可以收集優(yōu)質(zhì)RGB和深度圖像,并通過物體6D姿態(tài)數(shù)據(jù)旋轉(zhuǎn)和平移分別進(jìn)行注釋。該數(shù)據(jù)集具有各種形狀和大小的特征,并添加了數(shù)據(jù)增強(qiáng)技術(shù)以確保其在不同環(huán)境條件下的多功能性。這種方法使該數(shù)據(jù)集高度適用于廣泛的機(jī)器人應(yīng)用。
Tan副教授表示:“該數(shù)據(jù)集經(jīng)過精心設(shè)計(jì),適合各個(gè)行業(yè)。它包含具有不同形狀和環(huán)境變量的物體,不僅為研究人員提供了寶貴的資源,也使相關(guān)領(lǐng)域(機(jī)器人需要在動(dòng)態(tài)和復(fù)雜條件下運(yùn)行)工程師受益。”
通過最先進(jìn)的深度學(xué)習(xí)模型EfficientPose和FFB6D進(jìn)行評估,該數(shù)據(jù)集分別達(dá)到了97.05%和98.09%的準(zhǔn)確率。這證明它可以提供可靠和精確的姿態(tài)信息,對于機(jī)器人操作、制造業(yè)質(zhì)量控制和自動(dòng)駕駛汽車等應(yīng)用十分重要。這些算法在數(shù)據(jù)集上的強(qiáng)大性能,突顯了對需要精確度的機(jī)器人系統(tǒng)進(jìn)行改進(jìn)的潛力。
Tan副教授表示:“該數(shù)據(jù)集包括一系列基本形狀,包括長方體、梯形和圓柱體。對其進(jìn)行擴(kuò)展以包含更復(fù)雜和不規(guī)則的物體,將使其更適用于現(xiàn)實(shí)世界的場景。Intel RealSense Depth D435攝像頭可以提供出色的深度和RGB數(shù)據(jù),但該數(shù)據(jù)集對它具有依賴性,無法使用相同設(shè)備的研究人員可能訪問受限。”
盡管存在這些挑戰(zhàn),但研究人員對該數(shù)據(jù)集的效用持樂觀態(tài)度。結(jié)果表明,良好的數(shù)據(jù)集設(shè)計(jì)可以明顯提高6D姿態(tài)估計(jì)算法的性能,從而支持機(jī)器人以更高的精確度和效率執(zhí)行更復(fù)雜的任務(wù)。展望未來,通過整合更廣泛的物體和自動(dòng)化部分?jǐn)?shù)據(jù)收集過程,該團(tuán)隊(duì)計(jì)劃擴(kuò)展數(shù)據(jù)集,以使其更高效和易于訪問。他們希望進(jìn)一步增強(qiáng)該數(shù)據(jù)集的適用性和實(shí)用性,使依賴于機(jī)器人自動(dòng)化的研究人員和行業(yè)受益。