8月18日,威邁爾VMR正式發(fā)布全球首款人形機器人頭部模組OmniHead(奧視知腦)。
當前,人形機器人在實(shí)際應用中普遍面臨環(huán)境感知能力弱、決策依賴(lài)預設邏輯的痛點(diǎn),導致難以擺脫人工遙控,制約了實(shí)際應用場(chǎng)景的拓展。OmniHead的推出將有效解決這些技術(shù)瓶頸。
OmniHead是威邁爾專(zhuān)為具身智能打造的頭部模組,搭載高精度RGB-D視覺(jué)系統和AI大模型。通過(guò)OmniHead開(kāi)發(fā)者可輕松提升機器人的視覺(jué)感知能力和環(huán)境魯棒性,從此擺脫遙操。
01、視覺(jué)全景感知
OmniHead的RGB-D深度視覺(jué)系統由三組十個(gè)RGB-D陣列相機組成,分布于頭部模組的正前方、左后側和右后側,形成360°x90°的全景視野,實(shí)現機器人在復雜場(chǎng)景中的定位、感知和自主導航。
視覺(jué)定位技術(shù)
OmniHead采用視覺(jué)定位技術(shù),通過(guò)RGB-D陣列相機實(shí)時(shí)獲取周?chē)h(huán)境的三維信息并快速建圖,為機器人定位導航提供可靠數據。
多模態(tài)感知與語(yǔ)義識別
OmniHead的RGB-D相機融合語(yǔ)義感知算法,實(shí)現環(huán)境物體類(lèi)別的精準識別,經(jīng)過(guò)訓練可識別桌子、椅子、人、機器人、狗等多類(lèi)物體,為機器人行為決策提供準確依據。
多機協(xié)同數據同步
三組RGB-D陣列相機可實(shí)現視覺(jué)數據同步采集與傳輸,最終獲得全景三維重建與實(shí)時(shí)感知。
02、AI大模型+麥克風(fēng)陣列
深度集成DeepSeek或通義千問(wèn)大模型和環(huán)形麥克風(fēng),支持360°聲源定位與自然語(yǔ)義理解,實(shí)現多輪對話(huà)與情感化響應。
環(huán)形麥克風(fēng)陣列6麥協(xié)同降噪,支持5米遠場(chǎng)拾音,搭配聲紋識別算法,實(shí)現多人對話(huà)場(chǎng)景下的聲源分離與語(yǔ)音增強,并且支持中英雙語(yǔ)交流。
03、開(kāi)放接口多模態(tài)數據融合
OmniHead擁有豐富的開(kāi)放接口,支持視覺(jué)、語(yǔ)音多模態(tài)數據聯(lián)合推理,適配各類(lèi)人形機器人平臺,可拓展具身智能多場(chǎng)景應用,包括商業(yè)辦公、智能制造、智能家居、醫療陪護等領(lǐng)域。
電話(huà)
微信掃一掃