阿里巴巴集團(tuán)在數(shù)字人技術(shù)領(lǐng)域再下一城。

阿里開源最新3D數(shù)字人應(yīng)用,可做虛擬客服、虛擬主播

2025-06-13 14:37:53發(fā)布     來源:多知    作者:Doris  

  多知6月13日消息,在2025上海AWE煥新消費(fèi)節(jié)的家享生活展館中,3D數(shù)字導(dǎo)購「小淘」以近乎真人的形態(tài)與觀眾自然互動(dòng)。MNN TaoAvatar是阿里巴巴基于其開源的輕量級深度學(xué)習(xí)推理框架MNN開發(fā)的3D數(shù)字人技術(shù)。這項(xiàng)融合3D高斯重建、AI語音驅(qū)動(dòng)與端側(cè)大模型的尖端技術(shù),突破傳統(tǒng)數(shù)字人局限,實(shí)現(xiàn)從“二次元偶像”到“3D真人復(fù)刻”的躍遷。

  在智能交互上,TaoAvatar結(jié)合當(dāng)前最前沿的大模型技術(shù),依托阿里集團(tuán)的通義千問開源模型和MNN開源推理引擎,在端側(cè)部署了輕量化的ASR-LLM-TTS語音問答鏈路。TaoAvatar在Apple Vision Pro上的對話延遲穩(wěn)定在1~2秒,基于導(dǎo)購領(lǐng)域?qū)I(yè)知識(shí)微調(diào)的Qwen2.5-1.5B模型,設(shè)備端內(nèi)存占用僅為1.2GB,在輕量化的同時(shí)保持了高效響應(yīng)。這款創(chuàng)新技術(shù)將高保真的3D虛擬形象生成與實(shí)時(shí)交互能力帶到移動(dòng)設(shè)備,為直播、虛擬社交和AR應(yīng)用等領(lǐng)域帶來全新可能性。

  目前,該項(xiàng)目地址已公開(https://github.com/alibaba/MNN),開發(fā)者可通過豐富的API和文檔快速上手,定制屬于自己的3D數(shù)字人應(yīng)用。