技術(shù)
導(dǎo)讀:作為小米長(zhǎng)期生態(tài)合作伙伴,商湯“日日新”大模型交互平臺(tái)“商量”已探索性接入小米 AI 眼鏡,幫助用戶在生活與工作的真實(shí)場(chǎng)景中,實(shí)現(xiàn)“看、說(shuō)、記、想”一體化,具備全雙工實(shí)時(shí)音視頻交互能力。
8 月 6 日消息,據(jù)商湯科技消息,作為小米長(zhǎng)期生態(tài)合作伙伴,商湯“日日新”大模型交互平臺(tái)“商量”已探索性接入小米 AI 眼鏡,幫助用戶在生活與工作的真實(shí)場(chǎng)景中,實(shí)現(xiàn)“看、說(shuō)、記、想”一體化,具備全雙工實(shí)時(shí)音視頻交互能力。
據(jù)官方介紹,傳統(tǒng)智能設(shè)備的交互體驗(yàn),常受限于響應(yīng)延遲、語(yǔ)境斷裂與單向輸入。小米 AI 眼鏡 × 商湯日日新組合的亮點(diǎn)之一,在于其全雙工實(shí)時(shí)音視頻交互能力。這并非簡(jiǎn)單的語(yǔ)音指令接龍或“一問(wèn)一答”的半雙工拼接,而是構(gòu)建了類似人與人對(duì)話的自然、流暢、不間斷的交互閉環(huán),例如逛街逛展進(jìn)行實(shí)時(shí)識(shí)別,化身問(wèn)答小百科;出國(guó)旅游又能成為翻譯助手,在這些場(chǎng)景均展現(xiàn)了強(qiáng)大的實(shí)力:
毫秒級(jí)響應(yīng),思考即交流:依托“日日新”強(qiáng)大的模型推理能力與底層優(yōu)化,交互延遲被壓縮至毫秒級(jí),用戶言語(yǔ)未落,理解已經(jīng)開(kāi)始,回應(yīng)幾乎實(shí)時(shí)生成。
語(yǔ)境連續(xù)不中斷:“日日新”大模型能深度理解上下文,精準(zhǔn)跟蹤對(duì)話脈絡(luò),支持隨時(shí)打斷、糾偏和深入追問(wèn),對(duì)話如同與真人助手般自然流暢。
復(fù)雜環(huán)境反饋超穩(wěn)定:即使在嘈雜的展館人潮或喧鬧的街頭,其抗噪性能升級(jí)也能確保指令被精準(zhǔn)捕捉、理解無(wú)誤。
深度分析,記憶加持:結(jié)合音視頻記憶與檢索技術(shù),系統(tǒng)能即時(shí)關(guān)聯(lián)歷史溝通細(xì)節(jié)(如在向客戶復(fù)述方案時(shí)),提供極具針對(duì)性的信息支持。
商湯科技稱,此次合作為智能眼鏡乃至更廣泛的下一代智能硬件交互范式,提供了具備高價(jià)值的參考方向 —— 讓 AI 更實(shí)時(shí)、更深層地融入人類感知與交互,持續(xù)釋放其賦能用戶創(chuàng)造價(jià)值的潛力。
據(jù)了解,今年 6 月,小米首款 AI 眼鏡正式問(wèn)世,被定義為“面向下一代的個(gè)人智能設(shè)備”,也是“隨身的 AI 入口”。據(jù) XR Vision 報(bào)道,小米 AI 眼鏡首銷 3 天銷量或已接近 5 萬(wàn)副,創(chuàng)下了中國(guó) AI 眼鏡最快銷售紀(jì)錄。