3月22日,阿里巴巴人工智能實驗室推出了第二代中文人機交流系統(tǒng)AliGenie2.0。新一代系統(tǒng)在此前“聽”和“說”的基礎(chǔ)上引入了視覺能力,能夠進行視覺認知、多模態(tài)交互、情景感知。
阿里巴巴人工智能實驗室負責(zé)人淺雪表示,AliGenie 2.0的視覺能力將首先落地在天貓精靈X1上。據(jù)了解,天貓精靈只需要裝載一個XHolder硬件,然后通過手機APP中的“精靈火眼”功能,就可以實現(xiàn)視覺識別能力。
目前,“精靈火眼”功能主要聚焦在兒童和老人場景。對于兒童,精靈火眼可以通過圖像識別,結(jié)合智能語音互動、聲音朗讀,幫助兒童讀書、識字;對于老人,精靈火眼具備識別藥盒的功能,只要掃一掃藥盒,就能用語音播報藥名、功效、過期日等信息。
據(jù)悉,精靈火眼目前已能識別117套圖書、4萬個藥盒。此外,精靈火眼還具備一個3D虛擬形象,可提供自然交互的表情擬態(tài)動畫。目前,這個虛擬形象可實現(xiàn)20多種擬態(tài)動畫,用戶觸摸其不同部位,它能夠產(chǎn)生不同的反饋和互動。
淺雪表示,天貓精靈的本質(zhì)是一個家庭智能終端,將具備認知能力、理解力,執(zhí)行力。未來,它不僅是一個智能音箱,還可以連接其他家電、家居產(chǎn)品進行智能控制。
所以在淺雪看來,智能音箱是否帶屏幕并不重要,重要的是視覺認知的能力。淺雪表示,智能音箱終極形態(tài)是家庭機器人,從“聽”“說”,到“視覺交互”,再到“行動力”,阿里巴巴希望通過引入視覺能力加速這種進化。
阿里巴巴人工智能實驗室作為阿里巴巴智聯(lián)網(wǎng)戰(zhàn)略的一部分,未來的主要研究方向便是將語音交互、視覺交互、機器行動力等結(jié)合在一起,推動家庭智聯(lián)網(wǎng)的落地。
截至目前,天貓精靈的銷量已經(jīng)達到200萬臺,連接的家用電器數(shù)量超4500萬臺,并累計為用戶執(zhí)行了9億次任務(wù)。
|