大模型来袭,智能音箱进入2.0时代

大模型来袭,智能音箱进入2.0时代


文/Leon

编辑/侯煜

AI(人工智能)是近年来最热门的技术,各种基于大模型的软件,比如文字处理助手、画图工具等,在一定程度上提升了生产力。今年,一众科技厂商致力于将AI概念硬件化,包括AI手机、AI电视、AI PC的概念纷沓而至。其中,还有一个重要的产品类型,有望率先将AI应用落地,那就是智能音箱。

第一款真正意义上的智能音箱,是2014年亚马逊推出的Echo。随后几年间,这一概念逐渐在全球普及,中国互联网厂商迅速入局推出相关产品,包括华为、阿里巴巴、百度、小米等。除了播放音乐,智能音箱还扮演了智能助手、智能家居中心的角色,逐渐普及

然而,智能音箱市场自2020年开始迅速降温,一直持续到现在。据洛图数据显示,2023年,中国智能音箱市场销量为2111万台,同比下降19.8%;2024年第一季度中国智能音箱销量为391.8万台,同比下降31.4%,连续第12个季度呈下跌状态。

图片2.jpg

洛图科技认为,智能音箱市场销量下滑的根本原因在于产品力不足,缺乏实质性创新,同时作为音箱其音质也并不令人满意。不过,该品类并不会退出历史舞台,转机就在于AIGC(生成式人工智能)

ChatGPT 4.0问世时,人们惊叹于它的自然语言处理、上下文理解能力,这是大模型为AI带来的质变。显然,AIGC+智能音箱这一组合是非常契合的,互联网厂商们迅速跟进,有望为智能音箱市场带来新的活力。

大模型时代,智能音箱实现了多模态交互

去年4月,天猫精灵宣布正式接入阿里巴巴通义千问,成为第一批将大模型接入智能音箱硬件的厂商。今年5月23日,天猫精灵宣布将进行品牌焕新,不仅更换了logo,还带来了全新产品天猫精灵X6。这款音箱采用全新“天空音”布局,突出科技感设计的同时升级音质表现,同时也是搭载Genie OS+百科问答大模型的新一代AI智能音箱。

图片3.png

不少传统智能音箱之所以被视为“智障”,原因之一是语音识别能力弱,经常听不清或听不懂用户的话;第二,缺乏上下文联想能力,无法实现真正对话式的交互,需要用户不厌其烦地重复对话;第三,回答非常机械,不接地气。

针对上述痛点,天猫精灵X6给出了解决方案,包括:海量搜索信息、主动引导补充信息、强化信息实时更新能力及强化语境语义分析。综合来说,就是智能音箱在AI助力下,可实现更广泛的应用场景。

阿里通义大模型目前已经颇具规模,阿里最新一季度财报也提到了AI相关收入同比激增,说明市场对其产品的认可。在接入通义大模型后,天猫精灵X6将具备启发式的多轮对话能力,未来甚至有望和用户玩桌游。

阿里天猫精灵业务中心负责人宋刚在接受《华尔街科技眼》专访时表示,未来AI可实现更加自然的交互。“比如你玩桌游的时候缺一个裁判,它可以充当裁判。我只是举一个例子,这样类似的场景非常多,我们会选择三到四个有价值的场景先深耕。”宋刚说。

据宋刚表示,目前天猫精灵已经在内测交互式对话功能,在不久的将来,产品会陆续地迭代升级落地,实现场景判断、多模态交互。也就是说,用户不用每一次都要去喊它一下才能应答。

那么回到天猫精灵X6,它究竟有什么创新式的设计和体验,又给整个市场带来了什么变化呢?

天猫精灵X6给出的版本答案:兼顾音质与智能

天猫精灵X6在设计上进行了一定的创新,天空音布局颇具科技感。同时,设计是为了音质而服务,采用1.1声学架构,通过独立高音单元的天空方向扬声设计构建出穹顶效果,实现沉浸式的聆听体验。有趣的是,天空音布局处的氛围灯,不仅可以通过手机App进行设置,还具备温度感知功能,动态调节色温。

图片4.jpg

不论是何种类型的音箱,本分是好音质。相比此前产品,天猫精灵X6选择了更强劲的驱动单元,包括1英寸10W高音单元以及3英寸20W低音单元,再加上灵珑腔体架构使得悬浮顶至机身上下贯通,音质更加通透,可实现114 dB的高信噪比与0.03%的低失真率。

在实现出色音质的同时,Genie OS+人工智能大模型,赋予了天猫精灵X6更丰富的使用体验。除了常规的查天气、定闹钟、根据自然人来推荐歌曲等各种常规操作外,天猫精灵X6智能音箱还新加入了场景音乐的设计。

所谓场景音乐,是通过基于AI大数据的算法,整合曲库风格标签,天猫精灵X6就能结合环境、时间及对用户的个性化行为理解,自动推荐适合当下场景的音乐。当然,有了大数据的加持,语音点播歌曲也更加准确,不会出现文章开头的反面案例。

天猫精灵X6也是一个智能家庭中心,可兼容1600余个品牌、6800余种型号的智能家居设备,并且通过深度学习用户偏好和习惯,提供一些个性化服务,比如主动式的问候等。

在接入通义千问之后,加上前端的夸克搜索服务,天猫精灵X6的理解能力也上了一个档次。不仅回答方式更加人性化,还拥有更精准的归纳信息能力。如果参考信息不足,天猫精灵X6还能过引导用户补充信息,更加连贯、精准地回答问题。

当然,天猫精灵X6只是一个新的开始。随着AIGC的发展,传统智能音箱市场格局将被打破,对于厂商来说是一个机遇,也是挑战。

AIGC有望重塑智能音箱市场格局

目前,智能音箱市场中的头部厂商几乎都拥有自主大模型和少量AI应用形态,那么拼的是什么? 

宋刚认为,在AIGC带来的智能化浪潮中,智能音箱需要具备关键三点:素质过硬的硬件、AIGC应用以及大模型的内容整合能力。三者缺一不可。

“AI大模型的落地是一个很长的过程,不断成长,不断满足人们需求的过程,与硬件发展是并行的。硬件首先是一个有价值的硬件,用户才会去买,其次还能不断地给用户解锁新的技能,持续有惊喜,这样的硬件才是良性发展的状态。所以,我们在这个方向会去深耕。”宋刚补充道。

从这个角度来看,背靠阿里巴巴通义大模型和庞大生态体系,天猫精灵有能力在AI时代带来更有想象力的应用体验。结合天猫精灵X6,一个尝试就是在硬件方面将“天空音”设计带到千元以内,符合宋刚所说的“硬件+AI” 的逻辑。

至于AI方面的体现,未来的智能音箱显然不再是一问一答的呆板机器。宋刚提出,首先要在语音交互上借助大模型能力做语音链路的优化;其次,它能主动判断当前场景,涉及到多模态交互;第三,能够智能地判断当前状态,而不仅仅是被动接受。从天猫精灵X6的部分功能来看,部分特性已经初步实现,相信未来会有更多样化的应用落地。 

图片5.png

市调机构IDC预测,智能音箱市场将在2024年中期开始逐步小幅复苏。对于智能音箱的未来发展重点,IDC认为后续交互能力优化及内容资源拓展将逐步改善智能化使用体验,从而撬动中高端市场需求。人机交互优化将成为一个关键点,推进智能音箱市场升级发展。

对于大型互联网企业,不论主营业务是电商、搜索还是游戏,在AI时代全面争夺入口是基本战略方针。与手机、电视相比,智能音箱使用场景广泛、操作便捷,是现阶段智能家居中最理想的入口

天猫精灵创立7年来,已经服务超过 6300 万用户、3500 万家庭,产生的天量公共数据有助于训练大模型、提升AI性能。同时,依托于阿里云多年累计的先进技术,天猫精灵很有潜力成为阿里集团AI业务的重要入口,加快AI应用落地。

作为阿里巴巴集团在人工智能领域的重要布局,天猫精灵始终专注于人工智能技术在日常生活中的广泛应用,通过为天猫精灵构建更聪明、更专业、更个性、更有温度的AI交互系统,赋予天猫精灵更为丰富的生活角色,提升用户在使用中主动创造出来的惊喜感。

随着大模型的逐步落地,头部大厂正在投入更多资源、加大研发力度,训练垂直领域的应用模型,将更多创新式的体验落地,以智能音箱为代表的入口型硬件产品,将迎来迭代潮。


格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论