发布时间:2024-09-18
大模型技术正在悄然改变我们与智能助手的互动方式。以小米的小爱同学为例,这一变革不仅提升了用户体验,还为整个智能助手行业指明了发展方向。
小爱同学是小米集团的人工智能交互引擎,自2016年研发以来,已广泛应用在小米的手机、音箱、电视等众多设备中。2022年10月,小爱同学开始探索大模型应用,这一举措显著提升了用户活跃度和中长尾问题的回答满意度。据小米集团小爱总经理王刚介绍,大模型的应用使得中长尾提问的满意度从30%-40%提升到了80%,用户活跃度提升了约10%。
大模型的应用为小爱同学带来了多方面的改进。首先,在意图理解方面,小爱同学采用了“function calling”的方式,通过大模型判断用户意图并选择相应的API执行。这种方法不仅提高了意图理解的准确性,还大大减少了训练数据的需求,中长尾query满足率提升了4%,多轮query满足率提升了3%,训练数据减少了90%。
其次,在回复生成方面,小爱同学利用RAG技术(Retrieval-Augmented Generation),通过外挂知识库让大模型基于检索到的知识进行回答。这种方法解决了通用大模型回复中存在的时效性、长上下文理解和指令遵循等问题,使得回复更加准确和智能。
大模型的应用还为小爱同学带来了新的功能。例如,在小米汽车SU7上,小爱同学可以遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗台”等画面,增加亲子互动和乘车乐趣。在小米手机端,小爱同学还可以完成一键拍照生成菜谱、户型图分析、提供P图建议等复杂的图片理解任务。
然而,大模型的应用也面临着挑战。王刚指出,知识问答类任务对准确性要求高,通常只有唯一答案,这对大模型的通用能力提出了很高的要求。目前,大模型在解决这类任务时仍存在明显差距。
展望未来,小爱同学的发展方向包括探索用一个大模型端到端地满足用户需求,甚至实现由一个多模态大模型进行端到端的理解,无需ASR(自动语音识别)和TTS(文本转语音)。此外,小米还在进行端侧大模型的研发,以更好地解决用户隐私问题。
小爱同学的实践表明,大模型正在深刻改变智能助手的用户体验。它不仅提高了智能助手的智能水平,还为用户带来了更加精准、高效的服务。随着技术的不断进步,我们可以期待智能助手在未来能够更加智能地处理各种复杂的任务,为用户提供更加优质的服务。
在这个AI驱动的新时代,智能助手正在成为连接人与数字世界的桥梁。小爱同学的实践为我们展示了这一趋势的未来可能性,也为我们思考如何更好地利用AI技术改善日常生活提供了宝贵的启示。