如何用百度飞桨PaddleNLP实现对话中智能客服的情绪识别
日前 智研咨询 易观等数据平台相继发布《2022-2026年中国智能客服行业市场运营现状及投资规划研究建议报告》 《2019中国客户服务智能化市场专题分析》等客服行业相关报告 报告内容都在不同程度提及了客服行业市场规模的扩大 其中智研咨询发布的报告显示 至2018年我国智能客服行业市场规模达到了27.22亿元 同比2017年增长了44.48%。智能客服行业规模不断扩大 而如何降低成本并提供给顾客更好的体验 一直是该行业在不断探索的重要问题。
这其中 自然语言处理(NLP)技术的应用则是优化体验的重要“工具”之一。NLP技术不仅在智能对话 智能问答等智能客服场景中发挥着核心的作用 而且能在客服质检环节提高质检效率 优化客服质量。
(图:智研报告资料内容)
在传统客服场景下 为了保证服务质量 有专门的客服质检员来对服务记录进行抽样监听及评分工作 并形成质量报告反馈于业务人员和客服人员。但往往客服质检员在抽样和统计过程存在耗时 效率较低 质量报告难以完全代表整体客服水平等问题。利用NLP技术后 可以对顾客的说话内容进行情绪正向 负向 中性的标签定义 初步完成对存在问题的客服进行筛选 从而为企业降低了人工质检的成本并提高了效率。
在优化客服体验的“这条路上” 基于飞桨深度学习平台开发的自然语言处理(NLP)工具PaddleNLP 为企业与开发者带来了诸多便利。PaddleNLP是百度飞桨开源的产业级NLP工具与预训练模型集 提供了依托于百度实际产品打磨 通过百亿级大数据训练的预训练模型 能够极大地方便 NLP 研究者和工程师快速应用。使用者可利用百度飞桨PaddleNLP 灵活使用文本分类 词法分析 相似度计算 语言模型 文本生成 阅读理解和问答 对话系统以及语义表示8大类工具 并且可以直接使用百度飞桨开源工业级预训练模型进行快速应用 在极大地减少研究和开发成本的同时 获得更好的基于产业实践的应用效果。近期 百度AI快车道PaddleNLP实战营举办多次活动 从文本语义匹配 对话情绪识别 物流信息抽取三个主题带来不同的PaddleNLP开源工具的实战课程。
其中 “对话情绪识别”的本质就是通过“分类任务模型”对客户表达的内容进行快速分类 辨别其当前表达的内容在情感上是正向 负向还是中性的。因此 当模型应用于客服质检业务时 可有效快速地检测出用户表达的内容中 是否表达了不满 满意和无情绪三种感受。客服质检员则可针对识别为不满情绪的对话客户进行集中的查看 用以提升客服质检的效率。
(图:使用NLP分类任务的客服质检业务)
技术上 基于百度飞桨PaddleNLP的“对话情绪识别”模型则特别针对中文表达中口语化 语气词多 词汇乱序等常见情况与难题 优化除去口语化 同义词转换等预处理方式 保证识别数据的干净有效 从而让机器“更懂”用户所表达的“中心思想”。因此 该模型可以广泛的适用于电商 教育 地图导航等场景 帮助“机器”更好地理解“人心”。
此外 百度飞桨所提供的AI Studio一站式开发实训平台 还可提供集开放数据 开源算法 免费算力三位一体的服务 为开发者提供高效易用的学习开发环境 高价值高奖金的算法大赛 高质量的案例和进阶课程 助力企业加速落地 AI 业务场景 相关内容可进入百度大脑开放平台AI Studio页面查看。(https://aistudio.baidu.com/aistudio/projectdetail/121630)
活动当天 不少开发者表示导师讲解的内容“非常实用” 一位来自社交领域NLP开发的从业者更指出:“飞桨AI Studio使用下来感觉非常‘流畅舒服’ 开发者可以用现成的代码 把整个操作流程‘跑通’。尤其是对于初学者有着极大帮助 能够帮他们快速上手建立信心。”
(图:百度AI快车道活动现场)
在应用上 面对解决实际问题的具体模型选择时 除了要考虑模型本身的效果 还要考虑跟真实操作环境的匹配。在GitHub的PaddleNLP主页里 已经对包括对话情绪识别工具——emotion_detection等许多数据集等进行验证 开发者可以直接使用。(https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/emotion_detection)
(图:GitHub中对话情绪识别代码结构说明)
2006年深度学习模型的提出 直接驱动了AI在图像识别 语音识别 自然语言处理等方面取得众多技术突破。而AI作为一种“新动能” 正在为众多传统产业降本提效和模式升级 带来质的突破 产业智能化将成为新的趋势。因此对AI乃至深度学习的关注和了解 将成为各行业“玩家”领先一步的关键。据了解 百度大脑AI开放平台十月份集中分享了基于飞桨的深度学习领域资料 面向众多开发者推出“深度学习技术课堂 探索实践继往开来”主题月活动。
在客户服务场景中 语言和表达就像是“第一生产力”。随着金融 电信 教育 电商等行业的快速发展 大众对客服的需求也随之增加。然而 人工客服因数量覆盖有限 而现有的“智能客服”则因语言和表达“不通人情”常让客户难以满意 此时 情绪识别的价值便凸显出来。
具体如何使用PaddleNLP开源工具集的分类任务 从数据准备到模型训练 再到效果调优 百度AI快车道PaddleNLP专场活动中已进行详细说明。错过此次活动不要紧 开发者可以进入“IT大咖说”网站后搜索“AI快车道”即可回看活动直播(http://www.itdks.com/Home/Act/apply?id=3212&mUid=3104597)。
百度飞桨深度学习平台对“产业智变”的探索还在持续进行中 想要快速上手 获得开源代码 听大咖实操解读等 可以关注百度飞桨官网https://www.paddlepaddle.org.cn 微信公众号“飞桨PaddlePaddle” 或加入PaddleNLP交流群(QQ:758287592)了解最新信息。