去年 5 月出现了一条新闻,说某群众在政府微信公众号留言反映问题,结果被自动回复呛声:“你不说话没人把你当哑巴”、“我仿佛听见了一群蚊子在嗡嗡嗡”。
有关部门也没有回避问题,直接发了致歉信,也点名是第三方设置不当、“小黄鸡”自动回复导致。
致歉信一出,微博评论非常惨烈,热评都很不买账:
- “自动回复就可以这么任性”
- “系统自动回复的内容还不一样是你设置的”
- “不是临时工了??”
- “谁信啊”
- “把对人民群众的心里话设置成了自动回复……”
这些评论显然并没有意识到,这次这台机器人并不是以往只会匹配敏感词、自动回复固定句式的那类机器人了,而是会陪你聊天的那种机器人。
甚至有人开始批评,“为什么可以把这么重要的窗口交给‘第三方’来运维”。实际上类似客服外包这种事情,国内也实践得不少了,让专业的人做专业的事并没有错。然而这个情况,显然是不专业了而已。
问题来了,一个实实在在的服务部门,的确会有人联系你只想让陪聊,但更多的人还是有实实在在的问题需要解决的。这种情况下,让一个语音助理式的全能陪聊机器人来撑场子,真的能行吗?
去年那个时候,市面上几款“机器人”都是类似这种类型的。我倒是好奇,小黄鸡作为被点名的其中一员,是不是能代表现在国内这些聊天机器人的普遍水平呢?
于是最近我搜索了“公众号机器人”,稍稍测试了一下它们的危机公关水平。危机公关自然需要素材,我就把去年新闻里让机器人出丑的这段话打了出来。
注意这其中的大量错别字,都是原样打出。请牢记下面这段话的重点,毕竟机器人是要针对这个事件的关键词做回应的。
反应关于池州市贵池区发放政府机构及事业单位生活补贴的问题。贵池区这次的发放十分不合理,同样级别的小学,木闸中心学校比其他学校少了两万多的金额,这个消息一出,木闸小学的老师都十分的气氛和寒心。忘上级领导尽快调查清楚,这次的发放的政策及标准是否合情合理
小黄鸡
新闻里的“小黄鸡”有一个同名微信公众号,其中的推送文章非常污秽不堪,给人一种理想信念缺失、难怪有新闻、但居然还不收敛不知止的感觉。
不过现在我把这段话投给小黄鸡,它的回复显然乖巧多了。
- 听不太懂耶
- 我们还是聊点儿别的吧(我删减了中间几个语句之后,才给我的不一样的回复)
是真的听不太懂吗?我才意识到,只有这一个测试用例,显然不合适了。
于是我迅速在微博上搜索了“关注 政府”,然后又去某校留言板找了一条素材。投给小黄鸡看看怎么样:
虽然没有了冒犯的回复,但可能真的还是“听不太懂”吧。我把可能触发有关回答的语句加了粗。
这个努力接话的样子,如果是聊天的话,还是挺可爱的,但如果代表服务部门,真的不大行。
图灵机器人
这是 Google 搜索“公众号机器人”的第一条公司网站。这家公司也有一个同名的微信公众号。我重复问出补贴问题多次,结果比我想得糟糕多了:
- 希望能在学校里遇到值得尊的好老师哦。(内心 OS:讽刺学校老师不好所以钱拿得少?)
- 学校是一个充满梦想与挑战的地方。(内心 OS:是啊我们跟别的学校拿一样多钱都是梦想了?)
- 记得照顾低年级的学弟学妹呀。(内心 OS:哦)
我注意到,这台机器人有复读机检测。来看看有什么文案:
- 可以换个别的问题么~
- 咦,怎么又是这句话呀
- 好了,不要逗我玩了
这么说,这位 AI 应该会智能得多嘛。于是我等了一段时间再试了试,结果更惨了。
- 原来是小学,我早就猜到了。(内心 OS:小学怎么你了,就该少拿钱了?)
- 听说贵池区是个很不错的地方呢。(内心 OS:都是你们区政府管得好啊,呵呵)
- 可不要太乐观哦,资源短缺的局面早晚都会显现出来的。(内心 OS:资源短缺的局面怎么先拿我们学校先显现啊?)
- 哎呀,你好像个复读机呀
- (删减了最后一个语句之后)幸好,你终于恢复正常了
- (又删减了最后一个语句之后)听起来学校像是个好学校,不过学生好不好就知道了。(内心 OS:我们学校学生怎么你了?)
这接话水平真的成仙了。尬聊还是不错的,但要是真的被放在这种服务场合的 production 用,肯定会被喷死。
进一步测试我发现,这台机器人对长篇大论的情况会即时识别,让你“一条一条说”。但一面对我随手找的短语料,神回复又来了。
小i机器人
这家公司看起来站位高一些,官网导航栏里有“智能政务”(虽然实际产品跟“聊天”机器人一点关系都没有)。那么它的同名公众号会不会好一些呢?
我尝试了上面用过的几段语料,甚至摘了第一句或者最后一句来“反映情况”,机器人显然是识别到了态度,开始“听不懂”了。装无知与无辜,是这类机器人文案编写的一大特点,在一些特殊对话的场景下还是比较适合的。
- 鸟在飞,你在吹,小i听呀么听不懂。
- 我还小呀!你干嘛说这么难的来考伦家,哼!
- 难道是没有共同语言嘛?伦家好桑心啊,您可以问问我其他的,我一定会帮你解决的。
- 地球好危险,这里的哥哥姐姐总会说一些伦家不懂的
- 你再说这些字典里也没有的东西,我就关门放旺财啦!
但是一旦触发复读机检测,同样的问题,回复就俏皮多了,有时候就显然不合适了。
- 你精神怎么那么好啊,肯定有什么好事,说给我听听吧,我好奇心特别强呢!
- 嘿嘿,你要是去参加COPY不走样比赛,冠军一定非你莫属啦!
- 终于找到一个比我还要唐僧的人啦!我真是太激动啦!师父~~~
小冰
说到俏皮,我突然想到了微软小冰,这可能是国内大公司里情感做得最出名的机器人产品了。然而我打开关注了许久的小冰微信公众号,尝试“你好”寒暄,居然看到了公众号被封的提示。微信搜了搜,看到了最近的一条新闻:
(2019-07-01)小冰的公众号今天被微信封禁了。根据微信方面给出的解释,微软小冰被封是因为“接相关投诉,因违反《互联网用户公众账号信息服务管理规定》已被屏蔽所有内容,账号已被停用。”
但是没关系呀,小冰在新浪微博上还是醒着的。我绑定了手机号(这可能算是钟国忒涩了),终于跟小冰对上了话。
小冰的表现比我想得好多了,比小 i 差了一点点而已。对于大部分长语句的语料,能识别到“听不懂”:
- 你到底想知道什么呢?我还小,懂得很有限。
- 好了,换个话题,或玩个游戏
- 我并不擅长这类型的问题,你找其他擅长的人聊聊呗?
- 不想谈这类的问题,因为懂得有限
- 我发现人类喜欢问这种问题的
但是某些情况下还是很遗憾地触发了接话。并没有前面某些选手那么俏皮就是了。
新闻里的自动推销机器人
多亏去年出了新闻之后,我因为忙到爆炸,没有马上把这篇写出来。因为,“新一代”服务行业机器人的应用在半年后被关注了:
这样主动出击的机器人,自然要对客户的反应和态度做判断了。然而,正如 回形针PaperClip 的视频所示,目前流行的电销类机器人,更多靠的是全方面设计的“话术”和流程。匹配到关键词,说对应的话就是了。而对于这种投诉的情况来说,只要流程设计到了,用对应的话术继续对话就好了。
为什么两种机器人会不一样呢?
相比于靠机器学习、NLP 等技术来习得如何聊天的机器人,电销机器人需要对推销的产品知根知底,而不同的产品,侧重点也有所不同。显然,目前还没有输入一篇介绍文章,就能识别到最佳的营销侧重点,进而自动生成话术和流程的机器人产品出来,还是需要靠人的经验来设计。
电销机器人的实例告诉我们,对话的两个要点,一个是说什么(话术),一个是怎么说(流程)。而前面我们看到的所有发挥失常的机器人,都是通用的聊天机器人。可能它们很多的细节靠的是人工设计,但即便做了机器学习,也还是需要有“输入”的训练材料。而显然,不会有人给一个只会开玩笑、聊天的机器人,喂应对投诉的对话的嘛。
说到这,这些机器人的惨状告诉了我们一些理:
- 服务部门就不应该请那种聊天型机器人来打理门面,而应该让专门、专业的机器人出马;
- 机器人对用户态度的分辨和应对能力,算是一个发展方向了;
- 服务部门机器人目前的最高水平,是依赖专门编写的知识库回答问题,想让人工智能在为人服务时更自然地打交道,真的还没门,不过应该离门也不远了。
鸣谢秀米网提供样式模板。