【世界快播报】新手来报到②丨给机器人当老师?我做起了“数据标注师”丨决战四季度 大干一百天

时间:2022-10-19 05:51:44 来源: 川观新闻

四川在线记者 唐泽文 摄影 吴聃

“你看看,这是一个错别字,我们要让机器人在有这个错别字的情况下,也能明白这是什么意思,就需要把它标注出来。”10月18日,成都腾讯大厦,腾讯云智服智能服务中心,数据标注师陈丽指着屏幕,让记者把这句话标注到“意图识别错误”一栏中去。


(资料图片仅供参考)

陈丽是一款手游的人工智能客服数据标注师。标注师的职责,是提升智能客服的“聪明度”——也就是让它正确判断用户发送的每句话意图的概率更高。

这句话是“我的猴子(游戏角色名字)上绑了”。“榜”字被用户错打成了“绑”,造成了智能客服无法理解。她解释:“这样标注出来,告诉智能客服,这里的‘绑’可以直接理解为‘榜’,下次再遇到这个情况,它就能明白意思了,这就是对人工智能进行训练,让它的‘聪明度’得到提升。”

人工智能之所以“智能”,就是无数标注师在这背后不断对其进行训练的结果。随着标注数量的提升,它们也变得越来越聪明。作为新手,记者按照陈丽的提示一步步执行,当了一天数据标注师。

每天标注2000条

这是一支200人顶4000人的“施工队”

体验标注师的工作,一上手,记者眼睛就“麻”了。

屏幕左侧是满满一竖行需要标注的语句。右侧是会话类型、标记类型、主意图等多个选项,其中仅标记类型就又被分为十余个选项。

“我们对每个需要标注的语句进行精准分类,这样智能客服才能学得更精准。”陈丽在一旁指导。

这是一个庞大的工作量——每天,陈丽需要对2000条识别不精准的信息进行校正标注。

环顾周边的“同行”,他们大多为刚毕业不久的大学生。“平均年龄在26岁左右。”腾讯云智服智能服务中心负责人张超介绍。

记者被分配到的小组,有一个有趣的名字“校外施工队”。“大部分人都刚从学校毕业不久,所以用了‘校外’两个字,同时也有‘校正’的意思;我们做的业务是人工智能中最基础的部分,所以也把自己称为‘施工队’。”陈丽说。

为什么选择标注师这个行业?“兴趣使然,我是一名游戏高手,自己也会在游戏中遇到各种问题需要咨询客服。如果遇到的问题在智能客服这个环节就被解决,这对用户来说是最方便的。”她说。

这是一个“厉害”的团队。在他们的训练下,智能客服和人工客服相互配合,200人就能完成4000人工客服的任务量。

80万条诉求、一字之差的歧义

“我会尽全力去当一位好‘老师’,让它们越来越‘善解人意’”

作为新手,一上午的时间,记者就标注了100余条。跟指导老师一天2000条的业务量相比,还有较大提升空间。“哈哈,新手都这样,熟悉了流程就能一眼看出怎么标注怎么分类,这需要慢慢锻炼。”陈丽说。

在标注师办公座位旁边,就是人工客服的坐席。在这里,标注师们“培养”的智能客服和人工客服相互配合,解决用户的各类诉求。人工客服所在的整个片区,被隔成了密密麻麻的小隔间,每个隔间的围挡都比其他工位高出半米。客服们有的通过文字进行回复,有的接听电话与用户进行沟通。高出半米的围挡,就是为了给他们提供一个相对独立安静的环境,相互不打扰。

两位标注师正在讨论业务工作

“智能客服是未来大方向,我们必须朝这个方向走。”张超说,2017年开始,人工智能产业进入“爆发”式发展,智能客服成为“主战场”之一。

成为“主战场”的重要原因,是市场需求。“仅以腾讯客服微信公众号为例,每天客服咨询诉求量就有80万条,每一条都靠人工来解答,怎么可能完成?”

如何通过人工智能来解决这个问题,成为当下各大互联网厂商研究的热点。“目前,我们通过智能客服和人工相结合的方式来解决。”

张超介绍,在标注师们的努力下,智能客服的数据库已有了数百万标注量。90%左右的用户诉求,能通过智能客服自助解决。

剩下的10%,虽然智能客服不能直接解决,但也能大概梳理出问题所在及解决方向,此时再交给人工接待,效率将提升很多。“200人能顶4000人,就是这样完成的。”

长远来看,智能客服的最佳状态,是用户在与其聊天时,甚至会错以为在与真人聊天,察觉不出对方是一名“机器人”。

“这并不是那么容易能达到的,尤其是中文领域。”张超以两句话举例介绍,“你要吃点什么?”和“你要吃点什么吗?”两句话仅一字之差,意思却完全不同。

“机器人要精准识别类似的不同意图,需要进行海量标注学习,算法和系统也需要不断优化,这还有很长一段路要走。”他说。

而这段路途中,标注师们将成为其间的最主要角色。

“虽然看上去工作比较枯燥,但我很有成就感。很多细枝末节的问题被我们解决了,会很有参与感。”陈丽说,看到机器人从很多问题都答不上来的状态,变得越来越聪明,这就像看着自己的“学生”在慢慢成长。“我就是人工智能背后的‘人工’,我会尽全力去当一位好‘老师’,让它们越来越‘善解人意’。”

【体验心得】

希望有更多技术能够“烂大街”

去年中国人工智能大会上,清华大学一位专家的话让我记忆犹新。他说,人工智能领域,“烂大街的技术才是好技术。”

话糙理不糙。

我们对人工智能的需求,是能实实在在普及到日常生活中去的东西,而不是听着“酷炫”却只能停留在实验室中的“PPT”。

但现实情况是,能普及的技术,往往是十分成熟的。而人工智能产品的成熟度,与其被训练的数据量息息相关。

站在人工智能背后的“人工”,也就是这群不起眼的标注师们,是其成熟的关键。他们每天通过繁琐的标注工作,对它们进行训练,让其变得更聪明之后,才有机会让技术走入到日常生活的方方面面中去,也就是“烂大街”。

采访结束时,陈丽对记者说,虽然自己的工作很基础。“但我一点也不觉得自己‘渺小。’”原因很简单:一个有价值的标注,就能解决上万个用户的问题。“想到这里就很兴奋。”

希望陈丽的兴奋劲,能传播到更多人工智能岗位上去,大家一起努力,让更多优质技术“烂大街”。

标签:

相关文章

新闻快讯

X 关闭

X 关闭

新闻快讯