谷歌人工智能可筛查歹意谈论 竟因错别字受质疑

作者:fun88com

时间:
2023-04-20 00:43:01

  【网易智能讯 3月2日音讯】拜访任何新闻或交际媒体网站,你一定会发现一些含有咒骂或仇视的言语。正如Ars网站谈论区友善的网友所知,企图在谈论中根绝寻衅和咒骂的言语,可能是比较吃力不讨好的工作:约束得太紧会有限制的倾向;而太宽松又会毒害社区,导致用户由于惧怕被进犯而不敢共享自己的主意。而以人为本的适度是十分耗时的工作。

  这两个问题都是Jigsaw的一个项目使命,这是一个从谷歌分离出来的Alphabet旗下草创公司。Jigsaw公司推出的Pespective项目是一个专心于线上会话的使用程序,它用机器学习来辨认谩骂、打扰和其他歹意谈论。这项人工智能技能为谈论设置“歹意等级评分”,可以用来润饰或直接回绝谈论,并告诉谈论者其发布的内容被拒的原因。Jigsaw现在正在与及打开协作,施行Perspective API项目,协助处理网友发布的内容。

  不过,正如华盛顿大学网络安全实验室的研讨人员所说,人工智能依然需求练习。在一篇论文中,Hossein Hosseini、Sreeram Kannan、Baosen Zhang和Radha Poovendran证明,他们可以令Perspective的人工智能为某些谈论打出较低的歹意等级分数,不然这些单词将会被符号为拼写过错,例如灵敏词汇idiot(痴人)被写成iidiot等,别的还可能会在单词中刺进符号,写成i.diot或i d i o t等。他们研讨了人工智能的文本剖析,成功骗过Perspective,令某些侮辱性谈论经过了歹意评分测验。

  Hosseini和他的其他合著者们写道:“机器学习算法的一个缺点是,对手可以经过奇妙地打乱算法的输入,来改动其输出,这往往会被人疏忽。这种输入被称为对立样本,在不同的机器学习算法中都被证明是有用的,即使对手仅仅使用黑盒来进犯方针模型。”

  研讨人员还发现,Pespective会过错符号一些非歹意谈论,这些内容中含有某些关键词,人工智能在此前练习时将其符号为侮辱性言辞。例如,“不愚笨”或“不是痴人”这两个短语的歹意评分简直和它们的肯定式相同高。

  这些过错符号,以及经过改动算法来逃避筛查等行为,是自动化检查遍及会遇到的问题。在发给Ars的一份声明中,Jigsaw的产品司理CJ Adam承认了咱们报导的这一问题,他表明:

  此类研讨是很有含义的。网络歹意是一个很难处理的问题,Perspective这一项意图开发,为此类问题中机器学习的使用供给了思路。咱们欢迎学术研讨人士参加咱们在Github上的研讨工作,探究怎么一起协作,找出现有方式的缺点,并改善它们。

  正如研讨人员所指出的那样,Perspective的技能依然处在初级阶段,它只能辨认出与现有歹意谈论数据库中相类似的内容。咱们的对话人工智能(Conversation AI)版块有更多此类问题的细节信息。Perspective答应用户和研讨人员直接提交修正主张,这些主张之后会被用于改善这一技能模型,保证它可以了解更多方式的歹意言语,并不断改善。(来历/Ars Technica 翻译/机器小易 审校/小ka)