本周内,今日头条将放养一条看门狗“灵犬”
导读
“灵犬”的母体是一个使用人工智能技术反复训练的反低俗模型。
刺猬公社 | 石灿
3月27日,今日头条出品的一款名为“灵犬”的微信小程序,正式结束了为时两个月的内测期。“灵犬”本周内正式上线,这是国内首款反低俗信息小程序。
这款小程序脱胎于今日头条反低俗算法模型,用于鉴定低俗信息。用户可以将文字或者文章链接放置到搜索框内,即可查询该条信息的健康程度。
不过,在文字检测上,“灵犬”团队规定,用户输入的字数必须超过10个字,才能进行检测。
为此,“灵犬”团队给出了解释:用户给的上下文、语境等信息越充分,机器判断的准确度就会越高。
有参与内测的用户曾经在“灵犬”上检测了“你饿不饿我下面给你吃”几个字,数据显示,该内容健康指数为51%。昨天,刺猬君再次检测,该内容的指数为56%。

“灵犬”团队解释说,不同于色情信息,处理低俗信息的一个难点在于,人们对于低俗的判断标准具有一定的主观性。色情信息很直接,低俗信息偏隐晦,对于像“灵犬”这种机器就更难了。
今日头条的做法是,把低俗的标准分为两个层次:几乎所有人看来都会一致同意的标准底线,和因人而异的主观判断。
那么,在算法机制机制背后,“灵犬”是如何判断一段文字或网址链接为低俗呢?
“灵犬”团队给出的解释是,算法模型处理低俗内容,有一条最常见的路径:“收集数据-标注样本-训练模型”。
对于用户输入的文字或链接,“灵犬”会先进行提取、分词和语义识别,然后根据设定的规则,输出对应的分数、评级和结论。

不过,测试员将带图片和视频的链接进行测试时,检测效果并不太好。
“灵犬”团队给出的解释是:因为图片、视频提取需要较长的时间,返回结果较慢,考虑到工具的即时性,暂时还不支持检测。
“灵犬”的诞生,将被纳入到今日头条内容审核体系中,它与今日头条内容审核机制是一条“犬”和一支“工作犬部队”的关系。可以理解为,“灵犬”是头条审核机制中反低俗部分的一个简化版本。
据了解,在内容审核方面,今日头条目前投入了4000多人专业审核团队。
“灵犬”团队对外称,这是国内最大的审核团队,并搭建色情、低俗、标题党、虚假信息、低质模型180多个,结合人工、技术手段,有效提升了内容审核的效率和准确度。
其实,今日头条在去年就谋划这件事情了,在今年1月底,“灵犬”团队曾面向全社会招募反低俗测试员,最终从超过5000位报名用户,选出了30位代表,包括政府部门工作人员,媒体记者、编辑,大学教授、学生,互联网公司产品经理和技术人员,自媒体人等。
在内测阶段,“灵犬”团队根据测试员的意见反馈,增加了大量人工策略,帮助完善“灵犬”小程序。增加的策略包括:对于权威媒体报道和诗词类内容,予以算法推荐倾斜;对于时政等机器难以直接处理的内容,必须交由人工审核判断。
“灵犬”项目对于消除外界一直以来的舆论诟病是否有效,还有待观察。


石 灿
关注资讯社交平台、泛媒体领域
微信号:S1468002343
添加时烦请注明姓名、机构、职务

完

内容产业报道第一平台
微博 @刺猬公社
合作、转载事宜请联系微信号yunlugong
投稿邮箱ciweigongshe@126.com
网站www.ciweigongshe.net
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 中法元首相会都江堰 7904429
- 2 对日斗争突发新情况 7808157
- 3 美最新报告:不允许任何国家过于强大 7714368
- 4 国际机构看中国经济 关键词亮了 7616805
- 5 男子欠近5000元房费 酒店倒贴都不搬 7520007
- 6 荒野求生女选手疑遭骚扰 榕江通报 7428603
- 7 净网:网民造谣汽车造成8杀被查处 7329136
- 8 海军、国防部、外交部 严正批驳×3 7234637
- 9 国乒8比1击败日本队 11战全胜夺冠 7144010
- 10 千吨级“巨无霸”就位 7048118



![袁冰妍:#夏日乐游记# 就亿点点热[吃瓜] ](https://imgs.knowsafe.com:8087/img/aideep/2021/7/12/fd93a51e4a4db028eed33f9d26baa337.jpg?w=250)





刺猬公社
