今天的头条新闻将在网上发布中国第一部反俗信息小程序“灰狗”
3月27日,今天的标题产生了一个名为“灰狗”的微信小程序,正式结束了为期两个月的内部测试期。 “灰狗”本周正式推出,这是中国第一个反庸俗信息小程序。
这个小程序诞生于今天的标题反庸俗算法模型,用于识别粗俗信息。用户可以将文本或文章链接放入搜索框以查询消息的健康状况。
但是,在文本检测方面,“灰狗”团队规定,用户输入的单词数量必须超过10个单词才能进行测试。
为此,“灰狗”团队给出了一个解释:用户的背景,背景等越充分,机器判断的准确性就越高。
一些参与内部测试的用户曾在“灰狗”上测试过“你饿了,我给你以下”字样。数据显示内容健康指数为51%。昨天,Hedgehog再次测试了该指数的含量为56%。
“灰狗”团队解释说,与色情文学不同,处理庸俗信息的困难之一是人们对庸俗的判断标准具有一定的主观性。色情信息很简单,粗俗的信息有偏见,对于像“狗”这样的机器来说更难。
今天的标题方法是将粗俗标准分为两个层次:几乎每个人似乎都同意的标准底线,以及因人而异的主观判断。
那么,在算法机制背后,“精神之犬”如何判断一段文字或链接到一个网站作为粗俗?
“雕文”团队给出的解释是算法模型处理粗俗内容并且具有最常见的路径之一:“收集数据 - 标记样本 - 训练模型”。
对于用户输入的文本或链接,“灰狗”将首先提取,分段和语义识别,然后根据设定的规则输出相应的分数,等级和结论。
但是,当测试人员用图像和视频测试链接时,测试结果不是很好。
“雕文”团队给出的解释是,由于图像和视频提取需要很长时间,因此返回结果很慢。考虑到该工具的即时性,暂时不支持检测。
“灰狗”的诞生将包含在今天的标题内容审查系统中。它与今天的标题内容审查机制有关,如“狗”和“工作犬单位”。可以理解,“精神狗”是标题审查机制的反粗俗部分的简化版本。
据了解,就内容审查而言,今天的头条新闻目前正在投资4,000多名专业审计团队。
“灰狗”团队表示,这是中国最大的审计团队,并建立了180多个色情,粗俗,头衔,虚假信息和低质量模型。结合手工和技术手段,有效提高了内容审查的效率和准确性。学位。
事实上,今天的头条新闻计划去年这件事。今年1月底,“灰狗”组沈阳软件开发
团队为全社会招募了反庸测试人员,最终选出了来自5000多名注册用户的30名代表,包括政府部门工作人员,媒体记者,编辑,大学教授,学生,互联网公司产品经理和技术人员。自媒体人。
在内部测试阶段,“灰狗”团队根据测试人员的反馈添加了大量手动策略,以帮助改进“灵魂犬”小程序。增加的策略包括:对于权威媒体报道和诗歌内容,建议倾斜算法;对于政府和其他机器难以直接处理的内容,必须通过人工审核来判断。
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
使用“扫一扫”即可将网页分享至朋友圈。
上一篇:
第三方游戏正在悄然上线,微信小程序距离“以下事情”只有几步之遥?
下一篇:很抱歉没有了