为打击犯罪,谷歌新闻实验室推出了一个仇恨犯罪数据库

太保乱谈 / 2018年07月09日 13:17

互联网+

由于美国日渐恶劣的政治环境,谷歌最近与ProPublica达成了合作。谷歌新闻实验室推出了一项可以追踪全美仇恨犯罪的新工具。

在机器学习的推动下,“仇恨新闻索引”将追踪所有50个州报告的仇恨犯罪,收集自2017年2月以来的数据。

数据可视化工作室Pitch Interactive帮助制作了这个索引,该索引收集谷歌新闻的结果,并通过谷歌的自然语言分析来过滤它们,以提取地理和上下文信息。

因为它们没有被编入任何正式的国家数据库,这一事实启发了该指数的创立,谷歌称该项目是对仇恨犯罪记录和研究的“起点”。

虽然联邦调查局在法律上被要求在联邦层面上记录仇恨犯罪,但州和地方政府往往没有报告自己的事件,这使得数据不完整。

谷歌新闻实验室数据编辑Simon Rogers在声明中写道:“这是第一个使用机器学习来生成内容的可视化工具,它使用的是谷歌的自然语言API,该API分析文本并提取有关人物、地点和事件的信息。”

“在这种情况下,它能帮助记者挖掘出3,000多个新闻报道的地点、名字和其他有用数据——每天更新的信息流,可以追溯到2017年2月。”

该计划是一个数据丰富的新分支,记录仇恨项目,收集并核实由个人贡献者和新闻机构报告的仇恨事件。

仇恨新闻指数将会留意错误的正面信息(例如,“讨厌”一词的随意用法),在一个非常敏感的话题上,对机器学习和人类管理之间的平衡做出了负责任的平衡。

仇恨事件会被映射到用户界面的日历上,不过用户也可以使用关键词搜索或浏览算法建议。

对于任何想要把数据带到一个新方向的人来说,谷歌将开放其数据集,让它通过GitHub获得。

该项目的希望在于,记者可以利用可视化数据和新闻索引的组合,更有效地报道可能会落入这些漏洞的总数据和事件。返回搜狐,查看更多

责任编辑:

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。