为打击犯罪，谷歌新闻实验室推出了一个仇恨犯罪数据库_互联网+_

由于美国日渐恶劣的政治环境，谷歌最近与ProPublica达成了合作。谷歌新闻实验室推出了一项可以追踪全美仇恨犯罪的新工具。

在机器学习的推动下，“仇恨新闻索引”将追踪所有50个州报告的仇恨犯罪，收集自2017年2月以来的数据。

数据可视化工作室Pitch Interactive帮助制作了这个索引，该索引收集谷歌新闻的结果，并通过谷歌的自然语言分析来过滤它们，以提取地理和上下文信息。

因为它们没有被编入任何正式的国家数据库，这一事实启发了该指数的创立，谷歌称该项目是对仇恨犯罪记录和研究的“起点”。

虽然联邦调查局在法律上被要求在联邦层面上记录仇恨犯罪，但州和地方政府往往没有报告自己的事件，这使得数据不完整。

谷歌新闻实验室数据编辑Simon Rogers在声明中写道：“这是第一个使用机器学习来生成内容的可视化工具，它使用的是谷歌的自然语言API，该API分析文本并提取有关人物、地点和事件的信息。”

“在这种情况下，它能帮助记者挖掘出3,000多个新闻报道的地点、名字和其他有用数据——每天更新的信息流，可以追溯到2017年2月。”

该计划是一个数据丰富的新分支，记录仇恨项目，收集并核实由个人贡献者和新闻机构报告的仇恨事件。

仇恨新闻指数将会留意错误的正面信息（例如，“讨厌”一词的随意用法），在一个非常敏感的话题上，对机器学习和人类管理之间的平衡做出了负责任的平衡。

仇恨事件会被映射到用户界面的日历上，不过用户也可以使用关键词搜索或浏览算法建议。

对于任何想要把数据带到一个新方向的人来说，谷歌将开放其数据集，让它通过GitHub获得。

该项目的希望在于，记者可以利用可视化数据和新闻索引的组合，更有效地报道可能会落入这些漏洞的总数据和事件。返回搜狐，查看更多

责任编辑：