案例:新泽西州警队武力报告 #98
Daisysansa
started this conversation in
Show and tell
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
The Force Report
新泽西州警队武力报告报告
作品链接:https://force.nj.com/
小组成员:黄俐珏、丁雁南、魏昀佳、沈文豪、陆麒丞
(1)所属媒体:NJ Advance Media新泽西先锋报,新州媒体
(1)奖项背景:美国网络新闻奖(Online Journalism Awards)
网络新闻奖创始于2000年5月,每年颁奖一次,是美国及其周边网络媒体的最高奖项,有“网络普利策”之称,旨在表彰在网络新闻报道领域做出突出贡献的媒体。奖项包括网络新闻卓越表现奖、公共服务奖、突发新闻奖、视觉叙事奖、解释性报道奖和数据新闻奖在内的19类奖项。
在2019年NJ Advance Media的《警队武力报告》(The Force Report)同时获得了数据新闻奖和奈特公共服务奖两个奖项。
(2)新闻背景:2000年代,新泽西州检察总长下令警方就每一宗警力运用的个案作文档纪录,借此建立数据库,以标记有滥用暴力倾向的警员,并适时对他们作出监察和调查。但十七年过去,那些填好的文档表格堆积于警局角落,却从未被认真审视;甚至还有数以千计未填完的、字迹太过潦草的表格,或是纸张发霉而无法检阅的。
因此,NJ Advance Media(新泽西州先锋报)决定自行建立一个数据库,纪录新泽西州警员运用武力的状况,让公众能轻易了解和监察警力滥用的问题。NJ Advance Media的十多名记者进行了为期16个月的调查,从72677条纸质记录中收集并数字化、标准化处理了将近300万个数据点,建立了全美国最全面的警察使用武力数据库。这个首创的数据库使读者能够搜索2012年至2016年近五年间当地官员和州警察的每一次使用武力的记录。
(3)新闻主要内容:NJ Advance Media 将数据重新整理、编排,制作成对公众开放的互动数据库。
本报道的具体内容分为八个部分:
A. 介绍新泽西州警察滥用武力的背景事件和历时十七年都未建成的警力监督数据库,以及本报道是如何诞生的
B. 总体数据分析——将数据汇总后的基本发现。这一部分主要是将收集来的数据进行初步分析,即与人口数据结合分析、其中的种族相关数据、新泽西州与其他已建立警力监督的地方的对比。
C. 以动图的形式说明警察可以合法动用的武力形式,明确了警察执法中使用武力是正常现象,但是这一权力不得滥用。(右图为合法方式的一种,名为compliance hold)

D. 可搜索的数据库(最重要的部分)公众可以输入警员姓名、警局分区、案件种类等资料,以获悉警方使用武力的信息;查询结果以图表、图像、地图等方式呈现,令公众对他们所在地区的警力滥用状况、经常被针对族群等资料一目了然。(下文搜索器部分会详细叙述)
E. 交互式散点图+柱状图+地图具体展现动用武力的警察和相关数据
F. 交互式地图表现新泽西州各城镇警局使用暴力的数据
G. 警察滥用暴力事件中受害者的故事
H. 常见问题回答
(4)文章贡献:警队武力报告是NJ Advance Media 为新泽西州社区送上了一份礼物,数据库推动州政府加快信息公开,促使警方正视警力运用、警队纪律等问题,并赋予公众更大的知情权。
2、数据处理
(1)数据收集
因此虽然这份报告中,大部份数据来自与新泽西州每个县警察局和州警察局的文档纪录。但是获得这些数据的过程并不是一帆风顺的。
他们遇到的阻碍有 (州>县>地方)
警察部门拒绝提供使用武力的报告
太过久远的数据已经丢失或者无法使用
漏报数据
要求提供高昂的服务费
处理方式:
把追溯时间从10年缩短到5年,即(2012~2016)
把数据搜集从县警察局扩大至地方警察局
新泽西州警察局协会协助收集数据
NJ Advance Media表示会提起诉讼或者向州政府记录委员会投诉
最终NJ advance media历时7个月,向各个警局发送了506份公共记录请求,最终获得了72677条纸质记录,时间区间为2012年至2016年。
(2)建立数据库
在建立数据库的过程中,由于很多数据没有填写完整,无负责人签名、发霉、缺少记录(新闻有报但没有数据记录)、弄丢、错误填写,因此部分数据以单独的形式报告,NJ advance media也向检察官办公室和总检查长办公室提出额外的记录要求来填补空白。
所有数据全是纸质的,因此NJ Advance Media 聘用了一个第三方公司invensis来完成这项将数据输入数据库的工作。同时,因为这些数据都是警员自我记录的,因此包含了一些不可避免的人为错误,记者咨询了独立的专家以设计一个输入和审查系统,最大程度减少数据输入过程中的任何其他错误。
在数据信度上,记者会随机选择15份即每天输入的百分之2,来根据原始记录检查600个数据点。同时他们也会把日常的审计合并为每月档案,进行额外的审计。
(3)数据清洗
在数据的录入和审计完成,NJ Advance Media建立了一个简单但功能强大的数据库,下一步就是数据的清洗和标准化。
由于数据包含了各种不同记录方式的时间,日期,城镇名称,军官级别,种族代码以及各种刑事指控的条目。比如:警员的名字,在某些情况下,一个警员可能有五个不同的名字拼写方式,所以记者会通过徽章数字(警号)州养老金记录和新闻档案来找出错误。团队也为每个军官和事件分配了唯一的id,以防止不同警队队员重名的情况。也确保在一起警员暴力事件中出现多个警员的情况下进行标准分析。同时数据清洗工作还包括辨别许多暴力案件中包含动物的情况,处于分析的目的,大部分动物条目都被删除了。
此外团队也利用了FBI的数据来计算细化警署的逮捕率,因为其中可能涉及种族的数据。
最后,NJ Advance Media 聘用了一个独立的统计学家,John Lamberth,一个警方数据统计专家,来检查这些方程,计算方法,研究方法,还有对总体呈现数据进行建议。最终他们也根据john的建议进行了改进。
3、展现形式

在新闻的首页我们可以看到如下几个标签,他们分别从8个维度对警队武力报告的诞生以及具体内容进行了说明。在这8项中有三个网页是对数据进行了可视化加工。
(1)搜索器
而在该新闻报道中,最核心的交互功能就是搜索器的使用,使读者能够搜索2012年至2016年近五年间当地官员和州警察的每一次使用武力的记录。这个首创的数据库使民众可以通过警员姓名或者所属警察署来查询具体武力使用数据。

而在宏观层面,作品先通过特写的数字展现了新泽西州武力使用的总数,以及每1000起逮捕案中的武力使用数。
接着提供了州内各个地方警署的数据,用户可以通过点击其名称查看该警署的详细内容。
相较于普通的新闻报道,他的目的更多偏向于提供一种公共服务,因此大规模使用搜索器给予了读者更高的互动感,以及对于所属区域的查询方式。整个报道不仅揭露整体性趋势,也具有个性化选项。而针对同样的数据,在这里作品多加了一个折线图的展现数据比较的功能。
先整体性数据,后单一数据的叙述策略,也运用到了州使用武力的警员数和州警员平均武力使用数上。具体警员使用武力的情况则同样以搜索器的方式呈现。相较于前者,在这里点击警员姓名我们除了可以看到他使用武力的统计数据,也可以看到他使用武力的具体时间、地点能力、对象等条目。警员的名字和所属警署并没有做数据脱敏处理,而这样的做法很大程度上为我们揭露了真实的警员武力使用情况,并且提醒公民。
(2)点状图

在美国,追踪警员的武力使用其实是对有问题警员审查的一部分,但这在新泽西州却不是必须的,因此在这部分,NJ advance media以洛杉矶、纽约和芝加哥的问题警员评判系统为标准,通过点状图展现在不同系统下新泽西州有多少警员算是问题警员,在这里每一个点代表十名警员。
洛杉矶的评判标准是警察是否使用强等级的武力,比如:警棍、电击枪、枪支,或者友人受伤住院。这里共有1263人符合此标准。
纽约的问题警员评判标准共有14项,而这14项其中就包含了使用武力,如果一个警员在14项中有任何一项显著高于他的同事们,就会被自动上报给检察官。在这里为了计算方便,就只以一年中使用武力为变量计算这个数据,而这里共有9955人符合此标准。
芝加哥的系统则是以是否遭成某人受伤、住院,或者使用高于踢和击打的手段。在新泽西州共有10,649其中的一项或多项。
而这些点状图的出现,代表了新泽西州对于问题警员的忽视,通过对比不同城市的数据,我们也可以知道有那些地方的警务审查更加严格,新泽西州应该往哪个方面去完善他的警务审查。
(3)柱状图

此处以种族为核心,对比了在新泽西州各个种族被使用武力的总数,非常明显的是黑人遭遇警员武力对待的平均次数,为白人的两倍多。
各个种族被暴力对待、逮捕和其占人口总数的数据如下。
这边是被使用武力的对象种族以及警员种族。

最后报告展示了各个类别的武力使用,从危险度最低的到最高的。

分别有:合规持有/抓捕/拳击/踢/警棍击打/辣椒水/枪击
下面是被使用武力的原因
分别是:拘捕/威胁或攻击警察/用刀威胁或攻击警察/用枪威胁警察或他人/用车威胁或攻击/向警察或他人开枪。
最后网页以百分比的形式展现了在武力使用中,被使用武力的对象和警员的受伤情况。
(4)地图

在这一页,作品以热度地图的形式呈现了各个地图武力使用的对比。
可视化风格 :动态交互

在这里每一个点都代表一位警员,此处共计有17369人,随着鼠标的移动,页面会显示出其所代表的人物。
在这里5年间使用武力少于4.1次以蓝色点表示,5~12次以绿色表示,13~20次以黄色表示,21次以上则以红色表示,
这些点汇聚成的柱状图,向我们展示了武力使用的趋势。

每一排都代表了一次的武力使用,从最少的一次,到最多的62次。
以蓝色和绿色所代表的警员数,占据了总人数的百分之95。
有百分之5的警员使用超过12次的武力,但是百分之五的人,他们的武力使用总数却是州武力使用总数的四分之一。
而下一页再将这些人群细分,我们可以看到253人使用超过20次武力,他们的武力使用数占总的10分之一。

而在这一页,作品则把所有点都归类至所属的警署。每一个圆圈代表一个警署,使用越多武力的警署圈就越大,我们可以使用拖拽的方式,查看不同角度的数据。
作品首先就几个具有代表性的地区进行了单独的说明。比如Camden是这个州最危险的地区, 在这里共有523名警员曾使用武力,而其中15人在5年间使用超过20次的武力,Camden整体武力使用数是州平均数的5倍。Atlantic city的武力使用总量排名第二,不到200人曾使用过武力,但其中的36人使用超过20次武力,是Camden的两倍多。
同样我们也可以从单一地区中看出比较性数据,比如lamberton大部分人都很少使用武力,但是有一个人使用了超过30次的武力,占了该警署武力使用的百分之37。
在最后一页,网页提供了一个具有查询功能的探索性地图,读者可以搜索或点击特定地区以查看一个该区域的武力使用量。
4、缺陷:
(1)这还是一个不断成长和变动的不完美的数据库,且目前该网页已经很久没更新了,最新的数据更新日是在2019的1月8日。
(2)这些数据全部来自警员自主记录,由于没有任何人解释对于武力报告记录的标准流程,因此可能有一些地方的记录标准更严格,他们的武力使用数据可能更高。
说明:有时候使用武力其实一个非常正常和必要的警员行为,因此这个数据库不是在揭露警员的行为错误,非常高的武力使用频率也不能代表这个警局或者警员犯错了。
Beta Was this translation helpful? Give feedback.
All reactions