案例:每天都有3名工人再不会下班回家(Three workers a day are never back from work for good) #119
Catherine-Wyh
started this conversation in
Show and tell
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
2021 Sigma Awards入围作品
作品链接:http://news.khan.co.kr/kh_storytelling/2019/labordeath/
(一)作品介绍
韩国媒体The Kyunghyang Shinmun京乡新闻 (daily newspaper)于2020年1月15日发布的数据新闻作品《每天都有3名工人再不会下班回家(Three workers a day are never back from work for good)》通过分析2018年1月至2019年10月内发生的1305起工业事故引起工人死亡的事故调查报告书,用数据呈现出1748名死亡工人的经历。该作品入围2021年SIGMA数据新闻奖。
作品共由介绍引入、数据库呈现、事故情况分析、死亡地图四个部分组成,并在最后附上了工人死亡专题下的其他报道内容链接。在第一部分,作品指出韩国在经济合作与发展组织(OECD)成员国中居于工业灾害死亡率的首位,说明了工人死亡问题在韩国社会的严重性,由此带着“避免让工人死亡成为无意义的统计数字”“用社会的方式记住这些死亡”的目的展开了数据分析;在第二部分,作品通过极具视觉冲击力的方式将1748名死亡工人的经历汇聚成可视化的数据库,读者可以通过选择筛选条件进行交互,并点击具体案例查看详情;第三部分则对调查报告书内的各个要素如所属公司、事发时间、死亡原因等进行了统计分析和可交互的可视化呈现;第四部分则按照事发地点绘制出韩国工人死亡地图。
(二)数据来源
宏观数据:
“韩国职业事故死亡率最高,每年约有2000名工人死于事故或疾病”
“据政府统计,2018年有2142名工人死亡”
(没有找到这些数据具体公开的地方,有关经合组织的数据可到https://www.oecd-ilibrary.org/oecd/about 或https://stats.oecd.org/搜索)
宏观数据的弊端:
微观数据:
于是,为了解当前工业事故的情况,《京乡新闻》(即作者团队)通过信息公开请求,从劳动部获得了2016年至2019年9月的重大事故报告清单。在一位民主党议员的协助下,他们共收集到1305份事故调查报告书,在此基础上,他们确认了每个工人的姓名和年龄,并详细追溯了导致他死亡的过程(原文注:该数据库是根据韩国职业安全与健康局准备的事故调查意见创建的。该意见是通过韩国民主党议员韩正爱获得的)。
报告是PDF文件格式,所以作者团队手动将受害者信息、事故摘要和原因等全部输入到电子表格中,并完成分类。完成数据输入花费了一个半月的时间。信息公开时得到的名单与国会议员室得到的名单、事故报告书中提取的名单不同,因此很难进行数据整理。直到报告前一天,作者才修改了死亡人数。
具体数据,可以通过网页源代码分析得到,包括1305个人的姓名、死亡日期、死亡原因等。
三、数据分析方法与叙述风格
(一)数据分析方法
对于获取的数据,作者团队把它们巧妙地分成了两大板块,分别放进了作品的第二部分“工业灾难档案”和第三、四部分“无声的死亡”“工人之死绣的地图”中。这样的归类不落俗套,能够让数据更好地服务于数据新闻的叙事,值得借鉴。
第二部分“工业灾难档案”中的数据是围绕“人”展开的,也再次强调着作者团队的人文关怀——他们在意的是死去的每一个个体。所以读者可以点击每一个小的人形,了解ta的个人信息(姓氏、年龄、籍贯、工种),及其所遭遇的事故类型、事故时间、所在企业、事故原因、处置结果。作者团队明白,这样分散的信息或许不利于读者了解社会事实的全貌,所以他们另外设置了一个分类窗口,对数据排列重组,让读者通过筛选事故类型、行业、假期、年龄、熟练程度、企业规模、事故具体情况来获取整体性信息。
第三部分“无声的死亡”和第四部分“工人之死绣的地图”中,作者团队分析了离“具体的人”稍远一些的其他数据——死亡日期、发生事故的公司、坠落高度、事故发生的每日时段、灾难发生地点。它们于死者档案来讲并不是最重要的,但对于改善社会问题而言举足轻重,例如能够直接获知哪些企业、哪些地方的防范力度不够。
(二)叙述风格
作品叙述风格呈现出以下三点特征:
首先,布局精巧、引人入胜。开头不是传统的标题、导语和作者名,而是一则简短的消息:2018年,金容均在工作时死亡的,年仅24岁。点击屏幕,出现,每天都有三个“金容均”死去。再次点击,是两句富有震撼力的引用“每天都有金容均,但是韩国社会对劳动者的死亡已经变得麻木。为了防止工人死亡成为一个毫无意义的统计数字,我们记录了每个死于事故的工人的死因。”“把碎片化的死亡聚集在一个地方。”暂时抛开新闻真实性和引导性不谈,开头的数据与文字带来的冲击效果很好。
其次,作者团队善用例证与论述相结合,做到了数据为主,论述为辅。并且论述是有益补充,而非再度阐述数据事实。在大量死亡工人的数据展现后,作者团队详写了22岁金浩敏和31岁姜志宇在事故中死亡的具体细节。
最后,作者团队在第三、四部分呈现的五个方面的数据(死亡日期、发生事故的公司、坠落高度、事故发生的每日时段、灾难发生地点)有堆砌的嫌疑。这些数据之间的内在关联并不清楚,它们应该被更有逻辑地呈现出来,或至少每类数据间有过渡。这一部分整体看像是一份数据报告,虽然类目本身很重要,但接收效果不佳。
(四)可视化方法与呈现风格
本篇作品的可视化主要分为两个部分,一是开篇的1748名韩国死亡工人统计,二是后文的相关统计表格。


第一部分是一个包含1748个工人死亡案例的图表。不同颜色的小人代表不同的死亡方式,随着读者向下滑动,所有小人坠落,带来极大视觉冲击。点击小人图标,会出现每个死亡工人的档案。档案内容包括:事故类型、事故时间、公司、受害人信息(姓氏年龄籍贯工种)、事故原因、处分结果。作者把每个死亡案例根据原因分类画成不同颜色不同形态的人,紧密整齐地排列在一起。首先从视觉上给人以震撼,让人感觉到两年来在韩国有这么多人因为各种原因在工作中失去生命。
其次,点进每个小人都能看到这个案例的详细信息,包括事故类型、事故原因、死亡时间、企业名称、受害者年龄和职位等。如此详细的信息一方面增强了文章数据的可信度,另一方面让人真切地感觉到每个人卡通小人背后是一条活生生的生命,引发公众对韩国工人工作安全性问题的重视。
除此之外,这个图表还提供了一些筛选条件,如事故类型、行业、时间、年龄、工人熟练程度、企业规模、事故原因等,我们可以根据单个或多个条件筛选出更具体的案例,让人意识到工人死亡事件发生于各个行业、各个年龄段和熟练程度的工人、各个规模的企业,更加具象地感受到这一问题的普遍性和严重性。同时也有助于受众根据自己的兴趣对这些案例进行统计分析。
第二部分是文内的五张统计图表。这些图表都是有交互设计的,主要按照频率、所属公司等分别统计韩国工人死亡案例。能够结合多个筛选条件对这些案例进行分离,为阐述解释提供切入点和依据。
第一个交互图表展示了2018、2019两年中每天的韩国工人死亡人数。用米黄色到橙色代表一天死亡0-14人不等。读者可以选择一天内死亡的人数(1-3人、4-6人、7-9人、10人以上),相应的天数就会出现在表中。如选择1-3人,可以看到在这两年中大部分时候每天死亡韩国工人1-3人。同时点击小格子可以看到它代表的具体日期和死亡人数。


第二个交互图表展示死亡员工数量排名前20的公司,来查看哪些公司死亡的员工最多。每一个横条代表着该公司的员工死亡人数。点击每一横条,可以看到该公司的名字和死亡员工人数。如排名第一的是“现代汽车”企业,总死亡员工32人。死亡员工数量最多的是红色,慢慢过渡到橙色和米色。

第三个交互表专门讲述高出坠落的死亡工人案例,展示了坠亡案例的坠落高度。这个表又分为两个独立的表。第一个表展示了所有坠亡案例的坠楼高度。每个横条代表这个高度内的坠亡人数。我们可以发现,10m以下的坠亡案例是最多的,占总数的70%。点击每个横条,可以看到具体的高度和死亡人数。如点击第一个横条,可以看到0-5m内坠亡了261人。第二个表展示了坠楼高度在10m内的坠亡案例情况。如可以看到从3m处坠亡的有76人。


第四个交互表格展示了工人死亡案例发生的时段。每个横条代表该时段内死亡工人的人数。点击每一个横条,能看到对应的时段和死亡的人数。如最多的10:00-10:59死亡了160人。可以看出午餐前后事故最多,夜间事故较少。

第五张图展示了韩国工人死亡的地点。每个点代表一起工人死亡事件。可以清晰地由点的密度看出工人死亡案例集中在哪些地区。

优点
缺点
1.觉得对数据的分析还停留在表面。把收集到的数据整理可视化,举一些同一角度的典型案例做阐释。但没有对数据背后的原因做更深入的探究。如为什么某天、某些行业、某些公司、某个时段、某个地区死亡人数多。如果能稍微解释下,引导大家更深入的思考会更好。
(五)网页源代码分析
该团队这样描述他们的数据可视化过程:





为了找出工业事故隶属于哪些企业集团,我们使用 Python 创建了一个程序,该程序将发生工业事故的工作场所与关联企业的名称进行对比。Python 还被用于分析导致灾难的原因以及有多少灾难具有类似的模式。
我们制作了每个人的死因,作为互动新闻。它是使用 html5/css3 和 jquery 和 javascript 创建的。使用 D3.js 库,将 2,000 名死去的工人可视化为人物的小图标。图标形状的颜色和形式根据事故原因的类型而有所不同,让用户一眼就能看出50%的死亡是由跌倒造成的。用户还可以按年龄、熟练程度、行业、企业规模、事故类型对死亡工人进行分类。
我们基于 D3.js 通过热图可视化了每日死亡人数的分布。我们使用 Leaflet 库在地图上标记了死亡地点。
可以使用demjson包,将该文件转化为python可读的格式。
上图的数据可以在开头为deathPerDay的文件中找到,在该文件中,多个字典组成一个列表,以表示对应时间的死亡人数。
(六)意义价值与不足
价值:
(1)用数据的方式直观尖锐地揭露了韩国工业生产对工人人身安全带来的高风险的社会问题,回应社会对于高频发生的工人死亡事件关切的同时吸引国家权力与社会资源关注工人的生产安全问题
(2)建立起工业事故档案数据库,做出了信息和数据汇总集合的工作,对后续对该问题的进一步分析、采取相关改善措施有帮助
(3)具有人文关怀,关注每一个逝去的生命本身,这一点在第二部分数据库呈现中表现地非常明显,每一个死亡的工人都有一个剪影代表,点开可以看到具体的事故信息,虽然死亡报道的只是一个个数字,但背后都是不同背景各有故事的人,能唤起读者对于事故严重性的认识
(4)可视化方面,黑红橙的主色调还是简单清晰的构成,给人视觉冲击力强,与报道主题和想要达到的警示效果相符合
不足:
(1)数据分析停留在表面,没有继续深挖导致现有数据所呈现出特定趋势的原因,对于潜在社会因素和法律漏洞问题没有进行探讨,发现了问题但是没有分析为什么会有问题、解决问题的方向建议
(2)在关注具体的人的同时却没有进行采访,适当增加一些对受害者家属、发生事故的所属公司、专家学者有何建议等采访可以丰富作品纬度和信息量,增添实践价值
Beta Was this translation helpful? Give feedback.
All reactions