作为开放新闻的数据新闻——英国《卫报》的数据新闻实践(上)

damndigital_views-open-journalism-data-journalism_2013-06_cover-1

鉴于文章比较长,我们将分为上下两期发布
本文以英国《卫报》的各类数据可视化为例,分析了数据新闻在新闻实践中运用以及对传统媒体带来的挑战与机遇。数据新闻并不等同于在新闻实务中直接引入数据分析技术或可视化技术,其核心仍是新闻叙事,而在《卫报》的新闻战略中,数据新闻实质上是其应对新媒体特别是公民新闻的冲击,而提出的开放新闻观的具体策略之一。

来源:新闻记者

数据新闻(data journalism),又称数据驱动新闻(data driven journalism)。它指的是对数据进行分析与过滤,从而创作出新闻报道的方式。近年来国际知名媒体 《纽约时报》 《卫报》 《经济学人》、英国广播公司等纷纷推出了自己的数据新闻作品。

2010年7月,在维基解密事件之中,数据新闻更是大显神通,数据新闻这一概念开始大行其道,在研讨会和学术论文①中被屡屡提及。较早从事数据新闻实践的新闻从业者更是频频在媒体网站与个人博客对这一新的新闻形式大力推介。芬兰学者发布了《数据新闻趋势》的研究报告,世界各地最早尝试数据新闻的业界与学界人士还共同推出了集当今数据新闻实践大全的《数据新闻手册》。②

当然,在传统的新闻操作中也曾有过基于数据分析与综合而完成的新闻作品,事实上,采用统计或量化方法分析数据并生产新闻的方式与理念在新闻学界早已有之,如菲利浦·梅耶的《精确新闻》与《新精确新闻》③就是这一领域的先行者。

上世纪90年代以来西方新闻学界又提出计算机辅助新闻(Computer Aided Journalism/Reporting)的概念,以及新闻2.0、数据库新闻等一系列概念。它们从不同侧重点表达了当前时代传统新闻面临新媒体挑战而作出的转型努力。可以说,数据新闻正是承袭了在新闻实践中引入社会科学研究方法的努力之一。

不过,近年兴起的数据新闻至少在三个方面有所突破首先,数据新闻所分析的数据量级已远非传统新闻操作中数据图表可相提并论,其数据多以上万甚至百万、千万计。这当然是拜信息技术发展所赐,为数据分析与数据挖掘技术的大力发展提供了可能。其次,在作品展示方面,由于可视化技术的发展,以及网络媒体的出现,使得互动式可视化效果在新闻作品中的呈现成为可能虽然数据新闻作品也有在传统媒体中展示的,但总体来说,主要仍出现在各类数字媒体平台之上。最后,更重要的是,以往更多的是文字为主、数据为辅(data for the journalism)或是数据与文字相辅相成(data with the journalism),而数据新闻则是数据为先、文字在后,数据驱动的新闻,在一定程度上改变了新闻生产的思路与流程。不同于传统新闻,主体由对事实的描述或当事人的话语引用构成,数据新闻更多的是对数据的展示。因而数据可视化(data visualization,也有人称之为信息可视化information visualization)成为数据新闻的重要组成部分之一。

然而,并不能简单地认为数据新闻就是与数字打交道,或画出夺人眼球的信息图。它与传统新闻一样仍然是在讲述故事,讲述数字背后人的故事,只是采用了数据新闻的方式,可以更简单而清晰地让受众明了复杂的情境。从某种意义上说,数据新闻实际上整合了从传统的调查新闻到统计、从设计到编程的若干个专业领域。它对新闻从业人员提出了更高的要求,而对新闻的受众来说,新闻的价值则大幅提升了。

Lorenz将数据新闻的生产过程以下图所展现的方式加以描绘:数据经过过滤与视觉化后形成故事,而在这一过程之中,于公众而言数据的价值也提升了。④

damndigital_views-open-journalism-data-journalism_2013-06_01

Bradshaw则依照传统新闻学里关于“倒金字塔”结构理论,提出了数据新闻的双金字塔结构 (见下图)。倒金字塔的自上而下是编辑、清理、情境与综合,而通过传播的连接,是一个正金字塔,自上而下是视觉化、叙事、社交化、人性化、个性化、应用化。

与Lorenz对于数据新闻生产与制作流程的观念一致,Bradshaw也认为数据新闻的产生基于对原始数据的分析并将其放入具体的情境,不过他同时还强调,数据新闻通过可视化形成新闻叙事之后在各种平台发布而实现社交化,然后,读者可以进一步将新闻作品按个人的兴趣与需求加以应用。

damndigital_views-open-journalism-data-journalism_2013-06_02

不过最先从事数据新闻报道的一批编辑记者也意识到,不能仅仅将数据新闻视为数字技术,也不能把数据分析与数据挖掘技术或数据可视化等同于数据新闻,英国《卫报》数据新闻编辑Simon Roger曾说:“数据新闻不是图形或可视化效果,而是用最好的方式去讲述故事。只是有时故事是用可视化效果或地图来讲述。”⑤

《卫报》的数据可视化与数据新闻

在诸多较早投身数据新闻实践的媒体中,英国的《卫报》成绩斐然,别具一格。《卫报》在众多国际媒体中不仅较早地意识到新媒体带来的挑战,也较早地把握了新媒体所带来的机遇。2006年6月13日,《卫报》宣布了“网络优先”的报道策略,要求所有的稿件先在网络上发布,然后才在纸质版本上登出。

“网络优先”的策略强调将传统报业的优势用网络彰显,而将传统报业的劣势用网络弥补,走出了打造报纸网络版的迷思,不是简单地将报纸内容放在网络上,而是着眼于打造全球领先的新闻网站。此后《卫报》又将此策略调整为“数字优先”,以适应移动网络等多种数字平台的出现所带来的改变。

2009年《卫报》开创了“数据博客”(http://www.guardian.co.uk/news/datablog),可谓数据新闻发展的一个里程碑。这个设于《卫报》网站上的独特栏目从2009年1月14日上线至2013年5月,共制作各类数据新闻2500多则。涵盖政治、经济、体育、战争、灾难、环境、文化、时尚、科技、健康等不同领域,采取的形式有图表、地图以及各种互动效果图,数据类型既有量化数据也有质性数据,还有两者兼顾的混合数据。现在不少钟情于数据新闻的国际媒体均采取了类似的形式,如《洛彬矶时报》的“数据桌”(data desk)等。

不同的新闻机构在生产数据新闻时可以采取不同的策略,有的要求记者具备编程能力,而有的则是外包给软件公司;有的购入专门定制的软件工具,有的则使用免费的网络工具。《卫报》的数据新闻团队目前主要由五人组成,其中Simon Rogers创立了《卫报》的数据新闻项目,编辑“数据博客”和“数据商店”等栏目;John Burn-Murdoch本人既是记者也是数据研究者,他们两人在数据新闻界相当活跃。其他成员则并非全职的数据新闻记者,同时还隶属于《卫报》的不同部门,从事其他新闻采编工作。

目前,数据新闻的分析与可视化的不少工作都可以采用开放源代码的软件工具实现,如用于互动图表的Google chart、 Google map、 IBM Many Eyes、 Tableau、 Spotfire;用于基于时间顺序的时间线类作品的Dipity、Timetoast、 Xtimeline、 Timeslide;用于基于地理信息的Google earth、 Quanum GIS;用于网络分析的Spicynodes、 VIDI、NodeXL;用于社交媒体可视化的Storify;用于文本可视化即标签云的Wordle、 Tagxedo等等。

《卫报》在早期大量使用Flash作为主要的技术支持手段来实现动态效果,但2012年10月之后,几乎不再制作这类作品。这也是近年来数据新闻制作的一个趋势,主要是由于Flash技术与部分移动网络终端不能完全兼容,加之软件成本昂贵,反而各类免费软件成为了制作数据新闻的主力军。

数据新闻及其可视化可以采取变化万千的不同形式,在《卫报》的实际操作中使用最多的主要是数据地图、时间线和交互图表

  • 数据地图

让《卫报》数据新闻一鸣惊人的是2010年10月23日刊登的一则伊拉克战争日志。《卫报》使用来自维基解密的数据,借用谷歌地图提供的免费软件Google fushion制作了一幅点图(dot map),将伊拉克战争中所有的人员伤亡情况均标注于地图之上(见图1)。地图可以缩放大小,数据多达39.1万条左右。在地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。这里既没有用枯燥的数字作毫无人性的平静描述,也没有采取夸张的文字进行煽情式的叙述,但地图上密布的红点却显得格外触目惊心。新闻从业者富于人性的思索通过精准的数据和适当的技术被传达出来。

damndigital_views-open-journalism-data-journalism_2013-06_03

此则新闻刊登后在英国朝野也确实引起了震动,相当程度上推动了英国最终做出撤出驻伊拉克军队的决定。

《卫报》团队在制作数据地图时一般会采用Google fushion作为主要的工作软件,将包括地理信息如经纬度在内的各类数据,整理成表单形式,在导入fushion后,就可以使用软件自带的功能导出地图。

在2011年9月6日刊出的英国伦敦骚乱的系列报道中,Simon Roger仍使用Google fushion软件作图,但不仅仅是以地图标示出骚乱发生的地点,而是更进一步以热力图的方式,用不同颜色色块标示出伦敦各地区的经济指标(见图2)。蓝色表示富裕地区、红色表示贫穷地区。地图明确清晰地显示出了骚乱与社会经济发展不平衡的密切相关性,从地理位置上凸显出一个分裂的社会。而在制作这则新闻之时,所使用的数据完全是来自公开的法庭审理骚乱案件资料以及政府关于社会经济状况的统计资料。这幅地图不仅标明了骚乱爆发的地点,也形象而视觉化地阐明了骚乱发生的原因。伦敦骚乱爆发后,英国舆论与政界一度将骚乱归罪于社交媒体如Facebook、Twitter传播谣言、煽动骚乱,甚至要求关闭社交媒体。

《卫报》数据新闻团队通过与学术团队一起研究社交媒体在骚乱中的作用,分析了260万条关于骚乱的推特信息,观察谣言如何在推特上传播,以及不同的用户在宣传和散布信息中的功能,以确定推特和其他社交媒体是否煽动了骚乱。他们对推特信息进行了内容分析,分类编码为:重复、驳斥、质疑、评论,还对数据进行可视化处理,从而发现推特在纠正谣言方面也发挥了积极作用。之后,《卫报》与伦敦政治经济学院的学者合作推出了一本用数据解读骚乱事件的小册子《解读骚乱》,使得新闻报道具备了带有前瞻性的社会科学研究的性质。

damndigital_views-open-journalism-data-journalism_2013-06_04

可视化不仅仅被用作展示或是解释(explanation)数据的工具,还成为进一步探索(exploration)数据的工作。2011年《卫报》的数据编辑团体正是凭借着灵活运用谷歌表单等工具、开创了通过数据讲述新闻的新思路而荣获Knight-Batten 奖的。

下篇将继续说《卫报》的实际操作中使用最多的其他两种方法,时间线和交互图表。

Have Your Say »

Required

Required, never published