您的位置首页  新闻资讯  国内

大数据时代下国内外新闻报道形态的创新

  • 来源:互联网
  • |
  • 2017-08-03
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

  大数据所带来的革新已经深刻影响到了人们生活的诸多领域,新闻业也受到了大数据的冲击。国内外新闻对数据投入了更多的关注,数据新闻这一新的报道形态逐渐发展成熟。中外都推出了许多信息量丰富、视觉效果好、效率高的可视化报道。然而,探索在先,国内的数据可视化报道与还存在较大的差距,需要通过创新选题思、借鉴先进技术、培养记者的数据素养等方法来提高报道质量。

  自2012年开始,大数据(Big Data)这一概念被越来越多地提及,而后迅速成为社会热点。最早提出“大数据“时代到来概念的麦肯锡报告称:“数据,已经渗透到当今每一个行业和业务职能领域。” 可以说,大数据所带来的和方法的革新已经深刻影响了人们日常生活的诸多领域。在大数据所裹挟的信息爆炸时代,我们生活在数据的包围之中,而自身也在每时每刻产生新的数据。大数据技术对新闻业也形成了不小的冲击,其影响还将一直持续下去。

  数据(Data)是计算机科学中的一个术语。泛泛地说,数据是对一切事实的描述,可以是定量的,也可以是定性的。数据或称资料,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类。数据是计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。[1]不可将数据狭隘地理解为数值(numerical value),否则对数据挖掘、可视化以及与之密切相关的数据新闻的概念也无法作出正确的解读。

  数据挖掘(Data mining)指的是从不同的角度处理、分析、总结原始数据的过程。其结果能够别用来增加利润、较少成本或者产生知识等高阶信息。提到数据挖掘,有三个概念很重要:数据、信息、知识。数据作为最原始的材料,通过提炼可以得到其中的规律、关联、关系,进一步分析得到的知识则可以用来指导下一步的行动或预测未来趋势。

  数据可视化(Data visualization)是指将数据以图表等图像化的方式展示出来的过程。因为图表的方式更为直观,更容易被人类理解和利用。

  从数据规模的角度来看,大数据指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的形式的信息。[2]麦肯锡全球研究所则认为,大数据之“大”是一个相对的概念。我们不需要对数据的规模界定一个具体的门槛,因为随着科技的进步,数据的尺寸还会不断扩张。对于不同的领域,无需统一“大”的标准。[3]

  从数据覆盖面来看,大数据的“大”,是数据种类的“全”所构成的交叉复现、丰富匹配的认识价值,而不仅仅是数据规模的海量。3大数据之大,在于它能够提供对于事物全面的把握,而非过去采用抽样方法的“管中窥豹”。大数据为总体分析提供了可靠的技术支持,将使得研究的结论更为完善。因而,数据之全正是体现了大数据的真正价值。

  从获取的渠道来看,大数据是每个人在为自己的利益行动时顺带的产物,而不再是人们有意识主动的参与。在这样一个互联网的时代,我们在网络中留下的行为痕迹,都会汇聚到一个庞大的数据库中。这些丰富而可靠的数据,为我们考察许多复杂的社会现象、探寻事物规律提供了宝贵的资源。

  IBM大数据中心用下面的图片(图1)形象地展示了大数据的四个特性(即4V):Volume、Velocity、Variety、Veracity,分别指的是体量巨大、流动率高、种类繁多和不确定性大。具体而言:

  据估计,每天都有2.5个五万亿字节(quintillion bytes)的数据产生,而且速度越来越快。预计2020年的数据总量将是2005年的300倍。可以说我们现代生活中无时不刻不在产生数据:浏览网页的每一次点击、每一次输入、每一段视频、每一幅照片都在贡献数据。甚至在未来,仅仅利用一个人在公共平台如社交网络或购物网站上留下的数据就能完整刻画出一个人的喜好、习惯、知识、甚至外貌。

  流动率高指的是有大量数据是实时产生的,例如证券市场交易数据,社交网络舆情数据、物理设备上的传感器数据等。这些数据需要及时分析才能产生效益,但是如此庞大的数据需要在短时间,甚至是几秒内被分析出结果是对硬件存取速度以及算法运行效率的。

  目前很多的数据并非是结构化数据,而是半结构数据和非结构化数据。有统计显示,全世界结构化数据年增长率大概是32%,而非结构化数据则是63%。2012年,非结构化数据占有比例已经达到互联网整个数据量的75%以上。而产生智慧的大数据,往往是这些非结构化数据。例如图片、声音、视频等数据占据了数据总量的绝大部分,而对这部分数据的分析理解仅仅停留在初级的识别层面。

  虽然数据对决策有积极的指导意义,但是在数据质量差的情况下,反而有很多企业的高管选择根据自身经验制定战略而不是相信数据。虽然每天都有大量数据产生,但是有许多数据的信息含量是稀疏的,大量数据由噪声。对原始数据的清洗、处理以及数据质量的判定甚至比利用数据本身重要性更高。

  大数据所提供的认知价值和商业价值正在重构许多传统的行业。新闻也不例外。作为信息的提供者,本就互联网冲击的更是不可能在信息爆炸的浪潮中置身事外,而会选择主动跟进。恰好大数据技术也给新闻信息的生产提供了新的可能性。国内外主流都逐渐对数据及其可视化投入了更多的关注。或者与掌握海量数据的互联网公司合作(如央视与百度合作的据说春运、大数据),或者成立自身的数据团队(如纽约时报在2014年的创新报告中提到组建数据分析团队)。他们直接将数据可视化呈现在报道中,或者利用大数据来分析用户的喜好来提供个性化信息推荐。

  新闻对数据的关注也促进了数据新闻(或称数据驱动新闻)这种新的新闻报道形态的发展。大数据时代到来之后,互联网上出现了越来越多的性数据,并且有越来越多便捷的统计、数据挖掘及可视化工具可以使用,这就使得传统的新闻开始向数据新闻转型。[5]数据新闻区别于以往计算机辅助报道或者精确新闻,不再是局部的调查抽样和相对简单的量化分析,而对数据规模的要求、数据的挖掘和呈现的深度都有所加强。在数据新闻报道中,数字和图表成为了报道的主体,而文字则成为辅助信息。数据本身就是故事,新闻则需要具备用数据叙述故事的能力。

  大数据新闻是基于大数据分析思维的新闻报道,是数据新闻的更高一级形态,也代表了未来新闻发展的一种趋势。3目前国内外都有利用大数据挖掘和分析来做新闻报道的案例,但更多的还是集中于“小数据新闻”。

  总之,数据新闻成为国内外在大数据的时代背景下对新闻报道形式作出的有效创新。就外媒而言,许多主流都推出了不同类型的数据新闻作品,有的也专门设立了图表栏目。如《卫报》、《经济学人》、《时报》、彭博社等都在网站上开辟了图表专栏,而且保持了相对较高的更新频次。美国传统大报《纽约时报》和《邮报》的网站也推出了不少数据新闻报道。国内的更是纷纷在网站上设立专门的栏目,几乎比较常见的新闻网站都开辟了类似于图解新闻的专栏,如人民网图解新闻、财新网数字说、澎湃新闻美数课等。图解新闻、数说新闻正成为一种热潮。在纸媒方面,《南方都市报》设置了数据版,《新京报》也增加了新图纸版面。这些数据新闻报道也会同时在微信、移动APP等多个终端进行发布和。因而,数据新闻在国内已经渗透到了PC、移动设备和纸质报刊等多种媒介平台。

  除了数据新闻,“机器人新闻”也成为大数据背景下常被提及的概念。面对庞杂的数据,机器在处理起来就具有天然的优势。因而一些也开始在新闻生产中使用机器人,程序员在设定一定的算法之后让“机器人”来完成新闻稿的写作、的选编、事实的核查等工作。纽约时字部门研发的虚拟智能机器人Blossomblot,通过基于Facebook此类社交平台的数据分析帮助预测哪些文章更有社交推广效应。其实这一概念并不新鲜,只是因为机器人写手的出现让人们逐渐意识到算法设计在新闻生产过程中所发挥的作用。

  本文不再赘述国内外在“机器人新闻”实践中的案例,而主要关注国内外(包括的新闻机构和数据分析及可视化爱好者)在新闻报道形态上的创新。

  大数据时代使数据成为新闻报道中的重要资源,而信息爆炸式地增长也使得新闻的生产需要对数据进行明晰的呈现、精准的分析以及透彻的解读。国内外在数据新闻上的尝试与创新也一直是近年新闻发展的趋势所在。

  从包括引用大量数据和用配图图解辅助新闻报道两种表现的早期数字新闻形态,到以故事呈现为核心的成熟形态;从简单的信息图表呈现方式,到形象生动的交互式呈现方式;从单纯地利用数据增加新闻的准确客观性到挖掘数据对于的意义,以数据来作为驱动新闻报道的逻辑。[6]数据新闻在实践中不断发展成熟。

  在这个过程中,信息图表扮演着越来越重要的作用。信息图表是将数值型和文本型的信息形象化、可视化的一种方式。信息图表能够化繁为简,并兼具形象化与趣味性,尤其适用于表达数据与地理、时间信息。它可以提示新闻要点、解析事件进程、各类关系、展现分布状态等等。[7]

  目前数据新闻的呈现形式大致分为静态信息图表、交互式信息图表以及3D动画等,它们分别适用于不同类型的新闻报道,例如,静态信息图表通常适用于数据较少,逻辑较为简单的报道;而交互式信息图表、3D动画一般适用于数据信息庞杂,需要强有力的叙事逻辑的报道。

  数据呈现型信息图是用可视化形式将一些数据变得形象直观的数据新闻。在传统报道中,数据只是提供某种信息,报道篇幅过长、难于理解、不便查询,读起来乏味呆闷。而在数据新闻中,通过对数据的视觉化再加工,人们能够更好地传递、解释、解读数据。

  例如,FLOWINATA网站推出了关于市民喜欢在哪里跑步的可视化报道(Where People Run in Major Cities)。[8]统计学博士Nathan Yau通过对人们日常使用的运动App上传的运动数据的分析,对美国多个大城市中跑步爱好者的线图做了一个可视化展示(如图2)。在图中,紫色线条表示跑步线,颜色越深的线越受跑步者的欢迎。这个线图将每个个体零碎的跑步数据综合起来,呈现出整体的状况,更宏观和直接地反映了市民选择跑步线的重合程度。Nathan Yau表示,这样的数据呈现不仅仅是给人们从另一个角度看待日常生活行为,对于市民或运动APP规划运动线,甚至对于未来城市规划时确保有适当的自行车道和运都有重要的作用。

  观点呈现型信息图表则是是对某个事件或者某个话题进行观点调查之后,运用可视化方法呈现人们观点的信息图。以网易数读发布的《六十五年国人婚恋观变迁》[9](图3)为例。网易绘制了一个国人65年来的婚恋观变化的螺旋式时间轴图,从择偶条件、最受欢迎类型、性行为态度、离婚率、再婚占结婚总数比例几个方面展现了从建国至今,中国人的婚恋观从压抑到、从单一到多元的变化。而这些变化也正是65年来中国社会发生巨大变化的体现,每个阶段独特的婚恋观念,也从侧面反映出这个阶段的社会现实。

  信息图表的使用也使得这种观念变化的展现更加直接。新闻在报道社会观念变化的时候不再拘泥于用单一视角描述某个具体故事、某个个体的主观感受的以小见大的方式,而是通过信息图表把抽象的内容具体化、数字化,用小数字、小细节反映大时代社会面貌,展现了65年来中国经济的增长与社会的变迁。

  知识普及型信息图表用图表的形式来传递知识,使知识的传达更为深入浅出。《邮报》的《30张图表解读今日中国》(30 charts and maps that explain China today)[10](如图4)就属此类。该报道一共选取了30张不同形式的图表,内容涉及中国的人口、语言、城市化、财富分配、对外贸易、饮食、网络以及中美财富比较等多个领域。这组报道以美国普通为受众,要为他们介绍今日中国的现状,如果采用文章的形式,篇幅的长度和吸引力强度都会成为这组报道很大的挑战。图表信息量大,在设计上又显得简约大方,容易识读,可以更为直观地阐释中国。因此本组报道以图表为主并辅以少量文字解释的呈现形式,具有较高的力,能够促使读者对于中国的发展和现状有的认知。使用信息图表也更加符合视觉时代用户的习惯与偏好。

  从目前发展趋势看,交互式信息图表(Interactive Infographic)和动态信息图表(Motion Graphic)在数据新闻中的应用也日渐增多。总体而言,就这两种信息图表而言,国外的探索早于国内,水平也更加成熟。其中英国的《卫报》、美国的《纽约时报》、《邮报》等制作了大量的优秀作品。

  例如《纽约时报》所制作的多报道——《重塑纽约》(Reshaping New York)[11](图5、图6),它用矢量图片与区域图片的自动和完美结合,展现出纽约市长迈克尔·布隆伯格在任十二年期间纽约新建建筑群、区域调整以及市内自行车道建设三方面的变化,从而形成对这位迄今为止纽约市任期最长市长的客观的政绩纪录。形象生动的图片和流畅的是其留给受众的直观感受,制作者首先用矢量图片呈现出宏观的变化,再在其中穿插角度几乎一致的前后对比图片,展现其微观的变化。

  除了形象美观的视觉效果,丰富的信息量也是这些优秀作品的共性所在。新闻产品如果仅仅只是有出彩的呈现形式,缺乏数据信息的传达,就只是毫无意义的空壳。因此真正优秀的作品背后是制作者对于数据的广泛搜集,仔细筛选,并选择一定的角度对数据进行科学的分析,最后通过可视化的形式呈现出来。

  《数字背后的医保》(Medicare Unmasked: Behind the Numbers)[12]是《华尔街日报》推出的有关美国医保系统信息透明度低的调查报道,它以数据作为驱动的逻辑,整个调查团队为了获得数据做出了不懈的努力,花费大量时间和人力对海量的数据进行科学的分析,数据记者们通过写代码等方式来探索调查线索和数据整体模式之间的相关性。这一里程碑式的作品体现了数据新闻的精髓——挖掘数据背后的意义并加以呈现,数据不仅仅是数字,更是一种按照科学方法进行统计分析后得到的信息。该报道摘得2015年的普利策调查性报道。

  《经济学人》制作的《全球地震:交互式地图》(Global earthquakes: Interactive map)[13],则是以2015年9月16日发生的智利8.3级大地震为立足点,用互动地图的形式展现出1995年到2005年30年来强度较大的地震演变。丰富的数据信息准确地刻画出了环太平洋地震带的主要范围,信息量十分丰富。

  以数据推动故事的发展,使得报道摆脱了传统的叙事方式。《重塑纽约》是典型的以数据和图片的来推动叙事的形式,整个过程流畅自然,具有较高的效率。在每一个部分,都配有制作者对纽约市长所实行政策的功过评价,以数据为基础,客观中肯。

  数据新闻作为新闻报道的一种创新形态,仍是要立足新闻本位。考察这些优秀作品不难发现,被挖掘出来的数据背后的意义通常具有很高的新闻价值。它或者通过揭露出鲜有关注的“盲点”,或与受众息息相关,或是大多数人密切关注的议题。

  FiveThirtyEight制作的报道《Uber在纽约曼哈顿外的行政区提供了比计程车更多的服务》(Uber Is Serving New York’s Outer Boroughs More Than Taxis Are)[14]就解决了一直以来纽约市内极具争议的一个问题——拥堵是否是Uber造成的,通过对五个月内的数据进行分析,报道得出结论:传统出租车在拥堵方面的“贡献”并不亚于专车。相反,Uber无可争议地解决了偏远地区乘车难的问题。该作品所传达的信息不仅填补关注的盲点,更与纽约市民的生活息息相关。再如财新网制作的动态新闻作品《的人与财》[15],全面展现出的人脉网以及其中的财务关系,在落马的背景下,具有很高的新闻价值。

  这些作品都取得了较好的效果,甚至产生了重要的影响。《数字背后的医保》发布后,在美国中产生了极大的反响,美国迫于压力公布了一直保密的医保数据。《重塑纽约》则通过生动的数据动画呈现,客观地展现了布隆伯格作为纽约市长为这座城市带来的变化,改变了很多纽约市民对市长的认知。

  总结这些报道案例,我们可以归纳出它们的特点:生动清晰的可视化呈现形式、丰富的数据信息、由数据图表推动的叙事方式、作品背后较高的新闻价值以及良好的效果。无论报道的形态如何变革,报道的新闻价值,以及它所带来的社会公益性,是评判优秀报道不变的标准。

  回首过去的95年,我们的党披荆斩棘、开拓进取,我们的党风雨无阻、成就辉煌。忆往昔峥嵘岁月,看今朝风华正茂,笔耕不辍,砥砺前行。以为首的党报正是95年征程的者和记录者……

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐
网站推荐更多>>