《数据新闻概论》课件第一章.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《数据新闻概论》课件第一章.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据新闻概论 数据新闻概论课件 第一章 数据 新闻 概论 课件
- 资源描述:
-
1、什么是数据新闻第一章数据新闻的概念与特征 第一节 西方主流大报和一些独立新闻机构成立了专门团队来设计一些新型的新闻应用,即运用各种技术软件来抓取、处理、分析和形象化呈现数据,数据呈现方式包括可视化数据图、互动图表和网络在线演示等,从而翻开了数据新闻实践领域的第一页。一、概念的提出与辨析从数据新闻与其他新闻的区别数据新闻与其他新闻的区别角度分析,德国伯明翰城市大学的保罗布拉德肖(Paul Bradshaw)指出数据新闻“简言之就是一切通过数据处理的新闻”,它与其他新闻的不同之处在于当你将传统的新闻嗅觉、讲述扣人心弦的故事的能力与庞大的数据信息结合在一起时,新闻报道能呈现出许多新的可能。从数据新闻
2、对新闻叙事的创新数据新闻对新闻叙事的创新角度阐述,纽约时报的阿隆菲尔霍夫(Aron Pilhofer)表示,“在我看来,数据新闻是一个概括性术语,它囊括了一套仍在不断增多的用于新闻叙事的工具、技巧与方法,涵盖了从传统的计算机辅助报道(使用数据作为信源)到最前沿的数据可视化和新闻应用等一切叙事方式。其统一的目标是新闻业意义上的:提供信息和分析以帮助告知我们一天内所有最重要的事件”。从数据新闻改变传统新闻工作方式数据新闻改变传统新闻工作方式的角度剖析,德国之声电视台的米尔科劳伦兹(Mirko Lorenz)认为,“数据新闻是一种工作流程,包括以下基本步骤:通过反复抓取、筛选和重组来深度挖掘数据,聚
3、焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事。数据新闻可被视为一个不断提炼信息的过程,在这一过程中,原始数据转换成有意义的信息。只有把复杂的事实组织成条理清晰、易于理解和记忆的故事,公众才能获取更多益处”。一、概念的提出与辨析 结合上述阐释,我们认为“数据新闻”是“基于数据信息的采集、分析和呈现的新闻工作方式基于数据信息的采集、分析和呈现的新闻工作方式”。对数据的重视和围绕数据所做的采集、分析与呈现工作构成了数据新闻的本质,媒体要推行数据新闻业务,首先要解决数据处理理念和技术的问题。必须强调的是,这里所说的数据(data)不是人们熟悉的数字(number),因此包含数字的报道并不一定是
4、数据新闻,而没有数字的报道未必不是数据新闻。在互联网技术大发展的今天,现实生活中的所有事物都可以被量化,并通过计算机程序对之进行统计分析,这就是数据新闻学在台湾也被译为“资料新闻学”的原因。同理,只是呈现数据,而缺乏对数据进行相应的处理,没有将信息背后存在的意义挖掘出来加以呈现,也不能称之为数据新闻。数据新闻中的数据应该是经过科学的社会研究方法进行统计分析后得来的信息,即新闻生产者对原始信息进行收集、量化而形成可被计算和分析的数据,按照报道的目的、依靠科学的程序和方法对数据进行统计分析,然后将被发掘的意义以新闻故事的形式呈现。在这个过程中,数据是支撑整个报道叙事逻辑的关键线索,或是报道中至为重
5、要的论据。二、数据新闻的特征 作为大数据时代新闻学发展形成的新领域,数据新闻代表未来新闻业发展的一大方向,它包含以下特征:1以服务公众利益为目的这是数据新闻的出发点,所有数据的处理和呈现归根究底是为了让公众理解我们身处的大数据时代中数据变迁的内涵,了解宏观数据如何影响每个人。2以开放的数据为基础这是数据新闻存在的前提,如果政府、社会其他组织不公开信息或者没有以开放数据的标准向公众开放大量权威数据,那么缺乏数据分析材料,数据新闻也不可能得以推行。3以数据处理分析的结果作为驱动报道逻辑的核心依靠特殊的软件程序对数据进行处理,发掘隐藏于宏观、抽象数据背后的意义,找寻数据背后的结构性联系,并将之作为报
6、道叙事逻辑的驱动因素。这是数据新闻和一般新闻相区别的核心特征。4以可视化作为其主要的呈现方式这是数据新闻的主要展现形式。得益于科学可视化的发展,数据新闻可以将复杂、抽象、难懂的数据转化为形象、具体、生动的新闻报道。三、数据新闻的形态 第一种是数据新闻的早期形态,它既在早期新闻报道中常见,也是目前国内很多媒体普遍采取的数据新闻形态。这种形态具体又有两类表现:一是纯文字叙事的报道,引用大量数据作为支撑报道的论据;二是以文字报道为主,同时采用配图表的图解方式辅助新闻报道,图表多展现数据。值得注意的是,在前种形态中,如果数据能成为支撑报道叙事的核心内容,则可视为数据新闻;而在后种形态中,报道中有关数据
7、的部分和文字报道部分必须是不可拆分的,也就是说数据要成为驱动叙事的核心。如果即使摆脱了图表,文字报道也有很强的完整性,数据就成了报道的点缀,而不是报道的驱动因素,这样的报道就不能称其为严格意义上的数据新闻。如果以这个标准来看许多以“数据新闻”命名的报道,就会发现其中存在诸多问题,不少报道还停留在用数据点缀文字的层面上,数据内容只不过是文字报道的附庸。三、数据新闻的形态第二种是数据新闻的成熟形态,即通过数据分析或数据挖掘,找出人们没有发现的盲点来报道的数据新闻。在这类新闻中,需要通过数据挖掘分析,才能对信息进行深度的解读和分析,并找到人们应知、欲知而未知的信息。举个最简单的例子,你把北京,比如说
8、我们每一个人的坐标,都记录下来,那这个记录本身可能没有什么特别的含义,它只是告诉你每个人的具体位置。但是如果我把这个时间点的全北京所有人的坐标都显示在一张地图上,那你就会发现地图上有的地方人多,有的地方人少。那么人多的地方显然就是商业价值更高的,所谓的热点地区。这个热点地区可能是西单、东单这样的地方,这就属于数据挖掘。就是说当我看每一个人的数据的时候,我不知道北京什么地方更有商业价值,它跟这事儿是没有关系的,把所有的数据放在一起并且把它们可视化的时候,我就能直接看出什么地方人更多。应该说,这就是一种数据挖掘。当然,这是最简单的数据挖掘方式,我们还有更复杂的数据挖掘方式。而且做数据挖掘,很多时候
9、不是那么简单。财新数据新闻与可视化实验室创始人、数据新闻CTO黄志敏三、数据新闻的形态 第三种形态也是数据新闻的成熟形态,但其把核心放在故事呈现的环节,即纯粹用数据和图标去讲一个新闻故事,而不是采用传统的叙事方式做新闻报道。在这类数据新闻中,文字不再成为叙事的主要手段,而需要用图形、数据和其他可视化元素来引导叙事,讲述故事。这就意味着记者编辑需要重新考量如何以可视化方式或其他网络应用的形式架构一个新闻故事,通过各种图形引导和互动设计让阅读进行下去,这对从业者的思维转换提出了较高的要求,如果没有多媒体叙事的能力,则无法胜任这样的报道设计。数据新闻产生的背景 第二节 “数据新闻”作为新闻传播界一个
10、新兴的概念,其诞生于特定的社会历史环境之中。了解其产生的特殊背景,有助于我们加深对数据新闻的理解。一、社会背景:大数据时代重新定义数据的价值 “大数据时代”意味着一切皆可被数据化,世界成为可以理解的数据海洋。如果说20世纪60年代麦克卢汉提出的“媒介即讯息”的观点在振聋发聩的同时也引发争议的话,那么“数据即讯息”已经成为这个时代的共识。数据的商业价值和管理价值正在得到前所未有的重视与开发。首先认识到大数据的商业价值的是一些互联网公司。互联网刚刚兴起的时候,很多人还沉醉于“匿名”交流的喜悦中,殊不知你偶然为之的网页点击、搜索引擎中的关键字查询、购物网站中的浏览痕迹等这些无足轻重的举动都给了互联网
11、公司获取你的相关数据、加深对你的了解的机会。后者据此开发出一系列服务,使数据转变成生意。国际知名互联网电商亚马逊能从每一位客户身上捕捉到大量数据,包括购买记录、浏览记录、浏览时间,并从这些杂乱的数据中找到产品的关联性,从而产生亚马逊推荐系统,将最适合用户的产品推荐给用户,极大地提升了用户的购物体验。案例:基于大数据分析的“百度”预测 搜索平台百度公司近年来陆续推出一系列大数据产品,如基于定位服务的人口迁徙大数据项目“百度迁徙”。在春运期间,用户通过该项目可以实时查看全国范围8小时内的人口迁徙轨迹及特征。再如基于大数据分析的“百度预测”,先后上线了“经济指数预测”、“疾病预测”、“城市预测”、“
12、景点预测”等细分产品。以“景点预测”为例,百度大数据部通过对全国用户搜索旅游的数据的深度挖掘,发现旅游相关词搜索数量和实际旅游人数之间的相关性,并依此建立了旅游预测模型,以反映各旅游景点在预测日期的人流趋势。2014年巴西世界杯期间,百度收集了20102013年全球范围内所有国家队及俱乐部的赛事数据,推出了“世界杯预测”这一赛事预测产品,而此类预测模型将在球队训练和体彩等方面发挥的商业价值不容小觑。案例:解密美国国安局文件:曝光事件对你而言意味着什么 同时,大数据在公共管理领域展现出的价值也在逐步为人们所重视。以公共卫生领域为例,谷歌公司发现对搜索流感的数据进行分析可以有效地预测流感的发展趋势
13、,提前做出防备,其将搜索情形汇总推出流感疫情估测服务,帮助公共卫生官员和专业人员更好地应对流感,如今这项服务也开始应用于登革热等其他流行病领域。2013年,斯诺登曝光的监听丑闻是一场国际政治风波,也彰显着数据在这个时代之于公共管理领域的价值。英国卫报就此事件做了解密美国国安局文件:曝光事件对你而言意味着什么的报道,用一系列惊人的数据报道我们的生活是如何被记录和监控的。其中提及如果某人被视为恐怖对象受到监控,那么和他相关的三级以内的朋友圈都会“遭殃”。用户可以根据自己在Facebook上的好友数判断将有多少人牵涉其中。比如某人在Facebook上有209个好友,这些好友共有34 150个好友和这
14、些好友的好友共有5 580 110个好友即“三级好友”,那么他们也会被纳入监控范围。二、技术支持:互联网开源软件市场的成熟 开源即open source,指在互联网上开放分享软件的原始代码,可以让别人自由地浏览、评价、修改和重新发布。开源软件指所有向公众公开源代码的软件,它源于一些软件技术发烧友出于技术展现目的或者说是对软件的一种热爱,将自己辛勤开发的软件源代码无私地发布到互联网社区上与社会共享。如今开源软件市场已趋成熟,其低成本型和代码的公开与透明为热心从事数据新闻报道的媒体和公众提供了高效快捷的工具,如:在数据获取时采用Scrapy软件快速从网络中提取结构化数据,运用Tabula软件获取P
15、DF格式文件中的表格信息并将内容转化为CSV文件或者微软Excel电子表格;在数据整理时运用OpenRefine实现数据排序、自动查找重复条目或完成数据记录;在数据统计分析领域运用R语,其主要用于统计分析、绘图的语言和操作环境;而在可视化阶段盛行的开源软件更是种类繁多,不一而足。这为数据新闻的产生和兴起打下了坚实的技术基础。正如记者大卫麦克坎德莱斯(David McCandless,信息之美一书的作者)所言:“数据正变得越来越重要,这并不是因为数据的量大,而是我们拥有了工具和能力去分析数据,找出模式、结构并揭示趋势。”三、政治环境:全球“开放数据”运动的蓬勃兴起伴随互联网技术的发展,越来越多的
16、程序开发员和软件公司加入了开源运动,这带动了开放数据运动的兴起。开放数据(open data)与开源不同,它不限于软件领域,而是直指政府对公共领域数据的公开,这些公开的数据不受著作权和专利权的限制,任何人都可以自由对之进行运用。各国政府在世界各地开展的开放数据活动中首当其冲,而向公众公开的政府数据为媒体制作数据新闻提供了重要的内容来源。案例:乔舒亚陶伯拉创办的GovTrack.us网站 全球开放数据运动始于美国。2004年,美国普林斯顿大学的一位名为乔舒亚陶伯拉(Joshua Tauberer)的本科生创办了首个民间公开数据的网站GovTrack.us,帮助人们获取美国国会的相关数据,以及追踪
17、美国国会的所有法案数据。案例:我的钱去哪儿了?告诉你你的缴税都如何花费 建立统一的政府开放数据门户,集中开放可加工的数据集是各国数据门户网站的一个普遍做法,除此以外,各地方和部门也建立了独立的开放数据门户。以英国为例,2010年初英国政府的数据开放网站data.gov.uk正式创建,所有政府部门要公开的数据都可以在这个网站上找到。针对政府未公开的数据,媒体可通过信息自由法申请有关部门公开数据。如非营利机构“开放知识基金会”制作的英国税收报道我的钱去哪儿了?告诉你你的缴税都如何花费,用户可通过选择自己年薪的数量来看自己缴纳的税收都用在何处。三、政治环境:全球“开放数据”运动的蓬勃兴起 近年来,中
18、国政府同样在为开放数据努力。国家统计局建立了类似英美政府的国家数据公开网站“国家数据”网()。由此可见,围绕民生需求逐步向公众开放政府的数据集,使民众更清晰地了解政府的执政政策并有效行使自己的权利,鼓励社会和企业利用这些数据创造更多社会价值,已经成为全球的大势所趋。开放政府数据的原则 2007年12月,包括乔舒亚陶伯拉在内的30位开放政府数据的倡导者齐聚美国加州,商讨制定了开放政府数据的8项原则。2014年乔舒亚陶伯拉在其所著的开放政府数据一书第二版中对此前的原则进行修改扩充,制定了开放政府数据的14项原则:(1)信息只有能在互联网上公开自由地获取才能被视为公共信息。(2)数据必须原始(pri
19、mary)。数据应该在其来源处收集,尽可能收集最高粒度(granularity)的数据,而不是收集经过聚合或更改后的数据。(3)数据必须及时(timely)。数据应该在其具有保存价值的时段内尽可能快速地公开。如果发布时间太晚,数据将失去其对于公众的价值。(14)政府应加强不同机构之间公开数据的跨域合作。政府应建立或采用一个可分享的数据标准,促进各机构之间发布数据的跨域合作,如针对同一事物的不同部门的数据应能互通,以便公众将这些相关数据合并考量。四、传播语境:从“信息传播”向“知识传播”的转型 “我们被信息淹没,但却缺乏知识。”如果说“信息”是以有意义的形式排列和处理的数据,“知识”则是经过加工
展开阅读全文