在美国做数据新闻记者的观察与体验

数据记者的必备技能

一个完整的数据新闻部门一般需要三种人:编辑,数据记者和网络工程师。在一些大型的网络媒体和非盈利新闻机构里,数据记者经常和网络工程师一起工作,一个负责内容整编,另一个提供技术。随着大数据时代的到来,我们能够接触到的数据越来越多,而要对庞大的数据库进行分析和整理,则需要一些统计学和编程知识。

我最初接触到“数据新闻”是在读研究生期间,当时教授介绍了一些常用的工具给大家,比如Excel, Google Fusion Table, Tableau等等。这些软件容易上手,因为它们并不需要使用者有任何编程背景。只要数据不是过于复杂,一般情况下我们都可以用Excel对它进行分析,利用Google强大的地图资源进行坐标定位,再将电子表格等信息导入到Tableau中,将数据可视化,绘制一个交互式地图。这种工作模式适合没有计算机背景的数据记者,以及人力资源有限的中小型媒体。

除此以外,一些基础的编程语言和数据库分析知识也会给我们的工作带来便利。比如当我们想获取社交网站上的数据时,可以通过该公司所提供的应用程序接口(API)来收集它的用户信息。又比如那些无法用Excel分析的庞大数据库,我们可以用更高级的R和Access进行整理。再说可视化,除了用工具绘制,有编程背景的人还可以用JavaScript等语言编写自己的交互式图表,从而避免软件本身带来的限制和操作不便。编程语言和数据库分析技术掌握起来要比使用软件难。但幸运的是大部分我们能用上的程序都是免费的,相关的教程讲义在网上也比比皆是。

被传统媒体忽略的数据

“公开数据”是美国媒体人最引以为豪的事情之一。宪法保障了人民的知情权和言论自由权,而政府部门的网站上提供的各项数据和报告则成为这条法律的具体表现。我的一名同事说,如果没有这些公开数据,他几乎无法开展工作。而事实上,作为调查记者的他的确从这些数据中得到很多新闻素材。比如政府部门工作人员的消费记录、交警部门的罚款记录、还有各级法院所受理过的案件记录等等。但传统的媒体,不论纸媒还是电视台,大多只是将这些数据作为信息传递给观众;或是作为证据用来鉴别采访对象所言之词是否属实,却往往忽略了这些数据本身的故事性。

举个例子,我们听说科罗拉多州一个名为Morrison的小镇2013年的政府收入中,最主要的来源是违规司机向交通部门所交纳的罚款。于是便向当地交通部门申请索要了13年所有的交通违规记录。调查中,我们发现这个人口只有四百多的小镇一年内开出的罚单竟然多达13000多份,这相当于当地警察每天平均要开至少35份罚单。得到这个结果,故事基本有了,可要作为调查性新闻报道的话,它仍旧缺少细节。比如:Morrison是否为一个旅游小镇?它平时的交通状况如何?当地有几名交警?他们平时都在哪里罚款?这些问题如果得不到解答,我们就不知道这个小镇的警察局是否存在恶意罚款的行为。

在数据分析进入编辑室以前,大部分调查记者在了解背景情况后,会实地走访那些他们认为“有料可挖”的地方,他们相信眼见为实。而面对手里成千上万份的资料,记者很多时候却无从下手。我的同事把这13000多份罚款记录交给我时,距离最初拿到它已经过去了大半年。我在分析数据的过程中,发现每条罚款记录都注明了肇事日期,地点和原因等。这意味着我们至少可以从这组数据中得出三个结论:1. 最容易被罚款的地点;2.罚款最常见的原因;3.一年当中罚单开得最多的一天。随着答案浮出水面,我们也掌握了更多信息,比如罚款最多的那天镇里正好举行一场大型户外演唱会,再比如最常见的罚款原因是在镇子外头的高速公路上超速行驶。那是一条沿山路,而罚款最多的地方,恰好是一个减速带。很多车子因为来不及刹车,被停在路边的警车抓了个正着。我们调查发现,这个减速带是最近几年新修的,而它的出现无疑给当地交通管理部门带来了良好的“经济效益”。是数据分析的能力,让这个原本被人遗忘的故事重新变得有意思起来。

主流?还是边缘化?

在美国学习和工作的三年里,我最害怕的是“被边缘化”。新闻记者大多需要良好的口才,和广阔的人脉关系,而外国人在这两点上可以说是“先天不足”。虽然我也见到许多英语水平很高的留学生,但能用第二语言在主流媒体里做内容的记者却是极少数。我也不止一次的想过,如果有一天自己能和其他同事一样进行独立采访报道,那该多好。但想起之前一次次失败的求职经历,便明白自己的优势并不在此。于是,如何在外媒中立足,成为我入职以来思考最多的问题。

扬长避短,多问多学。

和求职时一样,在工作中,我尽量展现自己的长项,同时避免因自身不足带来的影响。外国记者除了语言和人脉以外,最缺乏的是对于当地文化的了解。举个例子,我们得到过一份科罗拉多州警察装备清单,里面详细记录了给每个县警察局所配发的武器,从一粒子弹,到一辆装甲车。在数据分析的过程中,我发现有一个县所拥有的重型武器数量远多于其他地区,而它的人口比例却又出奇的低。总结中,我费了不少笔墨去描写这个县是如何的武装化。而编辑在审稿时却告诉我遗漏了一个重要信息:原来这个人烟稀少的地区有着号称全美最严格的监狱系统,里面关押着几名美国历史上臭名昭著的杀人犯和恐怖分子。如此一来,武器的数量也得到了合理解释。而我在不了解背景的情况下报道的新闻,多少显得有些扭曲事实。从那之后,每当我在调查中发现一些不合常理的现象时,都会先上网查一查相关的背景资料,或是向同事询问情况。这样不仅使得新闻报道更加准确、公正,也提高了对于当地的了解。

参加会议,交流讨论。

会议是各种各样的。大部分新闻单位一天都有两次例会,上下午各一次,每次不超过半小时。记者挨个报题,编辑审核,参加这种快节奏的会议很锻炼人的口才和反应能力。此外,每隔一段时间和编辑坐下来想想新题目,讨论故事大纲,也是必要的交流学习内容。工作之余,积极地参加各种数据新闻研讨会,既可以认识优秀的同行,又能了解到行业的最新动向。从地方到国家,美国有很多为新闻记者设立的奖项,交流会,讲座,以及短期交流项目。利用好这些资源,不但可以开拓视野,更能提高自身技能,进而不论在哪里,都可以从容自信的做记者。

时间: 2024-10-08 13:29:40

在美国做数据新闻记者的观察与体验的相关文章

想去机器学习初创公司做数据科学家?这里有最常问的40道面试题

导读   想去机器学习初创公司做数据科学家?这些问题值得你三思! 机器学习和数据科学被看作是下一次工业革命的驱动器.这也意味着有许许多多令人激动的初创公司正在起步成长.寻找专业人士和数据科学家.它们可能是未来的特斯拉.谷歌. 对于有职业抱负的你来说,看好一家好的创业公司团队后,如何能够脱颖而出,进入一家靠谱的创业团队呢? 想得到这样的工作并不容易.首先你要强烈认同那个公司的理念.团队和愿景.同时你可能会遇到一些很难的技术问题.而这些问题则取决于公司的业务.他们是咨询公司?他们是做机器学习产品的?

邬贺铨:BAT做了美国做不了的互联网金融

本文讲的是邬贺铨:BAT做了美国做不了的互联网金融,日前,中国工程院院士邬贺铨出席了浪潮云海金融大数据一体机发布会,并做了<大数据浪潮与金融业变革>的主题演讲.他表示在互联网金融领域,"中国的百度.阿里.腾讯做了美国谷歌.亚马逊.Facebook.Twitter做不了的事情." 邬贺铨院士介绍了当前中国互联网公司涉足金融业务的三种方式. 一是通过电商网站积累用户数据,用大数据分析建立信用体系,评估融资风险,并通过基金公司介入金融领域,如阿里跟天弘,微信跟华夏基金,百度和嘉实

人们不必为美国的数据中心能耗担心

最近据悉,欧洲数据中心的能源增长并没有像人们担心的那样快速增长.如今,又有一个来自美国的令人鼓舞的消息.美国伯克利劳伦斯国家实验室的一份报告表明,美国近年来的数据中心能耗的增长正在放缓. 从2010年到2014年,美国的数据中心使用的能源只增长了百分之四,相当于每年只增长了百分之一.而美国数据中心的能源使用研究报告,是由美国伯克利劳伦斯国家实验室研究人员阿尔曼·舍哈比与斯坦福大学乔纳森·科曼利共同领导,美国能源部的联邦能源管理项目提供资助进行的调查. 美国数据中心能源使用量预测 这是一个惊喜 在

美国大数据治理下的新问题

大数据与开放政府数据对电子公共服务.开放和透明政府以及政府公众与企业间的互动,都蕴藏着巨大的变革潜力.大数据与开放政府数据可推动多方协作,为农业.健康和交通运输等各个领域面临的挑战提出实时解决方案,推动更大程度的开放,并引领政策制定走向新时代. 本文以美国为背景,对有关开放政府数据与大数据的关键政策问题进行评论,然后为大数据和开放政府数据的实践提供建议,以推进数据驱动的创新. 大数据应用 2012年3月奥巴马政府发布了"大数据研究和发展计划".作为回应,美国国家科学基金会.美国国家卫生

揭秘:美国“脸书”数据中心,叹为观止

核心提示: 美国"脸书"数据中心位于俄勒冈州的一个小镇,庞大的数据中心为日益增长的点赞与上传照片做后台支持.     美国"脸书"数据中心位于俄勒冈州的一个小镇,庞大的数据中心为日益增长的点赞与上传照片做后台支持.     数据中心的外景     数据中心的外景     数据中心内部设备     数据中心制冷设备     数据中心空气过滤装置     看不明白是在做什么     数据中心内部     看不明白是在做什么     数据中心内部设备     数据中心内部

美国大数据工程师面试攻略有哪些?

大家好,我是来自硅谷的董飞,应国内朋友邀请,很高兴跟大家交流一下美国大数据工程师的面试攻略. 个人介绍 先做一个自我介绍,本科南开后,加入了一个创业公司kuxun,做实时信息检索,后来进入百度基础架构组,搭建了Baidu App Engine的早期版本,随后去Duke大学留学,在攻读硕士期间,做跟Hadoop大数据相关的研究项目Starfish,之后在Amazon EC2部门实习,了解它们的内部架构,毕业后加入Linkedin,做广告组的架构,涉及Hadoop调优,Data Pipeline,

ios做数据缓存后,显示数据的逻辑是怎样的?

问题描述 ios做数据缓存后,显示数据的逻辑是怎样的? ios做数据缓存后,显示数据的逻辑是怎样的?因为有上拉加载更多,和下拉刷新,求思路 解决方案 iOS数据缓存iOS开发数据缓存玩转iOS开发 - 数据缓存 解决方案二: 1.获取服务器数据后,可以写入本地文件中,需要用到的时候再去读取就可以了: 2.分页的话类似的: 解决方案三: 每次加载页面都可以先从缓存里面读取,读不到再网络获取

java web-JavaWeb公网上想和C++,JavaWeb系统做数据接入,技术选型应该选择哪种?

问题描述 JavaWeb公网上想和C++,JavaWeb系统做数据接入,技术选型应该选择哪种? JavaWeb公网上想和C++,JavaWeb系统做数据接入,技术选型应该选择哪种? 对数据安全有一定的需求

做数据上移为什么单击后没反应

问题描述 做数据上移为什么单击后没反应 protected void BtnUpClick_Click(object sender EventArgs e) { DataSet ds = new DataSet(); OleDbConnection myconn = DB.CreateDB(); myconn.Open(); DataTable aFolderDocsTable = (DataTable)ViewState[""id""]; //aFolderDos