1.5 本书简介和使用说明
近几年,做社会调查的人/机构越来越多,喜欢社会调查数据的人也越来越多。可是,我在调研和合作经验中,体会得越来越深的一点就是:无论是社会调查,还是数据管理,都是专业性极强的事业。令人恐慌的是,越来越多的非专业人员参与到社会调查中,甚至貌似谁都可以做社会调查,只要有数据,数据库想建就能建。这样发展的后果是人们越来越不相信社会调查数据,特别是基于非专业技术和方法收集的数据得出的所谓的“科学”的结论,更让很多人对社会调查数据嗤之以鼻。渐渐地,我萌生了写一本关于社会调查和数据管理的书的想法,不故弄玄虚,也不轻言薄语,不求面面俱到,至少能把其中的基本要素讲解清楚,让没有学过社会调查和数据管理的门外汉也能看懂。
在内容方面,本书的重点是讲解社会调查数据的整个管理过程,意图是让读者在看完本书后能对社会调查数据管理工作有一个总体的了解和掌握。对数据管理过程包含的所有工作的讲解侧重点不同。坦白说,本书中的每个章节都可单独写一本书,我也有这个写作计划。本书在内容上,更侧重用Stata管理数据,所用的示例数据均来源于中国综合社会调查。
在阅读对象方面,本书不仅适用于专职的数据管理者,而且对数据分析员和研究者,也有一定的使用和借鉴价值。所有的数据在用于正式的数据分析之前,都需要对其做一定的清理和处理,才能高效、精确地使用数据,而这些都属于数据管理的工作范围。本书的每个章节相互独立,读者可以从头读到尾,这样最好,但是也可以根据自己的需要选读。根据我的经验,有些基础的知识、命令和技巧很容易,但常常被数据使用者忽略,因此我在写作的过程中有针对性地反复使用这些知识,以帮助读者强化记忆。
在所用软件方面,本书的副标题是基于Stata14管理CGSS(China General Social Survey)数据,自然书中用到的主要统计软件就是Stata,这是因为我一直用Stata做数据管理和数据分析,而且CGSS的数据也主要用Stata管理。虽然书中的大部分工作用其他软件也都能实现,但Stata最好用,它的交互界面更友好,计算机语言更人性,而且它提供的do文件和log文件能轻松实现数据管理的可复制性和部分工作的自动化实现。
本书对Stata用法的讲解以数据管理任务为导向,区别于市面上其他以命令讲解为导向的Stata书籍。希望能借此揭开计算机和Stata的神秘面纱,水到渠成地引入数据管理中常用的Stata命令,而不是枯燥地列出所有可能用到的命令。Stata的功能非常强大,没有必要(我觉得也不大可能)把所有的命令都学完,掌握了学习Stata的技巧和方法,需要用哪个命令现学也不晚。而且大脑的内存有限,何不让它轻松运转呢?