微观数据资料简介

来源:互联网 发布:腾讯 群 大数据 教育 编辑:程序博客网 时间:2024/05/16 08:17

(一)   UHS  (Urban Household Survey)
简介:中国城镇住户调查数据。它是国家统计局城调总队负责调查的。现在可以拿到1986年至2006年的数据。如果可能的话,我们可以拿到全部省份的数据,但现在大家使用的是

六个省份的数据(北京、广东、浙江、辽宁、陕西、四川)。每年大约有3500-4000户的数据。
(内附1992年调查问卷)
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、行业、职业、就业状况、工资、总收入、工作小时数、参加工作年份、退休金、财产性收入。(2)家

庭层次上的变量。家庭总收入、家庭人口数、居住面积、房间个数、家庭财产、现金支出、现金流入、储蓄、借款、家庭消费。
可做的研究:
(1)教育回报率问题。
(2)收入不平等问题。
(3)劳动力供给问题。家庭财产、孩子(老人)、退休金。
(4)行业的分布及变化。
(5)职业的分布及变化。人力资源管理。
(6)就业问题。失业率和劳动参与率。
(7)教育决定因素及教育不平等问题。
(8)社会保障方面的研究(退休金)。
(9)财产性收入研究。
(10)房地产需求问题。它与人口结构的关系。
(11)非正规金融问题(借款)。
(12)家庭消费的决定因素及模式变化。
(二)   CHIP (Chinese Household Income Project Survey)
简介:中国家庭收入项目调查。它是由国家统计局农调总队和中国社会科学院经济研究所共同开展此项专门调查。调查内容主要包括:收入、消费、就业、生产等有关方面的情况

。现在做了三轮,分别是1988,1995,2002,可能2006的也正在进行中。这个数据是全部省份。这个数据的好处是,农村及城镇的数据都有。城镇每年家庭的数据大约有6800户,人

数大约为20000人。农村每年家庭的数据大约有9200户,人数大约有38000人。
(内附2002年调查问卷)
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、受教育年限、行业、所有制、职业、就业状况、工资、总收入、工作小时数、参加工作年份、是否中共党员、是否

当过兵、是否当过干部、吸烟花多少钱、喝酒花多少钱、是否残疾、医药支出额多少、生病的时间、从事家务劳动的时间、照顾家里其它病人的时间、工资收入总额、退休金、股

票红利、工作天数、工作小时数、找工作的渠道、居住条件、开始非农就业的年份。(2)家庭层次上的变量。家庭总收入、家庭人口数、居住面积、房屋所有权、贷款的数量、借

钱的途径、自己及配偶父母的家庭成分、家庭收入、老人补助金、现金支出、家庭消费、家庭财产。
可做的研究:
(1)教育回报率问题。
(2)收入不平等问题。
(3)劳动力供给问题。家庭财产、孩子(老人)、退休金、家务劳动时间。
(4)找工作的方式问题。
(5)行业的分布及变化。
(6)职业的分布及变化。人力资源管理。
(7)就业问题。失业率和劳动参与率。
(8)教育决定因素及教育不平等问题。
(9)社会保障方面的研究(退休金)。
(10)财产性收入研究(股票)。
(11)房地产需求问题。它与人口结构的关系。
(12)住房解决方式问题。
(13)农村非正规金融问题(借款)。
(14)家庭消费的决定因素及模式变化。
(15)党员、当兵、当干部、父母家庭成分对收入和就业的影响
(16)吸烟、喝酒等支出的决定因素及变化趋势
(17)农村老人补助金问题。
(18)老人养老安排问题。
(19)老年人劳动供给问题(退休年龄的提高)。
(三)Census
简介:中国人口普查数据。现在经常用到的人口普查数据是1982年、1990年、2000年的人口普查数据。一般的研究机构拿的数据是0.1%抽样的,但有的研究部门能够拿到1%抽样的

。对做宏观变量的趋势(如性别比例的变化,离婚率的变化等),这种大样本的数据非常合适,非常有说服力。要想使用这种大型的数据库,对硬件的设备要求很高。要想使用1%

抽样的数据,我们的电脑一般都不能承担。人口普查的一个缺陷是没有收入方面的数据,但是2005的中期普查,是有收入方面的数据的。
(内附1990年,2000年调查问卷)
包含的变量:在不同的年份,包含的变量不一样。这里说的是比较全的。个人层次上的变量:年龄、性别、民族、婚姻状态、初婚年龄、行业、职业、工作单位的性质、不参加工

作的原因、与户主的关系、户口、居住地、出生地、文化程度、何时迁入本地、迁来本地的原因、从何地迁来、迁出地的类型、五年前常住地、为什么现在住在本地、工作时间。

家庭层次上的变量:家庭人口数、调查期内死亡人数、住房面积、住房用途、住房间数、住房来源、购入住房的成本,购入住房的时间、租房的成本、自来水与厕所的情况。如果

是女性,还有总共生育了几个孩子,存活了几个孩子的信息。
可做的研究:
(1)人口预测、人口构成问题。
(2)性别比例问题。
(3)计划生育效果问题。
(4)人口老龄化问题。
(5)劳动力迁移问题。
(6)孩子的质量数量权衡问题。
(4)农村留守老人和孩子问题。
(5)房地产价格决定因素及变化趋势。
(6)老人居住问题(跟儿子还是跟女儿)。
(7)少数民族问题。
(四)CHNS (China Health and Nutrition Survey)
简介:中国健康与营养调查。由美国北卡罗莱纳大学教堂山校区的罗莱纳州人口中心(the Carolina Population Center at the University of North Carolina at Chapel Hill

)和中国疾病控制和预防中心的国家营养和食品安全所(the National Institute of Nutrition and Food Safety, and the Chinese Center for Disease Control and

Prevention)合作建立的一个数据。这个数据最大的好处是,它是一个面板数据。而且,农村和城镇的数据都有。现有的数据有:1989, 1991, 1993, 1997, 2000, 2004,2006等

年份。包括的省份:辽宁、黑龙江、江苏、山东、河南、湖北、湖北、湖南、广西、贵州。这些数据可以在网上下载。现在,国际一些好的刊物很多文章也是用这个数据做的。这

个数据库涉及的变量较多,处理起来比较困难。以后年份的数据缺失可能比较严重。
(内附2000年调查问卷)
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、出生日期、民族、身高、体重、血压、病史、吸烟史、受教育年限(水平)、户口、是否干部、行业、职业、第二

职业、工作单位的性质及人数、就业状况、工作时间(非常细致)工资、总收入、参加农业生产的情况。(2)家庭层次上的变量。农业生产、农作物价值、家庭总收入、家庭人口

数、家庭支出(较详细)、家庭收入(较详细)、居住情况(详细)、交通工具、家庭消费、家庭财产、医疗费用(详细)、家庭成员生病(较详细)、食物消费(详细)。(3)

社区层次变量。村人数、村户数、是否实行医疗保险、医院情况、消费结构、学校情况、计划生育情况、食品价格。
可做的研究:
(1)身高体重与食物结构的关系。
(2)劳动力市场上是否在身高等存在歧视。
(3)吸烟对健康的影响。
(4)健康对劳动力供给的影响。
(5)就业问题。
(6)劳动力供给时间问题。
(7)医疗保险对健康的影响。
(8)社区医疗结构(医院的多少)对健康的影响
(9)某些疾病的发病趋势。
(10)收入不平等问题。
(11)社会保障方面的研究。
(12)家庭消费的决定因素及模式变化。
数据来源:公开。

(五)RHS (Rural Household Survey)
简介:中国农村住户调查数据。它是国家统计局农调总队负责调查的。它是与城镇调查相对应的一个数据,也是每年做一次,但因为涉及到的问题比较敏感,这一套数据比较难拿


(内附2004年调查问卷)
包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、当年在家居住的时间、是否在校学生、是否接受过技能培训、是否丧失劳动能力、从事、行业、从事农

业生产的时间、从事非农行业的时间、是否乡镇企业职工、在乡镇企业工作的时间、外出方式、外出地区、在外务工时间、在外务工总收入
生活消费总支出。(2)家庭层次上的变量。家庭总收入、家庭人口数、家庭财产、现金支出、现金流入、家庭消费、缴纳的税费。
可做的研究:
(1)农村税费问题。
(2)农民工迁移问题,包括地区、迁移方式。
(3)农民工收入对家庭总收入的影响。
(4)研究乡镇企业问题。
(5)农村基础设施问题,电话、公路等等。
(6)农村地区财产性收入问题。
(7)农产品价格及农民收入问题。
(8)农业机械与农业产量。
(9)各种农作物种植面积的变化趋势。
(10)农村家庭消费的决定因素及模式变化。
数据来源:国家统计局。
(六)中国老年健康调查项目
简介:全国老年人口健康状况调查项目(又名中国老人健康长寿影响因素研究)的项目主持人为北京大学中国经济研究中心教授与杜克大学教授及北大老龄健康与家庭研究中心主

任曾毅。这一数据库主要是为有关老年人的研究服务。现有的数据包括:1998 2000 2002 2005年。
(内附2005年的调查问卷)
包含变量:性别、年龄、属相、出生日期、出生地、婚姻、受教育程度、以前所从事行业、生活能力、疾病、看病花费等信息
可做的研究:
(1)       老年人的居住安排(跟儿子住,还是跟女儿住)
(2)       老年人的疾病状况。
(3)       老年人医疗支出结构分析。
(4)       所从事行业对以后健康的影响。
(七)CHARLS(China Health and Retirement Longitudinal Study)
简介:中国健康退休跟踪调查。这个数据库是由北京大学中国经济研究中心赵耀辉教授负责的一个项目。这个项目实际是跟美国的HRS数据库并行的,主要是为了研究健康和退休行

为。这个数据选取的样本是,年龄大于等于45岁。这个数据库的质量非常好,为了得到血样的数据,专门对相关的数据采集员做了培训。这个数据库最快明年春天就能用,并且它

是对所有的研究者公开的。这个数据另外的一个好处是,它是一个面板数据。
(内附调查问卷)
包含的变量:包含的变量非常丰富。基本在劳动经济学研究中,能用到的变量都考虑到了。举几个例子。教育水平,细分到了硕士和博士;英语水平细分到了过了国家几级;大学

是同等学历还是正规毕业;村干部细分到了村书记还是村会计。
可做的研究:
(1)       社会保障方面的研究;
(2)       老龄化问题方面的研究;
(3)       其它劳动经济学方面的研究;
(4)       人口经济学方面的研究;
(5)       卫生经济学方面的研究;
(八)其它的数据
(1)       第一次经济普查数据
工业普查
农业普查
(2)       第一次、第二次妇女社会地位调查数据
(3)       CSMAR (China Stock Market & Accouting Reseach)。这是一个关于上市公司的数据。
(4)       关于全世界股票指数的数据库。
(5)       中国社会科学院劳动与人口研究所五个城市(上海、福州、沈阳、武汉和西安)的劳动力市场数据。
上述数据中,应用最广的CHIP数据,是中国社会科学院经济研究所收入分配课题组(李实、赵人伟老师主持,福特基金赞助)于1988年、1995年和2002年,进行的全国调查中的中

国农村和城市居民家庭收入分配调查得到的。1995年的调查覆盖19个省(市、自治区),调查了6931户城镇家庭和7998户农村家庭,分别涉及21696位城镇居民和34739位农村居民

;2002年的调查覆盖22个省(市、自治区),调查了6835户城镇家庭和9200户农村家庭,分别涉及20632位城镇居民和37969位农村居民。刚开始CHIP(中国家庭收入项目)数据是

在海外公开的,前几年我的老师用的时候还是花了好几千买的,而我们现在都已经能共享了,是由美国密西根大学校际政治及社会研究联盟(ICPSR)公布的,里面还有很多其他数

据。(经济研究上有很多文章都是用的这个数据)
        而CHNS(中国健康与营养调查)、CHARLS(中国健康与养老追踪调查)、CFPS(中国家庭动态调查)、CHFS(China Health and Fertility Survey )等则是在老师上课

时所给的链接中下的,大部分的数据下载页面都是英文界面的,而且需要先注册,通过邮件获得密码、ID之类的才能继续下载,所以可能需要点耐心。其中CFPS还需要寄信函到北

京才能取得密码和ID,所以我暂时只下到它的Codebook和问卷!

根据我的了解,研究中国劳动经济学的微观数据库主要有两个:
1.CHNS(China Health and Nutrition Survey),由美国北卡罗莱纳大学教堂山校区的罗莱纳州人口中心(the Carolina Population Center at the University of North

Carolina at Chapel Hill)和中国疾病控制和预防中心的国家营养和食品安全所(the National Institute of Nutrition and Food Safety, and the Chinese Center for

Disease Control and Prevention)合作建立的一个数据。是目前最常用的研究中国劳动经济学数据库。一般都可以自由下载。
具体介绍请见: http://www.cpc.unc.edu/china
2.第二个数据库是CHIPS(Chinese Household Income Project),是由福特基金会和中国社科院进行调查研究的,现在总共进行了三次,分别是1988、1995和2002。网上可以查询到

1988和1995的,据说可以下载,但我试过下载不了。2002年的听说在近期内也会在网上公布。
这个数据的目的是调查和分析中国城市和农村收入分布,所调查的变量包括了大多数微观经济变量,比如收入,婚姻状况,就业背景,工作时间,参加健康保险的情况,等等。
Chips1988地址:http://webapp.icpsr.umich.edu/cocoon/ICPSR/STUDY/09836.xml
CHIP1995地址:
http://www.ciser.cornell.edu/ASPs/search_athena.asp?CODEBOOK=ECON-111(1995)&IDTITLE=2064
读文献的时候碰到过中国农业部农村经济研究中心(RCRE)有一个家庭面板数据,大约有2000个家庭。但具体信息不得而知。
听总版主牧月说CCER的赵耀辉先生在做一个数据库,万分期待ing...

前半学期在一个简称唤作CHARLS的项目上帮忙,即“中国健康与养老追踪调查”,美国HRS的中国版。国内以前是很少有专业的微观面板数据的;统计局外的大规模调查只能依靠政

府的资助,只有政府意识到数据所关心问题的重要性时,才会下决心花一笔钱。故这么一个正式的项目刚出来时,着实能够令人激动一番。前段时间又通过老板知道了iSSS这个机

构,现在正在做类似PSID的“中国家庭动态跟踪调查”(CFPS)。忽然觉得中国的微观数据有点像雨后春笋,从之前的RCRE到CHARLS,再到CFPS,甚至让我有了在选题时不知用哪

个数据好的矛盾。毋庸置疑这是好事,务实地说,只有数据丰富了,做微观计量的人才有饭吃。记得我和小青玩笑道,如果两个数据做同一问题得到相反结论,怎么办?他笑答,

正好,发两篇文章,而后接着讨论为什么不同。

用不同数据得出相反结论,这是文献中常有之事。出现这一现象有两个可能,由于不同的方法,或只是由于不同的数据。先谈后者。调查数据的质量一直是做这行的心头之痛。撇开测量误差等几乎不可避免的问题而言,仍有不少其他顾虑造成数据不完美的命运。我奉命参照ELSA(英国版HRS)写CHARLS收入和财富部分报告时,发现虽然CHARLS初拟问卷时本着模仿ELSA的初衷,却舍去了不少问题,譬如没有问有关收入或财富的主观评估。我和同学讨论时,还以为这是因为怕主观问题的偏误太大,后来和沈老师不经意间聊起,才知道是因为怕得到的反馈过于惨淡,造成一些敏感问题,使政府不开心。其实有关收入或财富的客观问题也有很大误差,回答有现金的人只占总样本70%,存款则低得更不可信了。赵老师很爱讲的一个真实小故事便是,有次访问一户家庭,在财富部分问男主人是否有现金,答曰没有。访问完毕后,工作人员掏出一张100元,用以支付访问费50元,故需找零50元。男主人接过钱后,立刻从口袋里掏出一张50元找给工作人员……

源地址:http://ternjack.blog.163.com/blog/static/49655806201072384849382/
原创粉丝点击