【作业展示第一期】R语言循环命令实现NHANES数据批量下载!
查看NHANES系列往期推送请戳专辑
你还在为处在人群研究前期工作阶段没有数据产出而焦虑吗?你还在因为科研经费不足无法开展大规模的人群研究而苦恼吗?不用着急,免费的公共数据库NHANES来拯救你!
【作业内容】
下载NHANES数据库中1999-2014年人口学数据集和第一天24小时膳食回顾营养素摄入总量数据集。
参考推送:
【作业笔记】
首先在R语言使用library命令加载foreign包。其中6-11行是手动下载后打入的,后面的就是使用R语言循环下载。
本来想合并的,但是内部变量不一样就改成赋值賊不同的变量。
~~~提问答疑环节~~~
Q1:我想问一下,不同时间段,人口数据的变量数是不一样的啊?1999的是144个,2001的是37个。
A1:是不一样的。因为第一轮调查的DEMO数据集中还包含了一百多个抽样相关的变量(Jack Knife Replicate)。其他数据集中也有类似现象,不同调查周期的内容可能会有变化,因此在合并数据集之前,应该查阅所有数据集的说明文档确认变量名称和赋值等信息是否一致。