vlambda博客
学习文章列表

手把手带你学R语言编程与数据分析

相信很多人开始学习一个新的工具的时候,会去买对应的工具书,但是R语言学习过程中使用到的一些经典的工具书,它们有一个明显的缺点:一个词概括,过时


如果你是一个R语言使用者,并且你是通过看书(你能看到的中文书一般都很老)来学习的,你会发现就算是完成数据读取这么简单的操作,不是代码报错,就是数据读取错了;几个月前你的代码这么写可以,升级R版本后,这么写就不行了;读取个Excel文件居然要装Java环境.......如果你有遇到上述这些问题,就赶紧把你的书扔了(放一边吧,别太冲动),因为你花在上面的时间越多,损失的时间越多。听我下面给你介绍学习R应该学什么。找对学习途径,省心,省力,效果还好!


你能看到的这些中文书,虽然其中有些是三四年前出版的,但是有一些东西仍然显得过时了,更别说那些已经有5年以上历史的老古董了。R作为一个靠开开源社区维护的软件,它是在不断更新的,因此工具书很容易过时,更何况中文的R语言书大部分是翻译过来的,翻译需要时间,所谓的原创中文书也是从外文书甚至中文书借鉴过来的,这是中文工具书过时的客观原因。


还有一个重要的原因是,近几年随着大数据,数据分析等技术在企业中的落地,催生了对数据分析工具的进化需求,R语言在最近几年里,变化很大,在这种变化中,由于外部环境的影响,又形成了一个相对比较优秀的R语言数据分析生态系统。


这个生态系统就是由  【注:这里是个超链接,可点击查看有关Hadley的介绍】担任首席科学家的公司—Rstudio公司旗下的一系列R包组成的,这一系列R包中包含R社区中众所周知的ggplot2,dplyr,shiny,readr,readxl等。下图展示了Rstudio公司旗下的部分R包,这些包形成一个相对比较完善的数据分析生态。



 写了一本名为《R for Data Science》书,这本书,你可以在网上可以直接阅读,这里给出网址:http://r4ds.had.co.nz/ 。是以英文写成的,目前该书已经有中文纸质书了,如果需要购买或者查看,请访问点击下面的图书链接:



要知道上面列出的这些R包中,很大一部分都是   开发的,然后这本书也是由他写成的,书里面的内容基本上是围绕上述这些R包来展开的。建议学习R语言的同学,不要再购买哪些古老的书和课程了。直接看   的这本书比较好。


对了,  的个人网站是:http://hadley.nz/ 十分建议有兴趣的人前去了解一下。如果你是统计,数学,数据科学相关转业的,那一定要看一下才行。


上面推荐给大家的资源都是英文的资源,没有一定R语言基础的人,学习会很吃力,你可以选择学习我的《R语言数据分析》课程,我的这个课程主要就是围绕着Rstudio公司的这个R语言数据分析生态系统来展开的。课程包括R语言编程入门,这部分知识主要是帮助还没入门的同学快速入门。紧接着是R数据分析大数据分析,可视化分析统计分析等内容。这是一个比较全面的R语言课程,你可以长按识别如下二维码查看该课程: