通过【R语言学习经验(二):数据结构介绍】,已初步了解R的主要数据结构。在开始数据分析工作前,简单介绍一下R包的安装和使用。今后在数据分析过程中,遇到高难度问题时(例剧安颌儿如:数据挖掘软件接口、随机森林、人工神经网络等),与其自己编写函数,可以换一种解决思路,即:是否有相关R包可以支撑解决方案。
工具/原料
R环境(已安装)
互联网
1、什么是R包
1、包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上存储包的楫默礤鲼目录称为库(library)。函数.libPaths()能够显示库所在的位置, 函数library()则可以显示库中有哪些包。举个例子,R环境就像刚刚完成装修的房子,这时你需要解决一个问题,保存食物,你不需要自己造一个冰库、冰柜,只需要购买一台冰箱,放在房子里,就能解决这个问题。冰箱就是一个“包”,它自带的功能解决了“保存食物”这个问题。而在R中,这个冰箱,是免费的。
2、目前有2500多个称为包(package)的用户贡献模块可从http://cran.r-project.org/web/packages下载。这些包提供了横跨各种领域、数量惊人的新功能,包括分析地理数据、处理蛋白质质谱,甚至是心理测验分析的功能。
3、我们并不需要上英文网站去搜索下载包,R环境提供了一个函数,install.packages,可以直接下载安装包。举例来说,不加参数执行install.packages()将显示一个CRAN镜像站点的列表,选择其中一个镜像站点之后,将看到所有可用包的列表,选择其中的一个包即可进行下载和安装。
4、我们孀晏弁钾也可以直接通过,install.packages函数+包名,直接下载安装包。例如,包gclus中提供了创建增强型散点图的函数。可以使用命令install.packages("gc造婷用痃lus")来下载和安装它。即,一行代码,实现了一个包的安装。至于使用什么样的包来解决遇到的问题,可以通过百度搜索,网上有很多应用案例。
2、R包的使用
1、完成包的安装后,每次使用前,需要使用library()命令载入这个包。例如,要使用gclus包,执行命令library(gclus)即可。注:加载时,可能会提示需要添加另外的程辑包,直接添加即可。x,y是变量,ac,sil是gclus提供的方法。
2、至于包中各项参数如何使用,可以通过命令help(package="包名")来输出某个包的简短描述以及包中的函数名称和数据集名称的列表。
3、常用R包
1、stringr 方便地用正则表达式做批量字符串操作,可做检测、匹配、替换、计数等等
2、RODBC 连接ODBC数据库接口
3、ggplot2 高级绘图,一套统一的语法实现复杂图像组合绘制
4、data.table 快速处理较大数据表