R语言特点:
主要用于统计分析、图表显示。 属于解释型语言。支持模块化编程。
应用:数据科学、统计计算、机器学习
学习方法:
- 做笔记,记重点或者心得
- 手动实践,加深理解
- 坚持练习,利用身边数据进行应用分析
- 理解扩展包和函数背后的原理
运行R语言的三种方式:
- 在console中执行交互式命令(用于比较简单的命令)
- 在文本编辑器中进行编辑,然后运行。
- 通过source('x.R')进行运行
在shell里面使用Rscript命令
window下的R版本更新
install.packages("installr")
library(installr)
updateR()
在R语言中,变量不会被声明为某些数据类型,变量被分配给R对象,由R对象的数据类型转变为变量的数据类型。常见的R对象类型:
向量(包含6种原子向量:逻辑、数字、整数、复数、字符、原生)、列表、矩阵、数组、因子、数据帧
数据类型:
向量
可进行算术、逻辑运算 向量的索引从1开始 两个不同长度的向量相减,则短的向量默认被扩充。
支持的运算符:
算术运算符 —— 加减乘除
关系运算符 —— 大于小于等于
逻辑运算符(大于1的数字被认为是TRUE) 与或非
赋值运算符 <- | <<- | = 左分配符 -> | ->> 右分配符
其他运算符 : 为向量创建数字 v <- 2:8; %in% 识别元素是否属于向量
数学运算:
平均值:x <- (3,6,9) result.mean <- mean(x) print(result.mean)
中位数:数据的中间值 x<- (1,2,3) median.result <- median(x) print(median.result)
众数:自定义
数组
数据框 每列的数据类型可以不同 使用$取子集
列表 更加灵活 R列表类似于python列表 unlist函数:将列表转为向量
类和对象 class() 对象的类型 /str() 对象的明细
模型和公式 summary()
常用命令:
c():将元素组合成向量,非字符值强制为字符值
print():打印变量的值
cat():将多个变量整合为一个输出
getwd() 获取当前工作空间
setwd(0设置当前工作空间
ls()列出工作空间的对象
rm()移除一个或者多个对象
save.image("file")保存工作空间到文件中(默认后缀.RData)
save(object,file="myfile") 保存指定对象到一个文件中
load("myfile")读取工作空间
matrix(data, nrow, ncol, byrow, dimnames) #创建矩阵
dim(a,b,3) #创建数组,即多个矩阵(多维度),第三个参数为创建几个
factor() #创建因子,即可枚举的字符串或者整数
sys.date() 返回当前日期 date()返回当前日期和时间 可以在日期上执行算术运算