R语言(1):创建数据集
1.向量
向量是用于存储数值型、字符型或逻辑型数据的一维数组。可通过函数c()可用来创建向量。如:a <- c (1,2,2); b <- c ('one','two','three'); c <- c (TRUE,FALSE,FALSE)。
2.矩阵
矩阵是一个二位数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数matrix()创建矩阵。语法为:mymatrix <- matrix (data, nrow = 1, ncol = 1, byrow = FALSE, dimnames = list (rnames,cnames))。
3.数组
数组(array)与矩阵类似,但是维度可以大于2。数组可通过array()函数创建。语法为:myaaray <- array(vector, dimensions, dimnames)。
例如:
dim1<-
c
(
"A1"
,
"A2"
)
> dim2<-
c
(
"B1"
,
"B2"
)
> dim2<-
c
(
"B1"
,
"B2"
,
"B3"
)
> dim3<-
c
(
"C1"
,
"C2"
,
"C3"
,
"C4"
)
> z<-
array
(1:24,
c
(2,3,4),
list
(dim1,dim2,dim3))
> z
, , C1
B1 B2 B3
A1 1 3 5
A2 2 4 6
, , C2
B1 B2 B3
A1 7 9 11
A2 8 10 12
, , C3
B1 B2 B3
A1 13 15 17
A2 14 16 18
, , C4
B1 B2 B3
A1 19 21 23
A2 20 22 24
4.数据框
由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。数据框是R中最常处理的数据结构。数据框可通过函数data.frame()创建。语法为mydata <- data.frame(col1, col2, col3)。其中,列向量col1,col2,col3可为任何类型(如字符型、数值型或逻辑型)。
例如:
> patientID<-
c
(1,2,3,4)
> age<-
c
(25,34,28,52)
> diabetes<-
c
(
"Type1"
,
"Type2"
,
"Type1"
,
"Type2"
)
> status<-
c
(
"Poor"
,
"Improved"
,
"Excellent"
,
"Poor"
)
> patientdata<-
data.frame
(patientID,age,diabetes,status)
> patientdata
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1 Excellent
4 4 52 Type2 Poor
参考:https://blog.csdn.net/sinat_35187039/article/details/80257191;
https://www.cnblogs.com/linliyuan/p/7894915.html