c()
函数创建,例如 vec <- c(1, 2, 3, "a", TRUE)
。向量在R中是处理和分析数据的基础,许多高级数据结构如矩阵、数组和列表都是基于向量构建的。matrix(data, nrow, ncol, byrow=FALSE, dimnames=NULL)
函数创建,其中data
是向量数据源,nrow
和ncol
定义行数和列数,byrow
参数决定是否按行填充,若为TRUE则按行填充,FALSE则按列;dimnames
可为矩阵添加行名和列名。矩阵支持各种数学运算,可通过索引进行元素访问和修改。array()
函数创建,它接受一个向量作为基础数据,并通过dim
参数指定各维度大小来形成更高维度的集合。例如,可以创建包含多个矩阵的三维数组,每个元素都具有相同的类型。数组是向量和矩阵的扩展,可用来处理更复杂、多层面的数据组织。factor()
函数,可自定义级别顺序和标签。list()
函数创建,列表允许将多个元素聚合为单个对象,便于管理和操作多组不同性质的数据。例如,可以创建一个包含字符串、数值向量和逻辑矩阵的列表,每个成分都可以独立存取和修改。data.frame()
函数构建,其各列必须具有相同长度。数据框常用于统计分析和数据可视化,类似于电子表格,且能灵活处理多元统计中异质类型的数据集。mean()
是一个内置函数,用于计算向量或数组的平均值;用户也可自定义函数,如myFunction(x, y) <- {x + y}
实现两数相加的功能。函数有助于模块化编程,提高代码复用性和组织性。创建向量:在R中,通过c()
函数可以创建一维向量。例如,x <- c(10.4, 5.6, 3.1, 6.4, 21.7)
将一系列数值组合成名为x
的浮点数向量。赋值符号可以用<-
或=
, 这里所有元素自动转换为一致的数据类型(在这个例子中是数值型)。
生成序列:使用seq()
函数可以生成一系列连续数值。如seq(2, 10)
默认步长为1生成2到10的整数序列;指定步长为2用seq(1, 10, by = 2)
;步长为0.2则为seq(1, 5, by = 0.2)
;从2开始,步长为3产生4个数:seq(2, 8, by = 3)
;在区间[-5,5]生成100个数:seq(-5, 5, length.out = 100)
。
重复序列:rep()
用于复制向量或生成重复序列。比如rep(c(1, 2, 3), times = 3)
会将整个向量重复3次;而rep(x, each = 2)
会将向量x
中的每个元素分别复制2次形成新序列并赋值给data。
拼接函数:paste()
结合多个数据项为一个字符串。如paste("Hello", "World")
得到"Hello World";添加分隔符:paste(c("A", "B", "C"), collapse = ", ")
结果为"A, B, C";拼接与序列结合实例:paste(seq(1, 3), "apple")
生成"1 apple", “2 apple”, “3 apple”。
数据子集选择与修改:通过索引操作符[]
选取向量元素,如data[3:5]
获取向量data第3至第5个元素;条件选择:data[data > 300 & data < 400]
选出data中300至400之间的元素,并统计其数量:sum(data > 300 & data < 400)
。
汇总函数:summary()
提供对象的基本统计信息。对于向量,输出包括最小值、四分位数、中位数、均值和最大值等。例如,summary(data)
查看向量data的相关统计指标。
因子函数:factor()
将字符向量转化为有序或无序因子,便于分类分析。如data <- factor(c("湖南","四川","四川","湖南","贵州","湖南","贵州"))
,levels(data)
显示因子的类别。
矩阵函数:matrix()
创建矩阵,如matrix(c(4,-1,2,1,1,1,0,3,0,3,1,4), nrow = 4, ncol = 3)
创建一个4行3列的矩阵。访问矩阵元素如A[2, 3]
;创建单位矩阵:diag(n)
;填充特定元素矩阵示例已给出。
矩阵转置函数:t()
实现矩阵转置,如t(A)
将矩阵A转置。
矩阵维数函数:dim()
返回或设置矩阵维数,如dim(A)
查询矩阵A的维度,dim(A) <- c(3, 4)
更改A的维度为3行4列。
数组函数:通过array()
和dim
参数定义多维数组,例如创建三维数组需指定每维大小。
列合并与行合并:cbind()
按列合并矩阵,如cbind(A, B)
;rbind()
按行合并矩阵,如rbind(A, B)
。
列表函数:列表是一种可包含不同类型元素的数据结构。要获取列表中属性值,如list_data$attribute_name
。例如,my_list <- list(name = "Mike", age = 25); my_list$name
返回"Mike"。
数据帧函数:data.frame()
构造数据帧,各列可以是不同模式。如df <- data.frame(name = c("John", "Jane"), age = c(30, 28))
创建一个数据帧。引用数据帧元素时通常使用$
符号,如df$name
。attach()
和detach()
函数用于简化数据框变量的引用,但不推荐频繁使用以避免命名冲突等问题。例如,attach(df)
后可以直接用name
引用列名,结束后用detach(df)
解除关联。
read.table()函数:read.table()
是R语言中用于读取纯文本文件并将其中数据转换为数据帧的函数。该函数要求输入文件的第一行包含变量名,后续行代表数据记录,每行按列对应各变量值。若无表头,则默认变量名为"v1", "v2"等;若有表头但无行索引,通过设置header=TRUE
指明首行为列名。此外,可通过setwd()
函数改变当前工作目录以便正确读取目标文件。
info.txt
attach()
函数简化对info
的数据引用function()
关键字定义自定义函数,例如:myFunction <- function(arg1, arg2) {expression}
,其中arg1和arg2为输入参数,expression是基于这些参数进行计算或处理的代码块。f ( x ) = { x + 2 ( 1 ) x 2 ( 2 ) f(x)=\begin{cases} x+2 &(1)\\ x^2 &(2)\\ \end{cases} f(x)={x+2x2?(1)(2)?