和其它编程语言一样,R 中也存在着高效执行重复任务的结构,即循环,也称迭代。在 R 中存在着两种重要的迭代方式:命令式编程和函数式编程。其它编程语言中常见的如 for 循环、while 循环(或类似于这些循环)等循环结构,在 R 中同样存在,属于命令式编程。但在 R 中还存在着另外一种循环方式,即函数式编程。R 有一些包可以实现该功能,例如 purrr
包。该包是 tidyverse
包的核心 R 包之一。
和其它编程语言一样,R 中也存在着高效执行重复任务的结构,即循环,也称迭代。在 R 中存在着两种重要的迭代方式:命令式编程和函数式编程。其它编程语言中常见的如 for 循环、while 循环(或类似于这些循环)等循环结构,在 R 中同样存在,属于命令式编程。但在 R 中还存在着另外一种循环方式,即函数式编程。R 有一些包可以实现该功能,例如 purrr
包。该包是 tidyverse
包的核心 R 包之一。
向量是 R 中构建对象的基础数据结构,绝大部分函数和自定义函数都会使用向量。
除了 R 包自带的函数,也可以自己编写函数来执行一系列操作。作为翻译型语言,R 可以使用命令行逐行运行,也可以使用函数整体运行。此外,还可以编写脚本,构造 R 程序以运行。
print()
函数可以将对象的值输出到控制台窗口中
管道是 R 中一种用于简化操作的方式,可以表示由多个操作组成的一个操作序列。管道是包含于 magrittr
包中的,但 tidyverse
包会自动加载管道符号 %>%
。因此加载了 tidyverse
包后并不需要再显式地加载 magrittr
包了。
日期和时间也是 R 中需要重点处理的数据。tidyverse
包中对日期和时间进行处理的包为 lubridate
。但由于该包不是 tidyverse
包的核心包,因此需要额外加载。
因子在 R 中用于处理分类变量。分类变量类似于 C/C++ 中的枚举类型,是在固定的已知集合中取值的变量。在 tidyverse
包中,用于处理因子的是 forcats
包。由于因子的类似枚举特性,因此也被称为分类变量。
数据除了数值类型之外,还有着其它的数据类型,字符串就是其中之一。除了基本的操作之外,正则表达式( regular expression ,regexp )也是重要的相关内容之一。tidyverse
包中用于字符串处理的包是 stringr
。
除数据转换之外,数据关系的处理也是数据分析处理的重要一环。同样地,在 tidyverse
包中,实现该步骤的内容也是 dplyr
包 。
除了输入数据,R 还支持读取文件中的数据。readr
包可以完成这个任务,它也是 tidyverse
包的核心包之一。
tidyverse
包中使用的数据框一般并不是 data.frame
,而是 tibble
。而这也正是 tidyverse
包的核心包之一 —— tibble
包。
1 / 3