最近在看《R数据科学》这本书,由于报告的需要,对其中部分章节进行了总结
第七章:使用tibble实现简单数据框
1、创建tibble
as_tibble():数据框转换成tibble
tibble()创建:使用向量,可以使用非法列名
tribble()创建:定制化
2、tibble与data.frame的不同(即简单数据框和传统数据框)
在打印和取子集方式上有所不同
打印:Tibble默认只打印前10行,并且显示数据类型
取子集:$按名称提取,[[按名称或位置提取,其中tibble不能部分匹配
第八章:使用readr进行数据导入
read_csv():读取逗号分隔的文件
第一个参数是读取的文件的路径
一般使用第一行作为列名称,使用skip=n跳过前n行;使用comment=’#’来丢弃以#开头的行
参数col_names可以控制列名称
“\n”用于添加新行
参数na设定使用哪些值表示缺失值
2