一、关系数据库
数据库就是一张表格或是一组表格,表格以某种方式对数据进行管理,是数据
之间的相互关系显而易见,数据库软件则对表格进行管理。
1.关系数据库管理系统 关系数据库管理系统(RDBMS)只最重要最有效的数据管理方式之一
RDBMS中每一行都有一把钥匙,通常称为ID(标识)
数据库所要求的表格之间的关系都是量化关系
SQL数据库相关知识,需要学习。
二、整理数据/井然有序
数据分析师,花在数据整理的时间是要比数据分析的时间。所以,数据整理的速度越快,工作就会完成的越快
过程规划(准备)(保留原始数据,方便检查)修复数据整理数据(去除乱码;去除无法识别;去除重复等)正则表达式进行数据的批量处理