点击跳转 《Pandas系列目录》
pandas是强大的数据分析和处理工具
pandas常用的数据结构
Series:带标签的一维数组DatetimeIndex:时间序列DataFrame:带标签且大小可变的二维表格结构Panel:带标签且大小可变的三维数组pandas内置了10余种数据源读取函数和对应的数据写入函数
csv文件Excel文件使用read_table函数读取文本文件
pandas.read_table(filepath_or_buffer, sep='\t', header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None)使用read_csv函数读取csv文件
pandas.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, dtype=None, engine=None, nrows=None) sep 指定文本的分隔符。如果分隔符指定错误,在读取数据的时候,每一行数据将会连成一片 header 指定列名。如果是None,则会添加一个默认的列名 encoding 文件的编码格式。常用的编码有utf-8、utf-16、gbk、gb2312、gb18030等。如果编码指定错误,数据将无法读取,Python解释器会报解析错误结构化数据可以通过pandas中的to_csv函数实现以csv文件格式存储文件
DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)pandas提供了read_excel函数来读取xls、xlsx两种excel文件
pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None, dtype=None)将文件存储为excel文件,可以使用to_excel方法
DataFrame.to_excel(excel_writer=None, sheetname=None, na_rep='', header=True, index=True, index_label=None, mode='w', encoding=None)与to_csv方法的常用参数基本一致。区别之处在于指定存储文件的文件路径参数名为excel_writer,并且没有sep参数,增加了一个sheetname参数用来指定存储的excel sheet的名称,默认为sheet1