文章目录
前言一、pandas是什么?1.基本功能:2.数据结构:
二、Series使用方法1.创建方法2.访问数据Series输出结果:
3.Series的数组间的运算输出结果:
4.Series数学函数的使用输出结果:
5.Series数据结构的重新输出结果:
总结
前言
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。
以下是本篇文章正文内容,下面案例仅供参考
一、pandas是什么?
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 Pandas官网链接
1.基本功能:
数学运算和约简(比如对某个轴求和)可以根据不同的元数据(轴编号)执行灵活处理缺失数据合并及其他出现在常见数据库(例如基于SQL的)中的关系型运算
2.数据结构:
Series(一维) Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。DataFrame(二维) DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。 DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。Panel(三维)
二、Series使用方法
1.创建方法
代码如下(示例):
a
= pd
.Series
([11,22,33,44])
b
= pd
.Series
(range(4))
c
= pd
.Series
(range(4),index
= ["a","b","c","d"])
d
= {'BeiJing':35000,'ShangHai':42000,'GuangZhou':36000,'ShenZhen':41000}
2.访问数据Series
代码如下(示例):
print(a
[1:3])
print(c
.index
)
print(c
[["a","c"]])
print(d
.values
())
输出结果:
--------------------------------------------------------
1 22
2 33
dtype
: int64
Index
(['a', 'b', 'c', 'd'], dtype
='object')
a
0
c
2
dtype
: int64
dict_values
([35000, 42000, 36000, 41000])
--------------------------------------------------------
3.Series的数组间的运算
代码如下(示例):
print(a
+ b
)
print(a
* 2)
print(a
>= 33)
print(a
[a
>= 33])
输出结果:
--------------------------------------------------------
0 11
1 23
2 35
3 47
dtype
: int64
0 22
1 44
2 66
3 88
dtype
: int64
0 False
1 False
2 True
3 True
dtype
: bool
2 33
3 44
dtype
: int64
--------------------------------------------------------
4.Series数学函数的使用
代码如下(示例):
print(b
.mean
())
print(b
.count
())
print(b
.sum())
print(b
.median
())
print(b
.var
())
print(b
.std
())
输出结果:
--------------------------------------------------------
1.5
4
6
1.5
1.6666666666666667
1.2909944487358056
--------------------------------------------------------
5.Series数据结构的重新
代码如下(示例):
ser1
= pd
.Series
(['a','b','c','d','e'],index
=[2,1,3,5,4])
ser2
= ser1
.reindex
([1,2,3,4,5,6],fill_value
=0)
ser3
= ser2
.reindex
(range(10),method
='bfill')
print(ser3
)
输出结果:
--------------------------------------------------------
0 b
1 b
2 a
3 c
4 e
5 d
6 0
7 NaN
8 NaN
9 NaN
dtype
: object
--------------------------------------------------------
总结
本文仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法,还需自行挖掘。