Pandas数据分析01——Series基本操作

    科技2022-08-16  103

    文章目录

    前言一、pandas是什么?1.基本功能:2.数据结构: 二、Series使用方法1.创建方法2.访问数据Series输出结果: 3.Series的数组间的运算输出结果: 4.Series数学函数的使用输出结果: 5.Series数据结构的重新输出结果: 总结


    前言

    Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。


    以下是本篇文章正文内容,下面案例仅供参考

    一、pandas是什么?

    pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 Pandas官网链接

    1.基本功能:

    数学运算和约简(比如对某个轴求和)可以根据不同的元数据(轴编号)执行灵活处理缺失数据合并及其他出现在常见数据库(例如基于SQL的)中的关系型运算

    2.数据结构:

    Series(一维) Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。DataFrame(二维) DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。 DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。Panel(三维)

    二、Series使用方法

    1.创建方法

    代码如下(示例):

    #Series的创建方法 a = pd.Series([11,22,33,44]) b = pd.Series(range(4)) c = pd.Series(range(4),index = ["a","b","c","d"]) d = {'BeiJing':35000,'ShangHai':42000,'GuangZhou':36000,'ShenZhen':41000}

    2.访问数据Series

    代码如下(示例):

    print(a[1:3]) print(c.index) print(c[["a","c"]]) print(d.values())
    输出结果:
    -------------------------------------------------------- 1 22 2 33 dtype: int64 Index(['a', 'b', 'c', 'd'], dtype='object') a 0 c 2 dtype: int64 dict_values([35000, 42000, 36000, 41000]) --------------------------------------------------------

    3.Series的数组间的运算

    代码如下(示例):

    #Series的数组间的运算 print(a + b) print(a * 2) print(a >= 33) print(a[a >= 33])
    输出结果:
    -------------------------------------------------------- 0 11 1 23 2 35 3 47 dtype: int64 0 22 1 44 2 66 3 88 dtype: int64 0 False 1 False 2 True 3 True dtype: bool 2 33 3 44 dtype: int64 --------------------------------------------------------

    4.Series数学函数的使用

    代码如下(示例):

    #Series数学函数的使用 print(b.mean()) print(b.count()) print(b.sum()) print(b.median()) print(b.var()) print(b.std())
    输出结果:
    -------------------------------------------------------- 1.5 4 6 1.5 1.6666666666666667 1.2909944487358056 --------------------------------------------------------

    5.Series数据结构的重新

    代码如下(示例):

    #Series数据结构的重新 ser1 = pd.Series(['a','b','c','d','e'],index=[2,1,3,5,4]) ser2 = ser1.reindex([1,2,3,4,5,6],fill_value=0) ser3 = ser2.reindex(range(10),method='bfill') print(ser3)
    输出结果:
    -------------------------------------------------------- 0 b 1 b 2 a 3 c 4 e 5 d 6 0 7 NaN 8 NaN 9 NaN dtype: object --------------------------------------------------------

    总结

    本文仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法,还需自行挖掘。
    Processed: 0.017, SQL: 9