Python数据分析重要库Pandas:数据清洗后的数据整合

    科技2022-08-12  111

    本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

     

    Pandas合并数据

    组合或合并数据时,pandas 有几个不同选项。在 Jupyter的Notebook中,创建两个新的数据帧并合并数据。可以使用 append() 来合并这些数据帧。【案例】将城市名,人口和面积的两组数据合并。

     

    A..append()

     

     

     

    import pandas as pd data = {'city':['London','Manchester','Birmingham','Leeds','Glasgow'], 'population': [9787426, 2553379,2440986,1777934,1209143], 'area':[1737.9,630.3,598.9,487.8, 368.5 ]} cities = pd.DataFrame(data) data2 = {'city':['Liverpool','Southampton'], 'population': [864122, 855569], 'area':[199.6, 192.0]} cities2 = pd.DataFrame(data2) cities = cities.append(cities2) cities

    其操作是“data1 = data1.append(data2)” 将data2连接到data1的尾部。再赋值给data1。要注意data1和data2应具有相同的结构。

    B..concat()

    frames = [cities, cities2] df = pd.concat(frames) df

    像其在ndarray上的同级函数一样numpy.concatenate(),pandas.concat()采用同类对象的列表或字典。

     

    frames = [cities, cities2] df = pd.concat(frames, keys=['x', 'y']) df

    加入关键字keys参数进行不同数据来源的区分。

     

    然后可以根据数据来源直接查看定位所需的数据。

    df.loc['y']

     

    以上文章来源于源一学园,作者 房媛

     

    Processed: 0.014, SQL: 8