IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> Python数据分析——文件合并、数据分组统计 -> 正文阅读

[Python知识库]Python数据分析——文件合并、数据分组统计

import pandas as pd
import numpy as np

#合并数据方法一
data1 = pd.read_csv("guazi_bj.csv")
data2 = pd.read_csv("guazi_gz.csv")
data3 = pd.read_csv("guazi_sh.csv")
data4 = pd.read_csv("guazi_sz.csv")
data = pd.concat([data1,data2,data3,data4],axis=0,join="outer",ignore_index=True)
print(data)

#合并数据方法二,用于大量文件的合并,引入OS模块
#①**************************************
import os
filenames = os.listdir("D:\PycharmProjects\数据处理学习\逻辑教育数据分析作业") #读取该文件夹下的所有文件名
# print(filenames)
filenames.pop(-1)  #删除作业4.py文件名
# print(filenames)
data_list = []
for i in range(len(filenames)):
    file_i = filenames[i]
    data_i = pd.read_csv(file_i)
    data_list.append(data_i)
data_total = pd.concat(data_list,axis=0,join="outer",ignore_index=True)
print(data_total)
#②**************************************
import os
filenames = os.listdir("D:\PycharmProjects\数据处理学习\逻辑教育数据分析作业") #读取该文件夹下的所有文件名
# print(filenames)
filenames.pop(-1)  #删除作业4.py文件名
print(filenames)
data_list = []
for filename in filenames:
    data_name = pd.read_csv(filename)
    data_list.append(data_name)
data_total = pd.concat(data_list,axis=0,join="outer",ignore_index=True)
print(data_total)
#**************************************



data_unique = data.drop_duplicates(ignore_index=True)   #删除重复数据并重建索引
# print(data_unique.head())
# print(data_unique.info())
unique_speedbox = data_unique["speedbox"].unique()  #查看speedbox有哪些:自动挡和手动挡
# print(unique_speedbox)
unique_city = data_unique["city"].unique()
# print(unique_city)

#统计自动挡和手动挡的数量
print(data_unique["speedbox"].value_counts())   #.value_counts()) 也可以用先groupby再.count()统计

#统计各城市的二手车数量
city_counts = data_unique["city"].value_counts()
print(city_counts)

#统计每个品牌的汽车售价
brand_price = data_unique["es_price"].groupby(data_unique["brand"]).mean()
print(brand_price)
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-08-11 12:18:43  更:2021-08-11 12:22:18 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 10:28:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码