IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 金融统计分析与挖掘实战3.1-3.2 -> 正文阅读

[人工智能]金融统计分析与挖掘实战3.1-3.2

# 第三章 数据处理包 pandas
# 3.2序列
#3.2.1 序列的创建与访问
import pandas as pd
import numpy as np     # 数据分析前先导入两个最常见的包
# 创建序列
# 列表、元组和数组转化为序列
s1 = pd.Series([1,-2,2.3,'hq']) #把列表转换为序列
print(s1)   #虽然我们没写索引,但系统默认了索引
0      1
1     -2
2    2.3
3     hq
dtype: object
type(s1)   #查看数据结构
pandas.core.series.Series
s2 = pd.Series([1,-2,2.3,'hq'],index = ["a","b","c","d"]) #自己指定序列和索引,可个性化设置
print(s2)
a      1
b     -2
c    2.3
d     hq
dtype: object
s3 = pd.Series((1,2,3,4,'hq'))  #把元组转换为序列
print(s3)
0     1
1     2
2     3
3     4
4    hq
dtype: object
s4 = pd.Series(np.array([1,2,4,7.1]))  #先把列表转化为数组,在将数组转化为序列
print(s4)
0    1.0
1    2.0
2    4.0
3    7.1
dtype: float64
# 字典转化为序列
mydict = {"red":2000,"blue":1000,"yellow":500}   #先定义一个字典
ss = pd.Series(mydict)
print(ss)
red       2000
blue      1000
yellow     500
dtype: int64
# 访问:还是采用中括号加位置信息访问
print(s1[3])  #访问s1序列中索引为3的元素
hq
print(s2["c"])  #访问自定义的索引位置元素,访问s2中索引为c的值
2.3
# 3.2.2 序列属性(指值和索引)
va1 = s1.values   #把s1中的值保存到va1里面,只需要值结果
print(va1)
[1 -2 2.3 'hq']
in1 = s1.index  #把s1中的索引保存到in1里面,只需要索引
print(in1)
RangeIndex(start=0, stop=4, step=1)
in2 = list(in1)    #上述显示不太直观,改为列表形式展现索引
print(in2)
[0, 1, 2, 3]
# 3.2.3 序列方法
#去掉重复元素,使元素值唯一,unique()函数
s5 = pd.Series([1,2,2,3,"hq","hq","he"]) #先定义一个包含重复元素的序列
s51 = s5.unique()  #将s5序列去掉其中重复元素
print(s51)
[1 2 3 'hq' 'he']
# 判断元素值是否存在于序列中,用isin()
s52 = s5.isin([0,"he"])   # 判断元素0和he是否在s5里面
print(s52)  #输出模式是每个位置进行判断,看是否包含指定元素,0或he出现会输出True
0    False
1    False
2    False
3    False
4    False
5    False
6     True
dtype: bool
#统计元素出现的次数 用value_counts()函数
s53 = s5.value_counts()  #括号里面空值表示输出所有元素各自出现的次数
print(s53)
2     2
hq    2
he    1
1     1
3     1
dtype: int64
s54 = s5.value_counts("hq")  #括号里面写具体元素,注意输出结果
print(s54)
2     0.285714
hq    0.285714
he    0.142857
1     0.142857
3     0.142857
dtype: float64
# 空值的处理方法
#判断是否有空值isnull(),notnull()判断是否非空值,dropna清除空值
ss1 = pd.Series([10,"hq",60,np.nan,20]) #生成一个含有空值的序列,np.nan表示空值 
tt1 = ss1[~ss1.isnull()] #不是空值的显示出来,如果不要否符号,则显示空值的索引位置和值
print(tt1)
0    10
1    hq
2    60
4    20
dtype: object
tt2 = ss1[ss1.notnull()]   #ss1序列中不是空值的为真,显示ss1中真的元素
print(tt2)
0    10
1    hq
2    60
4    20
dtype: object
tt3 = ss1.dropna()   #去掉空值后的结果
print(tt3)
0    10
1    hq
2    60
4    20
dtype: object
# 3.2.4 序列切片
# 切片就是把满足条件的元素挑出来重新组成新的数据集
s22 = s2[["a","d"]]  #把s2序列中的索引为a和d的结果挑出来
print(s22)
a     1
d    hq
dtype: object
s11 = s1[0:2]   #把s1序列中索引为0,1 的结果展现出来,连续范围可用:或range等函数表示
print(s11)
0     1
1    -2
dtype: object
s12 = s1[[0,2,3]] #把s1中不连续位置的结果展现出来,则用列表形式一个个列入
print(s12)
0      1
2    2.3
3     hq
dtype: object
s41 = s4[s4 > 2]  #输出的是值大于2的结果,不是索引大于2的结果
print(s41)
2    4.0
3    7.1
dtype: float64
print("-" * 25)   # 打印某符号多次,可采用 符号 * n 
-------------------------
# 3.2.5 序列的聚合运算
s = pd.Series([1,2,4,5,6,7,8,9,10])
su = s.sum()  #sum表示求和
print(su)
52
sm = s.mean()   #求序列元素的平均值
print(sm)
5.777777777777778
ss = s.std()   # 求序列的标准差
print(ss)
3.0731814857642954
smx = s.max() #求序列中最大的元素值
print(smx)
10
smi = s.min() #求序列中最小的元素值
print(smi)
1

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-07 22:41:41  更:2022-04-07 22:41:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:59:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码