一、 数据分析环境搭建
1. anaconda环境搭建
Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件 。最流行的 Python 环境管理工具。
conda官网上下载安装,安装过程不停下一步就行。打开conda,调用里面的jupyter功能。 可以实现在线编写python,并进行可视化分析。
2.pycharm中调用anaconda中的库
安装好conda之后,之前使用PYcharm 去 pip install matpllotlip的包时候,始终出现错误,方法的根本出发点在于,Pycharm本身缺少numpy和matplotlib这些库,而另一个Python的开发环境Anaconda则自带了300多种常见的库。所以想在pycharm中使用Anaconda自带的库。实现这一“借用”的则是Pycharm中对 “Project Interpreter”的设置,该设置是设定Pychar使用哪一个python编译器。那么只要将该interpreter设置为Anaconda下的python.exe,就可以将Anaconda下众多的库导入到Pycharm中。(这是一种借用conda的方法,但让pycharm自己去调用库的问题始终没有解决) 用pycharm调用conda的库并使用
3.建议的学习顺序
NumPy是使用Python进行科学计算的基础包,常用于数据分析。NumPy通常与SciPy和Matplotlib一起使用,广泛用于替代matlab,有助于我们学习数据科学或机器学习。 Matplotlib是用于数据可视化的最流行的Python包之一,它是一个跨平台库,用于根据数组中的数据制作2D和简单3D图。 Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。Pandas用于广泛的领域,包括金融,经济,统计,分析等学术和商业领域。
二、NumPy学习
学习numpy,参考视频是numpy学习视频
1.Numpy的数据类型
a.数据类型
numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上,其中部分类型对应为 Python 内置的类型。下表列举了常用 NumPy 基本类型。
b.空值
c.Nan和inf
d.副本与视图
list01 =[1,2,3,4,5,6]
list02 =list01
print(list01,list02)
print(id(list01))
print(id(list02))
list02=list01.copy()
print(id(list01))
print(id(list02))
import copy
list03 = [1,2,3,[4,5,6]]
print(list03)
list03
list04=copy.deepcopy(list03)
list04
list03[3][0]=100
list03
list04
2.Numpy副本和视图
3.Numpy文件读写
4.数组的定义和创建
5.数组的属性
6.数组的索引和切片
7.数组操作
8.数组运算
|