Python进行数据分析学习笔记(一)基础认知
一般讲的数据是什么类型的数据?
数据可以转换成更适合分析的结构形式或从数据集提取特征形成一种结构形式。
重要的Python库
- Numpy(高效的数值计算)
提供多种数据结构、算法以及大部分涉及Python数值计算所需的接口 - Panda (数据结构操作)
实现表格和关系型数据库的灵活数据操作 - matplotlib
制图与数据可视化
IPython与Jupyter
Ipython
Python的优点之一是其交互式解释器,也称为shell。shell提供了一种能够快速实现灵感、检验特性的方法,以及交互式的模块界面,能够将一些需要两三行脚本才能完成的任务一次性完成。通常我们编写代码时,会采用同时运行文本编辑器和Python的方式,通过交互地使用编辑器和shell,也就是在两者之间切换来完成程序的编写。我们经常需要将代码从编辑器复制到shell或从shell复制到编辑器。这种方式使得我们可以即时看到代码在Python中的处理结果,并且可以快速地在文本编辑器中编写需要的代码。 IPython性能远远优于标准Python的shell。IPython支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。 安装完python后,现在安装ipython。 在 cmd 命令行输入 pip install ipython 即可安装。
Jupyter notebook
Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。
标准开发环境
Ipython+文本编辑器; 用IDE代替文本编辑器也可以,Pycharm之类的都可以。
|