数据结构和算法是程序员的必修课,也是基础课。学好数据结构很有必要,对于编程的思维和解决实际问题有很大的好处。最近重新翻看数据结构与算法的书,并把一些知识点整理出来,以加深自己的记忆和理解。
首先要明确一点什么是算法? 算法的速度并非指时间,而是操作数的增速。 讨论算法的速度时,我们说的是随着输入的增加,其运行时间将以什么样的速度增加。
一 数据结构绪论
1.1 数据结构的起源
数据结构是一门研究非数值的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科
1.2 数据结构基本概念和术语
- 可以输入到计算机中
- 能被计算机程序处理
-
数值计算:整型,实数型 -
非数值计算:字符型,比如声音,图像,视频(这些可以通过编码变成字符型处理)
1.3 数据元素
概念:是组成数据的,有一定意义的基本单位,在计算机中通常作整体处理,也被称为记录。
比如在人类中,数据元素是人,人是有一定意义的基本单位。
1.4 数据项
概念:一个数据元素可以由若干个数据项组成。
比如人这一数据元素有眼,耳,鼻,嘴,手这些数据项,也可以有性别,年龄,出生地址这些数据项等。
数据项是数据不可以分割的最小单位。
1.5 数据对象
数据对象:是性质相同的数据元素的集合,是数据的子集。
在实际应用中,处理数据元素通常具有相同性质,在不产生混淆的情况下,我们都将数据对象简称为数据。
1.6 数据结构
概念:是相互之间存在一种或多种特定关系的数据元素的集合。
不同数据元素之间不是相互独立的,而是存在特定的关系,我们将这些关系成为结构。
1.6.1 逻辑结构
它们的共同属性:属于同一个集合。集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。
线性结构中的数据元素是一对一的关系
树结构中的数据元素存在一种一对多的层次关系
图形结构的数据元素是多对多的关系
数据的逻辑结构画图attention:
- 将每一个数据元素看作一个node,用圆圈表示
- 元素之间的逻辑关系用node之间的连线表示,如果这个关系是有方向的,那么用用带箭头的连线
1.6.2 物理结构(存储结构)
概念:是指数据的逻辑结构在计算机中的存储形式
数据的存储结构应该正确反映数据元素之间的逻辑关系
概念:是把数据元素存放在地址连续的存储单元里,其数据之间的逻辑关系和物理关系是一致的。比如数组的存储结构。
链式存储结构
概念:是把数据元素存放在任意的存储单元里面,这组存储单元可以是连续的,也可以是不连续的。
逻辑结构面向问题,物理结构面向计算机
1.7 抽象数据类型
1.7.1 数据类型
概念:是指一组性质相同的值的集合及定义在此集合上的操作的总称
在C语言中,数据类型额可以分成两类
- 原子类型:是不可以再分解的基本类型,包括整型,实型,字符型等
- 结构类型:由若干个类型组合而成,是可以再分解的。比如,整型数组是由若干整型数据组成的。
何为抽象:是指抽取出事物具有的普遍性的本质。它是抽下给你问日的特征而忽略非本质的细节。
1.7.2 抽象数据类型(Abstract Data Type,ADT)
抽象数据类型体现了程序设计中问题分解,抽象,和信息隐藏的特性。
ADT
抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作1
初始条件
操作结果描述
操作2
初始条件
操作结果描述
操作3
......
操作n
.......
二 算法(Algorithm)
何为算法?算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
2.1 算法的特性
- 输入输出:0个或多个输入,至少有一个输出
- 有穷性:有限的步骤,自动结束而不会出现无限循环,每一个步骤在可接受的时间内完成
- 确定性:每一个步骤都具有确定的含义,不会出现二义性。只有一条路径,相同的输入只能由唯一的输出结果。
- 可行性:算法的每一步都必须是可行的,每一步都能通过执行有限的步骤完成
2.2 算法的设计要求
? 1 正确性:至少具有输入输出和加工处理无歧义性,能正确反映问题的需求,能够得到问题的正确答案。
-
算法程序没有语法错误 -
算法程序对于合法的输入数据能够产生满足要求的输出结果 -
算法程序对于非法的输入数据能够得出满足规格说明的结果 -
算法独有精心选择的,甚至刁难的测试数据都有满足要求的输出结果 2 可读性:便于阅读,理解和交流 3 健壮性:当输入的数据不合法时,算法也能做出相关的处理,不是产生异常或莫名其妙的结果 4 时间效率高和存储量低
2.3 算法效率的度量方法
- 事后统计方法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对于不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。
这种方法有很大的缺陷
- 必须依据算法编制好的程序,花费大量的时间精力
- 时间的比较依赖计算机的硬件和软件等环境的因素,会掩盖算法的优劣性。就算是同一台电脑,CPU使用率和内存占用情况不一样,也会造成细微的差别。
- 算法的测试数据设计苦难,并且与测试数据的规模有关,10个数排序,用哪一种排序差距几乎为0。
计算机上消耗时间取决于以下因素
- 算法本身:算法采用的策略,方法
- 软件支持:编译产生的代码量
- 测试模型:问题的输入规模
。就算是同一台电脑,CPU使用率和内存占用情况不一样,也会造成细微的差别。
- 算法的测试数据设计苦难,并且与测试数据的规模有关,10个数排序,用哪一种排序差距几乎为0。
计算机上消耗时间取决于以下因素
- 算法本身:算法采用的策略,方法
- 软件支持:编译产生的代码量
- 测试模型:问题的输入规模
- 硬件性能:机器执行指令的速度
|