1、数据结构相关概念和术语
1、数据 2、数据元素:是数据的基本单位,可由若干个数据项组成 3、数据对象:具有相同性质的数据元素的集合,是数据的一个子集 4、数据类型:是一个值的集合和定义在此集合上的一组操作的总称 5、数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。数据结构包括逻辑结构、存储结构、数据的运算
2、数据结构三要素
2.1 逻辑结构
指数据元素之间的逻辑关系 与数据的存储无关,是独立于计算机的 逻辑结构分为线性结构、非线性结构 线性结构:线性表 非线性结构:集合、树、图等
集合:结构中的数据元素之间除“同属于一个集合”外,别无其他关系 线性结构:数据元素之间只存在一对一的关系 树形结构:数据元素存在一对多的关系 图状(网状)结构:数据元素之间存在多对多的关系
2.2 存储结构(物理结构)
存储结构是数据结构在计算机中的表示(映像),也称物理结构 包括数据元素的表示和关系的表示 数据的存储结构是用计算机语言实现的逻辑结构,依赖于计算机语言 包括顺序存储、链式存储、索引存储、散列存储
2.2.1 顺序存储
把逻辑上相邻的元素存储在物理位置也相邻的存储单元中 元素之间的关系由存储单元的邻接关系来体现 优点:可以实现随机存取,每个元素占用最少的存储空间 缺点:智能使用相邻的一整块存储单元,可能产生较多的外部碎片
2.2.2 链式存储
逻辑上相邻的元素在物理位置上不一定相邻 借助指示元素存储地址的指针来表示元素之间的逻辑关系 优点:不会出现碎片现象,能充分利用所有存储单元 缺点:每个元素因存储指针而占用额外的存储空间,且只能实现顺序存储
2.2.3 索引存储
存储元素时建立附加的索引表 索引表中的每一项称为索引项,一般形式为:(关键字,地址) 优点:检索速度快 缺点:附加的索引表额外占用存储空间;增加和删除数据时也要修改索引表,会花费较多的时间
2.2.4 散列存储(哈希存储)
根据元素的关键字直接计算出该元素的存储地址 优点:检索、增加和删除节点的操作都很快 缺点:若散列函数不好,可能会出现元素存储单元的冲突,而解决冲突会增加时间和空间开销
2.3 数据的运算
施加在数据上的运算包括运算的定义和实现 运算的定义是针对逻辑结构的,指出运算的功能 运算的实现是针对存储结构的,指出运算的具体操作步骤
3、算法的基本概念
3.1 算法定义
算法是对特定问题求解步骤的一种描述,是指令的有限序列,其中的每条指令表示一个或多个操作
3.2 五个特性
有穷性:执行有穷步之后结束,且每一步都可在有穷时间内完成 确定性:每条指令都有确定的含义,相同的输入只能得到相同的输出 可行性:算法中描述的操作都可以通过已经实现的基本运算执行有限次来实现 输入:零个或多个输入 输出:一个或多个输出
3.3效率的度量
3.3.1 时间复杂度
一个语句的频度:是指该语句在算法中被重复执行的次数 所有语句的频度之和:T(n),时间复杂度主要分析T(n)的数量级 算法问题规模:n 采用算法中基本元素按的频度f(n)来分析算法的时间复杂度 T(n)=O(f(n))
算法的时间复杂度不仅依赖于问题的规模n,也取决于待输入数据的性质(输入数据元素的初始状态)
最坏时间复杂度是指在最坏情况下,算法的时间复杂度(一般考虑的为最坏时间复杂度) 平均时间复杂度是指所有可能输入实例在等概率出现的情况下,算法的期望运行时间 最好时间复杂度是指在最好情况下,算法的时间复杂度
3.3.2 空间复杂度
算法的空间复杂度S(n)定义为该算法所耗费的存储空间,它是问题规模n的函数。记为:S(n) = O(gn)) 一个程序在执行时除需要存储空间来存放本身所用的指令、常数、变量和输入数据外,还需要一些对数据进行操作的工作单元和存储一些为实现计算所需信息的辅助空间。 若输入数据所占空间只取决于问题本身,和算法无关,则只需分析除输入和程序之外的额外空间。 算法原地工作是指算法所需的辅助空间为常量,即 O(1)。
|