数据结构
数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及他们之间的关系和操作等相关问题的学科。
程序设计=数据结构+算法
数据
数据:描述客观事物的符号,是计算机可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
**数据元素:**组成数据的、具有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录。
**数据项:**一个数据元素可以由若干个数据项组成。数据项是数据不可分割的最小单位。
真正讨论问题时,数据元素才是数据结构中建立数据模型的着眼点。
**数据对象:**是性质相同的数据元素的集合,是数据的子集。
数据结构
**数据结构:**是相互之间存在一种或多种特定关系的数据元素的集合。
**意义:**分析待处理对象的特性及各处理对象之间的关系。
数据结构分为逻辑结构和物理结构:
- 逻辑结构:数据对象中数据元素之间的相互关系。
- 集合结构:同属一个集合。
- 线性结构:数据元素之间一对一关系。
- 树形结构:数据元素之间存在一种一对多的层次关系。
- 图形结构:数据元素是多对多的关系。
- 物理结构(存储结构):指数据的逻辑结构在计算机中的存储形式。
- 顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
- 链式存储结构:把数据元素存放在任意的存储单元里,这组存储单元可以连续,也可以不连续。
逻辑结构是面向问题的,而物理结构是面向计算机的,其基本的目标就是将数据及其洛基关系存储到计算机内存中。
数据类型
数据类型是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
- 原子类型:是不可以再分解的基本类型,包括整型、实型、字符型等。
- 结构类型:由若干个类型组合而成,可以再分解。如整型数组是由若干个整型数据组成。
抽象数据类型(ABstract Data Type,ADT):是指一个数学模型及定义在该模型上的一组操作。它的定义仅取决于它的一组逻辑特征,而与其在计算机内部如何表示和实现无关。
算法(Algorithm)
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
例如:求1加到100,循环算法和高斯算法。
基本特征
算法五个基本特性:输入、输出、有穷性、确定性和可行性。
- 输入输出:算法具有零个或多个输入。算法至少由一个或多个输出。
- 有穷性:指算法在执行有限的步骤后,自动结束而不会出现无线循环,并且每个步骤在可接受的时间内完成。
- 确定性:算法的每一步骤都具有确定的含义,不会出现二义性。相同的输入只能有唯一的结果,每个步骤都被精确定义而无歧义。
- 可行性:每一步都能通过执行有限次数完成。
设计要求
**正确性:**至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案。
- 程序没有语法错误
- 对于合法的输入能产生满足要求的输出结果
- 非法的输入能得出满足规格说明的结果(通常作为标准)
- 对精心选择的,刁难的测试数据有满足要求的输出结果(困难)
**可读性:**便于阅读、理解和交流。
**健壮性:**当输入数据不合法时,能做出相关处理,而不是产生异常或莫名其妙的结果。
时间效率高和存储量低
算法效率的度量方法
- 事后统计方法:通过设计好的测试程序和数据,对运行时间比较,确定效率高低。但是事后的方法有许多缺陷。首先已经完成了程序,然后发现不好用,不值得;其次,就算是同一台机器,CPU使用率和内存占用情况不一样,也会造成细微的差异;还有就是测试数据设计困难。综上不采纳。
- 事前分析估算方法:在编制前,依据统计方法对算法估算。计算对运行时间有小号的基本操作的执行次数。
函数渐进增长
判断一个算法的效率时,函数的常数和其他次要项常常可以忽略,而更应该关注最高阶项的阶数。
某个算法,随着n的增大,它会越来越优于另一算法,或者越来越差于另一算法。这是事前估算方法的理论依据,通过算法时间复杂度来估算算法时间效率。
|