第一章数据结构与算法
1.1 算法
1.1.1算法:是指解题方案的准确而完整的描述。
规定了解决某类问题所需的 操作语句 以及 执行顺序 使其能通过有限的指令语句,在一定时间内解决问题
算法不等于程序,也不等计算机方法,程序的编制不可能优于算法的设计。 算法的基本特征:是一组严谨地定义运算顺
序的规则,每一个规则都是有效的,是明确的,此顺序将在有限的次数下终止。
1.算法特征包括: (1)可行性;
(2)确定性,算法中每一步骤都必须有明确
定义,不允许有模棱两可的解释,不允许有多义性;
(3)有穷性,算法必须能在有限的时间内做
完,即能在执行有限的步骤后终止,包括合理的执行时间的含义; (4)拥有足够的情报。 2.算法的基本要素:
一是对数据对象的运算和操作;二是算法
的控制结构
通常,计算机可以以执行的基本操作是以指令的形式描述的。一个计算机系统能执行的所有指令的集合,称为计算机系统的指令系
统。 (1)计算机系统中的基本运算和操作包括: 算术运算 + - * / 逻辑运算 not and or 关系运算 < > ! = 数据传输 赋值 输入与输出
(2)算法的控制结构:顺序结构、选择结构、循环结构。
3.算法基本设计方法: 列举法 (列举所有解决方案) 归纳法(特殊?一般) 递推 (已知?未知) 递归 (逐层分解) 减半递推
“减半”是指将问题的规模减半,而问题的性质不为,所谓“递推”是指重复“减半”的过程 回溯法
找出一个解决问题的线索,然后沿着这个线索逐步多次“探、试”
1
1.1.2算法复杂度
算法时间复杂度和算法空间复杂度(一个算法所要付出的代价)是衡理算法好坏的。 1.算法时间复杂度
算法时间复杂度是指执行算法所需要的计算工作量。(既算法的运算次数)
含义:算法执行过程中所需要的基本运算次数
影响计算工作量的主要因素: 一、基本运算次数 二、问题与规模 2.算法空间复杂度是指执行这个算法所需要 的 内存空间。
一个算法所用的内存空间包括:
1、算法程序所占的空间
2、输入的初始数据所占的存储空间
3、算法执行过程中的额外空间
1.2 数据结构的基本基本概念
数据: 在计算机科学中指所有能输入到
计算机中的并被计算机程序处理的符号的总
称
数据元素:数据的基本单位,在计算机程
序中通常作为一个整体进行考虑和处理。
数据结构:是相互之间存在一种或多种特
定关系的数据元素的集合
数据结构研究的三个方面:
(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;
(2)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构; (3)对各种数据结构进行的运算。
数据结构是指相互有关联的数据元素的集
合。
即:一般来说,人们不会同时处理特征完全
不同且互相之间没有任何关系的各类数据元
素,对于具有不同特征的数据元素总是分别
进行处理。
1.数据的逻辑结构包含:
(1)表示数据元素的信息;
(2)表示各数据元素之间的前后件关系。
其中数据元素之间的前后件关系是指它们的
逻辑关系,与它们在计算机中的存储位置无
关。
2
2.数据的存储结构:P12
一个数据结构中的各数据元素在计算机存储空间中的位置关系与逻辑关系有可能不同 数据的存储结构指数据的逻辑结构在计算机存储空间中的存放形式。
由于数据元素在计算机存储空间中的位置关系可能与逻辑关系不同,因此,为了表示存放在计算机存储空间中的各元素之间的逻辑关系(即前后件关系),在数据存储结构中,不仅要存储各数据元素的信息,还需要存放各数据元素之间的前后件关系的信息。
逻辑结构与物理结构的关系
A.一种逻辑结构可以用不同的物理结构来实现
B..逻辑结构决定了算法的设计 C.物理结构决定了算法的实现 1.2.2 数据结构的图形表示: 春 夏 秋 冬 D 父亲 A C B 儿子 女儿
1.2.3 线性结构与非线性结构
如果一个非空的数据结构满足下列两个条件 有且只有一个根结点
每一个结点最多有一个前件,也最多有一个后件
则称该数据结构为线性结构,线性结构也称为线性表
特别需要说明的是,在一个线性结构中插入或删除任何一个结点后还应是线性结构。 如果一个数据结构不是线性结构,则称为非线性结构。
数据的存储结构有顺序、链接、索引等。 对于同一个逻辑结构来说,采用不同的存储结构,其数据处理的效率是不同的。 线性结构条件:
(1)有且只有一个根结点;
(2)每一个结点最多有一个前件,也最多有
一个后件。
非线性结构:不满足线性结构条件的数据结
3
构。
1.3 线性表及其顺序存储结构
线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。
在复杂线性表中,由若干项数据元素组成的数据元素称为记录,而由多个记录构成的线性表又称为文件。
1.3.1非空线性表的结构特征:P16 (1)且只有一个根结点a1,它无前件; (2)有且只有一个终端结点an,它无后件; (3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。结点个数n称为线性表的长度,当n=0时,称为空表。
1.3.2线性表的顺序存储结构具有以下两个基本特点:
(1)线性表中所有元素的所占的存储空间是连续的;
(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。
ai的存储地址为:ADR(ai)=ADR(a1)+(i-1)k,,ADR(a1)为第一个元素的地址,k代表每个元素占的字节数。
由此可以看出,在线性表的顺序结构中,其前后件两个元素在存储空间中是紧邻的,且前件元素一定存储在后件元素的前面。 在程序设计语言中,通常定义一个一维数组来表示线性表的顺序存储空间。
顺序表的运算:插入、删除。 (详见17--18页) 画图来理解
1.4 栈和队列
1.4.1栈及其基本运算
1.什么是栈
栈是限定在一端进行插入与删除的线性表,允许插入与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。 栈按照“先进后出”(FILO)或“后进先出”(LIFO)组织数据,栈具有记忆作用。用top表示栈顶位置,用bottom表示栈底。
2.栈的顺序存储与栈的基本运算: (1)插入元素称为入栈运算; (2)删除元素称为退栈运算;
(3)读栈顶元素是将栈顶元素赋给一个指定的变量,此时指针无变化。 1.4.2队列及其基本运算
4
1.什么是队列
队列是指允许在一端(队尾)进入插入,而在另一端(队头)进行删除的线性表。Rear指针指向队尾,front指针指向队头。 队列是“先进先出”(FIFO)或“后进后出”(LILO)的线性表。
2.循环队列运算包括
(1)入队运算:从队尾插入一个元素; (2)退队运算:从队头删除一个元素。 循环队列:s=0表示队列空,s=1且front=rear表示队列满 1.5 线性链表 p24
对于大的线性表或者变动频繁的线性表不宜用顺序存储,应该用链式存储。
在链式存储结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点。
结点由两部分组成:(1)用于存储数据元素值,称为数据域;(2)用于存放指针,称为指针域,用于指向前一个或后一个结点。 链式存储方式的特点:
☆在链式存储结构中,存储数据结构的存储空间可以不连续,
☆各数据结点的存储顺序与数据元素之间的
逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。
☆链式存储方式即可用于表示线性结构,也可用于表示非线性结构。 1.线性链表
为了适应线性表的存储结构,计算机存储空间被划分为一个一个小块,每一个小块占若干字节,通常称这些小块为存储结点。 存储结点=数据域(数据元素本身) +指针域(数据元素之间的前后逻辑关系) 在线性链表中,用一个专门的指针HEAD指向线性链表中的第一个数据元素的结点(即存放线性表中第一个数据元素的存储结点的序号)称为头指针,
头指针:在线性链表中,头指针(HEAD)很关键,不得丢失。
最后一个结点的指针域:线性链表的最一个结点的指针域为空(用NULL或0来表示) 空表的定义:当HEAD=NULL(或0)称为空表。
单链表的缺点:只能找到后不能找到前件。
2.双向链表
5