数据结构第一章:绪论

来源:互联网 发布:大医医学数据库 编辑:程序博客网 时间:2024/06/05 03:02

1.1 数据结构在程序设计中的作用

程序设计的实质是什么?

数据表示:将数据存储在计算机(内存)中

数据处理:处理数据,设计方案(算法)

利用计算机求解问题的一般过程


计算机不能分析问题并产生问题的解决方案,必须由人来分析问题,确定问题的解决方案,编写程序,然后让计算机执行程序最终获得问题的解

1.2 本书讨论的主要内容

计算机求解问题:

   问题→抽象出问题的模型→求模型的解

问题——数值问题、非数值问题

    数 值 问 题→数学方程

      非数值问题→数据结构

本书讨论非数值问题的数据组织和处理,主要内容如下:

(1)数据的逻辑结构:线性表、树、图等数据结构,其核心是如何组织待处理的数据以及数据之间的关系;

(2)数据的存储结构:如何将线性表、树、图等数据结构存储到计算机的存储器中,其核心是如何有效地存储数据以及数据之间的逻辑关系;

(3)算法:如何基于数据的某种存储结构实现插入、删除、查找等基本操作,其核心是如何有效地处理数据;

(4)常用数据处理技术:查找技术、排序技术、索引技术等。


1.3 数据结构的基本概念

数据所有能输入到计算机中并能被计算机程序识别和处理的符号集合。

     数值数据:整数、实数等

     非数值数据:图形、图象、声音、文字等

数据元素数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。

数据项构成数据元素的不可分割的最小单位



数据、数据元素、数据项之间的关系

包含关系:数据由数据元素组成,数据元素由数据项组成。

      数据元素是讨论数据结构时涉及的最小数据单位,其中的数据项一般不予考虑

      数据结构相互之间存在一定关系数据元素的集合。按照视点的不同,数据结构分为逻辑结构和存储结构。

       逻辑结构:指数据元素之间逻辑关系的整体
               逻辑关系:关联方式或邻接关系

                 数据的逻辑结构是从具体问题抽象出来的数据模型

             数据的逻辑结构在形式上可定义为一个二元组:

                                         Data_Structure =(D, R)

           其中D是数据元素的有限集合,RD上关系的集和


    存储结构又称为物理结构,是数据及其逻辑结构在计算机中的表示。


数据结构从逻辑上分为四类:

⑴ 集合:数据元素之间就是“属于同一个集合” ;

⑵ 线性结构:数据元素之间存在着一对一的线性关系;

⑶ 树结构:数据元素之间存在着一对多的层次关系;

⑷ 图结构:数据元素之间存在着多对多的任意关系


逻辑结构和存储结构之间的关系
(1)数据的逻辑结构属于用户视图,是面向问题的,反映了数据内部的构成方式;数据的存储结构属于具体实现的视图,是面向计算机的。

(2)一种数据的逻辑结构可以用多种存储结构来存储,而采用不同的存储结构,其数据处理的效率往往是不同的

在设计ADT时,把ADT的定义、设计和实现分开来。定义部分只包含数据的逻辑结构和所允许的操作集合,一方面,ADT的使用者依据这些定义来使用ADT,即通过操作集合对该ADT进行操作;另一方面,ADT的实现者依据这些定义来完成该ADT各种操作的具体实现。




抽象数据类型

ADT 抽象数据类型名

Data

     数据元素之间逻辑关系的定义

Operation

     操作1

         前置条件:执行此操作前数据所必须的状态 

           输        入:执行此操作所需要的输入

           功        能:该操作将完成的功能

           输        出:执行该操作后产生的输出

           后置条件:执行该操作后数据的状态

    操作2

            ……

    ……

    操作n

           ……

endADT



数据的操作:插入、删除、修改、检索、排序等 




1.4  算法及算法分析

1.算法(Algorithm):是对特定问题求解步骤的一种描述,是指令有限序列

2. 算法的五大特性:

输入:一个算法有零个或多个输入。

输出:一个算法有一个或多个输出。

有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。

确定性:算法中的每一条指令必须有确切的含义,对于相同的输入只能得到相同的输出。

可行性:算法描述的操作可以通过已经实现的基本操作执行有限次来实现。

算法的描述方法——自然语言 

优点:容易理解

缺点:冗长、二义性

使用方法:粗线条描述算法思想

注意事项:避免写成自然段


算法的描述方法——流程图 

优点:流程直观

缺点:缺少严密性、灵活性

使用方法:描述简单算法

注意事项:注意抽象层次


算法的描述方法——程序设计语言 

优点:能由计算机执行

缺点:抽象性差,对语言要求高

使用方法:算法需要验证

注意事项:将算法写成子函数

算法的描述方法——伪代码 

伪代码(Pseudocode)介于自然语言和程序设计语言之间的方法,它采用某一程序设计语言的基本语法,操作指令可以结合自然语言来设计。

优点:表达能力强,抽象性强,容易理解

使用方法:7 ± 2


算法分析

度量算法效率的方法:

事后统计将算法实现,测算其时间和空间开销。

缺点:⑴ 编写程序实现算法将花费较多的时间和精力;

            ⑵所得实验结果依赖于计算机的软硬件等环境因素。

事前分析对算法所消耗资源的一种估算方法

算法分析(AlgorithmAnalysis):对算法所需要的计算机资源——时间空间进行估算。

     时间复杂性(Time Complexity)

     空间复杂性(Space Complexity

                 算法的时间复杂性算法的执行时间=每条语句执行时间之和

问题规模:输入量的多少

基本语句:是执行次数与整个算法的执行次数成正比的操作指令

大O符号 

      定义:若存在两个正的常数cn0,对于任意nn0,都有T(n)≤c×f(n),则称T(n)=O(f(n))


定理:若A(n)=amnm+am-1nm-1+¼+a1n+a0是一个m次多项式,则A(n)=O(nm)。

说明:在计算算法时间复杂度时,可以忽略所有低次幂和最高次幂的系数


最好情况、最坏情况、平均情况

结论如果问题规模相同,时间代价与输入数据有关,则需要分析最好情况、最坏情况、平均情况。

最好情况:出现概率较大时分析
最差情况:实时系统
平均情况:已知输入数据是如何分布的,通常假设等概率分布

0 0
原创粉丝点击