第四章字符串和多维数组

来源：互联网发布：node什么牌子断路器编辑：程序博客网时间：2024/06/02 02:38

4.1字符串的定义

1.串——零个或多个字符组成的有限序列

串：零个或多个字符组成的有限序列。
串长度：串中所包含的字符个数。
空串：长度为0的串，记为：" "。

非空串通常记为：
S=" s1 s2 …… sn "
其中：S是串名，双引号是定界符，双引号引起来的部分是串值，si（1≤i≤n）是一个任意字符。

1.1串的逻辑结构

子串：串中任意个连续的字符组成的子序列。
主串：包含子串的串。
子串的位置：子串的第一个字符在主串中的序号。

串的数据对象约束为某个字符集。
微机上常用的字符集是标准ASCII码，由 7 位二进制数表示一个字符，总共可以表示 128 个字符。
扩展ASCII码由 8 位二进制数表示一个字符，总共可以表示 256 个字符，足够表示英语和一些特殊符号，但无法满足国际需要。
Unicode由 16 位二进制数表示一个字符，总共可以表示 216个字符，能够表示世界上所有语言的所有字符，包括亚洲国家的表意字符。为了保持兼容性，Unicode字符集中的前256个字符与扩展ASCII码完全相同。

1.2 字符串的比较

串的比较：通过组成串的字符之间的比较来进行的。

给定两个串：X="x1x2…xn"和Y="y1y2…ym"，则：
1. 当n=m且x1=y1，…，xn=ym时，称X=Y；
2. 当下列条件之一成立时，称X＜Y：
⑴ n＜m且xi=yi（1≤ i≤n）；
⑵存在k≤min(m,n)，使得xi=yi(1≤i≤k-1)且xk＜yk。

4.1.2字符串的存储结构

方案1：用一个变量来表示串的实际长度。

方案2：在串尾存储一个不会在串中出现的特殊字符作为串的终结符，表示串的结尾。

方案3：用数组的0号单元存放串的长度，从1号单元开始存放串值。

4.1.3 模式匹配

1.模式匹配：给定主串S="s1s2…sn"和模式T="t1t2…tm"，在S中寻找T 的过程称为模式匹配。如果匹配成功，返回T 在S中的位置；如果匹配失败，返回0。

模式匹配问题的特点

⑴ 算法的一次执行时间不容忽视：问题规模通常很大，常常需要在大量信息中进行匹配；
⑵ 算法改进所取得的积累效益不容忽视：模式匹配操作经常被调用，执行频率高。

2.BF算法

基本思想：从主串S的第一个字符开始和模式T 的第一个字符进行比较，若相等，则继续比较两者的后续字符；否则，从主串S的第二个字符开始和模式T 的第一个字符进行比较，重复上述过程，直到T 中的字符全部比较完毕，则说明本趟匹配成功；或S中字符全部比较完，则说明匹配失败。

在串S和串T中设比较的起始下标i和j；
2. 循环直到S或T的所有字符均比较完
2.1 如果S[i]=T[j]，继续比较S和T的下一个字符；
2.2 否则，将i和j回溯，准备下一趟比较；
3. 如果T中所有字符均比较完，则匹配成功，返回匹配的起始比较下标；否则，匹配失败，返回0；

int BF(char S[ ], char T[ ])
{
i=0; j=0;
while (S[i]!='\0'&&T[j]!='\0')
{
if (S[i]==T[j]) {
i++; j++;
}
else {
i=i-j+1; j=0;
}
}
if (T[j]=='\0') return (i-j+1);
else return 0;
}

int BF(char S[ ], char T[ ])
{
i=0; j=0;start=0;
while (S[i]!='\0'&&T[j]!='\0')
{
if (S[i]==T[j]) {
i++; j++;
}
else {
start++; i=start; j=0;
}
}
if (T[j]=='\0') return start;
else return 0;
}

4.2 多维数组

4.2.1多维数组的定义

1.数组是由一组类型相同的数据元素构成的有序集合，每个数据元素称为一个数组元素（简称为元素），每个元素受n(n≥1)个线性关系的约束，每个元素在n个线性关系中的序号i1、i2、…、in称为该元素的下标，并称该数组为 n 维数组。

2.多维数组的特点

元素本身可以具有某种结构，属于同一数据类型；
数组是一个具有固定格式和数量的数据集合。

4.2.2数组的存储结构及寻址

一维数组

设一维数组的下标的范围为闭区间［l，h］，每个数组元素占用 c 个存储单元，则其任一元素 ai 的存储地址可由下式确定：
Loc(ai)＝Loc(al)＋(i－l)×c

二维数组

常用的映射方法有两种：
按行优先：先行后列，先存储行号较小的元素，行号相同者先存储列号较小的元素。
按列优先：先列后行，先存储列号较小的元素，列号相同者先存储行号较小的元素。

N维数组

n（n＞2）维数组一般也采用按行优先和按列优先两种存储方法。请自行推导任一元素存储地址的计算方法。

4.3 矩阵的压缩存储

1.特殊矩阵：矩阵中很多值相同的元素并且它们的分布有一定的规律。
稀疏矩阵：矩阵中有很多零元素。

压缩存储的基本思想是：
⑴ 为多个值相同的元素只分配一个存储空间；
⑵ 对零元素不分配存储空间。

2.特殊矩阵的压缩存储——对角矩阵

对角矩阵：所有非零元素都集中在以主对角线为中心的带状区域中，除了主对角线和它的上下方若干条对角线的元素外，所有其他元素都为零。

3.对角矩阵的压缩存储

元素aij在一维数组中的序号
=2 + 3(i－2)+( j－i + 2)
=2i+ j -2
∵一维数组下标从0开始
∴元素aij在一维数组中的下标
= 2i+ j -3

4.稀疏矩阵的压缩存储

将稀疏矩阵中的每个非零元素表示为：

(行号，列号，非零元素值)——三元组

emplate <class DataType>
struct element
{
int row, col; //行号，列号
DataType item //非零元素值
};

三元组表：将稀疏矩阵的非零元素对应的三元组所构成的集合，按行优先的顺序排列成一个线性表。

5.稀疏矩阵的压缩存储——三元组顺序表

存储结构定义：
const int MaxTerm=100;
template <class DataType>
struct SparseMatrix
{
DataType data[MaxTerm]; //存储非零元素
int mu, nu, tu; //行数、列数、非零元个数
};

6.稀疏矩阵的压缩存储——十字链表

采用链接存储结构存储三元组表，每个非零元素对应的三元组存储为一个链表结点，结构为：

row：存储非零元素的行号
col：存储非零元素的列号
item：存储非零元素的值
right：指针域，指向同一行中的下一个三元组
down：指针域，指向同一列中的下一个三元组

0 0

第四章 字符串和多维数组

第四章字符串和多维数组