字符串和多维数组

来源:互联网 发布:乐乎城市青年社区 亦庄 编辑:程序博客网 时间:2024/05/18 01:53

1.——零个或多个字符组成的有限序列

串:零个或多个字符组成的有限序列。
 
串长度:串中所包含的字符个数。
 
空串:长度为0的串,记为:""

非空串通常记为:
      S=" s1 s2 …… sn "
其中:S是串名,双引号是定界符,双引号引起来的部分是串值si1≤i≤n)是一个任意字符。

1.1串的逻辑结构

子串:串中任意个连续的字符组成的子序列。
主串:包含子串的串。
子串的位置:子串的第一个字符在主串中的序号。

串的数据对象约束为某个字符集。
 
微机上常用的字符集是标准ASCII码,由 7位二进制数表示一个字符,总共可以表示 128个字符。
 
扩展ASCII码由 8位二进制数表示一个字符,总共可以表示 256个字符,足够表示英语和一些特殊符号,但无法满足国际需要。
 Unicode
16位二进制数表示一个字符,总共可以表示 216个字符,能够表示世界上所有语言的所有字符,包括亚洲国家的表意字符。为了保持兼容性,Unicode字符集中的前256个字符与扩展ASCII码完全相同。  

1.2  字符串的比较

串的比较:通过组成串的字符之间的比较来进行的。

给定两个串:X="x1x2…xn"Y="y1y2…ym",则:
1.
n=mx1=y1xn=ym时,称X=Y
2.
当下列条件之一成立时,称XY
nmxi=yi1≤ i≤n);
存在k≤min(m,n),使得xi=yi(1≤i≤k-1)xkyk

4.1.2字符串的存储结构

方案1:用一个变量来表示串的实际长度。

方案2:在串尾存储一个不会在串中出现的特殊字符作为串的终结符,表示串的结尾。 

方案3:用数组的0号单元存放串的长度,从1号单元开始存放串值。

4.1.3模式匹配

1.模式匹配:给定主串S="s1s2…sn"和模式T="t1t2…tm",在S中寻找T的过程称为模式匹配。如果匹配成功,返回TS中的位置;如果匹配失败,返回0

模式匹配问题的特点

算法的一次执行时间不容忽视:问题规模通常很大,常常需要在大量信息中进行匹配;
算法改进所取得的积累效益不容忽视:模式匹配操作经常被调用,执行频率高。

2.BF算法

基本思想:从主串S的第一个字符开始和模式T的第一个字符进行比较,若相等,则继续比较两者的后续字符;否则,从主串S的第二个字符开始和模式T的第一个字符进行比较,重复上述过程,直到T中的字符全部比较完毕,则说明本趟匹配成功;或S中字符全部比较完,则说明匹配失败。

在串S和串T中设比较的起始下标ij
2.
循环直到ST的所有字符均比较完
    2.1
如果S[i]=T[j],继续比较ST的下一个字符;
    2.2
否则,将ij回溯,准备下一趟比较;
3.
如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标;否则,匹配失败,返回0

int BF(char S[ ], char T[ ])
{
     i=0; j=0;   
    while (S[i]!='\0'&&T[j]!='\0')
    {
         if (S[i]==T[j]) {
             i++;   j++;
         }  
         else {
             i=i-j+1;    j=0;
         }   
     }
     if (T[j]=='\0') return (i-j+1);   
     else return 0;
}

int BF(char S[ ], char T[ ])
{
     i=0; j=0;start=0;   
    while (S[i]!='\0'&&T[j]!='\0')
    {
         if (S[i]==T[j]) {
             i++;   j++;
         }  
         else {
             start++;  i=start; j=0;
         }   
     }
     if (T[j]=='\0') return start;   
     else return 0;
}

4.2 多维数组

4.2.1多维数组的定义

1.数组是由一组类型相同的数据元素构成的有序集合,每个数据元素称为一个数组元素(简称为元素),每个元素受n(n≥1)个线性关系的约束,每个元素在n个线性关系中的序号i1i2in称为该元素的下标,并称该数组为 n 维数组。

2.多维数组的特点 

元素本身可以具有某种结构,属于同一数据类型;
数组是一个具有固定格式和数量的数据集合。

4.2.2数组的存储结构及寻址

一维数组

设一维数组的下标的范围为闭区间[lh],每个数组元素占用 c 个存储单元,则其任一元素 ai的存储地址可由下式确定: 
Loc(ai)
Loc(al)(il)×c 

二维数组

常用的映射方法有两种:
按行优先:先行后列,先存储行号较小的元素,行号相同者先存储列号较小的元素。 
按列优先:先列后行,先存储列号较小的元素,列号相同者先存储行号较小的元素。 

N维数组

nn2)维数组一般也采用按行优先和按列优先两种存储方法。请自行推导任一元素存储地址的计算方法。

4.3  矩阵的压缩存储

1.特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
 
稀疏矩阵:矩阵中有很多零元素。

压缩存储的基本思想是:
   
为多个值相同的元素只分配一个存储空间;
 
对零元素不分配存储空间。 

2.特殊矩阵的压缩存储——对角矩阵 

对角矩阵:所有非零元素都集中在以主对角线为中心的带状区域中,除了主对角线和它的上下方若干条对角线的元素外,所有其他元素都为零。 

3.对角矩阵的压缩存储

元素aij在一维数组中的序号
=2 + 3(i
2)+( ji + 2)
=2i+ j -2          
一维数组下标从0开始

元素aij在一维数组中的下标
= 2i+ j -3

4.稀疏矩阵的压缩存储 

将稀疏矩阵中的每个非零元素表示为:


(
行号,列号,非零元素值)——三元组

emplate <class DataType>
struct element
{    
    int row, col;                  //
行号,列号

    DataType item              //
非零元素值
};

三元组表:将稀疏矩阵的非零元素对应的三元组所构成的集合,按行优先的顺序排列成一个线性表。

5.稀疏矩阵的压缩存储——三元组顺序表

存储结构定义:
    const int MaxTerm=100;
    template <class DataType>
    struct SparseMatrix
    {
       DataType data[MaxTerm];       //
存储非零元素
       int mu, nu, tu;          //
行数、列数、非零元个数
    };

6.稀疏矩阵的压缩存储——十字链表

采用链接存储结构存储三元组表,每个非零元素对应的三元组存储为一个链表结点,结构为: 

row:存储非零元素的行号
col
:存储非零元素的列号
item
:存储非零元素的值
right
:指针域,指向同一行中的下一个三元组
down
:指针域,指向同一列中的下一个三元组

0 0