串的逻辑结构和线性表很相似,不同之处在于串针对的是字符集,也就是串中的元素都是字符,哪怕串中的字符是“123”这样的数字组成,或者“2010-10-10”这样的日期组成,它们都只能理解为长度为3和长度为10的字符串,每个元素都是字符而已。
因此,对于串的基本操作与线性表是有很大差别的。线性表更关注的是单个元素的操作,比如查找一个元素,插入或删除一个元素,但串中更多的是查找子串位置、得到指定位置子串、替换子串等操作。
ADT 串(string)
Data
串中元素仅由一个字符组成,相邻元素具有前驱和后继关系。
Operation
StrAssign(T, *chars): 生成一个其值等于字符串常量chars的串T。
StrCopy(T, S): 串S存在,由串S复制得串T。
ClearString(S): 串S存在,将串清空。
StringEmpty(S): 若串S为空,返回true,否则返回false。
StrLength(S): 返回串S的元素个数,即串的长度。
StrCompare(S, T): 若S>T,返回值>0,若S=T,返回0,若S<T,返回值<0。
Concat(T, S1, S2): 用T返回由S1和S2联接而成的新串。
SubString(Sub, S, pos, len): 串S存在,1≤pos≤StrLength(S), 且0≤len≤StrLength(S)- pos+1,用Sub返回串S的第pos个字符起长度为len的子串。
Index(S, T, pos):串S和T存在,T是非空串,1≤pos≤StrLength(S)。
若主串S中存在和串T值相同的子串,则返回它在主串S中
第pos个字符之后第一次出现的位置,否则返回0。
Replace(S, T, V):串S、T和V存在,T是非空串。
用V替换主串S中出现的所有 与T相等的不重叠的子串。
StrInsert(S, pos, T): 串S和T存在,1≤pos≤StrLength(S)+1。
在串S的第pos个字符之前插入串T。
StrDelete(S, pos, len):串S存在,1≤pos≤StrLength(S)-len+1。
从串S中删除第pos个字符起长度为len的子串。
endADT
对于不同的高级语言,其实对串的基本操作会有不同的定义方法,所以同学们在用某个语言操作字符串时,需要先查看它的参考手册关于字符串的基本操作有哪些。不过还好,不同语言除方法名称外,操作实质都是相类似的。比如C#中,字符串操作就还有ToLower转小写、ToUpper转大写In-dexOf从左查找子串位置(操作名有修改)、LastIndexOf从右查找子串位置、Trim去除两边空格等比较方便的操作,它们其实就是前面这些基本操作的扩展函数。
我们来看一个操作Index的实现算法。
/* T为非空串。若主串S中第pos个字符之后存在与T 相等的子串, */
/* 则返回第一个这样的子串在S中的位置,否则返回0 */
int Index(String S, String T, int pos){
int n, m, i;
String sub;
if (pos > 0){
/* 得到主串S的长度 */
n = StrLength(S);
/* 得到子串T的长度 */
m = StrLength(T);
i = pos;
while (i <= n - m + 1){
/* 取主串第i个位置 */
/* 长度与T相等子串给sub */
SubString(sub, S, i, m);
/* 如果两串不相等 */
if (StrCompare(sub, T) != 0)
++i;
/* 如果两串相等 */
else
/* 则返回i值 */
return i;
}
}
/* 若无子串与T相等,返回0 */
return 0;
}
当中用到了StrLength、SubString、StrCom-pare等基本操作来实现。