我们知道,c/c 之所以使用起来灵活,很大原因归因于它能够它对能够对内存的直接操作,所以本文我主要讲述一下c中的字符串操作函数。
一,常量指针与指针常量
先来补充一个上篇文章手把手教你深入理解c/c 中的指针 我在讲述指针中的一个问题,有人说常量指针与指针常量这两个概念总是混淆怎么办,例如:
那么究竟如何区分常量指针与指针常量呢,这里边有个技巧,上篇文章中我忘记给大家说了:
从左往右看,跳过类型,看修饰哪个字符,如果是*, 说明指针指向的值不能改变,如果是指针变量,说明指针的指向不能改变,指针的值不能修改。这个原则你可以通俗理解成 “就近原则”。
那么回头来看第一行代码,也就是指针常量:
constint*p = &a;
我们跳过变量类型 int,那么const修饰的是*,所以它指向的值不能修改
第二行代码,常量指针:
int*constp= &a;
同样,我们跳过int,发现const是直接修饰的p,所以它的指向不能改变。两者有细微的差别,请大家注意。
我们再回到本节的字符串问题上,在讲述字符串拷贝函数前,我们再来回忆一下c语言中的字符串。
我们知道,c语言中的字符串有两种定义的方法,分别是:
charstr1[]=”helloworld”;//栈区字符串char*str2=”helloworld”;//数据常量区字符串
那么这两种在使用起来究竟有什么区别呢?答案是第一行定以后,操作系统给它分配的是栈区内存,而第二行通过指针形式来定义字符串的话,它分配的内存区在数据的常量区,意味着它的值是不可更改的:
str1[0]=’m’;//正确,字符数组可以修改str2[0]=’m’; //错误,常量区不可修改
所以,在常量区,如果我们两个内容相同但变量不同的指针变量,其实它们指向的是同一块内存:
char*str1=”helloworld”;char*str2=”helloworld”;printf(“%p\n”,str1);printf(“%p\n”,str2);
这里值得注意的是,在c 中,字符串指针与c语言中稍有区别,c 中直接将字符串指针做了增强处理,因为c 中规定字符串指针必须用const修饰,例如在c 中这样定义,编译器会直接报错:
char*str=”helloworld”;//直接报错constchar * str = “hello world”; //正确
而在实际开发过程中,我们使用字符串一般使用数组形式,不太建议使用指针字符串形式,也即:
charstr[]=”helloworld”;//建议使用char* str = “hello world”; //不建议使用
所以,这方面细微的差别请大家注意。
二,字符串长度问题
我们知道c语言中的字符串是以 ‘\0’ 为结尾的,也就是说你在声明一个字符串的时候,系统会自动为你的结尾添加上一个以 ‘\0’ 为结尾的结束字符,而且,printf 在每打印一个字符就会检查当前字符是否为 ‘\0’ ,直到遇到 ‘\0’ 立马停止。这里最容易混淆的的是字符串的长度,我们来看下面两行代码:
我们先来看下面两行代码:
charstr1[]=”hello”;char*str2=”hello”;printf(“%d\n”,sizeof(str1));//输出结果为 6printf(“%d\n”,sizeof(str2));//输出结果为 4 或者 8
那么为什么在使用 sizeof 计算字符串长度,两者计算出来的结果不一样呢,而且第一行长度还不是我们想要的,不应该是 5 才对吗?这是因为在声明一个字符串的时候,系统会自动为你的结尾添加上一个以 ‘\0’ 为结尾的结束字符,内存模型如下:
所以,对于上面两行代码,实际上它们的长度都为 6 才对。那为什么第二行输出却为 4 呢,这是因为第二行我们定义的是一个字符串指针,它指向一个常量区的字符串,而 sizeof 操作符操作这个指针的时候,实际上计算的是这个指针的字节长度,而一个指针在x86系统下占有长度为 4 字节,在x64环境下占有长度为 8 字节,所以,在实际上我们计算字符串长度的时候,一般会用 strlen() 这个函数,但是要注意,strlen 计算字符串也是以’\0′ 为结束的,也就是说,strlen() 函数会不断判断当前字符是否为 ‘\0’,如果是的话,立马结束,这个特点与printf函数一样,两者都是碰到’\0’ 就立马结束:
charstr1[]=”abc”;charstr2[]={‘a’,’\0′,’c’};charstr3[]={‘a’,’b’,’c’, ‘\0’};char*str4=”abc”;printf(“%d\n”,strlen(str1));//输出结果为3printf(“%d\n”,strlen(str2));//输出结果为1printf(“%d\n”,strlen(str3));//输出结果为3printf(“%d\n”,strlen(str4));//输出结果为3
上面就是c语言中的字符串长度函数,在使用过程中千万要注意。
三,c语言中的字符串拷贝函数
1) strcpy()
示意代码如下:
#define _CRT_SECURE_NO_WARNINGS #include <string.h> char str[10] = { 0 };charstr1[]=”hello”;char*mystr=strcpy(str,str1);将strcpy返回的指针保存到mystr里面 printf(mystr);
内存模型如下:
由于是逐个拷贝,意味着哪怕在字符串的中间遇到了 ‘\0′ 字符,也会结束拷贝。
这里边要注意两个问题:第一,必须保证 dest 所指向的内存空间足够大,否则可能会造成缓冲溢出的错误;第二,由于本身strcpy函数是一个非安全函数,所以编译器会弹出警告,要想忽略,请在程序最开头添加宏定义代码:
#define _CRT_SECURE_NO_WARNINGS
2), strncpy()
这个函数与strcpy类似,这里不再累赘。
3),strcat()
这是一个字符串追加函数,将 src 指向的字符串追加到 dest 指向的字符串后面,同样,结束符’\0’ 也会追加过去:
#define _CRT_SECURE_NO_WARNINGS #include <string.h> char str[] = “123”; char str1[] = “hello”; char* mystr = strcat(str, str1); printf(“%s\n%p”, mystr, mystr); //输出结果为:123hello
但是同样注意的是,目标字符串 dest 要有足够大的缓冲区来接收,否则会报错,内存模型如下:
4),strncat()
这个函数与strcat类似,只不过指定了追加的数量。
5),strcmp()
作用是对两个字符串的ASCII码进行比较,输出不同结果,经常用于判断两个字符串是否相等,示例代码如下:
char *str1 = “hello world”;char*str2=”hellomike”;if (strcmp(str1, str2) == 0){ printf(“str1==str2\n”);}else if (strcmp(str1, str2) > 0){ printf(“str1>str2\n”);} else{ printf(“str1<str2\n”);}
6),strncmp()
这个函数作用也是与strcmp类似,不再累赘。
7),sprintf()
示例代码如下:
char dst[100] = { 0 }; int a = 10;charsrc[]=”hello”;intlen=sprintf(dst,”a=%d,src=%s”,a,src);printf(“dst:%s\n”,dst);输出a=10,src=helloprintf(“len=%d\n”,len);输出14
下面再介绍几个字符串操作函数,但这几个使用频率比较小:
8) sscanf()
示例代码:
char src[] = “a=10, b=20”; int a; int b; sscanf(src, “a=%d, b=%d”, &a, &b); printf(“a:%d, b:%d\n”, a, b); 输出:a:20,b:20
sscanf与scanf类似,都是用于输入的,只是后者以屏幕(stdin)为输入源,前者以固定字符串为输入源。
9) strchr()
示例代码:
char src[] = “ddda123abcd”;char *p = strchr(src, ‘a’);printf(“p=%s\n”,p);输出:p=a123abcd
10),strstr()
这个函数与上一个 strchr 功能类似,只不过查找的内容是字符串,而非字单个字符。
11) strtok()
示例代码:
char a[100] = “www.baidu.com”;char*p=strtok(a,”.”);while (p != NULL){ printf(“%s\n”, p); p = strtok(NULL, “.”);}输出:www baidu com
以上,就是本文的全部内容了。