创作不易,友友们给个三连吧!!
编程中我们经常遇到需要处理字符和字符串的情况,为了能够让我们更加方便地操作,C语言标准库提供了一系列相关的库函数 。
一、字符分类函数
C语⾔中有⼀系列的函数是专⻔做字符分类的,也就是⼀个字符是属于什么类型的字符的。
这些函数的使⽤都需要包含⼀个头⽂件是 ctype.h
这些函数的使用方法都十分类似,比如说:
cpp
int islower ( int c );
通过返回值来说明是否是⼩写字⺟,如果是⼩写字⺟就返回⾮0的整数,如果不是⼩写字⺟,则返回 0。(其他字符分类函数也是如此)
例题:写⼀个代码,将字符串中的小写字⺟转⼤写,其他字符不变。
cpp
int main()
{
char str[100] = {0};
gets(str);//从键盘输入一个字符串放进str数组中
char c;
int i = 0;
while (str[i])
{
c = str[i];
if (islower(c))
c -= 32;//小写字母转大写字母
putchar(c);//将字符打印出来
i++;
}
return 0;
}
二、字符转换函数
C语⾔提供了2个字符转换函数:
cpp
int tolower ( int c ); //将参数传进去的⼤写字⺟转⼩写
int toupper ( int c ); //将参数传进去的⼩写字⺟转⼤写
上⾯的代码,我们将⼩写转⼤写,是-32完成的效果,有了转换函数,就可以直接使⽤ tolower 函 数。
cpp
int main()
{
char str[100] = { 0 };
gets(str);//从键盘输入一个字符串放进str数组中
char c;
int i = 0;
while (str[i])
{
c = str[i];
if (islower(c))
c =toupper(c);//小写字母转大写字母
putchar(c);//将字符打印出来
i++;
}
return 0;
}
三、strlen的使用和模拟实现
字符串相关函数的头文件string.h
strlen即string length(计算字符串的长度)
cpp
size_t strlen ( const char * str );
3.1 使用的注意事项
1、字符串以 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前⾯出现的字符个数(不包含 '\0' )。
2、参数指向的字符串必须要以 '\0' 结束,如果没有,就可能会出现越界访问,会返回一个随机值。
cpp
int main()
{
char str[] = { 'a','b','c' };
strlen(str);
printf("%zd", strlen(str));
}
运行结果:42 (属于随机值)
3、注意函数的返回值为size_t,是⽆符号的(占位符是%zd)
易错点:利用strlen的返回值相减
cpp
int main()
{
char str1[] = "ab";
char str2[] = "abc";
if (strlen(str1) - strlen(str2) > 0)
printf("大于\n");
else
printf("小于\n");
}
输出结果:大于
按照我们的理解,str1的长度是2,str2的长度是3,为什么结果会是大于?
就是因为strlen的返回值是无符号整形,虽然2-3=-1但是不加以转换的话,会被当成无符号数,所以对应的值也是正数,如果这里想这么用的话,就必须把strlen的返回值强制类型转化成int类型才能算。
cpp
int main()
{
char str1[] = "ab";
char str2[] = "abcdefg";
if ((int)strlen(str1) -(int) strlen(str2) > 0)
printf("大于\n");
else
printf("小于\n");
}
3.2 strlen的模拟实现
3.2.1 计数器方式
cpp
size_t my_strlen1(const char* str)
{
size_t count = 0;
assert(str);//确保传的不是空指针
while (*str)//遇到\0停止
{
count++;
str++;
}
return count;
}
3.2.2 指针-指针方式
cpp
size_t my_strlen2(const char* str)
{
assert(str);//确保传的不是空指针
char* p = str;//用来遍历
while (*p)
p++;
return p - str;//指针减指针得到中间的元素个数
}
3.2.3 不能创建临时变量(使用递归)
cpp
size_t my_strlen3(const char* str)
{
assert(str);//确保传的不是空指针
//比如"abcdef"的长度 可以拆成1+"bcdef" 再拆成1+1+"cdef"............
if (*str == '\0')
return 0;
else
return 1 + my_strlen3(str + 1);
}
3.3 size_t和unsigned int的区别
1、size_t大小不固定,取决于操作系统(在32位环境中,是4个字节,在64位环境中是8个字节)。unsigned int通常4个字节
2、"size_t"用于存储对象的大小,而"unsigne int"用于存储整数值
四、strcpy的使用和模拟实现
strcpy即string copy(字符串的拷贝)
cpp
char* strcpy(char * destination, const char * source );
destination是目标字符串,source是源字符串,strcpy的作用是将源字符串拷贝到目标字符串,并返回指向新的目标字符串的指针
4.1 使用的注意事项
1、 源字符串必须以 '\0' 结束。
2、会将源字符串中的 '\0' 拷⻉到⽬标空间。
3、⽬标空间必须⾜够⼤,以确保能存放源字符串。
4、⽬标空间必须可修改。
4.2 strcpy的模拟实现
cpp
char* my_strcpy(char* des, const char* src)
{
char* ret = des;//记录返回值
assert(des && src);//确保没有传NULL指针
while (*des++ = *src++)
//++优先于*,但是后置加加是先使用完再++,所以实际上还是相当于src解引用的元素,知道src解引用出\0,循环正好停止
;//空语句
return ret;
}
五、strcat的使用和模拟实现
strcat即string concatenate(字符串连接)
cpp
char * strcat ( char * destination, const char * source );
destination是目标字符串,source是源字符串,strcat的作用是将源字符串连接到目标字符串后面,并返回指向新的目标字符串的指针。
5.1 使用的注意事项
1、源字符串必须以 '\0' 结束。
2、⽬标字符串中也得有 \0 ,否则没办法知道追加从哪⾥开始。
3、⽬标空间必须有⾜够的⼤,能容纳下源字符串的内容。
4、⽬标空间必须可修改。
5、不能自己给自己追加!(易错),会造成死循环,没有尽头
因为strcat的实现方法是将源字符串从目标字符串的\0开始拷贝(会覆盖\0),如果两个参数都是传同一个字符串,就会造成永远找不到\0,造成死循环
5.2 strcat的模拟实现
cpp
char* my_strcat(char* des, const char* src)
{
char* ret = des;//记录返回值
assert(des && src);//确保没有传NULL指针
//因为是从目标字符串的\0开始连接的,所以要先找到目标字符串的/0
//然后再逐个拷贝源字符串的内容
while (*des)
des++;
while (*des++ = *src++)
;
return ret;
}
六、strcmp的使用和模拟实现
strcmp即string compare(字符串比较)
cpp
int strcmp ( const char * str1, const char * str2 );
6.1 使用的注意事项
1、第⼀个字符串⼤于第⼆个字符串,则返回⼤于0的数字 ◦
2、第⼀个字符串等于第⼆个字符串,则返回0
3、第⼀个字符串⼩于第⼆个字符串,则返回⼩于0的数字
4、比较字符串的方法:⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩,小的字符所在的字符串小于另一个字符串。
6.2 strcmp的模拟实现
cpp
int my_strcmp(const char* str1, const char* str2)
{
assert(str1 && str2);//确保没有传NULL指针
while (*str1 == *str2&&str1!='\0')
//当两个指向的字符相等时或者str1和str2还没等于\0的时候
{
//迭代
str1++;
str2++;
}
//当两个指向的字符不相等时
return *str1 - *str2;//大于0返回正数,小于0返回负数
}
七、strncpy的使用和模拟实现
cpp
char * strncpy ( char * destination, const char * source, size_t num );
相比较于strcpy,可以拷贝源字符串中指定个数的字符
7.1 使用的注意事项
1、拷⻉num个字符从源字符串到⽬标空间。
2、如果源字符串的⻓度⼩于num,则拷⻉完源字符串之后,在⽬标的后边追加0,直到num个。
7.2 strncpy的模拟实现
cpp
char* my_strncpy(char* des, const char* src, size_t num)
{
char* ret = des;//记录返回值
assert(des && src);//确保没有传NULL指针
while (num)
{
if (src)//如果src不是\0,则继续拷贝
*des = *src;
else//如果src已经走到\0了,循环还没结束,就追加/0,直到num个
*des = '\0';
//迭代
des++;
if(src)//如果已经到\0了,不能再++了,否则越界
src++;
num--;
}
return ret;
}
八、strncat的使用和模拟实现
cpp
char * strncat ( char * destination, const char * source, size_t num );
想比较于strcat,可以追加源字符串的指定个数的字符
8.1 使用的注意事项
1、将source指向字符串的前num个字符追加到destination指向的字符串末尾,再追加⼀个 \0 字符
2、如果source 指向的字符串的⻓度⼩于num的时候,只会将字符串中到 \0 的内容追加destination指向的字符串末尾
8.2 strncat的模拟实现
cpp
char* my_strncat(char* des, const char* src, size_t num)
{
char* ret = des;//记录返回值
assert(des && src);//确保没有传NULL指针
//des要先走到\0的位置
while (*des)
{
des++;
}
//从des的\0出开始追加src
while (num&&src!='\0')//src会先走到\0,此时就跳出循环
{
//拷贝
*des = *src;
//迭代
des++;
src++;
num--;
}
//num个元素拷贝完成,则给结尾补上\0
*des = '\0';
return ret;
}
九、strncmp的使用和模拟实现
cpp
int strncmp ( const char * str1, const char * str2, size_t num );
相比较于strcmp,可以指定最多比较num个字母
9.1 使用的注意事项
⽐较str1和str2的前num个字符,如果相等就继续往后⽐较,最多⽐较num个字⺟,如果提前发现不⼀ 样,就提前结束,⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等,就是相等返回0.
9.2 strncmp的模拟实现
cpp
int my_strncmp(const char* str1, const char* str2, size_t num)
{
assert(str1 && str2);//确保没有传NULL指针
if(num==0)//如果传的是0,那么结果就是返回0
return 0;
while (--num&&*str1==*str2&&*str1!='\0')
//当num变成0的时候或者两个指向的字符相等时或者str1和str2还没等于\0的时候
{
//迭代
str1++;
str2++;
}
return *str1-*str2;
}
十、strstr的使用和模拟实现
cpp
char * strstr ( const char * str1, const char * str2);
10.1 使用的注意事项
1、函数返回字符串str2在字符串str1中第⼀次出现的位置
2、字符串的⽐较匹配不包含 \0 字符,以 \0 作为结束标志
10.2 strstr的模拟实现
cpp
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);//确保不传NULL进来
char* cur = str1;//cur用来记录遍历点
char* s1 = NULL, * s2 = NULL;//s1用来遍历字符串1,s2用来遍历字符串2
if (*str2 == '\0')//库的strstr函数规定如果要找的是空字符串,那么返回str1
{
return (char*)str1;//返回值是char*,要强转
}
while (*cur)
{
s1 = cur;
s2 = str2;
while (*s1 == *s2&&*s1&&s2)//当循环第一次找到第一个字符是相等的,开始确认是不是我们要找的字符串
//找到的情况:
// 1、*s1和*s2都是\0,
// 2、*s2是\0
// 没找到的情况:
// 1、*s1!=*s2
// 2、*s1是\0,但是*s2不是\0
{
s1++;
s2++;
}
//跳出循环后,判断s2是否走到\0
if (*s2 == '\0')
return cur;
//迭代
cur++;
}
return NULL;
}
十一、strtok函数的使用
cpp
char * strtok ( char * str, const char * sep);
1、sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
2、第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。
3、strtok函数找到str中的下⼀个标记,并将其⽤ \0 结尾,返回⼀个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以在使⽤strtok函数切分的字符串⼀般都是临时拷⻉的内容 并且可修改。)
4、strtok函数的第⼀个参数不为 NULL ,函数将找到str中第⼀个标记,strtok函数将保存它在字符串中的位置。
5、strtok函数的第⼀个参数为 NULL ,函数将在同⼀个字符串中被保存的位置开始,查找下⼀个标 记。
6、如果字符串中不存在更多的标记,则返回 NULL 指针。
使用方法
cpp
int main()
{
char arr[] = "xiaochen@163.com";
//使用strtok会改变需分割字符串的内容,所以最好用拷贝的数据分割
char *str = NULL;
char* sep = "@.";
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
//for循环的书写恰好满足strtok,因为只有第一次(初始化)传str,
//然后就一直传NULL(累加条件),直到str变成NULL(结束条件)
printf("%s\n", str);
return 0;
}
这里我们可以发现c语言库里的strtok函数里面应该有个静态变量, 他调用完后并不会被销毁,所以我们后面传NULL过去的时候他仍然能记住保存的位置在哪里
十二、strerror函数的使用
cpp
char * strerror ( int errnum );
strerror函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码,⼀般是放在 errno.h 这个头⽂件中说明的,C语⾔程序启动的时候就会使⽤⼀个全面的变量errno来记录程序的当前错误码 ,只不过程序启动 的时候errno是0,表⽰没有错误,当我们在使⽤标准库中的函数的时候发⽣了某种错误,就会讲对应的错误码,存放在errno中,⽽⼀个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。
12.1 使用举例
cpp
int main ()
{
FILE * pFile;
pFile = fopen ("unexist.ent","r");
if (pFile == NULL)
printf ("Error opening file unexist.ent: %s\n", strerror(errno));
return 0;
}
输出结果:Error opening file unexist.ent: No such file or directory
12.2 perror和strerror的区别
perror函数是打印完参数部分的字符串后,再打印一个冒号和一个空格,然后再打印错误信息。
cpp
int main ()
{
FILE * pFile;
pFile = fopen ("unexist.ent","r");
if (pFile == NULL)
perror("Error opening file unexist.ent");
return 0;
}
输出结果:Error opening file unexist.ent: No such file or directory
使用场景的不同:
perror函数不需要error.h的头文件就可以直接打印储存在erron这个全局变量的错误信息,相对比较好用,但是也比较粗暴,会直接打印在屏幕上。
strerror函数需要使用error.h的头文件,因为传参传的是erron这个变量,他比较不粗暴,是暂时将该错误信息存储起来,我们可以把它写进文件里,也可以先记录但是暂时不打印,比较灵活。