C语言：字符函数和字符串函数

创作不易，友友们给个三连吧！！

编程中我们经常遇到需要处理字符和字符串的情况，为了能够让我们更加方便地操作，C语言标准库提供了一系列相关的库函数。

一、字符分类函数

C语⾔中有⼀系列的函数是专⻔做字符分类的，也就是⼀个字符是属于什么类型的字符的。

这些函数的使⽤都需要包含⼀个头⽂件是 ctype.h

这些函数的使用方法都十分类似，比如说：

cpp 复制代码

int islower ( int c );

通过返回值来说明是否是⼩写字⺟，如果是⼩写字⺟就返回⾮0的整数，如果不是⼩写字⺟，则返回 0。（其他字符分类函数也是如此）

例题：写⼀个代码，将字符串中的小写字⺟转⼤写，其他字符不变。

cpp 复制代码

int main()
{
	char str[100] = {0};
	gets(str);//从键盘输入一个字符串放进str数组中
	char c;
	int i = 0;
	while (str[i])
	{
		c = str[i];
		if (islower(c))
			c -= 32;//小写字母转大写字母
		putchar(c);//将字符打印出来
		i++;
	}
	return 0;
}

二、字符转换函数

C语⾔提供了2个字符转换函数：

cpp 复制代码

int tolower ( int c ); //将参数传进去的⼤写字⺟转⼩写 
int toupper ( int c ); //将参数传进去的⼩写字⺟转⼤写

上⾯的代码，我们将⼩写转⼤写，是-32完成的效果，有了转换函数，就可以直接使⽤ tolower 函数。

cpp 复制代码

int main()
{
	char str[100] = { 0 };
	gets(str);//从键盘输入一个字符串放进str数组中
	char c;
	int i = 0;
	while (str[i])
	{
		c = str[i];
		if (islower(c))
			c =toupper(c);//小写字母转大写字母
		putchar(c);//将字符打印出来
		i++;
	}
	return 0;
}

三、strlen的使用和模拟实现

字符串相关函数的头文件string.h

strlen即string length（计算字符串的长度）

cpp 复制代码

size_t strlen ( const char * str );

3.1 使用的注意事项

1、字符串以 '\0' 作为结束标志，strlen函数返回的是在字符串中 '\0' 前⾯出现的字符个数（不包含 '\0' )。

2、参数指向的字符串必须要以 '\0' 结束,如果没有，就可能会出现越界访问，会返回一个随机值。

cpp 复制代码

int main()
{
	char str[] = { 'a','b','c' };
	strlen(str);
	printf("%zd", strlen(str));
}

运行结果：42 （属于随机值）

3、注意函数的返回值为size_t，是⽆符号的（占位符是%zd）

易错点：利用strlen的返回值相减

cpp 复制代码

int main()
{
	char str1[] = "ab";
	char str2[] = "abc";
	if (strlen(str1) - strlen(str2) > 0)
		printf("大于\n");
	else 
		printf("小于\n");
}

输出结果：大于

按照我们的理解，str1的长度是2，str2的长度是3，为什么结果会是大于？

就是因为strlen的返回值是无符号整形，虽然2-3=-1但是不加以转换的话，会被当成无符号数，所以对应的值也是正数，如果这里想这么用的话，就必须把strlen的返回值强制类型转化成int类型才能算。

cpp 复制代码

int main()
{
	char str1[] = "ab";
	char str2[] = "abcdefg";
	if ((int)strlen(str1) -(int) strlen(str2) > 0)
		printf("大于\n");
	else 
		printf("小于\n");
}

3.2 strlen的模拟实现

3.2.1 计数器方式

cpp 复制代码

size_t my_strlen1(const char* str)
{
	size_t count = 0;
	assert(str);//确保传的不是空指针
	while (*str)//遇到\0停止
	{
		count++;
		str++;
	}
	return count;
}

3.2.2 指针-指针方式

cpp 复制代码

size_t my_strlen2(const char* str)
{
	assert(str);//确保传的不是空指针
	char* p = str;//用来遍历
	while (*p)
		p++;
	return p - str;//指针减指针得到中间的元素个数
}

3.2.3 不能创建临时变量（使用递归）

cpp 复制代码

size_t my_strlen3(const char* str)
{
	assert(str);//确保传的不是空指针
	//比如"abcdef"的长度 可以拆成1+"bcdef" 再拆成1+1+"cdef"............
	if (*str == '\0')
		return 0;
	else
		return 1 + my_strlen3(str + 1);
}

3.3 size_t和unsigned int的区别

1、size_t大小不固定，取决于操作系统（在32位环境中，是4个字节，在64位环境中是8个字节）。unsigned int通常4个字节

2、"size_t"用于存储对象的大小，而"unsigne int"用于存储整数值

四、strcpy的使用和模拟实现

strcpy即string copy（字符串的拷贝）

cpp 复制代码

char* strcpy(char * destination, const char * source );

destination是目标字符串，source是源字符串，strcpy的作用是将源字符串拷贝到目标字符串，并返回指向新的目标字符串的指针

4.1 使用的注意事项

1、源字符串必须以 '\0' 结束。

2、会将源字符串中的 '\0' 拷⻉到⽬标空间。

3、⽬标空间必须⾜够⼤，以确保能存放源字符串。

4、⽬标空间必须可修改。

4.2 strcpy的模拟实现

cpp 复制代码

char* my_strcpy(char* des, const char* src)
{
	char* ret = des;//记录返回值
	assert(des && src);//确保没有传NULL指针
	while (*des++ = *src++)
//++优先于*,但是后置加加是先使用完再++，所以实际上还是相当于src解引用的元素，知道src解引用出\0，循环正好停止
		;//空语句
	return ret;
}

五、strcat的使用和模拟实现

strcat即string concatenate（字符串连接）

cpp 复制代码

char * strcat ( char * destination, const char * source );

destination是目标字符串，source是源字符串，strcat的作用是将源字符串连接到目标字符串后面，并返回指向新的目标字符串的指针。

5.1 使用的注意事项

1、源字符串必须以 '\0' 结束。

2、⽬标字符串中也得有 \0 ，否则没办法知道追加从哪⾥开始。

3、⽬标空间必须有⾜够的⼤，能容纳下源字符串的内容。

4、⽬标空间必须可修改。

5、不能自己给自己追加！（易错），会造成死循环，没有尽头

因为strcat的实现方法是将源字符串从目标字符串的\0开始拷贝（会覆盖\0），如果两个参数都是传同一个字符串，就会造成永远找不到\0，造成死循环

5.2 strcat的模拟实现

cpp 复制代码

char* my_strcat(char* des, const char* src)
{
	char* ret = des;//记录返回值
	assert(des && src);//确保没有传NULL指针
	//因为是从目标字符串的\0开始连接的，所以要先找到目标字符串的/0
	//然后再逐个拷贝源字符串的内容
	while (*des)
		des++;
	while (*des++ = *src++)
		;
	return ret;
}

六、strcmp的使用和模拟实现

strcmp即string compare（字符串比较）

cpp 复制代码

int strcmp ( const char * str1, const char * str2 );

6.1 使用的注意事项

1、第⼀个字符串⼤于第⼆个字符串，则返回⼤于0的数字 ◦

2、第⼀个字符串等于第⼆个字符串，则返回0

3、第⼀个字符串⼩于第⼆个字符串，则返回⼩于0的数字

4、比较字符串的方法：⽐较两个字符串中对应位置上字符ASCII码值的⼤⼩，小的字符所在的字符串小于另一个字符串。

6.2 strcmp的模拟实现

cpp 复制代码

int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);//确保没有传NULL指针
	while (*str1 == *str2&&str1！='\0')
//当两个指向的字符相等时或者str1和str2还没等于\0的时候
	{
		//迭代
		str1++;
		str2++;
	}
	//当两个指向的字符不相等时
	return *str1 - *str2;//大于0返回正数，小于0返回负数
}

七、strncpy的使用和模拟实现

cpp 复制代码

char * strncpy ( char * destination, const char * source, size_t num );

相比较于strcpy，可以拷贝源字符串中指定个数的字符

7.1 使用的注意事项

1、拷⻉num个字符从源字符串到⽬标空间。

2、如果源字符串的⻓度⼩于num，则拷⻉完源字符串之后，在⽬标的后边追加0，直到num个。

7.2 strncpy的模拟实现

cpp 复制代码

char* my_strncpy(char* des, const char* src, size_t num)
{
	char* ret = des;//记录返回值
	assert(des && src);//确保没有传NULL指针
	while (num)
	{
		if (src)//如果src不是\0，则继续拷贝
			*des = *src;
		else//如果src已经走到\0了，循环还没结束，就追加/0,直到num个
			*des = '\0';
		//迭代
		des++;
		if(src)//如果已经到\0了，不能再++了,否则越界
		src++;
		num--;
	}
	return ret;
}

八、strncat的使用和模拟实现

cpp 复制代码

 char * strncat ( char * destination, const char * source, size_t num );

想比较于strcat，可以追加源字符串的指定个数的字符

8.1 使用的注意事项

1、将source指向字符串的前num个字符追加到destination指向的字符串末尾，再追加⼀个 \0 字符

2、如果source 指向的字符串的⻓度⼩于num的时候，只会将字符串中到 \0 的内容追加destination指向的字符串末尾

8.2 strncat的模拟实现

cpp 复制代码

char* my_strncat(char* des, const char* src, size_t num)
{
	char* ret = des;//记录返回值
	assert(des && src);//确保没有传NULL指针
	//des要先走到\0的位置
	while (*des)
	{
		des++;
	}
	//从des的\0出开始追加src
	while (num&&src!='\0')//src会先走到\0,此时就跳出循环
	{
		//拷贝
		*des = *src;
		//迭代
		des++;
		src++;
		num--;
	}
	//num个元素拷贝完成，则给结尾补上\0
	*des = '\0';
	return ret;
}

九、strncmp的使用和模拟实现

cpp 复制代码

int strncmp ( const char * str1, const char * str2, size_t num );

相比较于strcmp，可以指定最多比较num个字母

9.1 使用的注意事项

⽐较str1和str2的前num个字符，如果相等就继续往后⽐较，最多⽐较num个字⺟，如果提前发现不⼀样，就提前结束，⼤的字符所在的字符串⼤于另外⼀个。如果num个字符都相等，就是相等返回0.

9.2 strncmp的模拟实现

cpp 复制代码

int my_strncmp(const char* str1, const char* str2, size_t num)
{
	assert(str1 && str2);//确保没有传NULL指针
	if(num==0)//如果传的是0，那么结果就是返回0
		return 0;
	while (--num&&*str1==*str2&&*str1!='\0')
		//当num变成0的时候或者两个指向的字符相等时或者str1和str2还没等于\0的时候 
	{
		//迭代
		str1++;
		str2++;
	}
	return *str1-*str2;
}

十、strstr的使用和模拟实现

cpp 复制代码

char * strstr ( const char * str1, const char * str2);

10.1 使用的注意事项

1、函数返回字符串str2在字符串str1中第⼀次出现的位置

2、字符串的⽐较匹配不包含 \0 字符，以 \0 作为结束标志

10.2 strstr的模拟实现

cpp 复制代码

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);//确保不传NULL进来
	char* cur = str1;//cur用来记录遍历点
	char* s1 = NULL, * s2 = NULL;//s1用来遍历字符串1，s2用来遍历字符串2
	if (*str2 == '\0')//库的strstr函数规定如果要找的是空字符串，那么返回str1
	{
		return (char*)str1;//返回值是char*，要强转
	}
	while (*cur)
	{
		s1 = cur;
		s2 = str2;
		while (*s1 == *s2&&*s1&&s2)//当循环第一次找到第一个字符是相等的，开始确认是不是我们要找的字符串
			//找到的情况：
			// 1、*s1和*s2都是\0,
			// 2、*s2是\0
			// 没找到的情况：
			// 1、*s1！=*s2
			// 2、*s1是\0，但是*s2不是\0
		{
			s1++;
			s2++;
		}
		//跳出循环后，判断s2是否走到\0
		if (*s2 == '\0')
			return cur;
		//迭代
		cur++;
	}
	return NULL;
}

十一、strtok函数的使用

cpp 复制代码

char * strtok ( char * str, const char * sep);

1、sep参数指向⼀个字符串，定义了⽤作分隔符的字符集合

2、第⼀个参数指定⼀个字符串，它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标记。

3、strtok函数找到str中的下⼀个标记，并将其⽤ \0 结尾，返回⼀个指向这个标记的指针。（注： strtok函数会改变被操作的字符串，所以在使⽤strtok函数切分的字符串⼀般都是临时拷⻉的内容并且可修改。）

4、strtok函数的第⼀个参数不为 NULL ，函数将找到str中第⼀个标记，strtok函数将保存它在字符串中的位置。

5、strtok函数的第⼀个参数为 NULL ，函数将在同⼀个字符串中被保存的位置开始，查找下⼀个标记。

6、如果字符串中不存在更多的标记，则返回 NULL 指针。

使用方法

cpp 复制代码

int main()
{
	char arr[] = "xiaochen@163.com";
	//使用strtok会改变需分割字符串的内容，所以最好用拷贝的数据分割
	char *str = NULL;
	char* sep = "@.";
	for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
//for循环的书写恰好满足strtok，因为只有第一次（初始化）传str，
//然后就一直传NULL（累加条件），直到str变成NULL（结束条件）
		printf("%s\n", str);
	return 0;
}

这里我们可以发现c语言库里的strtok函数里面应该有个静态变量，他调用完后并不会被销毁，所以我们后面传NULL过去的时候他仍然能记住保存的位置在哪里

十二、strerror函数的使用

cpp 复制代码

 char * strerror ( int errnum );

strerror函数可以把参数部分错误码对应的错误信息的字符串地址返回来。

在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码，⼀般是放在 errno.h 这个头⽂件中说明的，C语⾔程序启动的时候就会使⽤⼀个全面的变量errno来记录程序的当前错误码 ，只不过程序启动的时候errno是0，表⽰没有错误，当我们在使⽤标准库中的函数的时候发⽣了某种错误，就会讲对应的错误码，存放在errno中，⽽⼀个错误码的数字是整数很难理解是什么意思，所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。

12.1 使用举例

cpp 复制代码

int main ()
{
 FILE * pFile;
 pFile = fopen ("unexist.ent","r");
 if (pFile == NULL)
 printf ("Error opening file unexist.ent: %s\n", strerror(errno));
 return 0;
}

输出结果：Error opening file unexist.ent: No such file or directory

12.2 perror和strerror的区别

perror函数是打印完参数部分的字符串后，再打印一个冒号和一个空格，然后再打印错误信息。

cpp 复制代码

int main ()
{
 FILE * pFile;
 pFile = fopen ("unexist.ent","r");
 if (pFile == NULL)
 perror("Error opening file unexist.ent");
 return 0;
}

输出结果：Error opening file unexist.ent: No such file or directory

使用场景的不同：

perror函数不需要error.h的头文件就可以直接打印储存在erron这个全局变量的错误信息，相对比较好用，但是也比较粗暴，会直接打印在屏幕上。

strerror函数需要使用error.h的头文件，因为传参传的是erron这个变量，他比较不粗暴，是暂时将该错误信息存储起来，我们可以把它写进文件里，也可以先记录但是暂时不打印，比较灵活。