使用C语言库函数格式化输入时格式类型与数据类型不匹配导致程序异常

问题

使用两次sscanf()库函数从两个字符串中按照指定的格式读取数据,执行完毕后发现第一个正常读取的数据被篡改。项目在Ubuntu上使用CMake和Ninja构建项目,编译时没有错误和警告。

复现

为方便调试,在keil中编译stm32工程代替,为了更直观,将两个变量放在结构体中,并一字节对齐。伪代码如下:

c 复制代码
char str[] = "15";

#pragma pack(1)
typedef struct{
	uint8_t id;
	uint16_t count;
}attr_t;
#pragma pack()

void test_func(void)
{
	int ret = 0;
	attr_t attr = {0,0x1234};

	printf("&attr.id = %p &attr.count= %p\r\n",&attr.id,&attr.count);
	printf("attr.count = 0x%04X\r\n",attr.count);
	ret = sscanf(str, "%d", &attr.id);
	if (ret != 1) {
		printf("can't parse str\n");
	}
	printf("attr.count = 0x%04X attr.id = %d\r\n",attr.count,attr.id);
	//proc_func(attr.count,attr.id);
}

输出结果如下:

理想情况下count的值应该是0x1234,执行sscanf()函数后的值确实是0x1234,但是在获取id值之后,这个数据就被篡改了。

原因

获取id时,id类型为unsigned char,而%d对应的是int类型,count和id变量相邻,因此被篡改。

更直观的把字符串str改为"123456"。

初始化时:

RAM内容:

获取id后

RAM内容:

串口输出:

123456十六进制为0x01E240,因此count值为0x01E2,id值为0x40(64)。

其他

其实在使用KEIL编译时,上面伪代码会报警告:

使用gcc编译时也会有警告:

因此,应该使用正确的格式来消除警告,同时要确保输入的字符串不能超出变量的取值范围。对于unsigned char

类型,格式可以使用%hhu,同时需要注意输入的字符串范围为0-255,超出范围后同样会导致数据溢出或截断,得到意想不到的结果。

在stm32下,同样是str为"123456",格式改为使用%hhu,此时没有警告,输出结果为:

格式 说明
%d 以十进制形式输入或输出有符号整数
%u 以十进制形式输入或输出无符号整数
%i 根据输入数据的格式自动判断是十进制、八进制还是十六进制整数,并进行相应的转换和存储。
%o 以八进制形式输入或输出无符号整数
%x/%X 以十六进制形式输入或输出无符号整数
%f 以小数形式输入或输出单精度浮点数
%lf 以小数形式输入或输出双精度浮点数
%e/%E 以指数形式输入或输出浮点数
%c 用于输入或输出单个字符
%s 用于输入或输出字符串
%p 以十六进制形式输出指针变量的值
%% 用于输出一个%字符
%n 不输入输出任何数据,而是将到目前为止已读取或输出的字符数存储到对应的变量中。通常用于与其他格式控制符配合使用,获取输入输出的字符数量。

另外还有%hhd表示char,%hhu表示unsigned char,占用一个字节;%hd表示short,%hu表示unsigned short,占用两个字节等特殊表示。

相关推荐
小禾苗_1 小时前
C++ ——继承
开发语言·c++
李长渊哦1 小时前
Java 虚拟机(JVM)方法区详解
java·开发语言·jvm
进击ing小白1 小时前
Qt程序退出相关资源释放问题
开发语言·qt
烂蜻蜓2 小时前
前端已死?什么是前端
开发语言·前端·javascript·vue.js·uni-app
老猿讲编程2 小时前
安全C语言编码规范概述
c语言·开发语言·安全
Biomamba生信基地5 小时前
两天入门R语言,周末开讲
开发语言·r语言·生信
RAN_PAND5 小时前
STL介绍1:vector、pair、string、queue、map
开发语言·c++·算法
Bio Coder5 小时前
R语言安装生物信息数据库包
开发语言·数据库·r语言
Tiger Z5 小时前
R 语言科研绘图第 27 期 --- 密度图-分组
开发语言·程序人生·r语言·贴图