《嵌入式AI筑基笔记02：Python数据类型01，从C的“硬核”到Python的“包容”》

《嵌入式AI筑基笔记02：Python数据类型01，从C的"硬核"到Python的"包容"》

前言

数据类型是编程的基石。Python的数据类型虽灵活，但遵循着可变/不可变、有序/无序两大核心规则。理解它们，就能掌握字符串、列表、元组、字典、集合的精髓。

原文内容过长，为了方便阅读，将内容拆分两篇文章发布，本章主要介绍标量类型。

Python 的数据类型可以分为两大类，核心逻辑是：可变 / 不可变 、有序 / 无序：

基本数据类型（标量类型）：单个值的类型，不可再分

• 数值型：整数 (int)、浮点数 (float)、复数 (complex)

• 布尔型：bool（只有 True/False 两个值）

• 字符串：str（字符的序列）

容器数据类型（复合类型）：可以存储多个值的类型

• 有序容器：列表 (list)、元组 (tuple)、字符串 (str)（字符串本质是字符的有序序列）

• 无序容器：集合 (set)、字典 (dict)

整数(int)

• 无小数部分，可正可负。

• Python 支持任意大小的整数（无位数限制）。

python 复制代码

# 整数 可正可负，无位数限制
a = 4
b = -1000000000000000000000
print(a, type(a))   # 4 <class 'int'>
print(b, type(b))   # -1000000000000000000000 <class 'int'>

C程序员的视角

整数：Python 无位数限制，C 语言有固定范围（如 int 最大 2^31-1）。
大数运算再也不用担心溢出了。

浮点数(float)

• 带小数的数值

• 可能有精度误差

• 示例代码

python 复制代码

# 浮点数 带小数部分，可能有精度限制
f1 = 3.1415926
f2 = -2.3e-3
print(f1, type(f1)) # 3.1415926 <class 'float'>
print(f2, type(f2)) # -0.0023 <class 'float'>

C程序员的视角

浮点数和 C 的 double 类似，精度问题依然存在，比较时要注意。

复数(complex)

• 形如 a + bj 的数（a 是实部，b 是虚部）

• 主要用于科学计算

• 示例代码

python 复制代码

# 复数 (complex)
# 形如 `a + bj` 的数（a 是实部，b 是虚部）
# 主要用于科学计算
comp = 3 + 4j
print(comp, type(comp)) # (3+4j) <class 'complex'>
print(comp.real, type(comp.real))   # 实部 3.0 <class 'float'>
print(comp.imag, type(comp.imag))   # 虚部 4.0 <class 'float'>

C程序员的视角

• C 语言没有原生复数，需要自己定义结构体或使用库。Python 直接内置，科学计算方便很多。

布尔型(bool)

• 只有两个值：True（真，等价于 1）、False（假，等价于 0）

• 主要用于条件判断

• Python 中除了 0、""、[]、{}、None 等空值，其他值都被视为 True

• 示例代码

python 复制代码

# 布尔型 (bool)
# 只有两个值：`True`（真，等价于 1）、`False`（假，等价于 0）
# 主要用于条件判断
# Python 中除了 `0`、`""`、`[]`、`{}`、`None` 等空值，其他值都被视为 `True`
b = True
print(b, type(b))   # True <class 'bool'>
print(b and False, b or False, not b)   # False True False
print(bool([]), bool(None), bool(""))   # False False False

C程序员的视角

• C 语言中布尔值本质是整数（0 假，非 0 真）。Python 的 True/False 是独立类型，但也能参与运算。

• 假值的范围扩大了：除了 0，还有空容器、None 等，写条件判断时要留意。

字符串(str)

特点

• 不可变性 ：字符串创建后，单个字符无法直接修改（如 s[0] = 'A' 会报错），所有修改操作都是生成新字符串。

• 有序性 ：字符按顺序存储，支持索引（取单个字符和切片（取子串）。

• 可拼接 / 重复 ：支持 + 拼接、* 重复操作。

基本操作

• 索引

• 功能：获取单个字符

• 语法：字符串[索引值]

• 规则：正向索引从 0 开始，反向索引从 -1 开始（最后一个字符为 -1）。

• 示例代码

python 复制代码

# 索引
# 使用下标索引
s = "hello"
print(s[1], s[-1])  # 第二个元素和最后一个元素 e o

• 长度

• 功能：获取字符串长度

• 语法：len(字符串)

• 示例代码

python 复制代码

# 长度
# 使用len()
s = "hello"
print(s, len(s)) # hello 5

• 成员

• 功能：判断指定字符是否是字符串的成员

• 语法：'字符' in '字符串'、'字符' not in '字符串'

• 示例代码

python 复制代码

# 成员
s = "hello"
print('1' in s)     # 1 不是 s 的成员    False
print('1' not in s) # 1 不是 s 的成员    True
print('o' in s)     # o 是 s 的成员      True

• 遍历

• 功能：逐个处理字符

• 方法

• 直接遍历字符

• 语法：for char in 字符串:

• 特点：最简洁，最基础

• 通过索引遍历

• 语法：for idx in range(len(字符串)): + 字符串[idx]

• 特点：手动控制索引和步长，灵活度高

• 使用 enumerate () 遍历

• 语法：for idx, char in enumerate(字符串, start=起始索引):

• enumerate() 会返回一个迭代器，每个元素是 (索引, 字符) 的元组；

• start 参数可选，默认从 0 开始，可指定起始索引（如 start=1）。

• 特点：推荐！索引 + 字符一键获取

• 示例代码

python 复制代码

# 遍历
# 直接遍历字符
#特点：最简洁，最基础
s = "hello"
for char in s:
    print(char, end='') # hello
print()

# 通过索引遍历
# 手动控制索引和步长，灵活度高
for i in range(len(s)):
    print(s[i], end='') # hello
print()

# 使用 enumerate () 遍历
# 推荐！索引 + 字符一键获取
for i, char in enumerate(s):
    print(i, char, end='|')  # 0 h|1 e|2 l|3 l|4 o|
print()

• 切片

• 功能：获取子串

• 语法：字符串[起始索引:结束索引:步长]

• 关键规则

• 左闭右开：包含起始索引，不包含结束索引；

• 步长默认 1，步长为负数表示反向切片；

• 起始 / 结束索引可省略（省略起始 = 从开头，省略结束 = 到末尾）。

• 示例代码

python 复制代码

# 切片
# 获取子串
s = "hello"
print(s[1:3])   # 取[1,3)的字符 el
print(s[:2])    # 取[0,2)的字符 he
print(s[2:])    # 取[2,4]的字符 llo
print(s[::2])   # 隔2位取所有字符 hlo
print(s[-4:-2]) # 取[-4,-2)的字符 el
print(s[::-1])  # 反向取所有字符 olleh

• 拼接与重复

• 拼接：+ 连接多个字符串

• 注意：仅能和字符串拼接，其他类型需先转 str

• 重复：* 让字符串重复指定次数。

• 示例代码

python 复制代码

# 拼接和重复
s = "hello"
s1 = ',feng!'
print(s+s1)     # 拼接 hello,feng!
print(s*2)      # 重复 hellohello

判断操作

• 全为大写

• 语法：字符串.isupper()

• 判断是否全为大写字母（返回 bool）

• 全为小写

• 语法：字符串.islower()

• 判断是否全为小写字母（返回 bool）

• 全为字母

• 语法：字符串.isalpha()

• 判断是否全为字母（返回 bool）

• 全为数字

• 语法：字符串.isdigit()

• 判断是否全为数字（返回 bool）

• 全为空格

• 语法：字符串.isspace()

• 判断是否为空格字符串（返回 bool）

• 字母或数字

• 语法：字符串.isalnum()

• 判断是否字母或数字（返回 bool）

• 首字母大写

• 语法：字符串.istitle()

• 判断是否为空格字符串（返回 bool）

• 指定前缀

• 语法：字符串.startswith()

• 判断是否以指定前缀开头（返回 bool）

• 指定后缀

• 语法：字符串.endswith()

• 判断是否以指定后缀结尾（返回 bool）

• 示例代码

python 复制代码

# 判断操作
print("hello".isupper(), "HELLO".isupper()) # 判断全为大写      False True
print("HELLO".islower(), "hello".islower()) # 判断全为小写      False True
print("HE12O".isalpha(), "hello".isalpha()) # 判断全为字母      False True
print("hello".isdigit(), "12345".isdigit()) # 判断全为数字      False True
print("HELLO".isspace(), " ".isspace())     # 判断为空格字符串   False True
print("he_lo".isalnum(), "HE12O".isalnum()) # 判断全为字母或数字 False True
print("hello".istitle(), "Hello".istitle()) # 判断首字母大写    False True
print("hello".startswith("ll"), "HELLO".startswith("HE")) # 判断前缀    False True
print("hello".endswith("ll"), "HELLO".endswith("LO")) # 判断后缀        False True

转换操作

• 转为大写

• 语法：字符串.upper()

• 全部转为大写

• 转为小写

• 语法：字符串.lower()

• 全部转为小写

• 转为整数

• 语法：int(字符串)

• 转为整数，字符串内容必须符合整数的格式，不能包含小数点等字母符号

• 转为浮点数

• 语法：float(字符串)

• 转为浮点数，字符串内容必须符合浮点数的格式

• 首字母大写

• 语法：字符串.title()

• 转为首字母大写，其余小写的格式

• 大小写反转

• 语法：字符串.swapcase()

• 所有字母大写变为小写，小写变为大写

• 示例代码

python 复制代码

# 转换操作
print("hello".upper(), "H12LO".upper()) # 转为大写  HELLO H12LO
print("HELLO".lower(), "hELlo".lower()) # 转为小写  hello hello
print(int("+12343323"), int("-15324"))  # 转为整数  12343323 -15324
print(float("3.141592"),float("-12.3")) # 转为浮点数 3.141592 -12.3
print("HELLO".title(), "heLLo".title()) # 首字母大写 Hello Hello
print("hLo".swapcase(), "HL12O".swapcase()) # 大小写反转 HlO hl12o

对齐操作

• 居中对齐

• 语法：字符串.center(输出字符长度)

• 输出指定字符长度，不足用空格代替，将字符串居中对齐

• 左对齐

• 语法：字符串.ljust(输出字符长度)

• 输出指定字符长度，不足用空格代替，将字符串左对齐

• 右对齐

• 语法：字符串.rjust(输出字符长度)

• 输出指定字符长度，不足用空格代替，将字符串右对齐

• 语法：字符串.zfill(输出字符长度)

• 输出指定字符长度，不足用0代替，将字符串右对齐

• 示例代码

python 复制代码

# 对齐操作
s = "hello"
print(s.center(10)) # 居中对齐 "  hello   "
print(s.ljust(10))  # 左对齐   "hello     "
print(s.rjust(10))  # 右对齐   "     hello"
print(s.zfill(10))  # 靠右补0  "00000hello"

拆分合并

• 拆分

• 语法：字符串.split(分隔符, 次数)

• 按分隔符分割字符串，返回列表；次数指定分割次数（默认全部分割）

• 右侧拆分

• 语法：字符串.rsplit(分隔符, 次数)

• 从右侧开始分割（仅次数生效时区别于 split）

• 按行拆分

• 语法：字符串.splitlines(分隔符, 次数)

• 按行拆分，多空格不合并

• 合并

• 语法：分隔符.join(可迭代对象)

• 将列表 / 元组等可迭代对象的字符串元素，用指定分隔符连接成新字符串

• 示例代码

python 复制代码

# 拆分操作
#  split() : 拆分
s = "hello    seven world"
print(s.split())        # 默认使用空格拆分，多空格合并 ['hello', 'seven', 'world']
print(s.split(' '))     # 指定使用空格拆分, 多空格不合并 ['hello', '', '', '', 'seven', 'world']
print(s.split('lo'))    # 指定使用"lo"拆分 ['hel', '    seven world']
print(s.split('123'))   # 指定使用"123"拆分，未找到，不分割 ['hello    seven world']

print(s.rsplit(maxsplit=1)) # 从右开始按空格拆分1次， ['hello    seven', 'world']

# splitlines(): 按行拆分
s ='''hello  
seven
world'''
print(s.splitlines())   # 按行拆分，多空格不合并 ['hello  ', 'seven', 'world']
print(s.split('\n'))    # 按行拆分，多空格不合并 ['hello  ', 'seven', 'world']

# 合并: join : 会得到字符串类型
# join 将列表中的字符串拼接
s = ['hello', 'world', 'seven']
print('\n'.join(s)) # 以换行符合并字符串 hello\nworld\nseven
print('\t'.join(s)) # 以制表符合并字符串 hello    world    seven
print(''.join(s))   # 直接合并字符串 helloworldseven

查找替换

• 统计次数

• 语法：字符串.count(子串)

• 统计子串出现的次数

• 查找子串

• 语法：字符串.find(子串)

• 查找子串首次出现的索引，找不到返回 -1（不报错）

• 语法：rfind()

• 从右向左查找，查找子串首次出现的索引，找不到返回 -1（不报错）

• 语法：字符串.index(子串)

• 查找子串首次出现的索引，找不到报错（区别于 find）

• 替换

• 语法：字符串.replace(旧子串, 新子串, 次数)

• 替换子串，可指定替换次数（默认全部替换）

• 去除

• 语法：字符串.strip(字符)

• 去除首尾指定字符（默认去除空格 / 换行 / 制表符）

• 语法：字符串.lstrip(字符)

• 去除左侧指定字符（默认去除空格 / 换行 / 制表符）

• 语法：字符串.rstrip(字符)

• 去除右侧指定字符（默认去除空格 / 换行 / 制表符）

• 示例代码

python 复制代码

# 查找和替换
# count(): 统计字符出现个数
s = "hello hello"
print(s.count('l'))     # 'l' 出现次数 4
print(s.count('e'))     # 'e' 出现次数 2
print(s.count('ll'))    # 'll' 出现次数 2
print(s.count('e', 5, 10) ) # [5, 10)中'e'出现次数   1

# find()/rfind(): 查找指定子串第一次出现的下标位置,如果不存在则返回-1
s = "124 hello world hello 1234"
print(s.find('hello'))  # 4
print(s.rfind('l'))     # 从右向左查找 19
print(s.rfind('x'))     # 不存在 -1

# index(): 查找子串首次出现的索引，找不到报错（区别于 find）
s = "124 hello world hello 1234"
print(s.index('hello'))  # 4

# 替换: replace() : 默认替换所有匹配的字符
s = 'hello world seven'
print(s.replace('l', 'm'))  # 将'l'替换成'm'        hemmo wormd seven
print(s.replace('l', 'nn')) # 将'l'替换成'nn'       hennnno wornnd seven
print(s.replace('x', '2'))  # 将'x'替换成'2',未找到  hello world seven

# strip() : 去除两边的指定字符(默认去除空格) (了解)
s = ' --hello   feng--   seven--  '
print(s.strip())        # 去掉两边空格    "--hello   feng--   seven--"
print(s.strip(' -'))    # 去掉两边空格和- "hello   feng--   seven"
print(s.lstrip())       # 去掉左边空格    "--hello   feng--   seven--  "
print(s.rstrip())       # 去掉右边空格    " --hello   feng--   seven--"

编码解码

• 编码

• 语法：字符串.encode(编码格式) → 转字节（bytes）

• 常用编码：utf-8（通用）、gbk（中文 Windows）

• 将字符串转换成二进制

• 解码

• 语法：字符串.decode(编码格式) → 转字符串

• 常用编码：utf-8（通用）、gbk（中文 Windows）

• 将二进制转换成字符串

• 示例代码

python 复制代码

# 编码解码
#  编码: encode() 将 字符串 => 二进制
#  解码: decode() 将 二进制 => 字符串
s = "hello 你好"
b = s.encode("utf-8")  # 编码，使用"utf-8"  b'hello \xe4\xbd\xa0\xe5\xa5\xbd'
b1 = s.encode("gbk")   # 编码，使用"gbk"    b'hello \xc4\xe3\xba\xc3'
print(b)
print(b1)
x = b.decode("utf-8")  # 解码，使用"utf-8"  hello 你好
x1 = b1.decode("gbk")  # 解码，使用"gbk"    hello 你好
print(x)
print(x1)

总结

本章仅介绍标量类型，想获取容器数据类型及完整代码内容，请参考《嵌入式AI筑基笔记02：Python数据类型02，从C的"硬核"到Python的"包容"》。