判断 Python 代码是否由 LLM 生成的几个小技巧

01 注释风格异常

人类开发者通常只在复杂逻辑或关键算法处添加注释，而 AI 则倾向于为每一行代码生成解释，甚至包括基础语法操作。例如，在遍历数组时，人类可能仅标注循环目的，而 AI 生成的代码可能会逐行说明"初始化变量""检查条件""更新索引"等冗余内容。这种注释风格虽然全面，却显得臃肿，缺乏重点。

Python 中单行注释的标准符号是#，但某些 AI 工具（如 DeepSeek）偶尔会使用三引号"""来标注单行注释，这在常规开发中极为罕见。此外，AI 生成的注释可能包含不自然的数学符号或排版，例如在注释中嵌入 LaTeX 风格的公式（如 $a=0$ ），而人类开发者通常不会在简单注释中引入此类复杂格式。

人类编写的注释往往与代码风格一致，语言自然流畅；而 AI 生成的注释可能过于正式，或带有"教科书式"的刻板语气。例如，在解释一个简单函数时，AI 可能使用冗长的学术化描述，而人类更可能用口语化的简短说明。

02 Lambda 表达式的滥用

AI 生成的代码往往对 lambda 的使用缺乏节制，甚至将其强行套用到不合适的复杂逻辑中。

比如递归算法的实现。人类开发者通常会选择使用常规的 def 函数来清晰地表达递归逻辑，而 AI 却可能执着于用 lambda 构造晦涩的嵌套结构。例如，在生成斐波那契数列时，AI 可能会生成如下代码：

python 复制代码

fib = (lambda f: (lambda x: f(f, x)))(lambda self, n: n if n < 2 else self(self, n-1) + self(self, n-2))

这种写法虽然理论上可行，却违背了 lambda 的设计初衷。

AI 生成代码中 lambda 的滥用还体现在其他不必要的场景中。例如，在简单的列表转换或过滤操作中，人类开发者可能直接使用列表推导式，而 AI 却倾向于机械地套用 map() 或 filter() 配合 lambda，导致代码冗余。

03 库的异常使用

Python 社区早已约定俗成将 import 语句统一放置在文件头部，但 AI 生成的代码偶尔会打破这一惯例。我们可能看到库导入语句突兀地出现在函数定义之后，甚至夹杂在代码逻辑中间。

AI 模型倾向于使用功能强大但过度复杂的库来解决简单问题。例如，在只需要基础列表操作时，代码中却出现了不必要的 numpy 数组转换；或者在进行简单数学运算时，引入了 sympy 这样的符号计算库。

04 命名与格式的不一致性

变量命名和代码格式往往能反映出开发者的思维习惯和编程风格。人类编写的代码通常呈现出一种自然的连贯性，而 AI 生成的代码则常常在命名和格式上表现出不一致的特征。

变量命名的过度规范化是一个明显的特征。例如，在实现一个基础的素数筛选算法时，人类可能会使用简洁的变量名如 primes 或 sieve，而 AI 则可能生成 prime_number_candidate_list 或 is_prime_number_flag_array 这样夸张的命名。

AI 生成的代码往往严格遵循 PEP 8 规范到近乎苛刻的程度。例如，在多行表达式对齐、行长度控制等方面表现出不自然的精确性。而在实际开发中，有经验的程序员会根据代码逻辑灵活调整格式，而不是机械套用规范。

05 逻辑漏洞与边界缺失

AI 生成的代码往往在算法选择上表现出知其然而不知其所以然的特性。处理数学问题时，模型可能会机械套用标准解法而忽略具体约束条件。比如在实现模运算相关算法时，代码可能默认输入都是正整数，完全忽视零或负数的处理。

更值得玩味的是那些"似是而非"的逻辑错误。例如在实现排序算法时，可能会看到精心构建却完全错误的递归结构，或者在处理树形数据时出现方向正确的遍历逻辑却搭配错误的终止条件。

人类程序员即使经验不足，在面对明确提示后通常都会考虑输入范围、极端情况等边界问题。而 AI 生成的代码则常常能正确处理常规输入，却在空列表、零值、极大/极小值等边界点上频频出错。