用结构化思维解一切BUG(1):核心思路

面对万"卷"世界,有人选择拼命学习新技术,解决眼前的、点状问题;有人提升思维层级,解决未来的、系统问题。您选择什么?

背景

我有10多年编程经验和研发管理经历,虽很久不写代码,但有很多人找我咨询技术问题,解决程序 BUG。因为不管多么千奇百怪的技术栈,我都能帮到他们,或直接给出解题思路,或帮他们精准定位问题。

在很多具体的技术点上(比如SQLServer、Kubernetes上),我都算不上资深专家,但我总能帮这些资深专家快速解决 BUG。为什么呢?

回答这个问题之前,我们要分清「诊断」和「治疗」。「诊断」需要的是结构化思维,只要您理解计算机运行原理,对现代应用的组成有基本认知,您就可以用「假设树」和「主动试验」来逐步缩小范围,最终确定「病因」。但「治疗」,需要把想法实现,需要具体的技术知识。

很多程序员在具体技术上很精通,但在需要平移或扩展到其它类似技术时,往往捉襟见肘。这导致,为了自己的维持竞争力,需要拼命的学习新的技术栈。很累,却效果不好。

本系列文章不介绍具体的技术,而介绍一种「程序诊断」的思维框架,是「性价比」更高的「通项公式」,可以跨场景解决任何问题,可以终生受益!

核心思路:做实验→造现象→缩范围

本「程序诊断」的核心思路就是依赖于「假设树」,通过重复多次执行「做实验→造现象→缩范围」动作序列,逐级下钻,缩小问题范围,直到「执行者」可以接管的程度(通常是一个服务/模块/函数)。如下图所示:

其基本逻辑是:

  1. 面对现象,先从宏观去判断第一层级的「可能的原因」,即原因所在的大类。当我们判断了第一层级的原因,我们就把问题范围缩小了。
  2. 假设确定原因大类为「可能的原因2」,接下来在更小的范围中,我们需要进一步确定更具体的原因,是 2-1 还是 2-2 还是 2-3。
  3. 如果当前现象没有提供充分的证据来帮我们进一步缩小范围,则我们需要主动做试验,来创造更多现象,以支撑我们缩小范围。
  4. 重复上面三个步骤,直到把范围缩小到执行者可以解决的程度。

在软件领域,前几层的「假设树」一般有大致的套路。以一个 Web 应用为例,其前几层「假设树」通常可参考下图制作。

我们面对一个现象时,通常先判断是前端原因还是后端原因。

假设是前端原因,我们再判断,是运行问题(代码问题)、数据问题、网络问题、还是运行环境问题。展开来说:

  1. 如果近期发布过新版本,则有很大概率是运行问题(代码问题)。
  2. 如果排除了代码问题,并且 BUG 只有某些固定用户出现,或只跟某些固定的实体(比如商品、流程)相关,那么大概率是数据问题。
  3. 如果排除了以上两者,并且 BUG 只有某些固定用户出现,则可以检查一下这些用户的浏览器(品牌和版本)是否一样,以确定是否浏览器问题。
  4. 如果排除了以上三者,并且 BUG 跟用户所在的网络环境有很大关系,则可以检查下网络。

再往后,以此类推。

请注意,「假设树」没有标准答案,以上只是 Web 应用的「假设树」的「一种」拆分方法。面对不同的软件应用场景、不同的现象,你可能需要绘制自己的「假设树」。这个绘制不难,只要懂得计算机的基本运行原理和现代应用的基本组成部分,利用机构化拆解问题的基本方法,即可绘制。

**从第一性原理来讲,一个应用本质就是「处理」「数据」的程序。出现问题,要么是处理逻辑发生了改变(一般是代码导致),要么是数据发生了改变。**如果我们能保证代码没改变(通过发布的版本号或者 Git 提交号来判断),那么一定是数据发生了改变。假设确定了是数据的问题,我们可以继续列举原因,可能是环境配置的数据、数据库的数据、缓存的数据、其它微服务传递过来的数据、前端传递过来的数据、时间等。这样,就可以继续往下钻。

实践原则:程序断案三字经

通过上面的介绍,您大概已经知道了核心思路。但到实际使用,还需要一些操作原则来帮助。我把他们总结成「程序断案三字经」:

  1. 先诊断,后开药。
  2. 信机器,勿信人。
  3. 做试验,缩范围。
  4. 先脆弱,后稳定。
  5. 找不同,看变化。

篇幅原因,本文不展开介绍这些实践原则,请关注本系列后续文章,我将深度讲解实践原则和典型案例。

总结

面对万"卷"世界,有人选择拼命学习新技术,解决眼前的、点状问题;有人提升思维层级,解决未来的、面状问题。您选择什么?

关于作者

您好,朋友。我现就职于西门子工业软件,担任高级咨询顾问。成功领导 10 多个世界 500 强企业的数字化转型项目,跨越政府、零售、金融、汽车制造、生物医药等多个行业,创造巨大商业价值。

如有任何与「数字化转型」有关的问题,欢迎用以下方式与我交流:

  1. 添加我的个人微信「zjh1943」。添加时请注明姓名、行业、交流的问题。

  2. 关注我的微信公众号「知明所以」。

  3. 关注我的知乎专栏:https://www.zhihu.com/people/zhu-jin-heng

相关推荐
程序员鱼皮4 天前
我干了两个月的大项目,开源了!
计算机·程序员·软件开发·代码·自学编程
guanpinkeji7 天前
解锁“搭子小程序”开发新机遇,助力企业数字化转型
小程序·软件开发·app开发·小程序开发·小程序制作·搭子小程序·搭子
guanpinkeji7 天前
AI数字人小程序:解锁个性化智能交互体验
大数据·人工智能·小程序·软件开发·小程序开发
万岳软件开发小城11 天前
校园食堂供应链管理的智能化:食堂采购系统源码开发详解
php·软件开发·食堂采购系统源码·供应链管理平台
华为云开发者联盟24 天前
读懂华为开发者空间第一课,让云上开发如此简单
python·鸿蒙·codearts·软件开发·昇腾·云主机
程序员鱼皮1 个月前
第一次参加实习,我祛魅了!
后端·计算机·互联网·软件开发·求职·代码·编程经验
Amd7941 个月前
PostgreSQL 的历史
postgresql·开源软件·计算机科学·软件开发·关系型数据库·数据库技术·数据库历史
华为云PaaS服务小智1 个月前
华为云云原生中间件DCS & DMS 通过中国信通院与全球IPv6测试中心双重能力检测
华为云·软件开发·分布式缓存·分布式消息
guanpinkeji2 个月前
上门服务小程序开发,打造便捷生活新体验
开发语言·小程序·生活·软件开发·小程序开发·上门服务系统·上门服务小程序
kuankeTech2 个月前
解读外贸制单软件:功能全面,操作便捷
大数据·产品运营·运维开发·软件开发·erp