《墨菲定律》读书笔记

书名:《墨菲定律》
作者:张新捷
类型:心理学/管理学通俗读物 / 风险意识


一、核心概念:什么是“墨菲定律”

常见表述是:“如果一件事有变坏的可能,它就可能发生。”
它不是宿命论,而是一种提醒:系统里存在不确定性,人会犯错,环境会变化;因此需要用方法降低失败概率与失败代价。

我更愿意把它理解成:风险管理与反脆弱思维的入门


二、这本书真正想表达的“主题”(我读到的主线)

如果只把墨菲定律理解成“会倒霉”,就太浅了。它更像是在讲三件事:

  1. 世界不是线性的:越复杂的系统,越容易出现意外组合导致的失败
  2. 人不是可靠的组件:疲劳、注意力、沟通误差、习惯性偷懒都会让错误发生
  3. 真正的高手靠系统赢:流程、检查、冗余、自动化、监控、复盘,让失败“更难发生”或“发生也不致命”

一句话总结主题:墨菲定律提醒我们用系统对抗偶然,用设计对抗人性。


三、这本书带来的 3 个关键提醒

1. 不要指望“运气一直站在你这边”

长期来看,偶然会反复出现。真正可靠的是流程、检查、冗余、备份。

2. 复杂系统里,“小概率事件”并不小

当次数足够多、环节足够多,小概率会变成“迟早会发生”。
因此要做的是:识别关键环节,而不是对所有风险平均用力。

3. 最危险的是“自信过度”

经验会带来自信,但也会带来盲区。
越熟练的事情,越容易跳过检查步骤,越容易在关键细节上翻车。


四、把它读“深”:墨菲定律背后的 4 个系统逻辑

1)失败往往来自“链条效应”,不是单点错误

很多事故并非某一步完全错误,而是多个“小问题”叠加:

  • 信息缺失(没人说清楚)
  • 假设不一致(各自以为对方懂)
  • 时间压力(赶进度省步骤)
  • 监控缺失(出事了才发现)

这类链条效应解释了:为什么“平时都没事”,一到关键时刻就翻车。

2)复杂系统里,正确率会相乘(整体会更脆弱)

当一个流程包含很多步骤时,总体成功率会显著下降。
所以解决办法不是“更努力”,而是:

  • 关键路径自动化(减少人为步骤)
  • 关键步骤强约束(校验/审批/双人复核)
  • 关键结果可观测(监控/告警/回滚)

3)风险管理的核心不是“消灭风险”,而是“控制代价”

现实里不可能做到 0 风险,更现实的目标是:

  • 让高风险事情发生概率更低
  • 让事情即便发生,也能快速止损、快速恢复

4)反脆弱:让系统在小故障中变强

如果系统从不暴露问题,往往意味着:

  • 问题被隐藏了
  • 风险在积累

好的系统会通过:演练、压测、灰度、故障注入、复盘等方式,把“未知风险”变成“已知可控”。


五、可落地的方法(我准备直接用)

1)关键任务清单化(Checklist)

适用:上线发布、重要汇报、合同签署、旅行出行、重要考试准备。
做法:把“经验”写进清单,避免靠记忆。

2)预演失败(Premortem)

在行动之前先问一句:
> “假设这件事最终失败了,最可能是什么原因?”

把原因列出来,逐条做防护:补资源、改计划、设兜底。

3)设置冗余与备份

  • 数据:3-2-1 备份原则(至少 3 份、2 种介质、1 份异地)
  • 时间:关键节点预留 buffer
  • 人员:关键岗位可替补

4)降低单点失败

把“只能成功不能失败”的环节拆掉:
例如上线前加回滚方案、灰度发布、监控告警。


六、在工作与生活中的例子(对照理解,更具体一点)

  • 软件发布:一次发布包含几十个步骤,哪怕每步 99% 正确,整体成功率也会下降;用自动化与清单提升稳定性。
  • 沟通协作:信息在传递中丢失,靠“口头约定”很脆弱;用文档、确认、复述降低误差。
  • 健康管理:靠“自律”容易崩;用固定作息、减少诱因、降低决策成本更可靠。

我再补几个更“可执行”的例子:

  • 线上事故
    • 预防:灰度发布、特性开关(feature flag)、回滚脚本
    • 发现:关键指标监控(错误率、延迟、成功率)、告警
    • 处置:应急预案、通讯群、责任人、时间线记录
    • 复盘:根因(技术/流程/沟通)+ 行动项(可验证)
  • 重要汇报/面试
    • 预防:提前彩排、准备备份材料、关键结论写在第一页
    • 兜底:电脑/投屏/文件三套备份,网络不稳就离线版
    • 风险点:最容易出问题的是“临场找文件/临时改 PPT/现场调环境”
  • 旅行出行
    • 预防:证件/电量/充电线/现金/保险
    • 兜底:行程截图离线、备用交通方案、紧急联系人

七、我给自己的“墨菲清单”(10 条)

  1. 重要文件只放一份=迟早会丢。
  2. 关键操作不确认=迟早会点错。
  3. 赶时间不留 buffer=迟早会迟到。
  4. 只靠口头沟通=迟早会误会。
  5. 不做监控告警=迟早会被线上事故教育。
  6. 不复盘=同样的坑会反复踩。
  7. 不做备选方案=一次意外就全盘崩溃。
  8. 忽视小异常=大事故的前兆。
  9. 只看成功案例=会高估自己。
  10. 把希望寄托在运气=不可控。

八、我补充的“工具箱”(模板 + 分级)

1)风险分级:用两维决定投入强度

把风险按两维评估:

  • 发生概率:低 / 中 / 高
  • 影响程度:低 / 中 / 高(钱/时间/声誉/安全)

最值得投入的是:高影响(哪怕低概率)
例如:数据丢失、资金损失、重大线上事故、健康安全。

2)关键流程 Checklist 模板(通用版)

  • 目标是什么?成功标准是什么?
  • 关键步骤有哪些?谁负责?
  • 最可能失败的 3 个点是什么?如何提前防护?
  • 发生问题后怎么止损?(回滚/替代/兜底)
  • 需要哪些备份?(文件/设备/人员/时间)
  • 需要哪些监控?(指标/告警/日志)

3)复盘模板(让系统变强)

  • 发生了什么?(时间线)
  • 影响是什么?(范围、损失、持续时间)
  • 根因是什么?(技术/流程/沟通/认知偏差)
  • 为什么没提前发现?(监控缺失?信号被忽视?)
  • 下次怎么防?(明确行动项 + 负责人 + 截止时间 + 验证方式)

九、评分(主观)

维度 评分
风险意识 ⭐⭐⭐⭐⭐
可操作性 ⭐⭐⭐⭐☆
深度严谨 ⭐⭐⭐☆
可读性 ⭐⭐⭐⭐☆

一句话总结:墨菲定律不是“丧”,而是提醒你:用流程、备份与冗余,把坏事变小、把小事变没。