un — 模拟 II：为什么任何人都应该相信它？

un

访客

1 / ?

返回课程列表

中心问题

汉明以一句来自 1975 年夏季计算机模拟会议的直接引用开启了第 19 章：

> 由于重要决策必须依赖模拟，必须对其有效性进行测试，并且其倡导者必须能够描述他们所达到的真实代表的水平。

他对同一问题更锐利的表述：

> 为什么任何人都应该相信这个模拟是相关的？

在认真思考这个问题之前，不要开始模拟。经常会有立即开始计算的实际压力——时间、金钱、组织动力。这些压力不会改变问题。

汉明的经历：当他对模拟提出有效性问题时，答案总是引用：

- 有多少人力投入到这项工作中

- 计算机有多大和多快

- 问题有多重要

这些答案都没有解决有效性。它们是社会论证，而不是技术论证。

太空飞行故事：一位模拟主任声称发射的可靠性为 99.44%。汉明追问：什么的可靠性？被逼到绝境后，主任承认他的数字是模拟的可靠性，而不是实际飞行的可靠性。他进一步承认批准发射的美国宇航局主任没有理解这个区别——他也没有纠正这个误解。

将模拟可靠性与系统可靠性混为一谈是工程实践中最危险的错误之一。

有效性验证的实际要求

汉明编制了一份用于评估模拟可靠性的清单。在模拟输出获得决策权重之前，必须回答每个问题：

1. 背景理论是否支持假定的定律？ 物理模拟基于已验证的方程；经济模拟通常不是这样。

2. 是否可能缺少小但至关重要的效应？ 飞行员培训师示例：对于已知物理学很好；如果新飞机有尚未纳入的相互作用，则很危险。

3. 输入数据是否可靠？ 输入中的不确定性通过计算传播。了解数据来自哪里。

4. 模拟是稳定还是不稳定？ 不稳定的方向场放大输入错误；稳定的则抑制它们。

5. 对已知过去经验有哪些交叉检查？

6. 能否进行内部检查？ 质量、能量、角动量或其他不变量的守恒。没有冗余，就不可能进行错误检测。

7. 纸上的标记是否准确地进入机器？ 编程错误在生产代码中持续数年。一个将反应描述自动转换为微分方程的自动化读卡器——汉明对大气化学模拟的解决方案——减少了转录错误，而不依赖人工警惕。

在模拟被用于做出重大工程或政策决策之前，你被要求审查它。使用汉明的清单，确定你会优先考虑的两个验证问题，并解释为什么这两个问题对于捕捉最危险的错误类别最关键。

汉明的经济学定律

物理模拟基于已验证的、数学上表达的定律。化学模拟需要已验证的速率常数。生物学模拟需要已知的种群动态。

根据汉明的观点，经济学有一个可靠的定律：你不能消耗未生产的东西。其他任何声称的经济定律要么是数学重言式，要么有时是错误的。

对模拟的含义：当背景定律不可靠地成立时，整个模拟的基础都是可疑的。计算中的高精度不能弥补模型中不可靠的定律。

汉明被要求运行生态模拟时的反应：他要求为每个相互作用进行数学上表达的规则，带有数值常数，以及真实数据来比较测试运行。请求者很快就找到了一个更愿意运行"非常可疑的模拟来给出他们想要的结果"的人。

汉明的规则： 保持你的完整性。不要让自己被用于其他人的宣传。拒绝在结构上设计以确认结论的模拟。

模拟数据中的辛普森悖论

汉明的伯克利故事：被研究生院接受的男性比女性多，这表明了歧视。没有一个单独的部门显示歧视。解释：女性不成比例地申请到低录取率的部门；男性不成比例地申请到高录取率的部门。总体统计是真实的，但具有误导性。

这就是辛普森悖论：合并数据可以创建在任何子组中都不存在的明显效应。汇总群体、地区或时间段的模拟输出可以展现相同的病态。

改变其模型对象的模拟

一种特殊的模拟失败类别：对象改变其对模型的响应行为。

股票市场示例：如果一个广为人知的交易策略可靠地产生高于市场的回报，参与者将采用它，竞争将消除超额回报。模型的成功摧毁了模型的有效性。

医学示例：双盲实验存在是因为知道哪些患者接受了治疗以及哪些患者接受了安慰剂的医生在他们期望的地方找到了改善。医生的知识污染了观察。

高风险决策的模拟——经济政策、军事规划、公共卫生——当模拟的输出被公开或指导行为时，面临这个问题。

汉明写道：'非常认真地说，许多模拟只不过是罗夏测试。'他指的是杰伊·弗雷斯特的承认，他在假设和系统行为之间重复循环，直到模型产生他想要的结果。什么科学实践的具体保障被设计来防止这一类自我证实的模拟，为什么这个保障很难在模拟工作中应用？

采样与精度

奈奎斯特定理对连续系统的数字模拟设定了基本约束：信号中最高频率的每个周期至少需要两个样本。

实际上，汉明指出，单边采样和混叠将要求推入到最高频率的每个周期的七到十个样本，这是感兴趣的。

精度权衡： 模拟计算机（在汉明的时代）每个分量最多达到 1:10,000 的精度。数字计算机可以进行任意精度计算。但数字精度需要充分的采样——对于具有尖锐高频内容的信号，该采样率驱动计算成本。

模拟优势： 速度和物理集成。你可以将物理分量直接连接到模拟电路中并测量其行为，而无需找到其数学描述。对于早期的导弹制导设计，这允许在完整的数学模型存在之前快速了解系统。

用于早期导弹工作的模拟机器源自 M9 枪枝指挥官零件。汉明从这样的设备中构建了一个微分分析器。求解时间：每条轨迹约 30 分钟。那个节奏强制在运行之间进行深思考——汉明开始将其视为结构优势的约束。

感觉与精度：火星着陆器问题

汉明提出了一个尖锐的设计问题：对于火星着陆器飞行培训师，模拟应该优化位置精度还是感觉？

古典数值分析使用局部多项式近似优化位置轨迹。路径是精确的，但加速度在每个多项式区间处不连续变化——一个不自然的感觉。

频率域方法优化模拟器的频率响应。位置可能不太精确，但飞行员感知车辆的动态响应是正确的。飞行员的肌肉记忆在正确的传递函数上形成。

汉明的判断： 飞行员培训师应该优化感觉。在实际飞行中，飞行员可以通过反馈控制来补偿位置错误。如果感觉是错误的，飞行员已经为一个不存在的车辆进行了培训。

更深层的原则：数值方法的选择编码了关于模拟用途的声明。这个声明是一个领域判断，而不是数学判断。

古典数值分析与火星着陆器模拟的频率域方法之间的辩论说明了汉明更广泛的声明：模拟方法的选择编码了关于模拟用途的隐含声明。从你的领域选择一个模拟。标准数值方法隐含声称什么最重要？对于模拟将支持的决策，那个声明是否正确？