练习与幂律
在广泛的技能范围内——打字、阅读、解决算术问题、装配设备——性能改进遵循幂律:
y = a · x^(−b)
其中y =每次试验的错误数(或每次试验的时间),x =累计练习试验次数,a =初始性能水平,b =学习率指数(b > 0表示改进)。
幂律具有一个简洁的性质:在对数-对数空间中,它变成一条直线。
ln y = ln a − b · ln x
对数-对数空间中直线的斜率:−b。斜率越陡,学习越快。无论初始性能水平a如何,相同的指数b都描述学习率。
为什么是对数-对数? 早期练习产生很大的进步;后期练习产生收益递减。线性图显示急剧的初期下降,然后是平坦的尾部。对数-对数揭示自相似结构:每次练习加倍都会使错误减少相同的比例2^(−b)。
计算学习率
如果学习者在第1次试验中犯100个错误,在第8次试验中犯50个错误,b是多少?
y₁ = a · 1^(−b) = a = 100
y₈ = a · 8^(−b) = 100 · 8^(−b) = 50
8^(−b) = 0.5 → −b · ln(8) = ln(0.5) = −0.693 → b = 0.693 / ln(8) = 0.693 / 2.079 ≈ 0.333
艾宾浩斯与指数遗忘
赫尔曼·艾宾浩斯(1885)测量了他自己对无意义音节随时间的保留情况,发现保留遵循指数衰减:
r(t) = e^(−t/S)
其中r(t) =在时间t处保留的比例,S =记忆强度(随每次复习而增加)。在t = 0时:r = 1(100%保留)。在t = S时:r = 1/e ≈ 37%。
间隔效应: 在即将遗忘的时刻(当r ≈ 0.8或更低时)复习材料会产生比学习后立即复习更大的S增长。
最优复习时间:如果S在每次复习时增长固定系数k,最优间隔形成几何序列。学习后具有S₀,在时间S₀、k·S₀、k²·S₀……复习。每个间隔是前一个的k倍。
来自经验数据的典型k值:2.0–2.5。在第1、2、4、8、16天进行复习的学生遵循这种几何间隔模式。
计算最优复习间隔
学生学习材料时初始记忆强度S₀ = 2天。每次复习将S乘以k = 2.5。学生在保留率下降到80%时复习(r ≥ 0.80阈值)。
在阈值处:e^(−t/S) = 0.80,所以t = −S · ln(0.80) ≈ S · 0.223。
课程作为图
分支程序定义了有向图G = (V, E),其中:
- 顶点V:教学节点(内容块、问题、反馈)
- 边E:由学生反应分类标记的转移(正确、部分、不正确、澄清)
每个学生从入口顶点追踪通过G的路径到出口顶点。路径完全取决于每个步骤处哪些边激活。
图结构决定的性质:
1. 可达性: 从入口可以到达每个顶点吗?不可达的顶点是死内容——学生永远看不到它。
2. 循环检测: 图是否包含循环?循环意味着学生可以无限循环。自适应程序故意使用循环(重试循环),但必须保证最终退出(强制进度的max-attempts边)。
3. 路径长度分布: 典型学生要走多少步?好的分支程序让高级学生走短路径;苦恼的学生走更长的补救路径。
分析分支程序的性质
考虑一个有5个问题节点(Q1–Q5)和3个补救节点(R1–R3)的分支程序。高级学生路径:Q1 → Q2 → Q3 → Q4 → Q5。苦恼的学生路径:Q1 → R1 → Q1 → Q2 → R2 → Q2 → Q3 → Q4 → Q5。
图通过max-attempts边保证进度:在任何Qn处失败3次后,学生无论性能如何都前进到Qn+1。