Skip to content

Commit 0608eb0

Browse files
committed
[mle] Update Translation
Updated translation of mle.
1 parent ba125f1 commit 0608eb0

File tree

1 file changed

+54
-55
lines changed

1 file changed

+54
-55
lines changed

lectures/mle.md

Lines changed: 54 additions & 55 deletions
Original file line numberDiff line numberDiff line change
@@ -115,7 +115,7 @@ plt.legend()
115115
plt.show()
116116
```
117117

118-
该直方图显示,大部分人的财富水平非常低,而少部分人却拥有非常多的财富。
118+
该直方图显示,大部分人的财富水平很低,而少部分人却拥有非常多的财富。
119119

120120
我们假定全体人口规模为
121121

@@ -141,18 +141,18 @@ $$ (eq:est_rev)
141141
142142
## 最大似然估计
143143
144-
[最大似然估计](https://en.wikipedia.org/wiki/Maximum_likelihood_estimation) 是一种估计未知分布的方法。
144+
[最大似然估计](https://baike.baidu.com/item/最大似然估计/4967925) 是一种估计未知分布的方法。
145145
146146
最大似然估计有两个步骤:
147147
148-
1. 猜测潜在分布是什么(例如,正态分布,均值为 $\mu$,标准差为 $\sigma$)。
148+
1. 猜测潜在分布是什么(例如,均值为 $\mu$,标准差为 $\sigma$ 的正态分布)。
149149
2. 估计参数值(例如,估计正态分布的 $\mu$ 和 $\sigma$)。
150150
151-
对于财富,一个可能的假设是每个 $w_i$ 都是[对数正态分布](https://en.wikipedia.org/wiki/Log-normal_distribution)的,参数 $\mu$ 在 $(-\infty, \infty)$ 范围内,$\sigma$ 在 $(0, \infty)$ 范围内
151+
对于财富而言,一种假设是每个 $w_i$ 都符合[对数正态分布](https://baike.baidu.com/item/对数正态分布/8976782)的,其中参数 $\mu \in (-\infty, \infty)$,$\sigma \in (0, \infty)$。
152152
153153
(这意味着 $\ln w_i$ 是以 $\mu$ 为均值,$\sigma$ 为标准差的正态分布。)
154154
155-
你可以看到这个假设不是完全没有道理,因为如果我们对财富的对数进行直方图表示而不是财富本身,图片开始看起来像一个钟形曲线
155+
不难发现,这个假设不是完全没有道理,因为如果我们用直方图表示财富的对数(而不是财富本身),直方图将看起来像一个钟形曲线
156156
157157
```{code-cell} ipython3
158158
ln_sample = np.log(sample)
@@ -161,9 +161,9 @@ ax.hist(ln_sample, density=True, bins=200, histtype='stepfilled', alpha=0.8)
161161
plt.show()
162162
```
163163
164-
现在我们的任务是获取 $\mu$ 和 $\sigma$ 的最大似然估计,我们用 $\hat{\mu}$ 和 $\hat{\sigma}$ 表示。
164+
我们现在的任务是获取 $\mu$ 和 $\sigma$ 的最大似然估计值,我们用 $\hat{\mu}$ 和 $\hat{\sigma}$ 表示。
165165
166-
这些估计值可以通过最大化给定数据的似然函数找到
166+
这些估计值可以通过最大化给定数据的似然函数获得
167167
168168
对数正态分布随机变量 $X$ 的概率密度函数 (pdf) 如下:
169169
@@ -173,18 +173,18 @@ $$
173173
\exp\left(-\frac{1}{2}\left(\frac{\ln x-\mu}{\sigma}\right)^2\right)
174174
$$
175175
176-
对于我们的样本 $w_1, w_2, \cdots, w_n$,[似然函数](https://en.wikipedia.org/wiki/Likelihood_function)定义为
176+
对于我们的样本 $w_1, w_2, \cdots, w_n$,[似然函数](https://baike.baidu.com/item/似然函数/6011241)是
177177
178178
$$
179179
L(\mu, \sigma | w_i) = \prod_{i=1}^{n} f(w_i, \mu, \sigma)
180180
$$
181181
182182
似然函数可以被视为:
183183
184-
* 样本的联合分布(假设是独立同分布)
184+
* 样本(假设是独立同分布)的联合分布和
185185
* 给定数据的参数 $(\mu, \sigma)$ 的“似然性”。
186186
187-
对两边取对数,我们得到对数似然函数,如下所示
187+
对两边取对数,我们得到对数似然函数:
188188
189189
$$
190190
\begin{aligned}
@@ -196,9 +196,9 @@ $$
196196
\end{aligned}
197197
$$
198198
199-
为了找到这个函数的最大值,我们计算关于 $\mu$ 和 $\sigma ^2$ 的偏导数,并将它们设为 $0$.
199+
要找到这个函数的最大值,我们需要计算对 $\mu$ 和 $\sigma ^2$ 的偏导数,并令结果为 $0$.
200200
201-
让我们首先找到 $\mu$ 的最大似然估计(MLE)
201+
我们首先推导 $\mu$ 的最大似然估计(MLE)
202202
203203
$$
204204
\frac{\delta \ell}{\delta \mu}
@@ -207,7 +207,7 @@ $$
207207
\implies \hat{\mu} = \frac{\sum_{i=1}^n \ln w_i}{n}
208208
$$
209209
210-
现在让我们找到 $\sigma$ 的MLE
210+
现在让我们推导 $\sigma$ 的最大似然估计
211211
212212
$$
213213
\frac{\delta \ell}{\delta \sigma^2}
@@ -219,21 +219,20 @@ $$
219219
\left( \frac{\sum_{i=1}^{n}(\ln w_i - \hat{\mu})^2}{n} \right)^{1/2}
220220
$$
221221
222-
现在我们已经推导出 $\hat{\mu}$ 和 $\hat{\sigma}$ 的表达式,
223-
让我们为我们的财富样本计算它们。
222+
至此我们已经推导出 $\hat{\mu}$ 和 $\hat{\sigma}$ 的表达式,现在要通过财富样本计算具体数值。
224223
225224
```{code-cell} ipython3
226225
μ_hat = np.mean(ln_sample) # 计算 μ 的估计值
227226
μ_hat
228227
```
229228
230229
```{code-cell} ipython3
231-
num = (ln_sample - μ_hat)**2 # 计算方差的分子部分
230+
num = (ln_sample - μ_hat)**2 # 计算方差的分子
232231
σ_hat = (np.mean(num))**(1/2) # 计算 σ 的估计值
233232
σ_hat
234233
```
235234
236-
我们来绘制使用估计参数的对数正态分布概率密度函数,并与我们的样本数据进行对比
235+
我们绘制对数正态分布概率密度函数(使用估计的参数),并与样本数据进行对比
237236
238237
```{code-cell} ipython3
239238
dist_lognorm = lognorm(σ_hat, scale = exp(μ_hat)) # 初始化对数正态分布
@@ -248,11 +247,11 @@ ax.legend() # 显示图例
248247
plt.show() # 展示图形
249248
```
250249
251-
我们的估计的对数正态分布看起来很适合整体数据
250+
我们估计的对数正态分布看起来很适合整体数据
252251
253252
我们现在使用方程{eq}`eq:est_rev`来计算总收入。
254253
255-
我们将通过 **SciPy** 的 [quad](https://docs.scipy.org/doc/scipy/reference/generated/scipy.integrate.quad.html) 函数使用数值积分计算
254+
我们将通过 **SciPy** 的 [quad](https://docs.scipy.org/doc/scipy/reference/generated/scipy.integrate.quad.html) 函数,使用数值积分的方式计算积分。
256255
257256
```{code-cell} ipython3
258257
def total_revenue(dist):
@@ -266,25 +265,25 @@ tr_lognorm = total_revenue(dist_lognorm) # 使用对数正态分布计算总收
266265
tr_lognorm # 显示总收入
267266
```
268267
269-
(我们的单位是10万美元,所以这意味着实际收入是10万倍。)
268+
(我们的单位是10万美元,这意味着实际收入是这一数字的10万倍。)
270269
271270
## 帕累托分布
272271
273-
如上所述,使用最大似然估计时需要我们假定一个先验的底层分布
272+
如上所示,使用最大似然估计时,我们需要先对分布做出假设
274273
275-
之前我们假定这个分布是对数正态分布
274+
刚才我们假定这个分布是对数正态分布
276275
277-
假设我们改为假设 $w_i$ 来自具有参数 $b$ 和 $x_m$ 的[帕累托分布](https://en.wikipedia.org/wiki/Pareto_distribution)。
276+
如果,我们改为假设 $w_i$ 抽样自参数为 $b$ 和 $x_m$ 的[帕累托分布](https://baike.baidu.com/item/帕累托分布/3344172)。
278277
279-
在这种情况下,最大似然估计已知为
278+
在这种情况下,最大似然估计为
280279
281280
$$
282281
\hat{b} = \frac{n}{\sum_{i=1}^{n} \ln (w_i/\hat{x_m})}
283282
\quad \text{和} \quad
284283
\hat{x}_m = \min_{i} w_i
285284
$$
286285
287-
我们来计算它们。
286+
下面,我们来计算它们。
288287
289288
```{code-cell} ipython3
290289
xm_hat = min(sample)
@@ -305,15 +304,15 @@ tr_pareto = total_revenue(dist_pareto)
305304
tr_pareto
306305
```
307306
308-
这个数字差距很大
307+
这个数字差别很大
309308
310309
```{code-cell} ipython3
311310
tr_pareto / tr_lognorm
312311
```
313312
314-
我们看到选择正确的分布非常重要
313+
可见,选择正确的分布极其重要
315314
316-
让我们将拟合的帕累托分布与直方图进行比较
315+
我们将拟合的帕累托分布与直方图进行比较
317316
318317
```{code-cell} ipython3
319318
fig, ax = plt.subplots()
@@ -327,21 +326,21 @@ ax.legend()
327326
plt.show()
328327
```
329328
330-
我们观察到在这种情况下,帕累托分布的拟合效果并不好,所以我们可能会拒绝它
329+
我们观察到在这种情况下,帕累托分布的拟合效果并不理想,所以我们很可能会拒绝这一假设
331330
332-
## 什么是最好的分布
331+
## 最好的分布是怎样的
333332
334-
没有“最好”的分布——我们做出的每一个选择都是一种假设
333+
没有“最好”的分布——我们做出的每一个选择,都只是一种假设
335334
336-
我们能做的就是尝试选择一个能很好地拟合数据的分布
335+
我们唯一能做的,就是不断尝试,选择一个能很好拟合数据的分布
337336
338337
上面的图表表明,对数正态分布是最佳的。
339338
340-
然而,当我们检查上尾部(最富有的人)时,帕累托分布可能是一个更好的选择。
339+
然而,当我们检查右尾部(最富有的人)时,帕累托分布可能是一个更好的选择。
341340
342-
为了查看这一点,现在让我们设定一个数据集中的净资产最低阈值
341+
要看清楚这一点,让我们设定数据集中净资产最低阈值
343342
344-
我们设定一个任意阈值为 $500,000,并将数据读入 `sample_tail`。
343+
我们不妨设定阈值为 $500,000,并将数据读入 `sample_tail`。
345344
346345
```{code-cell} ipython3
347346
:tags: [hide-input]
@@ -353,7 +352,7 @@ rv_tail = rv_tail.to_numpy()
353352
sample_tail = rv_tail/500_000
354353
```
355354
356-
让我们绘制这些数据
355+
接下来,绘制这些数据
357356
358357
```{code-cell} ipython3
359358
fig, ax = plt.subplots()
@@ -362,13 +361,13 @@ ax.hist(sample_tail, density=True, bins=500, histtype='stepfilled', alpha=0.8)
362361
plt.show()
363362
```
364363
365-
现在让我们尝试对这些数据拟合一些分布
364+
现在,我们尝试用不同的分布来拟合数据
366365
367-
### 对数正态分布和右尾部
366+
### 用对数正态分布拟合右尾部
368367
369-
让我们从对数正态分布开始
368+
让我们从对数正态分布开始
370369
371-
我们再次估计参数并将密度与我们的数据进行对比
370+
我们重新估计参数并绘制概率密度函数,与数据进行对比
372371
373372
```{code-cell} ipython3
374373
ln_sample_tail = np.log(sample_tail)
@@ -386,13 +385,13 @@ plt.show()
386385
```
387386
388387
虽然对数正态分布对整个数据集拟合良好,
389-
但它并不适合右尾部
388+
但它对于右尾部的拟合效果并不好
390389
391-
### 帕累托分布用于右尾部
390+
### 用帕累托分布拟合右尾部
392391
393-
现在假设截断数据集符合帕累托分布
392+
现在假设截取的数据集符合帕累托分布
394393
395-
我们再次估计参数,并将密度与我们的数据进行对比
394+
我们再次估计参数,并将概率密度函数与数据进行对比
396395
397396
```{code-cell} ipython3
398397
xm_hat_tail = min(sample_tail)
@@ -408,26 +407,26 @@ ax.plot(x, dist_pareto_tail.pdf(x), 'k-', lw=0.5, label='帕累托分布pdf')
408407
plt.show()
409408
```
410409
411-
帕累托分布更适合我们数据集的右尾部
410+
帕累托分布更适合数据集的右尾部
412411
413-
### 那么什么是最佳分布
412+
### 到底什么才是最好的分布
414413
415-
如上所述,没有“最佳”分布——每个选择都是一个假设
414+
如刚才所言,没有“最好”的分布——每个选择都只是一种假设
416415
417-
我们只需要测试我们认为合理的分布
416+
我们只需要检验我们认为合理的分布
418417
419-
一种测试方法是将数据与拟合分布进行绘图,正如我们所做的
418+
一种检验方法是,将数据与拟合分布进行绘图,如我们刚才所做的
420419
421-
还有其他更严格的测试方法,比如[科尔莫哥洛夫-斯米尔诺夫检验](https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test)。
420+
还有其他更严谨的测试方法,比如[科尔莫哥洛夫-斯米尔诺夫检验](https://baike.baidu.com/item/科尔莫格罗夫一斯米尔诺夫拟合优度检验/22366278)。
422421
423-
我们忽略了这些高级主题(但鼓励读者在完成这些讲座后研究它们)。
422+
我们省略了这些更深入的主题(但鼓励读者在完成这些讲座后研究它们)。
424423
425424
## 练习
426425
427426
```{exercise-start}
428427
:label: mle_ex1
429428
```
430-
假设我们假设财富是以参数 $\lambda > 0$ 的[指数](https://en.wikipedia.org/wiki/Exponential_distribution)分布
429+
假设我们假设财富是以参数 $\lambda > 0$ 的[指数分布](https://baike.baidu.com/item/负指数分布/6057031)
431430
432431
$\lambda$ 的最大似然估计为
433432
@@ -436,7 +435,7 @@ $$
436435
$$
437436
438437
1. 计算我们初始样本的 $\hat{\lambda}$。
439-
2. 使用 $\hat{\lambda}$ 来找到总收入
438+
2. 使用 $\hat{\lambda}$ 来计算总收入
440439
441440
```{exercise-end}
442441
```
@@ -463,7 +462,7 @@ tr_expo
463462
:label: mle_ex2
464463
```
465464
466-
绘制指数分布与样本的比较,并检查它是否适合
465+
绘制指数分布曲线,与样本比较并讨论它的拟合效果
467466
468467
```{exercise-end}
469468
```
@@ -483,7 +482,7 @@ ax.legend()
483482
plt.show()
484483
```
485484
486-
很明显,这个分布不适合我们的数据
485+
显然,这个分布对数据的拟合效果并不好
487486
488487
```{solution-end}
489488
```

0 commit comments

Comments
 (0)