Skip to content

Commit ed6c43f

Browse files
committed
updates
1 parent fba6f57 commit ed6c43f

File tree

1 file changed

+21
-18
lines changed

1 file changed

+21
-18
lines changed

lectures/inequality.md

Lines changed: 21 additions & 18 deletions
Original file line numberDiff line numberDiff line change
@@ -30,14 +30,16 @@ kernelspec:
3030
3131
* 在第二个社会中,每个人的年收入都是 100 美元
3232
33-
这些国家的人均收入相同(平均收入为 100 美元),但人民的生活却大不相同(例如,在第一个社会中,几乎每个人都在挨饿,尽管有一个人非常富有)。
33+
这些国家的人均收入相同(平均收入为 100 美元),但人民的生活却大不相同(例如,在第一个社会中,尽管有一个人非常富有, 但是几乎每个人都在挨饿)。
3434
```
3535

3636
上面的例子表明,我们在研究收入和财富问题时,不应该仅仅局限于简单的平均数。
3737

3838
这就引出了经济不平等的话题,即研究收入和财富(以及其他资源的数量)如何在人口中分配的话题。
3939

40-
在本讲座中,我们将研究不平等问题,首先探讨不平等的衡量标准,然后将其应用于美国和其他国家的财富和收入数据。
40+
在本讲中,我们将研究不平等问题。
41+
42+
我们首先探讨不平等的衡量标准,然后将其应用于美国和其他国家的财富和收入数据。
4143

4244

4345
### 一些历史
@@ -50,7 +52,7 @@ kernelspec:
5052

5153
由此导致的持续加剧的不平等成为罗马共和国政治动荡背后的重要驱动因素,深深地动摇了共和国的根基。
5254

53-
最终,罗马共和国让位于一系列独裁政权 -- 从公元前 27 年的[屋大维](https://en.wikipedia.org/wiki/Augustus)(奥古斯都)开始
55+
最终,罗马共和国让位于从公元前 27 年的[屋大维](https://en.wikipedia.org/wiki/Augustus)(奥古斯都)开始的一系列独裁政权
5456

5557
这段历史告诉我们,不平等问题很关键,它可以推动世界的重大事件发生。
5658

@@ -190,7 +192,7 @@ def lorenz_curve(y):
190192

191193
在下图中,我们从对数正态分布中生成了 $n=2000$ 个样本,并将这些样本视为我们的总体。
192194

193-
其中45 度线($x=L(x)$ 对于所有 $x$)对应于完全平等的情况。
195+
其中45 度线(对于所有 $x$,$x=L(x)$)对应于完全平等的情况。
194196

195197
对数正态分布的样本产生了一个不那么平等的分布。
196198

@@ -240,9 +242,9 @@ df_income_wealth = df.dropna()
240242
df_income_wealth.head(n=5)
241243
```
242244

243-
接下来的代码使用存储在数据框 `df_income_wealth` 中的数据来生成洛伦兹曲线。
245+
接下来我们用存储在数据框 `df_income_wealth` 中的数据来生成洛伦兹曲线。
244246

245-
代码稍微复杂一些,因为我们需要根据 SCF 提供的人口权重来调整数据。)
247+
接下来的代码会稍微复杂一些,因为我们需要根据 SCF 提供的人口权重来调整数据。)
246248

247249
```{code-cell} ipython3
248250
:tags: [hide-input]
@@ -339,7 +341,7 @@ $$
339341

340342
基尼系数与洛伦兹曲线密切相关。
341343

342-
事实上,可以证明基尼系数的值是平等线与洛伦兹曲线之间面积的两倍(例如,{numref}`lorenz_gini` 中的阴影区域)。
344+
事实上,我们可以证明基尼系数的值是平等线与洛伦兹曲线之间面积的两倍(例如,{numref}`lorenz_gini` 中的阴影区域)。
343345

344346
其思想是,$G=0$ 表示完全平等,而 $G=1$ 表示完全不平等。
345347

@@ -364,7 +366,7 @@ ax.legend()
364366
plt.show()
365367
```
366368

367-
事实上,基尼系数还可以表示为
369+
基尼系数还可以表示为
368370

369371
$$
370372
G = \frac{A}{A+B}
@@ -396,7 +398,7 @@ plt.show()
396398
```
397399

398400
```{seealso}
399-
在全球数据网站上有一个用图表阐述[洛伦兹曲线和基尼系数](https://ourworldindata.org/what-is-the-gini-coefficient)的网页
401+
在全球数据网站 (Our World in Data) 上有一个用图表阐述[洛伦兹曲线和基尼系数](https://ourworldindata.org/what-is-the-gini-coefficient)的网页
400402
```
401403

402404

@@ -411,7 +413,7 @@ plt.show()
411413
```{code-cell} ipython3
412414
def gini_coefficient(y):
413415
r"""
414-
实现的基尼不平等指数
416+
基尼不平等指数
415417
416418
参数
417419
----------
@@ -463,7 +465,7 @@ for σ in σ_vals:
463465
ginis.append(gini_coefficient(y))
464466
```
465467

466-
让我们构建一个返回图形的函数(我们可以在讲义后面的部分中使用它)。
468+
让我们构建一个返回图形的函数(便于我们之后继续使用它)。
467469

468470
```{code-cell} ipython3
469471
def plot_inequality_measures(x, y, legend, xlabel, ylabel):
@@ -532,7 +534,7 @@ ax.set_ylabel("频率")
532534
plt.show()
533535
```
534536

535-
我们可以在 {numref}`gini_histogram` 中看到,根据50年的数据和所有国家的数据,该指标在20到65之间变化。
537+
我们可以在 {numref}`gini_histogram` 中看到,根据50年所有国家的数据,该指标在20到65之间变化。
536538

537539
现在,我们来看看美国在过去几十年的基尼系数变化。
538540

@@ -543,7 +545,7 @@ data.head(n=5)
543545
data.columns = data.columns.map(lambda x: int(x.replace('YR','')))
544546
```
545547

546-
(这个数据包通常会返回包含年份信息的列。这在使用 pandas 进行简单绘图时并不总是很方便,因此在绘图之前将结果转置可能会有帮助。)
548+
(这个包经常返回包含年份信息的数据列。这对于使用 pandas 进行简单绘图来说并不总是很方便,所以在绘图之前对结果进行转置可能会很有用。)
547549

548550
```{code-cell} ipython3
549551
data = data.T # 将年份作为行
@@ -644,13 +646,13 @@ plt.show()
644646

645647
我们发现挪威的数据时间序列较短。
646648

647-
让我们仔细查看底层数据,看看是否可以修正这个问题。
649+
让我们仔细检查底层数据,看看是否可以修正这个问题。
648650

649651
```{code-cell} ipython3
650652
data[['NOR']].dropna().head(n=5)
651653
```
652654

653-
此数据包中挪威的数据可以追溯到1979年,但时间序列中存在空缺,所以matplotlib 没有显示这些数据点。
655+
此数据包中挪威的数据可以追溯到1979年,但时间序列中存在空缺,所以 matplotlib 没有显示这些数据点。
654656

655657
我们可以使用 `.ffill()` 方法来复制并前移序列中的最后已知值,以填补这些空缺。
656658

@@ -715,7 +717,7 @@ max_year = plot_data.year.max()
715717

716718
这三个国家的时间序列开始和结束的年份不同。
717719

718-
我们将在数据中添加一个年份掩码来提高图表的清晰度,包含每个国家时间序列的不同结束年份
720+
我们将在数据中添加年份掩码,以提高图表的清晰度,包括显示每个国家时间序列不同的结束年份
719721

720722
```{code-cell} ipython3
721723
labels = [1979, 1986, 1991, 1995, 2000, 2020, 2021, 2022] + \
@@ -754,7 +756,7 @@ fig.show()
754756

755757
另一个受欢迎的不平等衡量指标是前10%比例。
756758

757-
在本节中,我们展示如何计算前10%比例。
759+
在本节中,我们学习如何计算前10%比例。
758760

759761
### 定义
760762

@@ -842,6 +844,7 @@ plt.show()
842844
```
843845

844846
## 练习
847+
845848
```{exercise}
846849
:label: inequality_ex1
847850
@@ -1005,7 +1008,7 @@ plt.show()
10051008
10061009
{ref}`计算基尼系数的代码已在上述讲义中列出 <code:gini-coefficient>`。
10071010
1008-
此代码使用循环计算基于收入或财富数据的基尼系数
1011+
此代码循环计算基于收入或财富数据的基尼系数
10091012
10101013
该函数可以通过向量化改写,从而大大提高在 `python` 中的计算效率。
10111014

0 commit comments

Comments
 (0)