@@ -30,14 +30,16 @@ kernelspec:
3030
3131* 在第二个社会中,每个人的年收入都是 100 美元
3232
33- 这些国家的人均收入相同(平均收入为 100 美元),但人民的生活却大不相同(例如,在第一个社会中,几乎每个人都在挨饿, 尽管有一个人非常富有)。
33+ 这些国家的人均收入相同(平均收入为 100 美元),但人民的生活却大不相同(例如,在第一个社会中,尽管有一个人非常富有, 但是几乎每个人都在挨饿 )。
3434```
3535
3636上面的例子表明,我们在研究收入和财富问题时,不应该仅仅局限于简单的平均数。
3737
3838这就引出了经济不平等的话题,即研究收入和财富(以及其他资源的数量)如何在人口中分配的话题。
3939
40- 在本讲座中,我们将研究不平等问题,首先探讨不平等的衡量标准,然后将其应用于美国和其他国家的财富和收入数据。
40+ 在本讲中,我们将研究不平等问题。
41+
42+ 我们首先探讨不平等的衡量标准,然后将其应用于美国和其他国家的财富和收入数据。
4143
4244
4345### 一些历史
@@ -50,7 +52,7 @@ kernelspec:
5052
5153由此导致的持续加剧的不平等成为罗马共和国政治动荡背后的重要驱动因素,深深地动摇了共和国的根基。
5254
53- 最终,罗马共和国让位于一系列独裁政权 -- 从公元前 27 年的[ 屋大维] ( https://en.wikipedia.org/wiki/Augustus ) (奥古斯都)开始 。
55+ 最终,罗马共和国让位于从公元前 27 年的[ 屋大维] ( https://en.wikipedia.org/wiki/Augustus ) (奥古斯都)开始的一系列独裁政权 。
5456
5557这段历史告诉我们,不平等问题很关键,它可以推动世界的重大事件发生。
5658
@@ -190,7 +192,7 @@ def lorenz_curve(y):
190192
191193在下图中,我们从对数正态分布中生成了 $n=2000$ 个样本,并将这些样本视为我们的总体。
192194
193- 其中45 度线($x =L(x)$ 对于所有 $x $)对应于完全平等的情况。
195+ 其中45 度线(对于所有 $x$,$x =L(x)$)对应于完全平等的情况。
194196
195197对数正态分布的样本产生了一个不那么平等的分布。
196198
@@ -240,9 +242,9 @@ df_income_wealth = df.dropna()
240242df_income_wealth.head(n=5)
241243```
242244
243- 接下来的代码使用存储在数据框 ` df_income_wealth ` 中的数据来生成洛伦兹曲线。
245+ 接下来我们用存储在数据框 ` df_income_wealth ` 中的数据来生成洛伦兹曲线。
244246
245- (代码稍微复杂一些 ,因为我们需要根据 SCF 提供的人口权重来调整数据。)
247+ (接下来的代码会稍微复杂一些 ,因为我们需要根据 SCF 提供的人口权重来调整数据。)
246248
247249``` {code-cell} ipython3
248250:tags: [hide-input]
339341
340342基尼系数与洛伦兹曲线密切相关。
341343
342- 事实上,可以证明基尼系数的值是平等线与洛伦兹曲线之间面积的两倍 (例如,{numref}` lorenz_gini ` 中的阴影区域)。
344+ 事实上,我们可以证明基尼系数的值是平等线与洛伦兹曲线之间面积的两倍 (例如,{numref}` lorenz_gini ` 中的阴影区域)。
343345
344346其思想是,$G=0$ 表示完全平等,而 $G=1$ 表示完全不平等。
345347
@@ -364,7 +366,7 @@ ax.legend()
364366plt.show()
365367```
366368
367- 事实上, 基尼系数还可以表示为
369+ 基尼系数还可以表示为
368370
369371$$
370372G = \frac{A}{A+B}
@@ -396,7 +398,7 @@ plt.show()
396398```
397399
398400``` {seealso}
399- 在全球数据网站上有一个用图表阐述 [洛伦兹曲线和基尼系数](https://ourworldindata.org/what-is-the-gini-coefficient)的网页
401+ 在全球数据网站 (Our World in Data) 上有一个用图表阐述 [洛伦兹曲线和基尼系数](https://ourworldindata.org/what-is-the-gini-coefficient)的网页
400402```
401403
402404
@@ -411,7 +413,7 @@ plt.show()
411413``` {code-cell} ipython3
412414def gini_coefficient(y):
413415 r"""
414- 实现的基尼不平等指数
416+ 基尼不平等指数
415417
416418 参数
417419 ----------
@@ -463,7 +465,7 @@ for σ in σ_vals:
463465 ginis.append(gini_coefficient(y))
464466```
465467
466- 让我们构建一个返回图形的函数(我们可以在讲义后面的部分中使用它 )。
468+ 让我们构建一个返回图形的函数(便于我们之后继续使用它 )。
467469
468470``` {code-cell} ipython3
469471def plot_inequality_measures(x, y, legend, xlabel, ylabel):
@@ -532,7 +534,7 @@ ax.set_ylabel("频率")
532534plt.show()
533535```
534536
535- 我们可以在 {numref}` gini_histogram ` 中看到,根据50年的数据和所有国家的数据 ,该指标在20到65之间变化。
537+ 我们可以在 {numref}` gini_histogram ` 中看到,根据50年所有国家的数据 ,该指标在20到65之间变化。
536538
537539现在,我们来看看美国在过去几十年的基尼系数变化。
538540
@@ -543,7 +545,7 @@ data.head(n=5)
543545data.columns = data.columns.map(lambda x: int(x.replace('YR','')))
544546```
545547
546- (这个数据包通常会返回包含年份信息的列。这在使用 pandas 进行简单绘图时并不总是很方便,因此在绘图之前将结果转置可能会有帮助。)
548+ (这个包经常返回包含年份信息的数据列。这对于使用 pandas 进行简单绘图来说并不总是很方便,所以在绘图之前对结果进行转置可能会很有用。)
547549
548550``` {code-cell} ipython3
549551data = data.T # 将年份作为行
@@ -644,13 +646,13 @@ plt.show()
644646
645647我们发现挪威的数据时间序列较短。
646648
647- 让我们仔细查看底层数据 ,看看是否可以修正这个问题。
649+ 让我们仔细检查底层数据 ,看看是否可以修正这个问题。
648650
649651``` {code-cell} ipython3
650652data[['NOR']].dropna().head(n=5)
651653```
652654
653- 此数据包中挪威的数据可以追溯到1979年,但时间序列中存在空缺,所以matplotlib 没有显示这些数据点。
655+ 此数据包中挪威的数据可以追溯到1979年,但时间序列中存在空缺,所以 matplotlib 没有显示这些数据点。
654656
655657我们可以使用 ` .ffill() ` 方法来复制并前移序列中的最后已知值,以填补这些空缺。
656658
@@ -715,7 +717,7 @@ max_year = plot_data.year.max()
715717
716718这三个国家的时间序列开始和结束的年份不同。
717719
718- 我们将在数据中添加一个年份掩码来提高图表的清晰度,包含每个国家时间序列的不同结束年份 。
720+ 我们将在数据中添加年份掩码,以提高图表的清晰度,包括显示每个国家时间序列不同的结束年份 。
719721
720722``` {code-cell} ipython3
721723labels = [1979, 1986, 1991, 1995, 2000, 2020, 2021, 2022] + \
@@ -754,7 +756,7 @@ fig.show()
754756
755757另一个受欢迎的不平等衡量指标是前10%比例。
756758
757- 在本节中,我们展示如何计算前10 %比例。
759+ 在本节中,我们学习如何计算前10 %比例。
758760
759761### 定义
760762
@@ -842,6 +844,7 @@ plt.show()
842844```
843845
844846## 练习
847+
845848``` {exercise}
846849:label: inequality_ex1
847850
@@ -1005,7 +1008,7 @@ plt.show()
10051008
10061009{ref}`计算基尼系数的代码已在上述讲义中列出 <code:gini-coefficient>`。
10071010
1008- 此代码使用循环计算基于收入或财富数据的基尼系数 。
1011+ 此代码循环计算基于收入或财富数据的基尼系数 。
10091012
10101013该函数可以通过向量化改写,从而大大提高在 `python` 中的计算效率。
10111014
0 commit comments