updates

HumphreyYang · HumphreyYang · commit ed6c43f0c902 · 2025-02-22T23:37:24.000+11:00
diff --git a/lectures/inequality.md b/lectures/inequality.md
@@ -30,14 +30,16 @@ kernelspec:
 
 * 在第二个社会中，每个人的年收入都是 100 美元
 
-这些国家的人均收入相同（平均收入为 100 美元），但人民的生活却大不相同（例如，在第一个社会中，几乎每个人都在挨饿，尽管有一个人非常富有）。
+这些国家的人均收入相同（平均收入为 100 美元），但人民的生活却大不相同（例如，在第一个社会中，尽管有一个人非常富有, 但是几乎每个人都在挨饿）。
 ```
 
 上面的例子表明，我们在研究收入和财富问题时，不应该仅仅局限于简单的平均数。
 
 这就引出了经济不平等的话题，即研究收入和财富（以及其他资源的数量）如何在人口中分配的话题。
 
-在本讲座中，我们将研究不平等问题，首先探讨不平等的衡量标准，然后将其应用于美国和其他国家的财富和收入数据。
+在本讲中，我们将研究不平等问题。
+
+我们首先探讨不平等的衡量标准，然后将其应用于美国和其他国家的财富和收入数据。
 
 
 ### 一些历史
@@ -50,7 +52,7 @@ kernelspec:
 
 由此导致的持续加剧的不平等成为罗马共和国政治动荡背后的重要驱动因素，深深地动摇了共和国的根基。
 
-最终，罗马共和国让位于一系列独裁政权 -- 从公元前 27 年的[屋大维](https://en.wikipedia.org/wiki/Augustus)（奥古斯都）开始。
+最终，罗马共和国让位于从公元前 27 年的[屋大维](https://en.wikipedia.org/wiki/Augustus)（奥古斯都）开始的一系列独裁政权。
 
 这段历史告诉我们，不平等问题很关键，它可以推动世界的重大事件发生。
 
@@ -190,7 +192,7 @@ def lorenz_curve(y):
 
 在下图中，我们从对数正态分布中生成了 $n=2000$ 个样本，并将这些样本视为我们的总体。
 
-其中45 度线（$x=L(x)$ 对于所有 $x$）对应于完全平等的情况。
+其中45 度线（对于所有 $x$，$x=L(x)$）对应于完全平等的情况。
 
 对数正态分布的样本产生了一个不那么平等的分布。
 
@@ -240,9 +242,9 @@ df_income_wealth = df.dropna()
 df_income_wealth.head(n=5)
 ```
 
-接下来的代码使用存储在数据框 `df_income_wealth` 中的数据来生成洛伦兹曲线。
+接下来我们用存储在数据框 `df_income_wealth` 中的数据来生成洛伦兹曲线。
 
-（代码稍微复杂一些，因为我们需要根据 SCF 提供的人口权重来调整数据。）
+（接下来的代码会稍微复杂一些，因为我们需要根据 SCF 提供的人口权重来调整数据。）
 
 ```{code-cell} ipython3
 :tags: [hide-input]
@@ -339,7 +341,7 @@ $$
 
 基尼系数与洛伦兹曲线密切相关。
 
-事实上，可以证明基尼系数的值是平等线与洛伦兹曲线之间面积的两倍（例如，{numref}`lorenz_gini` 中的阴影区域）。
+事实上，我们可以证明基尼系数的值是平等线与洛伦兹曲线之间面积的两倍（例如，{numref}`lorenz_gini` 中的阴影区域）。
 
 其思想是，$G=0$ 表示完全平等，而 $G=1$ 表示完全不平等。
 
@@ -364,7 +366,7 @@ ax.legend()
 plt.show()
 ```
 
-事实上，基尼系数还可以表示为
+基尼系数还可以表示为
 
 $$
 G = \frac{A}{A+B}
@@ -396,7 +398,7 @@ plt.show()
 ```
 
 ```{seealso}
-在全球数据网站上有一个用图表阐述[洛伦兹曲线和基尼系数](https://ourworldindata.org/what-is-the-gini-coefficient)的网页
+在全球数据网站 (Our World in Data) 上有一个用图表阐述[洛伦兹曲线和基尼系数](https://ourworldindata.org/what-is-the-gini-coefficient)的网页
 ```
 
 
@@ -411,7 +413,7 @@ plt.show()
 ```{code-cell} ipython3
 def gini_coefficient(y):
     r"""
-    实现的基尼不平等指数
+    基尼不平等指数
 
     参数
     ----------
@@ -463,7 +465,7 @@ for σ in σ_vals:
     ginis.append(gini_coefficient(y))
 ```
 
-让我们构建一个返回图形的函数（我们可以在讲义后面的部分中使用它）。
+让我们构建一个返回图形的函数（便于我们之后继续使用它）。
 
 ```{code-cell} ipython3
 def plot_inequality_measures(x, y, legend, xlabel, ylabel):
@@ -532,7 +534,7 @@ ax.set_ylabel("频率")
 plt.show()
 ```
 
-我们可以在 {numref}`gini_histogram` 中看到，根据50年的数据和所有国家的数据，该指标在20到65之间变化。
+我们可以在 {numref}`gini_histogram` 中看到，根据50年所有国家的数据，该指标在20到65之间变化。
 
 现在，我们来看看美国在过去几十年的基尼系数变化。
 
@@ -543,7 +545,7 @@ data.head(n=5)
 data.columns = data.columns.map(lambda x: int(x.replace('YR','')))
 ```
 
-（这个数据包通常会返回包含年份信息的列。这在使用 pandas 进行简单绘图时并不总是很方便，因此在绘图之前将结果转置可能会有帮助。）
+(这个包经常返回包含年份信息的数据列。这对于使用 pandas 进行简单绘图来说并不总是很方便，所以在绘图之前对结果进行转置可能会很有用。)
 
 ```{code-cell} ipython3
 data = data.T           # 将年份作为行
@@ -644,13 +646,13 @@ plt.show()
 
 我们发现挪威的数据时间序列较短。
 
-让我们仔细查看底层数据，看看是否可以修正这个问题。
+让我们仔细检查底层数据，看看是否可以修正这个问题。
 
 ```{code-cell} ipython3
 data[['NOR']].dropna().head(n=5)
 ```
 
-此数据包中挪威的数据可以追溯到1979年，但时间序列中存在空缺，所以matplotlib 没有显示这些数据点。
+此数据包中挪威的数据可以追溯到1979年，但时间序列中存在空缺，所以 matplotlib 没有显示这些数据点。
 
 我们可以使用 `.ffill()` 方法来复制并前移序列中的最后已知值，以填补这些空缺。
 
@@ -715,7 +717,7 @@ max_year = plot_data.year.max()
 
 这三个国家的时间序列开始和结束的年份不同。
 
-我们将在数据中添加一个年份掩码来提高图表的清晰度，包含每个国家时间序列的不同结束年份。
+我们将在数据中添加年份掩码，以提高图表的清晰度，包括显示每个国家时间序列不同的结束年份。
 
 ```{code-cell} ipython3
 labels = [1979, 1986, 1991, 1995, 2000, 2020, 2021, 2022] + \
@@ -754,7 +756,7 @@ fig.show()
 
 另一个受欢迎的不平等衡量指标是前10%比例。
 
-在本节中，我们展示如何计算前10%比例。
+在本节中，我们学习如何计算前10%比例。
 
 ### 定义
 
@@ -842,6 +844,7 @@ plt.show()
 ```
 
 ## 练习
+
 ```{exercise}
 :label: inequality_ex1
 
@@ -1005,7 +1008,7 @@ plt.show()
 
 {ref}`计算基尼系数的代码已在上述讲义中列出 <code:gini-coefficient>`。
 
-此代码使用循环计算基于收入或财富数据的基尼系数。
+此代码循环计算基于收入或财富数据的基尼系数。
 
 该函数可以通过向量化改写，从而大大提高在 `python` 中的计算效率。