Skip to content

Commit

Permalink
Add Chinese doc and language switcher for demos of metaverse, style_f…
Browse files Browse the repository at this point in the history
…s2 and story talker, test=doc
  • Loading branch information
WongLaw committed Sep 7, 2022
1 parent 79f017a commit 1459162
Show file tree
Hide file tree
Showing 4 changed files with 64 additions and 0 deletions.
2 changes: 2 additions & 0 deletions demos/metaverse/README.md
Original file line number Diff line number Diff line change
@@ -1,3 +1,5 @@
([简体中文](./README_cn.md)|English)

# Metaverse
## Introduction
Metaverse is a new Internet application and social form integrating virtual reality produced by integrating a variety of new technologies.
Expand Down
27 changes: 27 additions & 0 deletions demos/metaverse/README_cn.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,27 @@
(简体中文|[English](./README.md))

# Metaverse

## 简介

Metaverse是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。

这个演示是一个让图片中的名人“说话”的实现。通过 `PaddleSpeech``PaddleGAN``TTS` 模块的组合,我们集成了安装和特定模块到一个shell脚本中。

## 使用

您可以使用 `PaddleSpeech``PaddleGAN``TTS` 模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。

运行 `run.sh` 完成所有基本程序,包括安装。

```bash
./run.sh
```

`run.sh`, 先会执行 `source path.sh` 来设置好环境变量。

如果您想尝试您的句子,请替换`sentences.txt`中的句子。

如果您想尝试图像,请将图像替换shell脚本中的`download/Lamarr.png`

结果已显示在我们的 [notebook](https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/tts/tts_tutorial.ipynb)
2 changes: 2 additions & 0 deletions demos/style_fs2/README.md
Original file line number Diff line number Diff line change
@@ -1,3 +1,5 @@
([简体中文](./README_cn.md)|English)

# Style FastSpeech2
## Introduction
[FastSpeech2](https://arxiv.org/abs/2006.04558) is a classical acoustic model for Text-to-Speech synthesis, which introduces controllable speech input, including `phoneme duration``energy` and `pitch`.
Expand Down
33 changes: 33 additions & 0 deletions demos/style_fs2/README_cn.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,33 @@
(简体中文|[English](./README.md))

# Style FastSpeech2

## 简介

[FastSpeech2](https://arxiv.org/abs/2006.04558) 是用于语音合成的经典声学模型,它引入了可控语音输入,包括 `phoneme duration``energy``pitch`

在预测阶段,您可以更改这些变量以获得一些有趣的结果。

例如:

1. `FastSpeech2` 中的`duration` 可以控制音频的速度 ,并保持`pitch`。(在某些语音工具中,增加速度将增加音调,反之亦然。)
2. 当我们将一个句子的`pitch` 设置为平均值并将音素的`tones`设置为 `1`时,我们将获得 `robot-style` 的音色。
3. 当我们提高成年女性的`pitch` (比例固定)时,我们会得到 `child-style` 的音色。

句子中不同音素的 `duration``pitch`可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。

## 运行

运行以下命令行开始:

```
./run.sh
```

`run.sh`, 会首先执行 `source path.sh` 去设置好环境变量。

如果您想尝试您的句子,请替换 `sentences.txt`中的句子。

更多的细节,请查看 `style_syn.py`

语音样例可以在 [style-control-in-fastspeech2](https://paddlespeech.readthedocs.io/en/latest/tts/demo.html#style-control-in-fastspeech2) 查看。

0 comments on commit 1459162

Please sign in to comment.