GitHub - w-okada/ttsclient

TTSClient

[日本語] [English] [한국어] [中文简体]

Text To Speech(TTS)のクライアントソフトウェアです。各種AIに対応していく計画です。(現時点ではGPT-SoVITSのみ)

対応 AI
- GPT-SoVITS
- coming soon...

demo2.mp4

ダウンロード

Hugging Faceのリポジトリよりダウンロードしてください。

win_stdエディション：Windows向けのCPUで動作するエディションです。cuda版と比較して低速ですが、最近のそれなりのスペックのCPUであれば動きます。
win_cudaエディション：Windows向けのNVIDIAのGPUで動作するエディションです。GPUのハードウェアアクセラレーションにより高速に動きます。
macエディション：Mac(Apple silicon(M1, M2, M3, etc))向けのエディションです。

使用方法

zipファイルを展開後、start_http.batを実行してください。表示された、URLにブラウザでアクセスしてください。
start_https.batを使用すると、リモートからでもアクセスすることができます。
(上級者向け)start_http_with_ngrok.batを使用するとngrokを用いたトンネリングを使用してアクセスすることができます。

note: macエディションは.batを.commandで読み替えてください。

GPT-SoVITS

モデルの詳細はGPT-SoVITSの公式リポジトリを参照してください。

GPT-SoVITSでは、モデルと参照音声と参照テキストを選択してから、音声生成を行います。TTSClientでは参照話者という概念があり、参照話者に複数の参照音声と参照テキストを持たせることができます。

音声生成

モデルと、参照話者を選択します((1), (2))。
参照話者に登録された参照音声と参照テキストを選択します(3)。
生成したいテキストを入力して音声を生成します(4)。

モデルの登録

モデル選択エリアの編集ボタンから登録してください。

参照話者の登録

参照話者登録エリアの編集ボタンから登録してください。

参照音声、テキストの登録

参照音声選択エリアで未登録のスロットを選択して登録してください。

リポジトリからの起動(Advanced)

$ git clone https://github.com/w-okada/ttsclient.git
$ cd ttsclient/
$ poetry install
$ poetry run main cui
---

リモートからアクセスする場合は`--https true`を付与してください。
---
$ poetry run main cui --https true

cudaを使用する場合

モジュールを入れ替えてください。

$ poetry add onnxruntime-gpu==1.19.2
$ poetry remove torch
$ poetry add torch==2.3.1 --source torch_cuda12

directmlを使用する場合

モジュールを入れ替えてください。

$ poetry add onnxruntime-directml==1.19.2

Acknowledgements

JVNVコーパス

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
.vscode		.vscode
GPT_SoVITS/configs		GPT_SoVITS/configs
client		client
scripts		scripts
settings		settings
ttsclient		ttsclient
web_front		web_front
.gitignore		.gitignore
README.md		README.md
README_cn.md		README_cn.md
README_en.md		README_en.md
README_ko.md		README_ko.md
build.bat		build.bat
licenses_by_license.json		licenses_by_license.json
licenses_flat.json		licenses_flat.json
mypy.ini		mypy.ini
pyproject.toml		pyproject.toml
utils.py		utils.py
w_okada's_TextToSpeech_version_2_x.ipynb		w_okada's_TextToSpeech_version_2_x.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TTSClient

関連ソフトウェア

ダウンロード

使用方法

GPT-SoVITS

音声生成

モデルの登録

参照話者の登録

参照音声、テキストの登録

リポジトリからの起動(Advanced)

cudaを使用する場合

directmlを使用する場合

Acknowledgements

About

Releases

Packages

Languages

w-okada/ttsclient

Folders and files

Latest commit

History

Repository files navigation

TTSClient

関連ソフトウェア

ダウンロード

使用方法

GPT-SoVITS

音声生成

モデルの登録

参照話者の登録

参照音声、テキストの登録

リポジトリからの起動(Advanced)

cudaを使用する場合

directmlを使用する場合

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages