Skip to content

Tout le contenu du projet Deep Voice 3 réalisé en 2019 au LIUM

Notifications You must be signed in to change notification settings

scullabyte/DeepVoice3

 
 

Repository files navigation

DeepVoice3

Dans ce dépôt se trouvent tout le contenu du projet Deep Voice 3 sur lequel j'ai travaillé le long de mon stage au sein du LIUM du 21/01/2019 au 05/07/2019.

Note : Les corpus utilisés sont LJ Speech (en anglais) et SynPaFlex (en français) et ils ne sont pas inclus dans ce dépôt.

Chaque répertoire possède son propre README pour donner plus de détails sur le fonctionnement et les modifications apportées.

Contenu

On y trouve les différents répertoires :

  • deepvoice3_by_tg : le synthétiseur Deep Voice 3 fonctionnel en français avec Griffin-Lim ou WaveNet
  • deepvoice3_world : une tentative de mêler Deep Voice 3 et WORLD
  • evaluation : des fichiers pré et post évaluation
  • merlin : une tentative de faire fonctionner le synthétiseur Merlin sur du français
  • scripts : différents scripts bash ou python pour faire fonctionner tous les programmes
  • tacotron : une version très peu modifiée de Tacotron pour le comparer à Deep Voice 3
  • wavenet_vocoder : le vocodeur WaveNet, fonctionnel sur du français
  • world_vocoder : le vocodeur WORLD, très peu modifié
  • synpaflex-metadata-10s.csv : les données d'où partir pour le pré-traitement (les wavs ne sont pas fournis)

Différents corpus

Le fichier synpaflex-metadata-10s.csv fourni a été conçu à partir des textes du corpus emotional de SynPaFlex auxquels ont été ajoutés les extraits manquants. Pour obtenir la version "Demi" qui contient 50% du corpus, il suffit d'utiliser la commande awk NR%2 synpaflex-metadata-10s.csv > <nom du fichier de sortie>. Pour obtenir la version "Quart" qui contient 75% du corpus, il suffit d'utiliser la commande awk NR%4 synpaflex-metadata-10s.csv > <nom du fichier de sortie>.

Crédits

Je rends à César ce qui appartient à César. Je ne suis pas le créateur de tous ces logiciels, voici leur origine :

About

Tout le contenu du projet Deep Voice 3 réalisé en 2019 au LIUM

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 72.9%
  • C++ 11.7%
  • Shell 11.0%
  • C 1.6%
  • Scheme 0.7%
  • Objective-C 0.7%
  • Other 1.4%