本リポジトリはボイスチェンジャーの変換結果を比較し、類似した音声のデータセットや学習済みモデルを検索するためのリポジトリです。
現在はα版で、今後データベースの列名等は追加・削除する可能性があります。。
本リポジトリでは音声変換モデル、及び音声変換の学習に用いてよい音声データの収集を行います。 話者情報をembeddingに変換し、メタ情報と共に管理することで音声のベクトル検索をサポートします。
登録しているデータ一覧をhtmlで見れるようにしました。 下記のページよりhtml形式の表で確認することができます。 https://nadare881.github.io/voice-changer-vector-search/data/meta_display.html
VOICEVOXとSHAREVOXの読み上げ音声のデータを追加しました。 機械学習に用いる際は必ず各ソフトウェアおよび各キャラクターの規約を確認してください。
α版を公開しました。許諾不要・許諾確認済みのITAコーパスから得た収集と検索のデモを用意しました。
notebook/search_similar_voice.ipynbを実行すると音声to音声の検索が可能です。
ver0.0.1では類似音声検索のPoCとしてJVSコーパスの話者分類、及びそのembeddingの分析結果を公開します。