WIP: Segmentation using nnet3 for diarization and ASR #2

vimalmanohar · 2016-11-24T02:29:46Z

This pull request is a place holder for all the modifications required for training nnet3 models for speech activity detection, music detection and similar tasks and using those models on test data. This includes recipes for

Training SAD and music detection model on Fisher and Babel corpus corrupted with MUSAN music and noise.
Creating segments for Babel dev data (evalutated on WER), AMI dev data (evalutated on DER), RT04 (evaluated on DER)
Music detection task on Broadcast news

This PR request also contains generic tools for segmentation, nnet3 modifications for training with multi-task objectives and other generic utility scripts and binaries.

tdnn_fastlstm

…softmax per row, copy-matrix apply-log, matrix-add-offset, matrix-dot-product

…ts.pl

…gments_for_data, get_utt2num_frames, get_reco2num_frames, get_reco2dur, convert_ali_to_vec, quantize_vector, convert_rttm_to_utt2spk_and_segments, get_frame_shift_from_config

…in aspire

…ns to library and adding extra options

and get-egs-multiple-targets

…tiple outputs in egs

…component

… MUSAN noise

…ith MUSAN music

…nd testing on AMI

vimalmanohar · 2016-12-03T06:23:14Z

Creating new PR wrt master #4

Added Beamformit

vimalmanohar force-pushed the asr_diarization_clean branch 13 times, most recently from bc6ef53 to 4bba0dd Compare November 30, 2016 19:49

vimalmanohar mentioned this pull request Nov 30, 2016

WIP Speech Activity Detection using SNR Prediction kaldi-asr/kaldi#353

Closed

vimalmanohar force-pushed the asr_diarization_clean branch from 4bba0dd to 0fde60d Compare November 30, 2016 22:08

GaofengCheng and others added 2 commits December 3, 2016 09:09

tdnn_fastlstm

5365330

Merge pull request kaldi-asr#1243 from GaofengCheng/fastlstm_tdnn

e5fa353

tdnn_fastlstm

vimalmanohar force-pushed the asr_diarization_clean branch from 0fde60d to 46ced5d Compare December 3, 2016 02:03

vimalmanohar added 12 commits December 2, 2016 23:01

Bug fix in nnet3-latgen-faster which missed uttspk option

e02b95e

Bug fix in sparse-matrix.cc

a6f722b

asr_diarization: Adding get_frame_shift.sh

265e337

Pass --no-text option to validate data dir in speed perturbation

a9b261c

Print Cuda profile in nnet3-compute

5019bd8

asr_diarization: Fix stats printing

5af09e0

asr_diarization: Add --skip-dims option to apply-cmvn-sliding

3d5b5dd

asr_diarization: Adding length-tolerace to extract ivector scripts

8251d5d

asr_diarization: Adding --do-average option to matrix-sum-rows

9bca27f

asr_diarization: Added weight-pdf-post, vector-to-feat, kaldi-matrix …

a02d4cb

…softmax per row, copy-matrix apply-log, matrix-add-offset, matrix-dot-product

asr_diarization: Modify subsegment_feats and add fix_subsegmented_fea…

eee41d0

…ts.pl

asr_diarization: Utility scripts get_reco2utt, get_utt2dur and get_se…

5290091

…gments_for_data, get_utt2num_frames, get_reco2num_frames, get_reco2dur, convert_ali_to_vec, quantize_vector, convert_rttm_to_utt2spk_and_segments, get_frame_shift_from_config

vimalmanohar added 26 commits December 2, 2016 23:04

asr_diarization: Adding Log and Exp components

fa9bac5

asr_diarization: Adding ScaleGradientComponent

3bf8fb0

asr_diarization: Adding AddGradientSacaleLayer to components.py

db74c3d

asr_diarization: Adding get_egs changes into get_egs_targets

0b18b08

asr_diarization: Multiple outputs in nnet3

5c452c7

raw_python_script: Made LSTM and TDNN raw configs similar

0b1ae75

asr_diarization: Create prepare_unsad_data.sh

5288871

asr_diarization: Temporary changes to mfcc_hires_bp.conf and path.sh …

cf69a08

…in aspire

asr_diarization: Modified reverberation script by moving some functio…

1af7f98

…ns to library and adding extra options

asr_diarization: Add extra_egs_copy_cmd

c9dcd0b

asr_diarization: Create get_egs.py supporting multiple targets

3cf7032

and get-egs-multiple-targets

asr_diarization: Modify the egs binaries and utilities to support mul…

1698a12

…tiple outputs in egs

asr_diarization: Adding local/snr/make_sad_tdnn_configs.py and stats …

712132b

…component

asr_diarization: SAD decoding scripts and do_segmentation_data_dir.sh

913d30a

asr_diarization: Adding min-extra-left-context

7d3417f

asr_diarization: Segmentation tools

36d992d

asr_diarization: Adding do_corruption_data_dir.sh for corruption with…

0c9b75c

… MUSAN noise

asr_diarization: Add do_corruption_data_dir_music.sh for corruption w…

207678f

…ith MUSAN music

asr_diarization: Recipe for music-id on broadcast news

6e9ffc4

asr_diarization: Utilities invert_vector.pl and vector_get_max.pl

6b84db0

asr_diarization: Recipe for segmentation on AMI SDM dev set

48e5b5a

asr_diarization: Fisher recipe from data preparation, training nnet a…

7a54deb

…nd testing on AMI

asr_diarization: created compute-snr-targets

678aa64

asr_diarization: make_snr_targets.sh

3a21c47

asr_diarization: Added script to get DCT matrix

9f07d8d

asr_diarization_clean: Adding run_train_sad.sh

398ece6

vimalmanohar force-pushed the asr_diarization_clean branch from 46ced5d to 398ece6 Compare December 3, 2016 04:05

vimalmanohar closed this Dec 3, 2016

vimalmanohar pushed a commit that referenced this pull request Jan 13, 2019

Merge pull request #2 from sas91/reverb

1797446

Added Beamformit

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

WIP: Segmentation using nnet3 for diarization and ASR #2

WIP: Segmentation using nnet3 for diarization and ASR #2

Uh oh!

vimalmanohar commented Nov 24, 2016 •

edited

Loading

Uh oh!

vimalmanohar commented Dec 3, 2016

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

WIP: Segmentation using nnet3 for diarization and ASR #2

WIP: Segmentation using nnet3 for diarization and ASR #2

Uh oh!

Conversation

vimalmanohar commented Nov 24, 2016 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

vimalmanohar commented Dec 3, 2016

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

vimalmanohar commented Nov 24, 2016 •

edited

Loading