-
Добрый день, пробую onnx модель, и после запуска session.run (для 4000 элементного сэмпла) в аутпуте получаю два значения, например 0.94601 и 0.0567758 для первого сэмпла файла files_ru.wav. Я так понимаю, первый параметр это вероятность того, что сэмпл это речь, верно? А что представляет второе значение? |
Beta Was this translation helpful? Give feedback.
Replies: 1 comment 1 reply
-
Тот факт, что в сумме они примерно равны 100, намекает, что это два логита сетки после софтмакса, а во всех примерах используется первый (нулевой), потому что там - логит для речи. В обширных примерах для ONNX указано какой и как использовать - https://colab.research.google.com/github/snakers4/silero-vad/blob/master/silero-vad.ipynb : |
Beta Was this translation helpful? Give feedback.
Тот факт, что в сумме они примерно равны 100, намекает, что это два логита сетки после софтмакса, а во всех примерах используется первый (нулевой), потому что там - логит для речи.
В обширных примерах для ONNX указано какой и как использовать - https://colab.research.google.com/github/snakers4/silero-vad/blob/master/silero-vad.ipynb :