-
Notifications
You must be signed in to change notification settings - Fork 1.9k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Hackathon 7th] 修复不存在 *.npy
文件的空文件夹导致的数据遍历错误
#3948
base: develop
Are you sure you want to change the base?
Conversation
Thanks for your contribution! |
为什么会存在数据为空的文件夹? |
好问题 ~ emm... ... 不晓得 ~ 有可能,是因为我这里测试的数据不全导致的 ~ 这个例子原本的数据集 不管咋样,感觉这里做个保护也没啥大问题?~ 🫠 |
不建议在这里做保护,如果空文件很多这里的保护只能引起后续数据对不上的错误,更加难查。 |
那这里是允许空文件夹还是不允许? 如果允许的话,框架那边抛错误咋整? 如果不允许的话,抛个错误? |
抛个错误吧 |
done ~ |
PR types
Bug fixes
PR changes
Others
Describe
修复不存在
*.npy
文件的空文件夹导致的数据遍历错误。MultiSpeakerMelDataset
初始化的时候,如果
list(speaker_dir.glob("*.npy"))
为空 list,即,speaker_dir
文件夹中没有npy
数据(数据集 dump 的时候,没有生成 npy 文件),则在后续遍历的时候跳出遍历 ~
而,
_DataLoaderIterMultiProcess
初始化的时候,由于上面
self._try_put_indices()
报错,导致其实例没有初始化self._shutdown
属性,从而报错综上,这里在
MultiSpeakerMelDataset
初始化的时候,便将空数据的文件夹过滤掉,命令可正常执行@zxcd @Liyulingyue @enkilee @GreatV @yinfan98