japanese-splade-base-v1 等の学習方法です。他のバージョン(v2など)の学習用 yaml も同梱されています。
yast のルートディレクトリで実行します。
poetry install
サンプルデータセットの学習です。データセットが小さすぎて、きちんとしたモデルは作れませんが、データのサンプルとして。
poetry run python -m yast.run ./examples/japanese-splade-v1/toy.yaml
poetry run python -m yast.run ./examples/japanese-splade-v1/japanese-splade-base-v1.yaml
poetry run python -m yast.run ./examples/japanese-splade-v1/japanese-splade-base-v1-mmarco-only.yaml
データセットを作った場合、データセットを混ぜての学習が可能です。
poetry run python -m yast.run ./examples/japanese-splade-v1/japanese-splade-base-v1-with-toy.yaml