小町守「自然言語処理の教科書」(技術評論社)のサポートサイトです。
第2章から5章までは演習があります。それぞれの章の演習の Google Colab のリンクです。
- 日本語 BERT モデルによる文書分類
- 機械翻訳の品質推定
- early stopping で訓練が途中で終わることがあります。
- 現在配布しているデータセットだときれいに訓練できないことがあるので、きれいに訓練できるデータセットに差し替え予定です。
- Fast GECToR と cLang-8 による英語誤り検出・訂正
- データの前処理に結構時間がかかり、無料版の Google Colab だと GPU の無料枠を使い切ってしまうようなので、データの前処理部分を別にやるよう Notebook を修正予定です。
- fairseq によるニューラル機械翻訳演習
- OpenNMT-py によるニューラル機械翻訳演習
- fairseq を使った方を主にメンテナンスしているので、こちらは動かなくなっている可能性があります。
書籍に載せている演習例は楽天データセットによるものなので配布はできませんが、配布可能なデータセットでのアノテーション例(Google Spreadsheet)を公開予定です。
第1章から第6章までは章末に練習問題があります。それぞれの章の練習問題の回答例を掲載します。
正誤表を掲載します。本に関する誤りを見つけた場合は教えていただけると嬉しいです。
Amazon のページ で購入できます(書籍版、Kindle 版ともにあります)。 EPUB/PDF 版は技術評論社のページから購入できます。