kagawa-gaming-time-restriction-law-public-comments

ocr-text/ にパブコメpdfをOCRに掛けたテキストがあるので遊んでね。PDF1ページごとに1ファイルに分割されてます。ファイル名の規則は <元ファイル名>-<0origin3桁0paddingページ番号>.txt
sepalated-text/ パブコメ1件ごとにファイル分割・結合したテキスト、手でやる必要があって、全然進んでない。ファイル名の規則は <元ファイル名>-<開始ページ番号>-<終了ページ番号>.txt

その他

今後

下記のようなことをしたいけど、4000件あるから難しいね。

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
jpg		jpg
ocr-text		ocr-text
pdf		pdf
sepalated-text		sepalated-text
tmp		tmp
tools		tools
.gitignore		.gitignore
README.md		README.md