『Google Cloud Vision APIとPythonで文字認識』の関連ファイルのリポジトリです。
- basic : 第3章 前半
- advanced : 第3章 後半
- storage : Google Cloud Storage関連
- async : PDF/TIFFからの文字認識(非同期)
- generate_pdf : ReportLabによるPDF生成
$ python3 -m venv venv
$ source venv/bin/activate
(venv) $ pip install -r requirements.txt
Google Cloud Vision APIの認証情報を記載したJSONファイルへのパスをGOOGLE_APPLICATION_CREDENTIALS
にセットする必要があります。
$ export GOOGLE_APPLICATION_CREDENTIALS=/patho/to/your-credentials.json
image_data
ディレクトリの画像うち、Webから入手したものは以下のとおりです。
- 日本語版Wikipediaの「光学文字認識」のページの一部(
about_ocr.png
) - プログラマが知るべき97のこと/DRY原則 - Wikisource(
dry_image.pdf
) - 英語版WikipediaのOCRのページ(
output_multi.tiff
)
ソースコードからサンプルデータにアクセスするパスの解決のためにpathlib
を使用しています。
追加のモジュールのインストールは不要です。