OCR校正ツール

NDL古典籍OCRアプリケーションを利用して取得するOCR結果を手動で校正するツールです。

URL

https://bakuhu-shokusei.github.io/proofreading/

手順

OCR

-aオプションを指定してOCRアプリを実行してください。

例

python main.py infer input_root output_dir -a

下記のようにフォルダを準備する

input_dir
  ├── book1
  │   ├── img
  │   │   ├── 001.jpg
  │   │   └── 002.jpg
  │   ├── txt
  │   │   ├── 001.txt
  │   │   └── 002.txt
  │   └── json
  │       ├── 001.json
  │       └── 002.json
  └── book2
      ├── img
      │   ├── 001.jpg
      │   ├── 002.jpg
      │   └── 003.jpg
      └── txt
          ├── 001.txt
          ├── 002.txt
          └── 003.txt

例

例（ダウンロード用）

校正

ここで先ほどのフォルダを選択し、校正作業に入ります。

スクショのように、構成画面は

左の部分（A）
右上の部分（B）
右下の部分（C）

三つの部分で構成されています。

流れとしては、

Aと照合してBを編集する（以下の操作ができます）
- 内容の編集
- 順番の調整（ドラッグ＆ドロップ）
- 長方形自体を削除
「確定」ボタンを押して、Bの内容をCに移す
Cで更に編集する

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
.github/workflows		.github/workflows
.vscode		.vscode
api		api
docs		docs
public		public
src		src
.gitignore		.gitignore
.prettierrc		.prettierrc
README.md		README.md
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
tsconfig.app.json		tsconfig.app.json
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OCR校正ツール

URL

手順

OCR

下記のようにフォルダを準備する

校正

About

Languages

bakuhu-shokusei/proofreading

Folders and files

Latest commit

History

Repository files navigation

OCR校正ツール

URL

手順

OCR

下記のようにフォルダを準備する

校正

About

Resources

Stars

Watchers

Forks

Languages