LabelExtractor

Extracts the content from the labeled pdf.

Given the labeled PDF files, The files first gets converted to Text file and further labels are extracted from the pdf based certain known parameters. In this case, as its medical datasets, repetition and pattern is identified and based on that key value pair are extracted and are written in the Excel file.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.settings		.settings
DataDictionaries		DataDictionaries
JAR Files		JAR Files
bin/Extractor		bin/Extractor
src/Extractor		src/Extractor
.classpath		.classpath
.project		.project
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LabelExtractor

About

Releases

Packages

Languages

apatawari/LabelExtractor

Folders and files

Latest commit

History

Repository files navigation

LabelExtractor

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages