GitHub - dhdbsrlw/AIKU-23-2-GGAMZI-AI: AIKU 2023-2R Project: 깜지 AI (Korean Fewshot Font Generation Task)

GGAMZI-AI

Generate texts with your own handwriting style!

Project Info

고려대학교 딥러닝 학회 AIKU 2023년 2학기 프로젝트
개발 기간 : 2023.09 ~ 2023.12

About The Project

깜지 AI는 개개인의 손 글씨 스타일을 모사하여 원하는 내용을 생성하는 FFG(Few-shot handwriting Font Generation) task 수행 모델입니다.

📌 Few-shot Font Generation Task

추가적인 fine tuning 없이, 적은 개수의 글자 모양(glyph)만으로 새로운 폰트를 생성해내는 task로, 글자 모양(content)의 global한 특징과 reference style의 local한 특징을 유지하는 것이 핵심입니다.

깜지를 대신 작성해주는 생성 모델을 만들어보자는 동기에서 시작하였습니다.
한글이 아닌, 한자나 중국어 데이터에 특화되어 있는 선행 모델들의 한계점을 해결하고자 했습니다.

Installation

Modeling

MX-Font (ICCV 2021)을 차용하였습니다. Link
Training
- Dataset
  - 무료 폰트 사이트에서 수집한 약 312개의 폰트 파일(.ttf) 눈누 온글잎 한글한글 아름답게
  - 공개되어 있는 필기체 데이터셋 및 직접 수집한 손글씨 이미지 데이터 (.png, .jpeg) 개인 특정을 위한 자필과 모사 필기체 데이터
  For more datasets that we used for training, please email us at [email protected]
- Methods
  - I2I(image-to-image) translation 방식으로 target domain에 맞도록 style을 transfer하면서 source domain의 content를 유지하는 매핑을 학습하는 방식입니다.
  - weak supervision으로 글자 구성 요소(component)를 학습하여 unseen data에 대한 성능을 올렸습니다
    - 여러 개의 인코더(multiple-headed experts)로 content와 style을 분리하여 학습합니다.
    - 최대 이분 매칭, 헝가리안 알고리즘을 활용하여 component-specific하게 훈련되는 것을 방지합니다.
Inference
- 입력 : Reference 이미지 4장, source language로 사용되는 글꼴, 생성하고 싶은 text 내용

Contribution

Pretrained model이 한글의 여러 component 중 ㅇ,ㅎ 생성에 한계를 가진다는 점을 발견
→ 여러 차례의 훈련을 진행하면서 발견되는 문제점을 참고하여 체계적으로 한글 폰트 데이터를 라벨링하고 분류하여 해결
한글 데이터로 훈련하였을 때 발생한 문제점 및 해결 방식
- 한글에 존재하지 않는 component 생성
  - 원인 분석
    - 모델 구조 중 최대 이분 매칭 알고리즘을 한글에 적용하여 원인을 분석 → overfitting으로 결론
    - 훈련 데이터에서 사용한 글꼴마다 미세하게 다른 스타일
      - 자음 모음을 이어 쓰거나 붙여 쓰는 style이 동시에 섞이는 경우
      - 글꼴 스타일에 따라 다른 ㅎ,ㅊ 작성 방식
  - 해결 방식
    - 여러 component로 분류될 여지가 있는 feature를 포함하는 특이한 데이터셋(out of distribution dataset)을 과감히 배제
    - 훈련 데이터의 다양성을 낮추어 학습
- 스타일 반영도가 떨어짐
  - 원인 분석
    - 여러 ablation study와 experiment를 통해 확인하는 방식으로 진행
    - 여러 기준으로 데이터를 분류하여 experiment 진행 : 실제 손 글씨와 유사한 스타일, 곡선이 많은 스타일, 굵기, 기울기 등
  - 해결 방식 : 실제 손 글씨와 유사하고 곡선 위주의 데이터셋으로 훈련 시 style 반영도가 증가한다는 점을 발견 후 데이터셋을 재구성
- 배경에 노이즈 포함
  - 해결 방식
    - 후처리 방식 고안 → morphological transformation, Alpha blending 기법 활용하여 해결

Results

👉왼쪽이 reference images, 오른쪽이 생성 결과

Team Members & Roles

박서현 : 프로젝트 주제 발제, 모델 조사 및 학습, 데이터셋 조사 및 분류, 후처리 등
오윤진 : 모델 조사 및 학습, 훈련 결과 시각화, 웹 데모 구성, 후처리 등
김지영 : 모델 조사 및 학습, 모델 조사 및 학습, 모델 추가 훈련, 데이터셋 조사 등
민재원 : 방향성 제시 및 자문

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
cfgs		cfgs
datasets		datasets
images		images
models		models
project_logo		project_logo
trainer		trainer
utils		utils
README.md		README.md
inference.ipynb		inference.ipynb
training.ipynb		training.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GGAMZI-AI

Project Info

About The Project

Installation

Modeling

Contribution

Results

Team Members & Roles

About

Releases

Packages

Languages

dhdbsrlw/AIKU-23-2-GGAMZI-AI

Folders and files

Latest commit

History

Repository files navigation

GGAMZI-AI

Project Info

About The Project

Installation

Modeling

Contribution

Results

Team Members & Roles

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages