-
Notifications
You must be signed in to change notification settings - Fork 72
12월 DATA/ML 블로그 포스팅 #257
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
12월 DATA/ML 블로그 포스팅 #257
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
너무 늦어서 죄송합니다 ㅜㅜ
여러 형태소 분석기를 한 눈에 볼 수 있어서 좋은 것 같네요.
다만 블로그 업로드 시 어떻게 될 지는 모르겠는데 이미지 부분 가독성이 조금 떨어질 것 같아서
이미지 크기를 수정하거나 각 항목마다 가로로 한번에 나열해서 비교해서 볼 수 있게 하면 좋을 것 같아요!
|
늦어서 죄송합니다,, 리뷰를 한 줄 알았는데 12월 리뷰를 건너 뛰었었네요 ㅠㅠ 한국어 자연어 처리는 저에게는 접해보지 않은 분야라서 낯설었는데 한국어 형태소 분석기(아마 토크나이저? 인 것 같은데 맞는지 모르겠습니다...,,)를 통한 데이터 전처리에 대해 조금은 알 수 있었던 것 같습니다. 저도 진민님과 같은 의견으로 노트북 출력결과가 제각기라서 가독성이 좀 떨어지는 것 같고, 혹시 후속 글을 쓰신다면 각 형태소 분석기를 비교하여 모델을 테스트 해보면 좋을 것 같습니다! |
|
|
||
|  | ||
|
|
||
| 그래프만 놓고 봤을 땐 Mecab이 가장 빠르게 나온다. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
분석기간 시간 차이가 어마어마 한 차이까지는 아니여도 꽤 많이 나는데 왜 그런지 더 알 수 있으면 좋을 것 같습니다!
이미지 수정 및 일부 내용 추가
1ebe463
늦어서 죄송합니다..