Skip to content

Latest commit

 

History

History
35 lines (18 loc) · 1.64 KB

README.md

File metadata and controls

35 lines (18 loc) · 1.64 KB

프로젝트명 NewStock

뉴스 기사를 통해 다음날 주가예측을 하는 프로젝트입니다.


배경

최근 들어 모든 연령대가 재테크, 그중에서도 주식과 코인에 대해 관심이 많습니다.

이에 따라서 많은 기사가 쏟아지고, 코인 같은 경우는 24시간 동안 운영되므로 특정한 호재가 직접적으로 가격에 영향을 미칩니다.

하지만 주식은 이러한 코인과는 달리 장이 열리는 시간이 한정되어있고, 코인보다도 더 다양한 종류의 뉴스를 통해서 기업에 대한 정보를 얻게 됩니다.

그래서 이러한 뉴스들의 정보 중에서 가격에 영향을 줄 만한 특정 키워드들이 많아지면 다음 날 가격에 긍정적인 영향 혹은 부정적인 영향을 주지 않을까 생각하였습니다.

그래서 이번 프로젝트를 통해서 가격에 영향을 줄 만한 키워드들이 어떤 것이 있을지, 실제 예측이 가능한지 알아보고자 합니다.


주제

뉴스 텍스트 분석을 통한 주가 방향 예측 모델 개발


프로젝트 내용

각 기업명을 통해서 뉴스들을 스크래핑 후, 각 기업별 뉴스 기사들에서 전처리를 통해 각 날짜별/기업별을 묶어서 하나의 행으로 만듭니다.

그리고 각 날짜별/기업별 단어 덩어리들을 TF-IDF를 통해서 각각의 피쳐들로 변환 후,

전날 뉴스를 통해서 생성된 피쳐들이 다음 날 주식에 어떠한 영향을 미치는지 평가하는 프로젝트입니다.

각 코딩에 대한 설명은 블로그 https://blog.naver.com/gimhun0 를 참고하세요.