Skip to content

Projekt ma za zadanie wytworzenie analizatora danych zescrapowanych ze strony filmweb

License

Notifications You must be signed in to change notification settings

alexiej/filmweb-rekomendacje

Repository files navigation

filmweb-rekomendacje

Build Status

Projekt ma za zadanie wytworzenie analizatora danych zescrapowanych ze strony filmweb.

image-20191114122705238

  • Stworzenie rozszerzenia do Google Chrome które scrapowałoby dane z filmwebu i pobierało informacje o ulubionych filmach, łączyło dane z. bazą imdb, przeliczało przy pomocy systemu rekomendacji najlepsze filmy i pokazywało je użytkownikowi razem za analizą i wykresami.

image-20191114122705238

Zespół:

STRUKTURA PROJEKTU

  • chrome_extension - Rozszerzenie do Chrome
  • filmweb_integrator - paczka do łączenia danych z filmweb
  • movies_analyzer - analiza filmów ściągniętych z filmweb
  • movies_recommender - paczka do rekomendacji filmwów
  • server - serwer Flask
  • tests - zbiór testów do aplikacji

URUCHAMIANIE:

  1. Ściągnięcie wszystkich danych do katalogu dane
python setup.py
  1. Instalacja wymagań
pip install -r requirements.txt
  1. Uruchomienie serwera flask
python server.py

image-20191119222643236

Sprawdż czy w chrome_extension/js/content.js , SERVER_URL wskazuje na ten sam adres :

var URL_SERVER = "http://127.0.0.1:5000/render"

CHROME Extension

  1. Dodanie rozszerzenia do chrome:

image-20191119222743159

  1. Zaznaczenie Tryb developera

image-20191119222759038

  1. Załaduj rozpakowane:

image-20191119222818123

  1. Wybieramy Chrome Extension

image-20191119222926022

  1. Pobrany chrome Extension

image-20191119222948005

Przejście do strony filmweb o sobie

image-20191119223041259

  1. Klikamy Statystyki filmweb-rekomendacje

  2. Klikamy Pokaż statystyki jeśli nie pojawi się w nowym oknie:

    image-20191119223331270

image-20191119223323136

Dane

FWAPI

Kolumna Typ Opis
ID int Identyfikator
Tytuł Polski tekst Polski tytuł
Tytuł Oryginalny tekst Oryginalny tytuł
Rok produkcji int Rok produkcji
Ulubione int Czy film dodany do Ulubionych?
Ocena int Ocena na filmwebie, dla danego filmu [1-10]
Komendarz tekst komentarz do oceny filmu
Kraj produkcji tekst Kraj produkcji. filmu
Gatunek tekst lista gatunków podpiętych do filmu
Data data Data ocenienia filmu

IMDB Dataset

Kolumna Typ Opis
tconst tekst id filmu z IMDB
titleType tekst typ filmu [tvEpisode, short,movie]
Primary Title tekst tytuł najbardziej popularny
Original Title tekst tytuł oryginalny
isAdult binarny czy dla dorosłych? (0/1)
startYear Int Początek roku wydania filmu
endYear Int Koniec roku wyświetlania dla seriali
runtimeMinutest int Ile minut trwa film
genres tekst gatunek filmu oddzielony przecinkami przykład: Animation,Comedy,Family

MOVIELENS

u.item

Kolumna Typ Opis
movie id int Wewnętrzne id filmu
movie title tekst Tytuł filmu
release date data data wyjścia filmu
imdb link link link do strony imdb
typ lista binarna lista gatunku filmu, każda kolumna ma wartość 1 jeśli należy do danego gatunku [unknown , Action , Adventure , Animation , Children's , Comedy , Crime , Documentary , Drama , Fantasy , Film-Noir , Horror , Musical , Mystery , Romance , Sci-Fi , Thriller , War , Western ]

u.user

Informacje o każdym ożytkowniku który oceniał film

Kolumna Typ Opis
user id int Id użytkownika
age int wiek
gender tekst M- male, F - female
occupation tekst Czym się zajuje (writer, librarian, writer)

u.data

Informacje o ocenach każdego użytkownika

Kolumna Typ Opis
user id int Id użytkownika
item id int id filmu
rating int Ocena [1-5]
timestamp timestamp Czas w postaci Unix, ilość sekund od czasu: 1/1/1970 UTC

Data Science

  • Wykonanie metodami rekomendacji i znalezienie najbardziej pasującego filmu do już ocenionymi. Skorzystanie z biblioteki surprise i algorytmu SVD , http://surpriselib.com/.
  • Porównanie z innymi algorytmami systemów rekomendacji.
  • Data Engineering - wyciąganie informacji ze scrapowannej strony i połączenie danych z różnych źródeł takich jak imdb.

Linki

About

Projekt ma za zadanie wytworzenie analizatora danych zescrapowanych ze strony filmweb

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •