Olá! Se você está vendo esta mensagem, deve ser um candidado para nosso time de dados! Este case serve para identificar em você as principais habilidades técnicas que estão em nosso dia a dia aqui na ChatClass. Sendo assim, lhe desejamos boa sorte e vamos ao que interessa :)
Gosta de filmes? Então você vai amar esse desafio! Neste case você irá trabalhar com dados retirados do site Kaggle.
O objetivo é testar 3 habilidades:
- ETL com python
- SQL
- Uso de API's REST
Para isso, vamos precisar que execute as seguintes tarefas:
Na tabela credits, extraia da coluna crew (lista de pessoas) quem é o diretor do filme (nome e ID). Pra isso, basta encontrar na lista de pessoas, alguém cujo job é Director (cuidado com case sensitive). Alguns filmes não vão ter essa informação, mas são bem poucos.
Após conseguir adicionar o nome do diretor e seu ID em cada linha da tabela credits, crie um banco de dados SQLite e insira as duas tabelas (movies e credits) no banco, utlizando formatos coerentes para as colunas. Não é necessário inserir as colunas JSON, pode descartá-las.
Agora, através de queries SQL:
- Liste o budget total (somatório) de todos os filmes para cada um dos diretores. Os diretores estão na tabela credits e os budgets na tabela movies.
- Liste a soma acumulada do faturamento (revenue) dos diretores a cada novo filme, por ordem de data de release dos filmes (apenas para filmes da "Warner Bros.")
- Liste as top 10 produtoras em faturamento no ano de 2009
Depois de ver um bom filme bate aquele tédio, não é? Bom, a atividade desta etapa é consultar (via python) esta API através de um GET e buscar uma atividade para matar o tédio!