Este projeto foi desenvolvido na disciplina de Ciência dos Dados do Insper pelos alunos:
Utilizamos a base de microdados do ENEM 2022 para realizar a análise.
Prever uma variável principal (Nota de matemática) em função de demais outras variáveis (Cor/Raça, Renda, Sexo, ser Treineiro e Nota de Ciências Humanas) que podem influenciar em seu comportamento.
Como a base de microdados que estamos utilizando é muito pesada, é necessário utilizar o Git LFS para baixar os arquivos.
Primero, instale o Git LFS no site oficial: https://git-lfs.github.com/
Depois, clone o repositório da forma que preferir:
Utilizando https:
git clone https://github.com/Phvr06/Proj2-Cdados.git
Utilizando ssh-key:
git clone [email protected]:Phvr06/Proj2-Cdados.git
Utilizando GitHub CLI:
gh repo clone Phvr06/Proj2-Cdados
Após isso, entre na pasta do repositório e execute os seguintes comandos:
git lfs fetch
git lfs checkout
Agora será possível acessar os arquivos da base de microdados e executar o jupyter notebook.