Exploratory Data Analysis wine quality dataset (FIAP IA04)
Utilizando a base descrita e disponibilizada em aula o objetivo do trabalho é mensurar a variável “Quality” dos vinhos desta região de Portugal com as variáveis de características (composição) dos vinhos.
Etapa 1 (Base)
- Avaliar se a análise será feita com os dois tipos de vinhos juntos ou se separaria por tipo para analisá-los.
- Análise exploratória de dados: Detecção de outliers, gráficos e análise sobre os dois tipos de vinhos. Correlações entre elas (numéricas e gráficos).
- Conclusão: colocar qual a opção seguirá sobre os tipos de vinhos , sobre os outliers (caso tenha) e o uso de Componentes Principais
Etapa 2 (Algoritmos explicar variável Quality
)
- Modelo 1: Regressão Linear
- Modelo 2: Árvore de regressão
- Para cada modelo fazer as análises adequadas como:
- explicar a técnica
- qual a variável dependente,
- quais são as variáveis independentes,
- relações entre elas (numéricas e gráficos) (verificar se todas já foram efetuadas adequadamente na parte 1.
- saída do modelo (análise)
- qualidade do modelo
- O que cada modelo gerou de resultados?
- Comparação entre modelos
- Utilizando as métricas adequadas para comparação de modelos façam um resumo sobre a qualidade dos modelos e indiquem qual o modelo/ técnica que vocês recomendariam
Etapa 3 (Algoritmos explicar variável "Quality": Vinhos bons e ruins)
- Modelo 1: Árvore de decisão
- Modelo 2: Regressão Logística
- Para cada modelo fazer as análises adequeadas como:
- explicar a técnica
- qual a variável dependente,
- quais são as variáveis independentes,
- relações entre elas (numéricas e gráficos) (verificar se todas já foram efetuadas adequadamente na parte 1.
- saída do modelo (análise)
- qualidade do modelo
- O que cada modelo gerou de resultados?
- Comparação dos modelos
- Utilizando as métricas adequadas para comparação de modelos façam um resumo sobre a qualidade dos modelos e indiquem qual o modelo/ técnica que vocês recomendariam
Etapa 4 (Análise sobre outras possíveis técnicas)
- quais outras técnicas supervisionadas vocês indicariam como adequadas para esta análise?
- e, das técnicas Não Supervisionadas, quais?