Introdução ao Aprendizado de Máquina Supervisionado com Python

Repositório com Materiais do Minicurso de Introdução ao Aprendizado de Máquina Supervisionado utilizando a linguagem Python.

Estrutura do Minicurso

O minicurso é dividido em 4 partes, sendo elas:

Parte 1

O Conjunto de Dados a ser utilizado durante o minicurso é uma cópia dos dados de Câncer de Mama do Estado de Wisconsin (EUA) de novembro de 1995, elaborado por: Dr. William H. Wolberg, W. Nick Street e Olvi L. Mangasarian. O Conjunto de Dados é carregado através da biblioteca sklearn.datasets.

Com o carregamento dos dados, eles serão divididos utilizando o método de Reamostragem Holdout onde 60% dos dados são destinados para treino e 40% para teste dos algoritmos de Classificação.

No total, 4 algoritmos de Classificação são utilizados, sendo eles:

Com o treinamento dos algoritmos e as previsões dos mesmos realizadas, os resultados são calculados a partir do acerto das previsões em relação as rótulos verdadeiros para os dados.

Parte 2

Nesta Parte a Reamostragem Holdout é comparada com a Bootstrap, onde divide o Conjunto de Dados em dois subconjuntos (um para treino e outro para teste) com a reposição de dados, ou seja, um mesmo dado pode aparecer em ambos os subconjuntos.

Com a divisão dos dados utilizando duas Reamostragens, os algoritmos de classificação são iniciados utilizando parâmetros diferentes de seus padrões.

Já nos Resultados, as previsões dos algoritmos são comparadas com métricas estatísticas voltadas para os 4 possíveis valores de acordo com uma Matriz de Confusão de Classificação Binária.

Parte 3

Nesta Parte a técnica K-Fold de Validação Cruzada é utilizada para dividir o Conjunto de Dados em k subconjuntos e execuções. Os algoritmos estão com os mesmos parâmetros informados na Parte 2.

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
.ipynb_checkpoints		.ipynb_checkpoints
Comparações		Comparações
Parte 1.ipynb		Parte 1.ipynb
Parte 2 - Resultados.csv		Parte 2 - Resultados.csv
Parte 2.ipynb		Parte 2.ipynb
Parte 3 - Resultados.csv		Parte 3 - Resultados.csv
Parte 3.ipynb		Parte 3.ipynb
README.md		README.md
Slide - Aprendizado de Máquina Supervisionado com Python.pptx		Slide - Aprendizado de Máquina Supervisionado com Python.pptx
breast_cancer.csv		breast_cancer.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Introdução ao Aprendizado de Máquina Supervisionado com Python

Estrutura do Minicurso

Parte 1

Parte 2

Parte 3

About

Releases

Packages

Languages

rodolfobolconte/minicurso-aprendizado-supervisionado

Folders and files

Latest commit

History

Repository files navigation

Introdução ao Aprendizado de Máquina Supervisionado com Python

Estrutura do Minicurso

Parte 1

Parte 2

Parte 3

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages