Skip to content

Latest commit

 

History

History
58 lines (52 loc) · 1.78 KB

lista_paquetes.md

File metadata and controls

58 lines (52 loc) · 1.78 KB

Importar y transformar datos

  • dplyr: filtrar filas, seleccionar columnas, crear nuevas columnas
  • tidyr: transformar data.frames
  • readr: importar datos
  • stringr: manipular texto
  • lubridate: fechas
  • forcats: factores

Visualization

  • ggplot2: todo tipo de gráficos

Web scraping

  • request: client HTTP
  • rvest: procesar ficheros HTML, XML, etc.

Herramientas de entrenamiento, validación cruzada, búsqueda de parámetros

  • caret: búsqueda de hyper-parametros, validación cruzada, partición train-test
  • mlr: similar a caret
  • rBayesianOptimization: bayesian optimization
  • modelMetrics: métricas
  • modelr: funciones auxiliares para modelizar
  • broom: extraer y ordenar info de los modelos
  • fastDummies: crear variables dummy

Modelos

  • class: knn
  • pls: PLS, PCR
  • leaps: Forward-backward stepwise y best subset
  • glmnet: penalized regression (Lasso, ElasticNet)
  • glmnetUtils: interfaz de formula para glmnet
  • MASS: ridge regression
  • nnet: multinomial logistic regression
  • mgcv: gam
  • gam: alternativa a mgcv
  • ridge: ridge regression with automatic tunning of the hyper-parameter
  • rpart: arboles de decision
  • randomForest: randomForest
  • e1071: SVM, NaiveBayes
  • gbm: gradient boosting
  • xgboost: extreme gradient boosting
  • kernlab: procesos gaussianos, reducción de dimensionalidad
  • Rtsne: fast tSNE using C optimization routines
  • NMF: non-negative matrix factorization for recommendations and clustering
  • keras: deep learning

Texto

  • word2vec: vectorización, word embeddings, etc.

Datasets

  • coil20: images of objects taken from various angles
  • snedata: repo with wrappers around many datasets