This is my repo with projects from Yandex.Praktikum educational courses
Project | Description | Stack |
---|---|---|
Proj 1 | Исследовательский анализ данных кредитного отдела банка. Предобработка данных. | pandas, numpy, pymystem |
Proj 2 | Исследовательский анализ цен и параметров недвижимости. Анализ распределений данных, графический анализ. | pandas, numpy, matplotlib, seaborn |
Proj 3 | Статистический анализ тарифов мобильного оператора. Анализ распределений. Формулирование гипотез и проверка стат.тестами (t-test). | scipy, pandas, numpy, matplotlib, seaborn |
Proj 4 | Предобработка данных, исследовательский и статистический анализ рынка видеоигр. Проверка гипотез, t-test. | scipy, pandas, numpy, matplotlib, seaborn |
Proj 5 | Построение рекомендательной системы выбора тарифа мобильного оператора. Построение модели бинарной классификации | sklearn, pandas, numpy, seaborn |
Proj 6 | Прогнозирование ухода клиентов банка. Построение моделей бинарной классификации. | sklearn, pandas, numpy, seaborn |
Proj 7 | Регрессионные модели предсказания добычи сырья. Построение моделей и анализ результатов прогнозирования. Определение доверительных интервалов для оценки бизнес-метрик (рисков). | sklearn, scipy, pandas, numpy, seaborn, matplotlib, joblib |
Proj 8 | Исследование технологического процесса обогащения золота и построение моделей регрессии для различных этапов технологического процесса. | sklearn, scipy, pandas, numpy, seaborn, matplotlib |
Proj 9 | Линейная алгебра и методы матричного кодирования данных. Прототипирование алгоритма кодирования матрицы признаков для обезличивания данных. | sklearn, numpy, pandas |
Proj 10 | Модель определения стоимости авто. Оценка моделей по критериям качества предсказания, а также производительности(скоростей обучения и предсказания) | lightgbm, catboost, scipy, pandas, numpy, seaborn, matplotlib |
Proj 11 | Построение моделей для планирования загрузки таксопарка по времени. Генерация признаков из временных рядов. Выявление трендов и сезонности. | sklearn, xgboost, lightgbm, catboost, scipy, pandas, numpy, seaborn, matplotlib |
Proj 12 | NLP - анализ токсичности комментариев. Обработка текста, классификация. | pandas, sklearn, re, gensim, NTLK, keras |
Proj 13 | Computer vision - определение возраста по фотографиям | pandas, Keras |