Привет! Меня зовут Иван Зыков, я начинающий Data Scientist.
Я пришёл к работе с данным из сверы EdTech. Последние два года работал как менеджер, продюсер и методист it-курсов в Skyeng.
В этом репозитории собраны проекты, выполненные за время профессиональной пере в Яндекс Практикуме.
Название проекта | Описание проекта | Используемые библиотеки |
---|---|---|
01 Музыка больших городов | Сравнение данных пользователей Яндекс.Музыки по городам и дням недели. | Python, Pandas |
02 Исследование надёжности заемщиков | Анализ данных о клиентах банка и определение доли кредитоспособных. | Python, Pandas, NumPy, Matplotlib, Seaborn, Statsmodels |
03 Исследование объявлений о продаже квартир в Санкт-Петербурге | Исследование архива объявлений о продаже объектов недвижимости в Санкт-Петербурге и Ленинградской области. | Python, Pandas, Matplotlib, Seaborn |
04 Определение перспективного тарифа для телеком-компании | Анализ поведения клиентов оператора сотовой связи для определения наиболее выгодного для оператора тарифа. | Python, Pandas, Numpy, Seaborn, Matplotlib, Scipy |
05 Анализ успеха компьютерных игр | Анализ рынка игровых платформ в разных регионах для определения потенциально популярных игровых жанров и платформ. | Python, Pandas, Numpy, Seaborn, Matplotlib, Scipy |
06 Выбор тарифа для клиентов мобильного оператора | Разработка системы рекомендаций тарифов для оператора мобильной связи. | Python, Pandas, Seaborn, Matplotlib, Sklearn (DecisionTreeClassifier, RandomForestClassifier, LogisticRegression, DummyClassifier) |
07 Предсказание оттока клиентов банка | Предсказание вероятности ухода клиента из банка. | Python, Pandas, Numpy, Seaborn, Matplotlib, Scikit-learn (DecisionTreeClassifier, RandomForestClassifier, LogisticRegression, DummyClassifier), GridSearchCV, resample, shuffle, OneHotEncoder, StandardScaler |
08 Выбор локации для разработки нефтяного месторождения | Обучение модели, которая помогает определить новое место для добычи нефти с наименьшим риском убытков. | Python, Pandas, Numpy, Seaborn, Plotly, Scipy, Matplotlib, Scikit-learn |
09 Прогнозирование коэффициента восстановления золота из руды | Моделирование процесса плавления золотой руды для улучшения работы предприятия. | Python, Pandas, NumPy, Matplotlib, Seaborn, Plotly, Scikit-learn |
10 Защита персональных данных клиентов | Разработка метода шифрования персональных данных клиентов, не ухудшающего качество моделей машинного обучения. | Python, Pandas, NumPy, Matplotlib, Seaborn, Plotly, Scikit-learn |
11 Определение стоимости автомобилей | Разработка модели для определения стоимости автомобиля с пробегом. | Python, Pandas, Numpy, Matplotlib, Plotly, Scikit-learn, LightGBM, XGBoost, CatBoost, Optuna |
12 Прогнозирование заказов такси | Прогноз количества заказов такси на следующий час. | Python, Pandas, NumPy, Matplotlib, Seaborn, Plotly, Sklearn, Statsmodels, CatBoost, XGBoost, LightGBM, Skopt |
13 Классификация токсичных комментариев | Классификация текстовых комментариев по степени их токсичности. | BERT, LightGBM, Scikit-learn, Pandas, Matplotlib, Seaborn |
14 Определение возраста покупателей | Модель для определения приблизительного возраста человека по фотографии. | Python, TensorFlow, ImageDataGenerator, ResNet50, Pandas, NumPy, Seaborn, Matplotlib |
15 Прогнозирование оттока клиентов оператора связи | Прогнозирование оттока клиентов в телекоммуникационной компании. | Python, Pandas, Random Forest, LightGBM, CatBoost, Scikit-learn, NumPy, Matplotlib, Seaborn |