Проект | Описание |
---|---|
Attention control | Командный проект по курсу MLOps by ODS. Реализована модель обучения, основанная на сжатии модели SKResNeXt50 с использованием дистилляции знаний. Для версионирования данных, отслеживания экспериментов и воспроизводимости результатов обучения я использовал DVC, а также развернул сервер MLflow в облаке. Командная работа была основана на методологии Scrum. |
Emotion detection | Проект посвящен распознаванию эмоций в русскоязычном тексте с использованием Bert-like моделей. Я собрал датасет, разработал обучающий конвейер с использованием PyTorch Lightning, внедрил методы MLOps, включая DVC и ML Flow для отслеживания экспериментов. Разработал и внедрил API-сервис с использованием FastAPI. |
Проект | Описание |
---|---|
Линейные модели | Реализация алгоритма линейной регрессии. Реализация алгоритма логистической регрессии, решение задача многоклассовой классификации с помощью метода One-vs-All. Реализация различных видов градиентного спуска. Предобработка и визуализация данных |
Полиномиальная регрессия. Переобучение и недообучение | Реализация полиномиальной регрессии и изучение явлений недообучения и переобучения |
Алгоритмы PCA и kmeans | Реализация алгоритмов PCA и kmeans |
Полносвязная нейронная сеть | Реализация многослойного перцептрона и метода обратного распространения ошибки |
Логистическая регрессия и градиентный бустинг | Логистическая регрессия, sklearn, gridsearch, pipeline, catboost |
Exploratory data analysis | Разведочный анализ данных на данных по доходу населения UCI Adult и данных по олимпийским играм Olympic games (ods course) |
EvrazHack | Хакатон от компании Evraz. Задача состояла в том, чтобы разработать алгоритм для прогнозирования содержания углерода и температуры чугуна. В нашем решении использовали catboost |
RaifHack | Хакатон от Райффайзен Банка. Задача заключалась в прогнозировании цены на коммерческую недвижимость (табличные данные). Была произведена предобработка данных, генерация признаков, в качестве модели использовали catboost |
Проект | Описание |
---|---|
Визуализация данных | Различные методы визуализации данных с помощью библиотек matplotlib и Plotly |
Базовые понятие математической статистики | Описательные статистики, гистограммы, box-plot, ЦПТ, доверительные интервалы для среднего, проверка распределения признаков на нормальность, KS-тест, qq plot |
Визуализация многомерных данных | Визуализация с использованием t-SNE и UMAP с различными параметрами |
Предобработка данных и статистические тесты | EDA, критерий Шапиро-Уилка, критерий Бартлетта, t-критерий Стьюдента, критерий Хи-квадрат |
Корреляция и линейная регрессия | Корреляция по Пирсону, линейная регрессия, предобработка данных |
Дисперсионный анализ | Дисперсионный анализ. однофакторный ANOVA тест, t-критерий Стьюдента, пост-хок тесты Тьюки, двухфакторный ANOVA тест |
Проект | Описание |
---|---|
Libft | Реализация основных функций стандартной библиотеки Си. Написаны функции для работы с: символами, строками, числами, памятью, списками, бинарными деревьями. Язык программирования - Си |
Libasm | Целью этого проекта является знакомство с языком ассемблера, регистрами и функциями. |
Cub3d | Создание игры с реализацией технологии ray-casting в стиле Wolfenstein 3D, с использованием небольшой графической библиотеки MiniLibX. Язык программирования - Си |
Minishell | Реализация командной оболочки по типу bash или zsh, со всем основным функционалом. Язык программирования - Си |
Philosophers | Этот проект представляет собой обучение многопоточному/многопроцессному программированию с использованием мьютекса и семафора на примере задачи с философами. Язык программирования - Си |
Server | Целью данного проекта является введение в системное администрирование. Для этого я изучил докер и использовал его для установки полноценного веб-сервера. На этом сервере работает несколько сервисов: Wordpress, phpMyAdmin и база данных SQL. |
Services | Этот проект направлен на изучение того, как работает Kubernetes. Я открыл для себя управление кластером и развертывание с помощью Kubernetes. |
Containers | Этот проект направлен на то, чтобы понять, как работают контейнеры из библиотеки STL. Реализованы следующие контейнеры: vector, stack, set, map Язык программирования - Си++ |
Webserv | Реализация собственного веб-сервер. Программа способна запускать HTTP-сервер, обрабатывать запросы и анализировать файлы конфигурации. Язык программирования - Си++ |
Laon_app | Курсовой проект. Создание на flask веб-приложения по типу карточек Anki. Язык программирования - Python |
Mirea-cpp Cpp-module java_labs R-practice | Различные практические задания в вузе и школе 21. Mirea-cpp - практики по процедурному программированию на языке С++. Cpp-module - практики из Школы 21 по объектно-ориентированному программированию. java_labs - практики по ооп на java. R-practice - практики по анализу данных на R. |