- Почему ты решил стать аналитиком данных, чем тебя привлекает профессия?
- Есть ли опыт командной разработки? Как у вас происходил процесс взаимодействия с другими аналитиками?
- Как ты относишься к написанию кода: делаешь так, чтоб просто работало, или пишешь обдуманно?
- Какие инструменты используешь?
- Сталкивался ли с ревью кода? Как проходило ревью? По какому принципу бы сам проводил ревью?
- С какими менеджерами задач работал?
- Приходилось ли тебе работать в команде? Как у вас была устроена работа с Git?
- Что такое доверительный интервал?
- Что такое P-value?
- Что такое Парадокс Симпсона?
- Как устроены словари?
- Что такое хеш-функция?
- Что такое декораторы?
- Какими библиотеками в работе ты пользовался?
- Работал ли с pandas? Какие методы и основные функции использовал?
- Работал ли с
matplotlib
? Какие методы и основные функции использовал? - Какая разница между кортежем и списком в Python? Между множеством и списком?
- Практическая задачка: создай
dataframe
из списка, из массива. - Что такое функция
map()
и как ее применять? А для чего используетсяreduce()
?
- В чем разница между
WHERE
иHAVING
в SQL? - В чем разница между
UNION
иUNION ALL
? - Какие есть способы обнаружения и удаления дубликатов? Назови три различных подхода.
- Какие join-ы чаще всего используешь? Расскажи подробнее про каждый.
- Предположим у нас есть какой-то продукт, например, светофор. Какую бы метрику качества его работы ты бы предложил?
- Задачка по теории вероятности: предположим 10% писем, которые приходят к нам - это спам. Пользователь получил 100 писем, какая вероятность того, что хотя бы 5 емейлов это спам?
- Задачка: найди самую большую зарплату в отделе, найди вторую самую высокую зарплату? Можно ли решить задачу другим способом?
- Какие есть способы обнаружения и удаления дубликатов? Назови три различных подхода.
- Задачка по теории вероятности: Представьте пустынную дорогу, за 30 минут вероятность, что проедет хотя бы 1 машина - 95%. Какова вероятность, что хотя бы 1 машина проедет за 10 минут?
- Задачка по прогнозированию: Нашим приложением пользуются и с мобильного приложения и через сайт. За прошлый месяц конверсия в покупку упала относительного предыдущего месяца. Но по отдельности конверсия за веб-приложение и мобильное увеличилась. Как такое может быть?
- Задачка по прогнозированию: предположим, что мы решили внедрить платный продукт. Случайно выбрали пользователей для теста. Новым продуктом воспользовались 1000 человек. Каким способом можно спрогнозировать на 95% доверительном интервале медианный/средний чек?
- Вопрос про изменение среднего чека. Допустим есть интернет-магазин с двумя товарами. Мы решили повысить цены сразу на два товара. Покупок в месяц меньше не стало при этом. Верно ли, что средний чек такого магазина вырастет?
- Маркетинговая задача. Перед нами стоит задача снижения стоимости привлечения клиентов. Есть показатель CTR - как люди кликают на объявление в Интернете. Взяли один баннер, но с разными цветами. Выяснили, что конверсия зеленого в два раза больше, чем у красного. Вопрос - верно ли наше предположение, что если мы начнем больше бюджета заливать в зеленый баннер, то стоимость привлечения клиентов снизится?
- При анализе данных интернет-магазина мы заметили, что пользователи, которые привязывают к профилю социальной сети, у них намного выше средний чек, чем у тех, кто не привязывает. У нас появилась идея стимулировать всех пользователей привязывать социальные сети. Насколько это правильная/неправильная инициатива по твоему мнению и почему?