Skip to content

Latest commit

 

History

History
53 lines (41 loc) · 6.41 KB

data-analytics.md

File metadata and controls

53 lines (41 loc) · 6.41 KB

Вопросы на собеседованиях аналитиков

Вопросы по soft skills

Junior

Общие вопросы

  1. Почему ты решил стать аналитиком данных, чем тебя привлекает профессия?
  2. Есть ли опыт командной разработки? Как у вас происходил процесс взаимодействия с другими аналитиками?
  3. Как ты относишься к написанию кода: делаешь так, чтоб просто работало, или пишешь обдуманно?
  4. Какие инструменты используешь?
  5. Сталкивался ли с ревью кода? Как проходило ревью? По какому принципу бы сам проводил ревью?
  6. С какими менеджерами задач работал?
  7. Приходилось ли тебе работать в команде? Как у вас была устроена работа с Git?

Аналитика

  1. Что такое доверительный интервал?
  2. Что такое P-value?
  3. Что такое Парадокс Симпсона?

Python

  1. Как устроены словари?
  2. Что такое хеш-функция?
  3. Что такое декораторы?
  4. Какими библиотеками в работе ты пользовался?
  5. Работал ли с pandas? Какие методы и основные функции использовал?
  6. Работал ли с matplotlib? Какие методы и основные функции использовал?
  7. Какая разница между кортежем и списком в Python? Между множеством и списком?
  8. Практическая задачка: создай dataframe из списка, из массива.
  9. Что такое функция map() и как ее применять? А для чего используется reduce()?

SQL

  1. В чем разница между WHERE и HAVING в SQL?
  2. В чем разница между UNION и UNION ALL?
  3. Какие есть способы обнаружения и удаления дубликатов? Назови три различных подхода.
  4. Какие join-ы чаще всего используешь? Расскажи подробнее про каждый.

Задачки

  1. Предположим у нас есть какой-то продукт, например, светофор. Какую бы метрику качества его работы ты бы предложил?
  2. Задачка по теории вероятности: предположим 10% писем, которые приходят к нам - это спам. Пользователь получил 100 писем, какая вероятность того, что хотя бы 5 емейлов это спам?
  3. Задачка: найди самую большую зарплату в отделе, найди вторую самую высокую зарплату? Можно ли решить задачу другим способом?
  4. Какие есть способы обнаружения и удаления дубликатов? Назови три различных подхода.
  5. Задачка по теории вероятности: Представьте пустынную дорогу, за 30 минут вероятность, что проедет хотя бы 1 машина - 95%. Какова вероятность, что хотя бы 1 машина проедет за 10 минут?
  6. Задачка по прогнозированию: Нашим приложением пользуются и с мобильного приложения и через сайт. За прошлый месяц конверсия в покупку упала относительного предыдущего месяца. Но по отдельности конверсия за веб-приложение и мобильное увеличилась. Как такое может быть?
  7. Задачка по прогнозированию: предположим, что мы решили внедрить платный продукт. Случайно выбрали пользователей для теста. Новым продуктом воспользовались 1000 человек. Каким способом можно спрогнозировать на 95% доверительном интервале медианный/средний чек?
  8. Вопрос про изменение среднего чека. Допустим есть интернет-магазин с двумя товарами. Мы решили повысить цены сразу на два товара. Покупок в месяц меньше не стало при этом. Верно ли, что средний чек такого магазина вырастет?
  9. Маркетинговая задача. Перед нами стоит задача снижения стоимости привлечения клиентов. Есть показатель CTR - как люди кликают на объявление в Интернете. Взяли один баннер, но с разными цветами. Выяснили, что конверсия зеленого в два раза больше, чем у красного. Вопрос - верно ли наше предположение, что если мы начнем больше бюджета заливать в зеленый баннер, то стоимость привлечения клиентов снизится?
  10. При анализе данных интернет-магазина мы заметили, что пользователи, которые привязывают к профилю социальной сети, у них намного выше средний чек, чем у тех, кто не привязывает. У нас появилась идея стимулировать всех пользователей привязывать социальные сети. Насколько это правильная/неправильная инициатива по твоему мнению и почему?