25/07/2024

Сбор, хранение, обработка и анализ данных: чем занимается Data Scientist

Термин Data Science используют для обозначения новой профессии, которая осмысливает огромные хранилища данных, стремительно растущих с каждым годом. Специалист по работе с данными для решения задач бизнеса стал важным звеном и в системе Газпромбанка. Рассказываем, какие задачи решает Data Scientist, и какие требования мы выдвигаем к кандидату на эту должность.  

Профессия Data Science родилась на стыке программирования, машинного обучения и математики. В основные обязанности Data Science-специалиста входит сбор и анализ данных, построение моделей, их обучение и тестирование. Специалист по Data Science должен хорошо понимать, как работает компания и конкретная индустрия, в которой он занят.
От студентов, которые только собираются стать специалистами по Data Science, часто приходится слышать следующее определение профессии: «Это человек, который умеет все». На самом деле роли Data Science в Газпромбанке бывают очень разные. Есть data-engineer, ML-engineer, есть те, кто собирает, модели, а есть те, кто анализирует информацию. И все они работают в области Data Science.

Андрей Анисимов,

управляющий директор, Департамент анализа данных и моделирования:

Data Science представляет собой комплексную дисциплину, занимающуюся изучением методов сбора, хранения, обработки и анализа данных. Также есть искусственный интеллект – это скорее не наука, а область, где в целом рассматриваются различные процессы: как их автоматизировать, роботизировать, предсказывать, и объяснять результаты. ИИ охватывает разработку алгоритмов и технологий, которые позволяют компьютерам выполнять задачи, традиционно требующие человеческого интеллекта, такие как восприятие, рассуждение, обучение и принятие решений. И если мы говорим про искусственный интеллект, то он включает в себя и машинное обучение, и глубокое обучение. Пересечение искусственного интеллекта с Data Science происходит на уровне математики и статистики.

Банку, как крупному бизнесу, нужно принимать быстрые качественные решения, и здесь не всегда выигрывают нейросети. Существуют задачи, с которыми лучше справятся нейросети, например, работа с неструктурированными данными (текст, изображение), а есть задачи, где лучше использовать модели для работы со структурированными данными, например, бустинг. Здесь к работе подключаются классические ML-engineers. Кроме того, есть вопросы к интерпретируемости модели. Если в задаче стоит вопрос о понимании, как модель принимает решение на основе данных, то нейросети не подходят.

Первые шаги специалиста по Data Science

Команда, которая занимается Data Science в Газпромбанке, довольно большая. В ней, помимо специалистов по Data Science, присутствуют также data-analysts и  data-engineers. Есть отдельные департаменты, которые занимаются протягиванием данных. 

Чтобы стать частью команды Газпромбанка в роли специалиста по data Science, необходим предварительный созвон с HR. Дальше соискатель проходит техническое интервью и фит-интервью с Product Owner. 

Для подготовки к собеседованию не лишним будет изучить информацию в открытых источниках на тему Data Science, а также познакомиться с инженерной культурой Data Science в Газпромбанке.
Иногда кандидатам до собеседования может казаться, что они знают все модели машинного обучения. Но на деле оказывается, что они знают их достаточно поверхностно, и этого недостаточно для работы. Второй момент: кандидат может не учесть, что Data Science-специалист должен работать с данными. Язык SQL является обязательным для будущих сотрудников. Это связано с тем, что мы агрегацию данных производим непосредственно в БД, чтобы оптимизировать расход памяти и скорости выполнения скриптов на формирование витрин. 

Приветствуется, когда Data Scientist умеет агрегировать данные и готовить их к модели. К примеру, знает, что такое оконные функции. 

Ирина Скорынина,

директор по разработке моделей, Департамент анализа данных и моделирования:

Нам очень важно, чтобы Data Scientist мог сам полностью пройти путь от и до. Бывают ситуации, когда нужно быстро отредактировать таблицу, не ждать data-engineer, когда он за тебя это сделает, а самостоятельно разобраться в данных, которые он погружает в модель. Важно услышать, насколько кандидат в целом входит в нашу культуру, насколько ему хорошо будет работать в системе Agile, потому что у нас scrum-команда, которая работает спринтами, со всеми церемониями от daily до retro.

Этапы, которые ждут кандидата на пути в команду Data Science Газпромбанка 
  1. созвон с HR
  2. техническое интервью
  3. фит-интервью

Дарья Архипова,

директор, Отдел подбора персонала информационных технологий, Департамент по работе с персоналом:

HR-созвон существует для того, чтобы понять, насколько мы подходим друг к другу. Мы ищем людей не на какой-то конкретный проект, а нам важно, чтобы человек вписывался в культуру компании и в культуру команды, в которую он идет. Сверяем вакансию и профиль на первом созвоне, уточняем опыт и мотивацию, обозначаем дальнейшие этапы. Нужно понять, насколько вакансия будет соответствовать ожиданиям кандидата, и будет ли ему интересно решать конкретные задачи и комфортно ли работать в предложенном формате. Мы также обращаем внимание на Soft Skills на этом этапе: коммуникабельность, открытость, умение управлять своим временем и четкость в соблюдении договоренностей. Если сверка ожиданий с обеих сторон проходит успешно, то мы переходим на следующий этап и договариваемся о техническом интервью с экспертами Data Science.

Последний этап интервью проводится с руководителем команды и начальником управления по моделированию. Здесь кандидату важно услышать общую постановку задачи, специфику банковского бизнеса, мнение об экономических показателях, которые влияют на бизнес, например, размер ключевой ставки.

Ирина Скорынина,

директор по разработке моделей, Департамент анализа данных и моделирования:

Мы рады всем кандидатам, которые обучались на смежное с DS направление в университете или прошел переподготовку на направление DS. Как правило, на собеседовании сразу становится понятно, насколько хорошо кандидат погружен в DS. На техническом интервью мы разбиваем вопросы и live-coding на несколько блоков. В первой части это знание SQL и Python, далее вопросы на знание статистики, моделей машинного обучения, а также не забываем о софт-скиллах, например, как кандидат подходит к решению задачи сейчас, из каких последовательных этапов состоит его процесс успешно завершенной задачи.

Растем от джуна до синьора

Для работы специалисту по Data Science нужно два вида навыков: hard и soft. Первые связаны с профильными дисциплинами, а вторые – с личными качествами и навыками управления, а также общением с другими участниками команды и заказчиком.

Как быстро кандидат может вырасти до мидла и впоследствии до сеньора, если он пришел на позицию джуна? На каждую позицию уходит от шести месяцев до года, но все очень индивидуально. Главное, понимать, сколько твоя работа приносит денег, и какой ее результат. 

Для этого, с одной стороны, надо развивать техническую базу. В Газпромбанке есть свои библиотеки, которые специалисты используют для того, чтобы выстраивать модели. Нужно понимать, как они работают, но при этом развиваться еще в области финансовых доходов, разбираться в различных понятиях, например: что такое чистый операционный доход и чем он отличается от LTV.

Ирина Скорынина,

директор по разработке моделей, Департамент анализа данных и моделирования:

Подниматься по карьерной лестнице возможно тем, кто хорошо освоил финансовую часть и стремится к росту бизнес-показателей. У нас есть разные позиции: от стажеров до исполнительных директоров. Рост заключается в развитии и soft, и hard-скилов, например, джун учится анализировать данные, реализовывать интересные решения, общаться с бизнес-заказчиком, и это развитие приводит к неизбежному карьерному росту.

На рост Data Scientist в компании влияют три главных показателя: 
  • Постоянное получение опыта и развитие своих навыков
  • Внесение ощутимого вклада в решение конкретных задач
  • Отслеживание трендов и их применение в реальных проектах
К надпрофессиональным навыкам специалиста можно отнести:
  • Коммуникацию с коллегами
  • Презентация результатов своей работы
  • Критическое мышление
  • Ответственность
  • Креативность мышления 
  • Коммуникабельность
  • Навык ведения переговоров
Профессия Data Scientist постоянно развивается и высоко оплачивается. Появляются новые интересные задачи. Поэтому востребованность Data Science в таких крупных компаниях как Газпромбанк будет только расти. Следите за вакансиями на нашем сайте и присоединяйтесь к команде мечты!
0%

Банк ГПБ (АО) использует файлы cookie. Подробная информация –
в правилах по обработке персональных данных. Вы можете запретить сохранение cookie в настройках своего браузера.