Data Scientist — что это за профессия?

профессии будущегопрограммисты
работа аналитиком big data

Data Scientist — это тот, кто занимается обработкой больших массивов информации. Потребность в таких специалистах возникла из-за быстрого развития интернета и накопления огромного количества данных.

Эта профессия стала особо актуальной в последнее время из-за того, что интернет стал более доступным, следовательно, больше людей стали оставлять информацию.

Data Scientist — что это за профессия

data scientist что за профессия?

Профессия специалиста по обработке данных появилась после 2000 года, и связана она не с какой-то обычной информацией из интернета, а с особой отраслью IT-науки — Big Data. Она была изобретена как набор инструментов для объединения разнородных файлов с информацией для конкретных задач.

Весь массив данных может быть разделен на три категории:

  • структурированные;
  • полуструктурированные;
  • неструктурированные.

К последним относятся в основном фото и прочие визуальные материалы, а они, в свою очередь, являются основной частью Big Data.

Чтобы справиться с такими объемами, находя нужное в потоке разрозненных данных, и была придумана профессия Data Scientist (дословно — «ученый по данным»). При этом вакансии, под которыми она подразумевается, могут называться по-разному: аналитик Big Data, менеджер по анализу систем, математик-программист, Data Miner и т. д.

Само название профессии подразумевает, что у этого человека должны быть знания и в области математики, в области статистики и в программировании. Кроме того, он должен хорошо разбираться в бизнес-процессах, различных факторах, влияющих на поведение пользователей.

Data Scientist — это тот, кто занимается вдумчивой аналитической работой, которая может быть неочевидна, но серьезно влияет на успешность любого крупного IT-проекта.

Чем конкретно занимается Data Scientist

Работа Data Scientist подразумевает различные способы анализа данных:

  1. Сбор статистики.
  2. Создание моделей баз данных.
  3. Прототипирование.
  4. Методы интеллектуального анализа.
  5. Использование специальных приложений для работы с данными.
  6. Методы проектирования и разработки баз данных.

Например, один из программистов компании Linkedin вместо стандартной работы по улучшению оптимизации проекта занялся разработкой нового алгоритма. В компании не было систем, которые могли бы оценить его работу, но он предложил внедрить решение, позволяющее пользователям быстрее находить знакомых людей или тех, у кого есть похожие данные.

После внедрения алгоритма, узнаваемость бренда выросла в несколько раз, так как количество посетителей значительно увеличилось. То есть этот программист создал алгоритм, который смог систематизировать огромный объем данных и принести пользу.

Конкретные обязанности специалиста зависят от проекта. Но общие черты у этих специальностей похожи:

  • Сбор данных из различных источников, чтобы на их основе проводить обработку;
  • работа с потребителями, анализ среза мнений;
  • моделирование клиентской базы;
  • работа над персонализацией продуктов;
  • оценка, анализ и составление отчетности эффективности внутренних процессов базы;
  • анализ различных рисков и т. д.

Чтобы было понятнее, разберем конкретный пример. Имеется онлайн-игра с неплохой концепцией, посещаемостью и наработанным комьюнити. Однако, как показывает практика, если такой проект не развивается, не улучшается, то пользователи теряют к нему интерес. Перед Data Scientist стоит несколько задач:

  • удержать игроков;
  • расширить комьюнити;
  • сделать так, чтобы среднее время, затраченное на игру, увеличивалось.

Для этого специалист совершает несколько действий:

  • собирает и анализирует ключевые показатели проекта;
  • проектирует метрики для того, чтобы спрогнозировать поведение игроков;
  • анализирует обновления и различные акции в игре, как они влияют на настроение комьюнити;
  • формулирует свои рекомендации: какие изменения в игру вносить, что можно улучшить, от чего отказаться и т. д. Затем отслеживает реакцию на изменения.

Курсы по Data Scientist

data scientist курсы

Российские вузы не предлагают обучение на Data Scientist, так как профессия появилась недавно. Нет даже общей системы обучения, так как границы специальности очень размыты.

Считается, что специалист по большим данным должен хорошо разбираться в математике, статистике и теории вероятностей. Поэтому рекомендуется поступать на специальность, где одновременно учат программированию и математическому анализу. Это может быть, к примеру, «Бизнес-информатика» или «Бизнес-аналитика».

В западных странах уже осознали высокую потребность аналитиках баз данных, поэтому в профильных учебных заведениях есть направления, где можно учиться на Data Scientist.

В России и за рубежом многие крупные IT-компании предлагают пройти обучение на эту специальность. Эти курсы платные, а особенность их в том, что большинство из них проводятся дистанционно. Поэтому можно освоить новую профессию без отрыва от основной деятельности.

Зарплата Data Scientist

data scientist зарплата

Вакансии Data Scientist связаны с IT-сферой, но разработки могут иметь самое разное применение:

  • медицина;
  • финансы;
  • телекоммуникации;
  • торговля.

Представители IT-индустрии констатируют, что рынок испытывает нехватку хороших специалистов этого направления. Потребность в них высока, соответственно, работодатели готовы платить аналитикам приличные деньги.

По данным сервиса по поиску вакансий, зарплата Data Scientist составляет:

  • Минимальная — от 25 тысяч рублей.
  • Максимальная — более 200 тысяч рублей.

Плюсы и минусы работы Data Scientist

Плюсы:

  • востребованность;
  • актуальность;
  • высокий уровень дохода.

Минусы:

  • молодая специальность, не вполне определенный круг обязанностей;
  • требуется долго обучаться, обязательно знание математики и статистики;
  • нет возможности получить системное профильное образование в России.