Data Scientist — это тот, кто занимается обработкой больших массивов информации. Потребность в таких специалистах возникла из-за быстрого развития интернета и накопления огромного количества данных.
Эта профессия стала особо актуальной в последнее время из-за того, что интернет стал более доступным, следовательно, больше людей стали оставлять информацию.
Профессия специалиста по обработке данных появилась после 2000 года, и связана она не с какой-то обычной информацией из интернета, а с особой отраслью IT-науки — Big Data. Она была изобретена как набор инструментов для объединения разнородных файлов с информацией для конкретных задач.
Весь массив данных может быть разделен на три категории:
К последним относятся в основном фото и прочие визуальные материалы, а они, в свою очередь, являются основной частью Big Data.
Чтобы справиться с такими объемами, находя нужное в потоке разрозненных данных, и была придумана профессия Data Scientist (дословно — «ученый по данным»). При этом вакансии, под которыми она подразумевается, могут называться по-разному: аналитик Big Data, менеджер по анализу систем, математик-программист, Data Miner и т. д.
Само название профессии подразумевает, что у этого человека должны быть знания и в области математики, в области статистики и в программировании. Кроме того, он должен хорошо разбираться в бизнес-процессах, различных факторах, влияющих на поведение пользователей.
Data Scientist — это тот, кто занимается вдумчивой аналитической работой, которая может быть неочевидна, но серьезно влияет на успешность любого крупного IT-проекта.
Работа Data Scientist подразумевает различные способы анализа данных:
Например, один из программистов компании Linkedin вместо стандартной работы по улучшению оптимизации проекта занялся разработкой нового алгоритма. В компании не было систем, которые могли бы оценить его работу, но он предложил внедрить решение, позволяющее пользователям быстрее находить знакомых людей или тех, у кого есть похожие данные.
После внедрения алгоритма, узнаваемость бренда выросла в несколько раз, так как количество посетителей значительно увеличилось. То есть этот программист создал алгоритм, который смог систематизировать огромный объем данных и принести пользу.
Конкретные обязанности специалиста зависят от проекта. Но общие черты у этих специальностей похожи:
Чтобы было понятнее, разберем конкретный пример. Имеется онлайн-игра с неплохой концепцией, посещаемостью и наработанным комьюнити. Однако, как показывает практика, если такой проект не развивается, не улучшается, то пользователи теряют к нему интерес. Перед Data Scientist стоит несколько задач:
Для этого специалист совершает несколько действий:
Российские вузы не предлагают обучение на Data Scientist, так как профессия появилась недавно. Нет даже общей системы обучения, так как границы специальности очень размыты.
Считается, что специалист по большим данным должен хорошо разбираться в математике, статистике и теории вероятностей. Поэтому рекомендуется поступать на специальность, где одновременно учат программированию и математическому анализу. Это может быть, к примеру, «Бизнес-информатика» или «Бизнес-аналитика».
В западных странах уже осознали высокую потребность аналитиках баз данных, поэтому в профильных учебных заведениях есть направления, где можно учиться на Data Scientist.
В России и за рубежом многие крупные IT-компании предлагают пройти обучение на эту специальность. Эти курсы платные, а особенность их в том, что большинство из них проводятся дистанционно. Поэтому можно освоить новую профессию без отрыва от основной деятельности.
Вакансии Data Scientist связаны с IT-сферой, но разработки могут иметь самое разное применение:
Представители IT-индустрии констатируют, что рынок испытывает нехватку хороших специалистов этого направления. Потребность в них высока, соответственно, работодатели готовы платить аналитикам приличные деньги.
По данным сервиса по поиску вакансий, зарплата Data Scientist составляет:
Плюсы:
Минусы: