Мы решили подготовить краткий обзор программ, применяемых для анализа данных, выбрав те, которые наиболее часто используются при решении HR-задач.
Все подобные программы можно условно разделить на 5 больших групп:
1. Неспециализированные программы
2. Специализированный софт
3. Среды разработки программного обеспечения и языки программирования
4. Софт для визуализации данных
5. Облачные платформы.
В первой группе находится давно знакомый и привычный нам MS Excel. Не брезгуют им и продвинутые пользователи, поскольку выгружаемые из ERP систем файлы часто имеют формат CSV или xls и могут редактироваться в Excel, благо возможности работы с таблицами там достаточно продвинутые. Кроме того, Excel уже установлен у большинства пользователей на личных и рабочих компьютерах, что позволяет его отнести к условно бесплатному софту. Многие уже знакомы с основами работы в программе, поэтому обучение статистическим функциям и надстройкам проходит достаточно быстро. Основное внимание уделяется грамотной интерпретации результатов. Именно поэтому, например, мы используем Excel в наших курсах по HR-аналитике.
Однако, к сожалению, у Excel есть и свои ограничения. Прежде всего, надо отметить то, что не все статистические процедуры возможно выполнить в Excel по умолчанию. Так, множественная регрессия, встроенная в надстройку «Пакет анализа», выполняется только в линейной форме, то есть невозможно получить уравнение кривой, если у вас более, чем одна независимая переменная. Нет также по умолчанию и других инструментов анализа данных: логистической регрессии, кластерного, факторного и дискриминантного анализа. Не встроены в программу и многие другие специализированные статистические процедуры.
Зато Excel позволяет сделать неплохую визуализацию результатов анализа, особенно в последних версиях Microsoft Office. Поэтому, если ваша задача – сбор и анализ HR-метрик, Excel – это 100% ваше решение.
Ко 2ой группе относятся специализированные программы для статистического анализа, которые давно и прочно вошли в обиход социологов, маркетологов, медиков и др специалистов, плотно работающих с обработкой данных. Это SPSS, Statistica, Stata, Minitab и т.п. Основной недостаток этого ПО – то, что его требуется специально приобрести и затем научиться в нем работать, хотя обучение проходит достаточно быстро, если пользователь понимает суть статистических процедур. Однако арсенал встроенных инструментов анализа данных здесь значительно шире, чем в Excel и достаточен для решения большинства HR-задач. Но если вам в работе понадобятся продвинутые алгоритмы машинного обучения, то придется прибегнуть к следующей группе программного обеспечения. Как правило, этим занимаются уже продвинутые аналитики данных.
Среды разработки программного обеспечения и языки программирования требуют специальной подготовки – необходимо научиться писать программный код. А на это у работающего HR-а, как правило, нет времени, не говоря о том, что не всем гуманитариям удается справиться с этой непростой задачей. Поэтому это, скорее, инструмент для аналитика данных, который ежедневно решает разноплановые задачи на больших массивах данных. Наиболее популярными языками программирования среди специалистов по анализу данных являются R и Python. Эксперты признают их равнозначными по возможностям, в каких-то случаях один из них превосходит другой, поэтому трудно отдать пальму первенства тому или иному однозначно. Для R существует бесплатная интегрированная среда разработки (IDE) – RStudio. R позволяет обрабатывать более крупные массивы данных, чем Excel, делать визуализацию данных. Для Python также существуют интегрированные программные среды. Среди наиболее часто применяемых PyCharm и Spyder.
Следующая группа софта – программы для визуального анализа и представления данных. Прежде всего, это MS Power BI, Tableau и Qlick. Все эти программы позволяют сделать популярные нынче дашборды, используя множество форматов графиков и диаграмм, даже тех, которые недоступны по умолчанию в Excel, например, диаграмму Sankey. Однако, как и в любых специализированных программах, пользователю необходимо научиться работать с ними, а также приобрести лицензию. Хотя много возможностей MS Power BI предоставляет и в бесплатном варианте. Но, положа руку на сердце, можем сказать, что, если вы не занимаетесь созданием дашбордов ежедневно, вы с успехом можете обойтись и возможностями MS Excel, где, проведя небольшие «танцы с бубном» можно сделать даже такие диаграммы как «спидометр», «термометр» и тот же «Санкей (санки)».
Ну, и наконец, облачные платформы. Это онлайн инструменты, которые позволяют провести анализ и визуализацию данных даже неопытным пользователям, но требуют оплаты подписки. Например, платформа Visier позволяет провести интеграцию с HR-системами, визуализировать HR-данные, прогнозировать увольнение, перемещение сотрудников и др изменения в рабочей силе. К сожалению, отечественный рынок софта пока не богат на подобные решения, да и не очень любят наши работодатели работать в облаках.
Чтобы сделать выбор из всего этого многообразия, рекомендуем сначала определиться с задачами, которые вы планируете решать, что сразу сузит круг ваших интересов. А далее уже в ход пойдут такие критерии как удобство пользования, легкость в обучении и стоимость. У многих решений есть возможность бесплатного пробного использования, так что сначала можно «пощупать» и посмотреть каждый вариант на практике, чтобы быть уверенным в своем выборе.