Процесс прогнозной аналитики в бизнес-аналитике с R



Блог дает краткое представление о процессе Predictive Analytics в Business Analytics с R

Типичный процесс моделирования:

В типичном процессе моделирования важно начать рисовать гипотезу. После получения RFP (Request for Proposal, запрос предложений) составляется гипотеза.





  1. Определите правильный источник данных - Здесь заказчик может предоставить источник данных, если нет, нам придется искать источник данных. В сценарии, в котором мы пытаемся оценить, кто победит на выборах, проводится публичный анализ данных с источниками, которые включают социальные сети, новостные каналы или общественное мнение. Нам также необходимо понимать объем данных, необходимых для анализа проблемы. В этом случае мы обычно ищем большие выборки, так как это случай выборов. С другой стороны, если анализ проводится в сфере здравоохранения, трудно использовать большую популяцию, потому что существует вероятность нехватки людей для проверки гипотезы. Также очень важно качество данных.
  2. Извлечь данные - Например, если мы возьмем выборку населения, мы сможем посмотреть на такие атрибуты, как высокий доход, низкий доход, возраст, работающее население (вне / на месте), жители, NRI, охват больниц и т. Д., Чтобы начать исследование. . Здесь нам может не понадобиться так много атрибутов для гипотезы. Мы понимаем, что такие характеристики, как высокий и низкий доход, могут не быть факторами, способствующими определению победителя на выборах. Но возраст может иметь значение, поскольку он дает прямой подсчет того, сколько людей собирается проголосовать. Часто мы можем исключать менее используемые атрибуты или включать полезные атрибуты. В обоих случаях все могло пойти не так. Вот почему аналитика является сложной задачей.
  3. Массаж данных по размеру инструмента - Это потому, что не все инструменты могут принимать все данные. Некоторые инструменты принимают только данные CSV или Excel. Отсутствие инструментов - проблема.
  4. Проведите анализ - Эту операцию можно выполнить с помощью многих методов аналитики.
  5. Сделать выводы - Анализ дает точные цифры. Но пользователь должен делать выводы из этих цифр. Например, если там написано 10% или 20%, мы должны понимать, что это значит? Есть ли корреляция между атрибутом A и атрибутом B?
  6. Реализовать результаты - Важно делать выводы, чтобы видеть результаты в бизнесе. Например, можно сделать вывод, что «Люди покупают зонтик в сезон дождей» что может привести к увеличению бизнеса. Здесь нам нужно реализовать вывод, где мы делаем зонтик, доступный в магазинах, но тогда у него могут быть проблемы с управлением. Как только статистика даст результат, реализация может пойти не так.
  7. Наблюдать за прогрессом - Последний шаг, здесь важную роль играет мониторинг. Мониторинг может пойти не так, потому что не многие организации хотят отслеживать прогресс, и это считается незначительным шагом. Но мониторинг важен, поскольку мы можем понять, движутся ли наши исследования и выводы в правильном направлении.

Также ознакомьтесь с этой статьей' Корреляция не означает причинно-следственную связь 'что дает представление о том, как аналитики могут ошибаться. Важный момент, который следует отметить в этой диаграмме, заключается в том, что текущий анализ - это единственный этап, на котором машина несет ответственность, и, кроме того, это зависит от человека, который в конечном итоге будет определять, как будет проводиться исследование.

Есть вопрос к нам? Упомяните их в разделе комментариев, и мы свяжемся с вами.



Похожие сообщения:



как проверить палиндром в Java