Методы моделирования в бизнес-аналитике с помощью R



В блоге дается краткое введение в методы моделирования в бизнес-аналитике с помощью R.

Различные методы моделирования:

Мы можем разделить любую проблему на более мелкие процессы:





Классификация - есть, где мы классифицируем данные. Например. Болезни все болезни проявляют определенное поведение, и мы можем дополнительно их классифицировать.

Например: заболевания, снижающие иммунитет, болезни, вызывающие головную боль и т. Д.



Регресс - включает выяснение взаимосвязи между несколькими переменными.

Например: как вес человека соотносится с его ростом.

АномолияОбнаружение - это в основном колебания.



Например: в случае высокого или низкого напряжения.

Другой пример может включать регулируемое поведение, которое включает в себя правостороннее или левостороннее движение в зависимости от страны. Аномолия здесь в том, что кто-то едет с противоположной стороны.

Другой пример - вторжение в сеть. Здесь аутентифицированный пользователь входит на веб-сайт вашей компании, а затем, если кто-то не аутентифицированный входит в систему, этоAn0moly.

Важность атрибута - В основном он дает несколько атрибутов, таких как рост, вес, температура, сердцебиение. Следует отметить, что все эти атрибуты важны для задачи.

Например: кто-то пытается предсказать, в какое время человек придет в офис. Каждый атрибут играет важную роль, но не все атрибуты важны.

как использовать python в анаконде

Правила ассоциации - Проще говоря, это анализ или прогноз следующего поведения, в котором оно вращается вокруг механизма рекомендаций.

Например: человек, покупающий хлеб, может также покупать молоко. Если мы проанализируем прошлое покупательское поведение, все товары в корзине имеют отношение. В этом случае есть вероятность, что человек, покупающий хлеб, также купит молоко.

Кластеризация - Это один из старейших статистических методов. Фактически, всегда можно смоделировать любую проблему, будь то классификация или кластеризация, что означает группирование похожих сущностей.

Например:

1) Возьмите корзину с яблоками и апельсинами, в которой мы можем отделить яблоки от апельсинов.

2) Важным вариантом использования кластеризации является здравоохранение. Практически вся статистика и анализ начинались с примеров использования здравоохранения. Если углубиться, существует термин для кластеризации, называемый когортами (люди с похожими заболеваниями), чтобы их можно было изучать отдельно от существующих клиентов. Например, если 10 человек страдают от лихорадки, а еще 10 человек - от головной боли, мы найдем, что у них общего, и создадим лекарство.

Извлечение функций - В точности извлечения признаков, валидность и неудача очень важны. Другими словами, извлечение признаков можно назвать распознаванием образов.

Например:

В поиске Google, когда пользователь вводит термин, появляются результаты. Теперь возникает важный вопрос: как он узнал, какая страница релевантна, а какая не имеет отношения к данному термину? На это можно ответить с помощью извлечения признаков и распознавания образов, которые добавляют характерные особенности. Допустим, дана фотография, определенные камеры обнаруживают лица, выделяют лицо, чтобы получить красивые изображения, а также использует распознавание функций.

Обучение с учителем и обучение без учителя

к) Категория прогнозов - Методы включают регрессию, логистику, нейронные сети и деревья решений. Некоторые примеры включают обнаружение мошенничества (когда компьютер изучает и предсказывает следующее мошенничество на основе предыдущей истории мошенничества). При обучении без учителя невозможно предсказать на примерах, так как нет исторических данных.

б) Категория классификации - Если взять пример, является ли транзакция мошеннической или нет, она попадает в категорию классификации. Здесь мы берем исторические данные и классифицируем их с помощью деревьев решений или, если мы вообще не берем никаких исторических данных, мы начинаем непосредственно с данных и пытаемся использовать функции самостоятельно. Например, если нам нужно знать сотрудников, которые могут покинуть организацию или остаться. В случае, если это новая организация, где мы не можем использовать исторические данные, мы всегда можем использовать кластеризацию для извлечения данных.

в) Категория разведки - Это простой метод, придумывающий, что означают большие данные. В обучении без учителя это называется основными компонентами и кластеризацией.

г) Категория соответствия - здесь задействованы несколько элементов, такие как перекрестные продажи / продажи, анализ корзины. В анализе корзины нет контролируемого обучения, так как нет исторических данных. Итак, мы берем данные напрямую и находим ассоциации, секвенирование и факторный анализ.

Есть вопрос к нам? Упомяните их в разделе комментариев, и мы свяжемся с вами.

Похожие сообщения: