Различные методы моделирования:
Мы можем разделить любую проблему на более мелкие процессы:
Классификация - есть, где мы классифицируем данные. Например. Болезни все болезни проявляют определенное поведение, и мы можем дополнительно их классифицировать.
Например: заболевания, снижающие иммунитет, болезни, вызывающие головную боль и т. Д.
Регресс - включает выяснение взаимосвязи между несколькими переменными.
Например: как вес человека соотносится с его ростом.
АномолияОбнаружение - это в основном колебания.
Например: в случае высокого или низкого напряжения.
Другой пример может включать регулируемое поведение, которое включает в себя правостороннее или левостороннее движение в зависимости от страны. Аномолия здесь в том, что кто-то едет с противоположной стороны.
Другой пример - вторжение в сеть. Здесь аутентифицированный пользователь входит на веб-сайт вашей компании, а затем, если кто-то не аутентифицированный входит в систему, этоAn0moly.
Важность атрибута - В основном он дает несколько атрибутов, таких как рост, вес, температура, сердцебиение. Следует отметить, что все эти атрибуты важны для задачи.
Например: кто-то пытается предсказать, в какое время человек придет в офис. Каждый атрибут играет важную роль, но не все атрибуты важны.
как использовать python в анаконде
Правила ассоциации - Проще говоря, это анализ или прогноз следующего поведения, в котором оно вращается вокруг механизма рекомендаций.
Например: человек, покупающий хлеб, может также покупать молоко. Если мы проанализируем прошлое покупательское поведение, все товары в корзине имеют отношение. В этом случае есть вероятность, что человек, покупающий хлеб, также купит молоко.
Кластеризация - Это один из старейших статистических методов. Фактически, всегда можно смоделировать любую проблему, будь то классификация или кластеризация, что означает группирование похожих сущностей.
Например:
1) Возьмите корзину с яблоками и апельсинами, в которой мы можем отделить яблоки от апельсинов.
2) Важным вариантом использования кластеризации является здравоохранение. Практически вся статистика и анализ начинались с примеров использования здравоохранения. Если углубиться, существует термин для кластеризации, называемый когортами (люди с похожими заболеваниями), чтобы их можно было изучать отдельно от существующих клиентов. Например, если 10 человек страдают от лихорадки, а еще 10 человек - от головной боли, мы найдем, что у них общего, и создадим лекарство.
Извлечение функций - В точности извлечения признаков, валидность и неудача очень важны. Другими словами, извлечение признаков можно назвать распознаванием образов.
Например:
В поиске Google, когда пользователь вводит термин, появляются результаты. Теперь возникает важный вопрос: как он узнал, какая страница релевантна, а какая не имеет отношения к данному термину? На это можно ответить с помощью извлечения признаков и распознавания образов, которые добавляют характерные особенности. Допустим, дана фотография, определенные камеры обнаруживают лица, выделяют лицо, чтобы получить красивые изображения, а также использует распознавание функций.
Обучение с учителем и обучение без учителя
к) Категория прогнозов - Методы включают регрессию, логистику, нейронные сети и деревья решений. Некоторые примеры включают обнаружение мошенничества (когда компьютер изучает и предсказывает следующее мошенничество на основе предыдущей истории мошенничества). При обучении без учителя невозможно предсказать на примерах, так как нет исторических данных.
б) Категория классификации - Если взять пример, является ли транзакция мошеннической или нет, она попадает в категорию классификации. Здесь мы берем исторические данные и классифицируем их с помощью деревьев решений или, если мы вообще не берем никаких исторических данных, мы начинаем непосредственно с данных и пытаемся использовать функции самостоятельно. Например, если нам нужно знать сотрудников, которые могут покинуть организацию или остаться. В случае, если это новая организация, где мы не можем использовать исторические данные, мы всегда можем использовать кластеризацию для извлечения данных.
в) Категория разведки - Это простой метод, придумывающий, что означают большие данные. В обучении без учителя это называется основными компонентами и кластеризацией.
г) Категория соответствия - здесь задействованы несколько элементов, такие как перекрестные продажи / продажи, анализ корзины. В анализе корзины нет контролируемого обучения, так как нет исторических данных. Итак, мы берем данные напрямую и находим ассоциации, секвенирование и факторный анализ.
Есть вопрос к нам? Упомяните их в разделе комментариев, и мы свяжемся с вами.
Похожие сообщения: