Что необходимо для машинного обучения?



Этот блог о предварительных требованиях для машинного обучения поможет вам понять основные концепции, которые вам необходимо знать, прежде чем вы начнете работать с машинным обучением.

Машинное обучение, несомненно, является самой востребованной технологией того времени! Если вы новичок и только начинаете работать с машинным обучением, важно, чтобы вы знали предварительные требования к машинному обучению. Этот блог поможет вам понять различные концепции, которые вам необходимо знать, прежде чем приступить к машинному обучению.

Чтобы получить более глубокие знания об искусственном интеллекте и машинном обучении, вы можете зарегистрироваться в прямом эфире от Edureka с поддержкой 24/7 и пожизненным доступом.





Вот список тем освещены в этом блоге:

  1. Предпосылки для машинного обучения
  2. Понимание машинного обучения на примере использования

Предпосылки для машинного обучения

Чтобы начать сПри машинном обучении вы должны быть знакомы со следующими понятиями:



  1. Статистика
  2. Линейная алгебра
  3. Исчисление
  4. Вероятность
  5. Языки программирования

Статистика

Статистика содержит инструменты, которые можно использовать для получения каких-либо результатов из данных. Существует описательная статистика, которая используется для преобразования необработанных данных в некоторую важную информацию. Кроме того, выводная статистика может использоваться для получения важной информации из выборки данных вместо использования полного набора данных.

Чтобы узнать больше о Статистику вы можете просматривать в следующих блогах:

Линейная алгебра

Линейная алгебра имеет делос векторами, матрицами и линейными преобразованиями. Это очень важно в машинном обучении, поскольку его можно использовать для преобразования и выполнения операций с набором данных.



Исчисление

Исчисление - важная область математики, играющая неотъемлемую роль во многих алгоритмах машинного обучения. Набор данных с несколькими функциямииспользуется для построения моделей машинного обучения, поскольку функции являются множественными многомерными исчислениями, играющими важную роль для построения модели машинного обучения. Интеграция и дифференциация - необходимость.

Вероятность

Вероятность помогает предсказать вероятность возникновения событий, помогает нам понять, что ситуация может повториться, а может и не повториться. Для машинного обучения вероятность - это Фонд.

Mathematics

Чтобы узнать больше о вероятности, вы можете пройти через это Блог.

Язык программирования

Важно знать языки программирования, такие как R и Python, чтобы реализовать весь процесс машинного обучения. Python и R предоставляют встроенные библиотеки, упрощающие реализацию алгоритмов машинного обучения.

Помимо базовых знаний в области программирования, важно также знать, как извлекать, обрабатывать и анализировать данные. Это один из важнейших навыков, необходимых для машинного обучения.

Чтобы узнать больше о программировании языки для машинного обучения, вы можете посетить следующие блоги:

  1. Лучшие библиотеки Python для анализа данных и машинного обучения

Пример использования машинного обучения

Машинное обучение - это создание алгоритма, который может учиться на данных, чтобы делать прогнозы, например, какие объекты присутствуют на картинке, или механизм рекомендаций, лучшую комбинацию лекарств для лечения определенного заболевания или фильтрацию спама.

Машинное обучение основано на математических предпосылках, и если вы знаете, почему математика используется в машинном обучении, это будет весело. Вам нужно знать математику, лежащую в основе функций, которые вы будете использовать, и какая модель подходит для данных и почему.

Итак, давайте начнем с интересной проблемы прогнозирования цен на жилье, имея набор данных, содержащий историю различных характеристик и цен, а пока мы рассмотрим площадь жилой площади в квадратных футах и ​​цены.

Теперь у нас есть набор данных, содержащий два столбца, как показано ниже:

Между этими двумя переменными должна существовать некоторая корреляция, чтобы понять, что нам нужно будет построить модель, которая может прогнозировать цены на дома. Как мы можем это сделать?

Давайте изобразим эти данные на графике и посмотрим, как они выглядят:

Здесь ось X - это цена за квадратный метр жилой площади, а ось Y - цена дома. Если мы построим все точки данных, мы получим диаграмму рассеяния, которая может быть представлена ​​линией, как показано на рисунке выше, и если мы введем некоторые данные, это будет предсказывать какой-то результат. В идеале мы должны найти линию, которая будет пересекать максимальное количество точек данных.

Здесь мы пытаемся создать строку, которая называется:

Y = mX + c

Этот метод прогнозирования линейной связи между целевой (зависимой переменной) и переменной-предиктором (независимой переменной) называется линейной регрессией. Это позволяет нам изучить и обобщить взаимосвязь между двумя переменными.

  • X = независимая переменная
  • Y = зависимая переменная
  • c = y-точка пересечения
  • m = Наклон линии

Если мы рассмотрим уравнение, у нас есть значения для X, который является независимой переменной, поэтому все, что нам нужно сделать, это вычислить значения для m и c, чтобы предсказать значение Y.

Итак, как нам найти эти переменные?

Чтобы найти эти переменные, мы можем попробовать набор значений и попытаться найти линию, которая пересекает максимальное количество точек данных. Но как найти лучшую линию?

Итак, чтобы найти наиболее подходящую линию, мы можем использовать функцию ошибок наименьших квадратов, которая найдет ошибку между реальным значением y и предсказанным значением y`.

Функция ошибки наименьших квадратов может быть представлена ​​с помощью следующего уравнения:

Используя эту функцию, мы можем узнать ошибку для каждой прогнозируемой точки данных, сравнив ее с фактическим значением точки данных. Затем вы суммируете все эти ошибки и возводите их в квадрат, чтобы определить отклонение в прогнозе.

Если мы добавим третью ось к нашему графику, содержащему все возможные значения ошибок, и построим его в трехмерном пространстве, он будет выглядеть так:

На изображении выше идеальные значения были бы в нижней черной части, которая предсказывает цены, близкие к фактической точке данных. Следующий шаг - найти наилучшие возможные значения для m и c. Это можно сделать с помощью метода оптимизации, называемого градиентным спуском.

это vs имеет Java

Градиентный спуск - это итеративный метод, при котором мы начинаем с инициализации некоторого набора значений для наших переменных и постепенно улучшаем их, минимизируя ошибку между фактическим значением и прогнозируемым значением.

Теперь, если мы подумаем, что цены на квартиру на самом деле не зависят только от цены за квадратный фут, есть много факторов, таких как количество спален, ванных комнат и т. Д. Если мы рассмотрим эти особенности, то уравнение будет выглядеть примерно как это

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Это полилинейная регрессия, она относится к линейной алгебре, здесь мы можем использовать матрицы размера mxn, где m - особенности, а n - точки данных.

Давайте рассмотрим другую ситуацию, когда мы можем использовать вероятность, чтобы найти состояние дома, чтобы классифицировать дом на основе того, в хорошем он или плохом состоянии. Для этого нам нужно будет использовать технику, называемую логистической регрессией, которая работает с вероятностью событий, представленных сигмоидной функцией.

В этой статье мы рассмотрели предпосылки машинного обучения и то, как они применяются в машинном обучении. В общем, он состоит из статистики, исчисления, линейной алгебры и теории вероятностей. В исчислении есть методы, используемые для оптимизации, у линейной алгебры есть алгоритмы, которые могут работать с огромными наборами данных, с вероятностью мы можем предсказать вероятность возникновения событий, а статистика помогает нам сделать полезные выводы из выборки наборов данных.

Теперь, когда вы знаете требования к машинному обучению, я уверен, что вам интересно узнать больше. Вот несколько блогов, которые помогут вам начать работу с Data Science:

Если вы хотите записаться на полный курс по искусственному интеллекту и машинному обучению, в Edureka есть специально подобранный это позволит вам овладеть такими методами, как контролируемое обучение, неконтролируемое обучение и обработка естественного языка. Он включает в себя обучение последним достижениям и техническим подходам в области искусственного интеллекта и машинного обучения, таких как глубокое обучение, графические модели и обучение с подкреплением.