Что такое нейронная сеть? Введение в искусственные нейронные сети

Этот блог о том, что такое нейронные сети, познакомит вас с основными концепциями нейронных сетей и тем, как они могут решать сложные задачи, связанные с данными.

С развитием машинного обучения взял большую дорогу. Глубокое обучение считается самой передовой технологией, созданной для решения сложных проблем, в которых используются массивные наборы данных. Этот блог о том, что такое нейронные сети, познакомит вас с основными концепциями нейронных сетей и тем, как они могут решать сложные задачи, связанные с данными.

Чтобы получить более глубокие знания об искусственном интеллекте и глубоком обучении, вы можете зарегистрироваться в прямом эфире от Edureka с круглосуточной поддержкой и пожизненным доступом.





Вот список тем, которые будут рассмотрены в этом Блог:

  1. Что такое нейронная сеть?
  2. Что такое глубокое обучение?
  3. Разница между AI, ML и DL
  4. Потребность в глубоком обучении
  5. Пример использования глубокого обучения
  6. Как работают нейронные сети?
  7. Нейронная сеть на примере

Простое определение нейронной сети

Созданный в соответствии с человеческим мозгом, Нейронная сеть была создана для имитации функций человеческого мозга. . Человеческий мозг - это нейронная сеть, состоящая из нескольких нейронов, аналогично искусственная нейронная сеть (ИНС) состоит из нескольких перцептронов (поясняется позже).



Нейронная сеть - Что такое нейронная сеть - Edureka

Нейронная сеть состоит из трех важных слоев:

  • Входной слой: Как следует из названия, этот уровень принимает все входные данные, предоставляемые программистом.
  • Скрытый слой: Между входным и выходным слоями находится набор слоев, известных как скрытые слои. На этом уровне выполняются вычисления, в результате которых получается результат.
  • Выходной слой: Входные данные проходят серию преобразований через скрытый слой, что в конечном итоге приводит к выходу, который доставляется через этот слой.

Прежде чем мы углубимся в то, как работает нейронная сеть, давайте разберемся, что такое глубокое обучение.



Что такое глубокое обучение?

Глубокое обучение - это продвинутая область машинного обучения, в которой используются концепции нейронных сетей для решения высокопроизводительных вариантов использования, которые включают анализ многомерных данных. Он автоматизирует процесс извлечения признаков, гарантируя минимальное вмешательство человека.

Так что же такое глубокое обучение?

Глубокое обучение - это продвинутый Подраздел машинного обучения, в котором используются алгоритмы, основанные на структуре и функциях мозга, называемые искусственными нейронными сетями.

Разница между AI, ML и DL (искусственный интеллект против машинного обучения против глубокого обучения)

Люди часто думают, что , , и Глубокое обучение одинаковы, поскольку имеют общие приложения. Например, Siri - это приложение для искусственного интеллекта, машинного обучения и глубокого обучения.

trim () в Java

Так как же связаны эти технологии?

  • Искусственный интеллект это наука о том, как заставить машины имитировать поведение людей.
  • Машинное обучение - это подмножество искусственного интеллекта (ИИ), которое фокусируется на том, чтобы заставить машины принимать решения, передавая им данные.
  • Глубокое обучение - это подмножество машинного обучения, которое использует концепцию нейронных сетей для решения сложных задач.

Подводя итог, ИИ, машинное обучение и глубокое обучение - взаимосвязанные области. Машинное обучение и глубокое обучение помогают искусственному интеллекту, предоставляя набор алгоритмов и нейронных сетей для решения проблемы, связанные с данными.

Теперь, когда вы знакомы с основами, давайте разберемся, что привело к необходимости глубокого обучения.

Потребность в глубоком обучении: ограничения традиционных алгоритмов и методов машинного обучения

Машинное обучение стало крупным прорывом в техническом мире, оно привело к автоматизации монотонных и трудоемких задач, помогло в решении сложных проблем и принятии более разумных решений. Однако у машинного обучения было несколько недостатков, которые привели к появлению глубокого обучения.

Вот некоторые ограничения машинного обучения:

  1. Невозможно обработать данные большого размера: Машинное обучение может обрабатывать только небольшие размеры данных, которые содержат небольшой набор переменных. Если вы хотите анализировать данные, содержащие сотни переменных, машинное обучение использовать нельзя.
  2. Разработка функций выполняется вручную: Рассмотрим вариант использования, когда у вас есть 100 переменных-предикторов, и вам нужно сузить список только значимых. Для этого вам нужно вручную изучить взаимосвязь между каждой из переменных и выяснить, какие из них важны для прогнозирования результатов. Эта задача чрезвычайно утомительна и требует много времени для разработчика.
  3. Не идеально подходит для обнаружения объектов и обработки изображений: Поскольку для обнаружения объектов требуются многомерные данные, машинное обучение нельзя использовать для обработки наборов данных изображений, оно идеально подходит только для наборов данных с ограниченным числом функций.

Прежде чем мы углубимся в Нейронные сети, давайте рассмотрим реальный вариант использования, в котором реализовано глубокое обучение.

Пример использования глубокого обучения / приложения

Знаете ли вы, что PayPal обрабатывает платежи на сумму более 235 миллиардов долларов в результате четырех миллиардов транзакций более чем 170 миллионами клиентов? Он использует этот огромный объем данных для выявления возможных мошеннических действий среди других причин.

С помощью алгоритмов глубокого обучения PayPal собирал данные из истории покупок своих клиентов в дополнение к просмотру шаблонов вероятного мошенничества, хранящимся в его базах данных, чтобы предсказать, является ли конкретная транзакция мошеннической или нет.

Компания полагается на технологии глубокого обучения и машинного обучения около 10 лет. Первоначально группа по мониторингу мошенничества использовала простые линейные модели. Но со временем компания перешла на более совершенную технологию машинного обучения под названием Deep Learning.

Ке Ван, менеджер по рискам мошенничества и специалист по данным PayPal, цитирует:

«Что нам нравится в более современном, продвинутом машинном обучении, так это его способность потреблять намного больше данных, обрабатывать уровни и уровни абстракции и иметь возможность« видеть »вещи, которые более простые технологии не смогли бы увидеть, даже люди. не может видеть ».

Простая линейная модель способна использовать около 20 переменных. Однако с помощью технологии Deep Learning можно обрабатывать тысячи точек данных. Следовательно, реализуя Технология глубокого обучения, PayPal может, наконец, проанализировать миллионы транзакций, чтобы выявить любые мошеннические операции. Мероприятия.

Теперь давайте углубимся в нейронные сети и поймем, как они работают.

Как работает нейронная сеть?

Чтобы понять нейронные сети, нам нужно разбить их и понять самую базовую единицу нейронной сети, то есть персептрон.

Что такое перцептрон?

Персептрон - это однослойная нейронная сеть, которая используется для классификации линейных данных. Он состоит из 4 важных компонентов:

  1. Входы
  2. Вес и смещение
  3. Функция суммирования
  4. Функция активации или трансформации

переопределение и перегрузка в Java

Основная логика персептрона следующая:

Входные данные (x), полученные от входного слоя, умножаются на присвоенные им веса w. Затем умноженные значения складываются для формирования взвешенной суммы. Затем взвешенная сумма входов и их соответствующие веса применяются к соответствующей функции активации. Функция активации отображает вход на соответствующий выход.

Веса и смещения в глубоком обучении

Почему мы должны назначать веса каждому входу?

После того, как входная переменная поступает в сеть, в качестве веса этого входа назначается случайно выбранное значение. Вес каждой точки входных данных указывает, насколько важны эти входные данные для прогнозирования результата.

мелкая копия и глубокая копия в java

С другой стороны, параметр смещения позволяет настроить кривую функции активации таким образом, чтобы получить точный выходной сигнал.

Функция суммирования

Как только входам присваивается некоторый вес, берется произведение соответствующих входных данных и веса. Сложение всех этих продуктов дает нам взвешенную сумму. Это делается функцией суммирования.

Функция активации

Основная цель функций активации - отобразить взвешенную сумму на выходе. Функции активации, такие как tanh, ReLU, sigmoid и т. Д., Являются примерами функций преобразования.

Чтобы узнать больше о функциях перцептронов, вы можете пройти через это Блог.

Прежде чем мы В заключение этого блога давайте рассмотрим простой пример, чтобы понять, как работает нейронная сеть.

Нейронные сети на примере

Рассмотрим сценарий, в котором вы должны построить искусственную нейронную сеть (ИНС), которая классифицирует изображения на два класса:

  • Класс A: содержит изображения нездоровых листьев
  • Класс B: содержит изображения больных листьев.

Так как же создать нейронную сеть, которая классифицирует листья на больные и здоровые культуры?

Процесс всегда начинается с обработки и преобразования ввода таким образом, чтобы его можно было легко обработать. В нашем случае каждое изображение листа будет разбито на пиксели в зависимости от размера изображения.

Например, если изображение состоит из 30 на 30 пикселей, то общее количество пикселей будет 900. Эти пиксели представлены в виде матриц, которые затем передаются на входной уровень нейронной сети.

Точно так же, как в нашем мозгу есть нейроны, которые помогают создавать и связывать мысли, в ИНС есть перцептроны, которые принимают входные данные и обрабатывают их, передавая их из входного слоя в скрытый и, наконец, выходной.

Когда входные данные передаются из входного слоя в скрытый, каждому входу присваивается начальный случайный вес. Затем входные данные умножаются на их соответствующие веса, и их сумма отправляется в качестве входных данных на следующий скрытый слой.

Здесь каждому перцептрону присваивается числовое значение, называемое смещением, которое связано с весом каждого входа. Кроме того, каждый перцептрон проходит через функцию активации или преобразования, которая определяет, активируется ли конкретный перцептрон или нет.

Активированный перцептрон используется для передачи данных на следующий уровень. Таким образом, данные распространяются (прямое распространение) через нейронную сеть до тех пор, пока перцептроны не достигнут выходного слоя.

На уровне вывода выводится вероятность, которая определяет принадлежность данных к классу A или классу B.

Звучит просто, не правда ли? Что ж, концепция, лежащая в основе нейронных сетей, основана исключительно на функционировании человеческого мозга. Вам необходимы глубокие знания различных математических концепций и алгоритмов. Вот список блогов, с которых можно начать:

  1. Что такое глубокое обучение? Начало работы с глубоким обучением
  2. Глубокое обучение с помощью Python: Руководство по глубокому обучению для начинающих

Если вы нашли этот блог актуальным, ознакомьтесь с от Edureka, надежной компании онлайн-обучения с сетью из более чем 250 000 довольных учащихся по всему миру. Курс Edureka Deep Learning with TensorFlow Certification Training помогает учащимся стать экспертами в обучении и оптимизации базовых и сверточных нейронных сетей с использованием проектов и заданий в реальном времени, а также таких понятий, как функция SoftMax, нейронные сети с автокодированием, ограниченная машина Больцмана (RBM).