R Tutorial - Руководство для новичков по изучению программирования на R



Этот блог на R Tutorial знакомит вас с инструментом R и поможет вам подробно понять различные основы программирования на R с примерами.

R - самый популярный инструмент для анализа данных, поскольку он имеет открытый исходный код, гибкий, предлагает несколько пакетов и имеет огромное сообщество. Он предназначен как для программистов, так и для статистиков и специалистов по добыче данных, и, следовательно, стал причиной популярности .В этом блоге, посвященном R Tutorial, я дам вам полное представление о R с примерами.

Ниже приведены темы этого блога с учебником по R, которые я буду обсуждать в следующей последовательности:





  1. Зачем нужна аналитика ?
  2. Что такое бизнес-аналитика ?
  3. Почему R и кто использует R ?
  4. Установка R
  5. Операторы данных
  6. Типы данных
  7. Управление потоком

Учебник по R: зачем нам аналитика?

Прежде чем я отвечу на вопрос, позвольте мне кратко рассказать вам о некоторых проблемах и их решениях в R в нескольких областях.



банковское дело - Учебник по R - Edureka

Банковское дело :

Ежедневно в банках генерируется большой объем данных о клиентах. WИмея дело с миллионами клиентов на регулярной основе, становится трудно отслеживать их ипотечные кредиты.



Решение :

R создает индивидуальную модель, которая поддерживает ссуды, предоставленные каждому отдельному клиенту, что помогает нам определять сумму, которую клиент должен выплатить с течением времени.

Страхование :

Страхование во многом зависит от прогнозов. Это сложно длярешить, какую политику принять или отклонить.

Решение:

Используя непрерывный кредитный отчет в качестве входных данных, мы можем создать модель в R, которая будет не только оценивать аппетит к риску, но и делать прогнозный прогноз.

Здравоохранение:

Ежегодно миллионы людей попадают в больницы, и миллиарды ежегодно тратятся только на госпитализацию.

Решение :

Учитывая анамнез пациента и историю болезни, можно построить прогностическую модель, чтобы определить, кто подвергается риску госпитализации и до какой степени следует масштабировать медицинское оборудование.

Теперь мы знаем, как аналитика данных помогает организациям использовать свои данные для выявления новых возможностей. Если мы говорим о необходимости аналитики в организации, вы должны столкнуться с этими 4 аспектами:

Затем давайте перейдем к учебному блогу R, где сначала мы поймем, что такое бизнес-аналитика.

Учебник R: что такое бизнес-аналитика?

Бизнес-аналитика - это процесс изучения больших наборов данных и выявления скрытых закономерностей, корреляций и других выводов. Это в основном помогает вам понять все данные, которые вы собрали, будь то данные организации, данные исследования рынка или продукта или любые другие данные. Вам становится легко принимать более обоснованные решения, улучшать продукты, улучшать маркетинговые стратегии и т. Д. Для лучшего понимания см. Изображение ниже:

Если вы посмотрите на рисунок выше, ваши данные на первом изображении разбросаны. Теперь, если вам нужно что-то конкретное, например конкретная запись в базе данных, это становится громоздким. Чтобы упростить это, вам нужен анализ. С помощью анализа легко установить корреляцию между данными. После того, как вы определились, что делать, вам станет довольно легко принимать решения, например, по какому пути вы хотите идти или с точки зрения бизнес-аналитики, какой путь приведет к улучшению вашей организации.

Но нельзя ожидать, что люди в приведенной выше цепочке всегда будут понимать необработанные данные, которые вы им предоставляете после аналитики. Чтобы преодолеть этот пробел, у нас есть концепция визуализация данных .

Визуализация данных : Визуализация данных - это визуальный доступ к огромным объемам данных, которые вы создали после аналитики. Человеческий разум обрабатывает визуальные образы и визуальную графику лучше, чем сравнивать с необработанными данными. Нам всегда легко понять круговую диаграмму или гистограмму в сравнении с необработанными числами. Теперь вам может быть интересно, как вы можете добиться такой визуализации данных на основе данных, которые вы уже проанализировали?
На рынке доступны различные инструменты для визуализации данных:

Вам всем должно быть интересно, что уже существует так много инструментов, которые помогут вам добиться визуализации данных и определенного объема аналитики, зачем использовать R?

Итак, моя следующая тема в учебном блоге R посвящена тому, «почему R» и «кто использует R».

Учебное пособие по R: Почему R и кто использует R?

Почему R?

R - это язык программирования и статистики.

R используется для анализа и визуализации данных.

R прост и легок в изучении, чтении и написании.

R является примером FLOSS (Free Libre and Open Source Software), где можно свободно распространять копии этого программного обеспечения, читать его исходный код, изменять его и т. Д.

Кто пользуется R?

  • Бюро финансовой защиты потребителей использует R для анализа данных
  • Статистики John Deere используют R для надежного и воспроизводимого моделирования временных рядов и геопространственного анализа.
  • Bank of America использует R. для отчетности.
  • R является частью технологического стека, лежащего в основе знаменитого механизма рекомендаций Foursquare.
  • ANZ, четвертый по величине банк Австралии, использует R для анализа кредитного риска.
  • Google использует R для прогнозирования экономической активности.
  • Mozilla, фонд, отвечающий за веб-браузер Firefox, использует R для визуализации веб-активности.

Ниже приведены некоторые из доменов, в которых используется R:

Теперь давайте перейдем к учебному блогу R и установим R.

Учебное пособие по R: установка R

Позвольте мне провести вас через процесс установки R в вашей системе. Просто выполните следующие шаги:

Шаг 1 : Перейдите по ссылке - https://cran.r-project.org/

Шаг 2 : Загрузите и установите R 3.3.3 в вашу систему.

См. Снимок экрана ниже, чтобы лучше понять.

различия между хэш-картой и хеш-таблицей

Выполнив указанные выше действия, вы закончите установку R. Теперь вы можете напрямую начать кодирование на R, загрузив RStudio IDE. Чтобы загрузить это, выполните следующие действия:

Шаг 1 : Переходим по ссылке - https://www.rstudio.com/

Шаг 2 : Загрузите и установите Rstudio в вашу систему.

После установки все готово к программированию!

R Учебное пособие для начинающих | Учебное пособие по программированию на R | Эдурека

Затем давайте продолжим в блоге R Tutorial и разберемся, что такое операторы данных в R.

Учебное пособие по R: операторы данных в R

В основном существует 5 различных типов операторов, которые перечислены ниже:

  1. Арифметические операторы : Выполняйте арифметические операции, такие как сложение, вычитание, умножение, деление и т. Д.
  2. Операторы присваивания :Операторы присваивания используются для присвоения значений. Например:
  • Оператор присваивания =
    Синтаксис:
    имя переменной = значение
> х = 5 >Икс 
Выход: [1] 5
  • Оператор присваивания<-
    Синтаксис:
    имя переменной<- value

    > х<- 15 > х
    Выход: [1] 15
  • Оператор присваивания<<-
    Синтаксис:
    имя переменной<<- value
> х<<- 2 > х
Выход: [1] 2
  • Оператор присваивания ->
    Синтаксис:
    значение -> имя переменной

    > 25 -> х > х 
    Выход: [1] 25

3. Оператор отношения : Он определяет отношения между двумя объектами. Например: ,<=,!= etc.

> хх! = 2
Вывод:[1] ИСТИНА

4. Логические операторы : Эти операторы сравнивают две сущности и обычно используются с логическими значениями, такими как &, | и !.

> x2 и 3
Вывод:[1] ИСТИНА

5. Специальные операторы : Эти операторы используются для определенных целей, а не для логических вычислений. Например:

  • Он создает последовательность чисел для вектора.

    > хх
    Вывод: [1] 2 3 4 5 6 7 8
  • % in% Этот оператор используется для определения принадлежности элемента к вектору.
    пример

    > xyy% в% x
    Вывод: [1] ИСТИНА

Учебник R: Типы данных

Типы данных используются для хранения информации. В R нам не нужно объявлять переменную как некоторый тип данных. Переменным присваиваются R-объекты, и тип данных R-объекта становится типом данных переменной.В R представлены в основном шесть типов данных:

Давайте более подробно остановимся на каждом из них:

Вектор : Вектор - это последовательность элементов данных одного и того же базового типа. Пример:

vtr = (1, 3, 5, 7 9)

или

vtr<- (1, 3, 5 ,7 9)

Есть 5 атомарных векторов, также называемых пятью классами векторов.

Список : Списки - это объекты R, которые содержат элементы разных типов, такие как числа & минус, строки, векторы и другой список внутри него.

> п = с (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = список (n, s, ИСТИНА) > х

Вывод -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] ИСТИНА

Массивы : Массивы - это объекты данных R, которые могут хранить данные более чем в двух измерениях. Он принимает векторы в качестве входных данных и использует значения в параметре dim для создания массива.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) результат<- array(c(vector1,vector2),dim = c(3,3,2))

Вывод -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Массивы : Матрицы - это объекты R, в которых элементы расположены в двумерном прямоугольном макете. Матрица создается с помощью функции matrix (). Пример: матрица (данные, число, число, номер строки, имена dimname) где,

данные - входной вектор, который становится элементами данных матрицы.

перейти к работе в Python

Nrow - количество создаваемых строк.

ncol - количество создаваемых столбцов.

Byrow это логическая подсказка. Если ИСТИНА, то элементы входного вектора располагаются по строкам.

тусклое имя это имена, присвоенные строкам и столбцам.

> Мат<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Мат
Вывод :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Факторы : Факторы - это объекты данных, которые используются для классификации данных и хранения их в виде уровней. Они могут хранить как строки, так и целые числа. Они полезны при анализе данных для статистического моделирования.

> данные<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Вывод :

[1] Восток Запад Восток Север Северо Восток Запад Запад Восток Уровни: восток, северо-запад

Фреймы данных : Фрейм данных представляет собой таблицу или структуру, подобную двумерному массиву, в которой каждый столбец содержит значения одной переменной, а каждая строка содержит один набор значений из каждого столбца.

> std_id = c (1: 5) > std_name = c ('Рик', 'Дэн', 'Мишель', 'Райан', 'Гэри') > mark = c (623,3 515,2 611,0 729,0 843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Вывод :

std_id std_name знаки 1 1 Рик 623,30 2 2 и 515.20 3 3 Мишель 611,00 4 4 Райан 729,00 5 5 Гэри 843,25

На этом мы подошли к концу различных типов данных в R. Теперь давайте перейдем к блогу R Tutorial и поймем еще одну ключевую концепцию - операторы управления потоком.

Учебник R: операторы управления потоком

Операторы управления потоком играют очень важную роль, поскольку они позволяют вам контролировать поток выполнения сценария внутри функции. Наиболее часто используемые операторы управления потоком представлены на рисунке ниже:

Теперь давайте обсудим каждый из них на примерах.

Учебное пособие по R: операторы выбора

  • Если оператор управления : Этот оператор управления оценивает одно условие. Это довольно просто, поскольку в нем есть всего лишь одно ключевое слово «if», за которым следует условие, а затем определенный набор операторов, которые необходимо выполнить, если оно истинно. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На этой блок-схеме код будет реагировать следующим образом:

  1. Прежде всего, он войдет в цикл, где проверяет условие.
  2. Если условие истинно, будет выполнен условный код или написанные операторы.
  3. Если условие ложно, утверждения игнорируются.

Ниже приведен пример если оператор управления в R. Попробуйте запустить этот пример в R Studio.

x = 2 repeat {x = x ^ 2 print (x) if (x> 100) {break}

Вывод :

[1] 4 [1] 16 [1] 256
  • Если другое контрольное заявление :Экзаментип контрольного заявленияоценивает группу условий и выбирает утверждения. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На этой блок-схеме код будет реагировать следующим образом:

  1. Прежде всего, он войдет в цикл, где проверяет условие.
  2. Если условие истинно, будут выполнены первые операторы «if».
  3. Если условие ложно, то оно переходит в условие «else if», а если оно истинно, выполняется код «else if».
  4. Наконец, если код else if также ложен, тогда он перейдет к коду else и будет выполнен. Это означает, что если ни одно из этих условий не выполняется, выполняется инструкция else.

Ниже приведен пример если еще оператор управления в R. Попробуйте запустить этот пример в R Studio.

x5) {print ('x больше 5')} elseif (x == 5) {print ('x равно 5')} else {print ('x не больше 5')}

Вывод:

[1] 'x равно 5'
  • Операторы переключения : Эти управляющие операторы в основном используются для сравнения определенного выражения с известным значением. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

В этой блок-схеме Switch case код будет реагировать следующим образом:

  1. Прежде всего, он войдет в корпус переключателя, у которого есть выражение.
  2. Затем он перейдет к условию Case 1, проверит значение, переданное в условие. Если это правда, блок Statement будет выполнен. После этого он вырвется из корпуса переключателя.
  3. Если он ложный, он переключится на следующий случай. Если условие случая 2 истинно, он выполнит оператор и выйдет из этого случая, иначе он снова перейдет к следующему случаю.
  4. Теперь предположим, что вы не указали ни один регистр или пользователь ввел неверный код, тогда он перейдет к случаю по умолчанию, где он распечатает ваш оператор по умолчанию.

Ниже приведен пример оператора switch в R. Попробуйте запустить этот пример в R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Вывод :

[1] 275

Учебное пособие по R: операторы цикла

Циклы помогают вам повторять определенный набор действий, чтобы вам не приходилось выполнять их повторно. Представьте, что вам нужно выполнить операцию 10 раз, если вы начинаете писать код каждый раз, длина программы увеличивается, и вам будет сложно понять ее позже. Но в то же время при использовании цикла, если я напишу тот же оператор внутри цикла, это сэкономит время и сделает код более читабельным. Он также становится более оптимизированным с точки зрения эффективности кода.

На изображении выше ' повторение' и ' в то время как «Утверждения помогают вам выполнять определенный набор правил, пока условие не станет истинным, но» для' это оператор цикла, который используется, когда вы знаете, сколько раз вы хотите повторить блок оператора. Теперь, если вы знаете, что хотите повторить это 10 раз, вы выберете оператор for, но если вы не уверены, сколько раз вы хотите, чтобы код повторялся, вы выберете «repeat» или цикл while.

Давайте обсудим каждый из них на примерах.

  • Повторение : Цикл повтора помогает выполнять один и тот же набор кода снова и снова, пока не будет выполнено условие остановки. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На приведенной выше блок-схеме код будет отвечать следующим образом:

  1. Прежде всего, он введет и выполнит набор кода.
  2. Затем он проверит условие, если оно истинно, он вернется и снова выполнит тот же набор кода, пока он не станет ложным.
  3. Если окажется, что он ложный, он выйдет из цикла напрямую.
  • В то время как : Оператор while также помогает выполнять один и тот же набор кода снова и снова, пока не будет выполнено условие остановки. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На приведенной выше блок-схеме код будет отвечать следующим образом:

  1. Прежде всего, он проверит состояние.
  2. Если окажется, что это правда, он выполнит набор кода.
  3. Затем он снова проверяет условие, если оно истинно, он снова выполнит тот же код. Как только условие оказывается ложным, он немедленно выходит из цикла.

Ниже приведен пример инструкции while в R. Попробуйте запустить этот пример в R Studio.

x = 2, а (x<1000) { x=x^2 print(x) } 

Вывод:

4 16 256 65 536

Итак, вам должно быть интересно, чем отличаются эти два утверждения? Позвольте мне развеять ваши сомнения!
Здесь основное различие между оператором repeat и while заключается в том, что оно изменяется в зависимости от вашего состояния. В то время как loop в основном определяет, когда вы собираетесь войти в цикл для выполнения операторов и повторение loop определяет, когда вы выходите из цикла после выполнения операторов. Таким образом, эти два оператора известны как цикл управления входом и цикл управления выходом. Вот чем отличаются инструкции while и repeat.

  • Для петли: Циклы For используются, когда вам нужно выполнить блок кода несколько раз. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На приведенной выше блок-схеме код будет отвечать следующим образом:

  1. Прежде всего, это инициализация, где вы указываете, сколько раз вы хотите, чтобы цикл повторялся.
  2. Затем он проверяет условие. Если условие истинно, он выполнит набор кода указанное количество раз.
  3. Как только условие оказывается ложным, он немедленно выходит из цикла.

Ниже приведен пример оператора for в R. Попробуйте запустить этот пример в R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Вывод :

7 19 25 65 45

Затем давайте перейдем к нашему последнему набору операторов в блоге R Tutorial, то есть к операторам перехода.

Учебное пособие по R: Операторы перехода

Заявление о перерыве : Операторы Break помогают завершить программу и возобновить управление до следующего оператора, следующего за циклом. Эти операторы также используются в случае переключения. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На приведенной выше блок-схеме код будет отвечать следующим образом:

  1. Прежде всего, он войдет в цикл, где проверяет условие.
  2. Если условие цикла ложно, он напрямую выходит из цикла.
  3. Если условие истинно, он проверит условие разрыва.
  4. Если условие прерывания истинно, оно существует из цикла.
  5. Если условие прерывания ложно, он выполнит операторы, оставшиеся в цикле, а затем повторит те же шаги.

Ниже приведен пример инструкции перехода в R. Попробуйте запустить этот пример в R Studio.

Икс<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Вывод:

[1] 1 [1] 2

Следующее заявление : Следующий оператор используется, когда вы хотите пропустить текущую итерацию цикла, не прерывая ее. Оператор Next очень похож на «continue» в другом языке программирования. Обратитесь к приведенной ниже блок-схеме, чтобы лучше понять:

На приведенной выше блок-схеме код будет отвечать следующим образом:

  1. Прежде всего, он войдет в цикл, где проверяет условие.

  2. Если условие цикла ложно, он напрямую выходит из цикла.

  3. Если условие цикла истинно, он выполнит инструкции блока 1.

  4. После этого он проверит «следующее» утверждение. Если он присутствует, то последующие операторы не будут выполняться в той же итерации цикла.

  5. Если «следующий» оператор отсутствует, то будут выполнены все последующие операторы.

Ниже приведен пример следующего оператора в R. Попробуйте запустить этот пример в R Studio.

for (i in 1:15) {if ((i %% 2) == 0) {next} print (i)}

Вывод :

1 3 5 7 9 11 13 15

Это конец учебного блога R. Я надеюсь, что вы, ребята, ясно понимаете каждую концепцию, которую я обсуждал выше. Следите за обновлениями, мой следующий блог будет посвящен обучению R, где я буду подробно объяснять еще несколько концепций R с exдостаточно.

Теперь, когда вы поняли основы R, ознакомьтесь с от Edureka, надежной компании по онлайн-обучению с сетью из более чем 250 000 довольных учащихся по всему миру. Обучение Edureka Data Analytics с R поможет вам получить опыт в программировании на R, манипулировании данными, исследовательском анализе данных, визуализации данных, интеллектуальном анализе данных, регрессии, анализе настроений и использовании R Studio для изучения реальных ситуаций в розничной торговле и социальных сетях.

Есть вопрос к нам? Пожалуйста, укажите это в разделе комментариев этого блога «R Tutorial», и мы свяжемся с вами как можно скорее.