Программирование на R - Руководство для начинающих по языку программирования R



Этот блог о программировании на R знакомит вас с R и поможет вам подробно понять различные фундаментальные концепции программирования на R с примерами.

R - один из самых популярных инструментов аналитики. Но помимо использования для аналитики, R также является языком программирования.С ростом ИТ-индустрии растет спрос на квалифицированных или с пониманием R как инструмента анализа данных и языка программирования.В этом блоге я помогу вам понять различные основы программирования R. В нашем п прошлый Блог ,мы обсудили, зачем нам аналитика, что такое бизнес-аналитика, зачем и кто использует R.

В этом блоге мы разберем следующие основные концепции программирования R в следующей последовательности:





  1. Переменные
  2. Типы данных
  3. Операторы данных
  4. Условный оператор
  5. Петли
  6. Функции

Вы можете просмотреть запись вебинара по языку программирования R, где наш инструктор подробно объяснил темы с примерами, которые помогут вам лучше понять программирование на языке R.

R Программирование для начинающих | Учебное пособие по языку программирования R | Эдурека



Итак, давайте продвинемся вперед и рассмотрим первую концепцию программирования на языке R - переменные.

жизненный цикл активности Android

Программирование на R: переменные

Переменные - это не что иное, как имя ячейки памяти, содержащей значение. Переменная в R может хранить числовые значения, комплексные значения, слова, матрицы и даже таблицу. Удивительно, правда?

Переменная - R Программирование - Edureka

Инжир: Творчествопеременных



На изображении выше показано, как создаются переменные и как они хранятся в разных блоках памяти. В R нам не нужно объявлять переменную перед ее использованием, в отличие от других языков программирования, таких как Java, C, C ++ и т. Д.

Давайте продвинемся вперед и попытаемся понять, что такое тип данных и различные типы данных, поддерживаемые в R.

Программирование на R: типы данных

В R сама переменная не объявляется какого-либо типа данных, скорее она получает тип данных объекта R. Итак, R называется языком с динамической типизацией, что означает, что мы можем снова и снова изменять тип данных одной и той же переменной при ее использовании в программе.

Типы данных определяют, какой тип значения имеет переменная и какие математические, реляционные или логические операции могут быть применены к ней, не вызывая ошибки. В R много типов данных, однако ниже приведены наиболее часто используемые:

Давайте теперь обсудим каждый из этих типов данных индивидуально, начиная с векторов.

Векторы

Векторы - это самые основные объекты данных R, и существует шесть типов атомарных векторов. Ниже приведены шесть атомарных векторов:

Логический : Используется для хранения логического значения, например ПРАВДА или ЛОЖНЫЙ .

Числовой : Он используется для хранения как положительных, так и отрицательных чисел, включая действительное число.

Например: 25, 7.1145, 96547

Целое число : Он содержит все целые числа, то есть все положительные и отрицательные целые числа.

Например: 45,479, -856,479, 0

Сложный : Они имеют форму x + yi, где x и y числовые, а i представляет собой квадратный корень из -1.

Например: 4 + 3i

символ : Он используется для хранения одного символа, группы символов (слов) или группы слов вместе. Символы могут быть определены как в одинарных, так и в двойных кавычках.

Например: «Edureka», «R интересно учиться».

Как правило, вектор определяется и инициализируется следующим образом:

Vtr = c (2, 5, 11, 24) Или Втр<- c(2, 5, 11 , 24)

Давайте продвинемся вперед и разберемся с другими типами данных в R.

Список

Списки очень похожи на векторы, но списки - это объекты R, которые могут содержать элементы разных типов, такие как числа & минус, строки, векторы и другой список внутри него.

Например:

Втр<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Вывод:

[[1]] [1] «Привет» «Привет» Как вы делаете '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] ИСТИНА

Матрица

Матрица - это объект R, в котором элементы расположены в двумерном прямоугольном макете.

Базовый синтаксис для создания матрицы в R - & минус

 матрица (данные, число, число, номер строки, имена dimname) 

Куда:

  • данные - входной вектор, который становится элементами данных матрицы.
  • Nrow - количество создаваемых строк.
  • ncol - количество создаваемых столбцов.
  • Byrow это логическая подсказка. Если ИСТИНА, то элементы входного вектора располагаются по строкам.
  • тусклое имя это имена, присвоенные строкам и столбцам.

Пример:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Вывод:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Массивы в R - это объекты данных, которые можно использовать для хранения данных в более чем двух измерениях. Он принимает векторы в качестве входных данных и использует значения в нет параметр для создания массива.

Базовый синтаксис для создания массива в R - & минус

 массив (данные, dim, dimnames) 

Куда:

  • данные - входной вектор, который становится элементами данных массива.
  • нет - это размерность массива, куда вы передаете количество строк, столбцов и количество матриц, которые должны быть созданы с помощью упомянутых измерений.
  • тусклое имя это имена, присвоенные строкам и столбцам.

Пример:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Вывод:

, , один [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Фрейм данных

Кадр данных - это таблица или двумерная структура, подобная массиву, в которой каждый столбец содержит значения одной переменной, а каждая строка содержит один набор значений.длякаждый столбец. Ниже приведены некоторые характеристики фрейма данных, которые необходимо учитывать каждый раз, когда мы работаем с ними:

  • Имена столбцов не должны быть пустыми.
  • Каждый столбец должен содержать одинаковое количество элементов данных.
  • Данные, хранящиеся в кадре данных, могут быть числового, факторного или символьного типа.
  • Имена строк должны быть уникальными.

Пример:

emp_id = c (100: 104) emp_name = c ('Джон', 'Генри', 'Адам', 'Рон', 'Гэри') dept = c ('Продажи', 'Финансы', 'Маркетинг', 'HR ',' НИОКР ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Вывод:

emp_id emp_name dept 1 100 Джон Сейлз 2 101 Генри Финанс 3 102 Адам Маркетинг 4 103 Рон Х. 5 104 Гэри НИОКР

Итак, теперь, когда мы разобрались с основными типами данных R, пора глубже погрузиться в R, поняв концепции операторов данных.

Программирование на R: операторы данных

В R в основном 4 оператора данных, они показаны ниже:

Арифметические операторы : Эти операторы помогают нам выполнять основные арифметические операции, такие как сложение, вычитание, умножение и т. Д.

Рассмотрим следующий пример:

num1 = 15 num2 = 20 num3 = 0 # add num3 = num1 + num2 num3 # substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2% num3 #modulus num3 = num1 / num2% num3 #modulus num3 = num1 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # деление этажа num3 = num1% /% num2 num3

Вывод:

[1] 35 [15 [1] 300 [1] 0,75 [1] 15 [1] 125 [11

Операторы отношения : Эти операторы помогают нам выполнять реляционные операции, такие как проверка того, больше ли переменная, меньше или равна ли она другой переменной. Результатом реляционной операции всегда является логическое значение.

Рассмотрим следующие примеры:

num1 = 15 num2 = 20 # равно num3 = (num1 == num2) num3 # не равно num3 = (num1! = num2) num3 # меньше, чем num3 = (num1 num2) num3 # меньше, чем равно num1 = 5 num2 = 20 число3 = (число1 = число2) число3

Вывод:

[1] ЛОЖЬ [1] ИСТИНА [1] ИСТИНА [1] ЛОЖЬ [1] ИСТИНА [1] ЛОЖЬ

Операторы присваивания: Эти операторы используются для присвоения значений переменным в R. Назначение может быть выполнено с помощью любого оператора присваивания.(<-) или оператор равенства (=). Значение переменной может быть присвоено двумя способами: левое присвоение и правое присвоение.

ЛогическийОператоры: Эти операторы сравнивают две сущности и обычно используются с логическими (логическими) значениями, такими как «и», «или».и'не'.


Программирование на R: условные операторы

  1. Если заявление: Оператор If помогает вычислить отдельное выражение как часть потока. Чтобы выполнить эту оценку, вам просто нужно написать ключевое слово If, за которым следует выражение, которое нужно оценить. Приведенная ниже блок-схема дает представление о том, как оператор If управляет потоком кода: Рассмотрим следующий пример:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Вывод:

[1] 'Num1 меньше или равно Num2'
  • Иначе, если заявление: Оператор Else if помогает вам расширять ветки до потока, созданного оператором If, и дает вам возможность оценивать несколько условий путем создания новых ветвей потока. Приведенный ниже поток даст вам представление о том, как оператор else if разветвляет поток кода:

    Рассмотрим следующий пример:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 меньше Num1')} else if ('Num1 == Num2) {print (' Num1 и Num2 равны ')}

    Вывод:

    [1] 'Num1 меньше Num2'

  • Другое заявление: Оператор else используется, когда все другие выражения проверены и признаны недопустимыми. Это будет последний оператор, выполняемый как часть ветки If - Else if. Ниже показано, как Else изменяет поток кода:

Рассмотрим следующий пример:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 меньше Num1')} else print ('Num1 и Num2 равны')}

Вывод:

[1] 'Num1 и Num2 равны'

Программирование на R: петли

Оператор цикла позволяет нам выполнять оператор или группу операторов несколько раз. В R есть в основном 3 типа петель:

  1. повторить цикл : Он повторяет оператор или группу операторов, пока данное условие ИСТИННО. Цикл повторения - лучший пример цикла с контролируемым выходом, где сначала выполняется код, а затем проверяется условие, чтобы определить, должен ли элемент управления находиться внутри цикла или выходить из него. Ниже показан процесс управления в цикле повтора:
    Давайте посмотрим на приведенный ниже пример, чтобы понять, как мы можем использовать цикл повторения для добавления n чисел, пока сумма не превысит 100:

    x = 2 repeat {x = x ^ 2 print (x) if (x> 100) {break}

    Вывод:

    [1] 4 [1] 16 [1] 256
  2. пока цикл : яt помогает повторять оператор или группу операторов, пока данное условие ИСТИННО. Хотя цикл, по сравнению с циклом повторения, немного отличается, это пример цикла с контролем входа, в котором сначала проверяется условие, и только если условие оказывается истинным, управление доставляется внутри цикла для выполнения кода. . Ниже представлен поток управления в цикле while:
    Давайте посмотрим на приведенный ниже пример, чтобы сложить сумму квадратов для первых 10 чисел и понять, как цикл while работает лучше:

    num = 1 sumn = 0, а (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Вывод:

    [11 [15 [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. для петли : Он используется для повторения оператора или группы фиксированное количество раз. В отличие от цикла repeat и while, цикл for используется в ситуациях, когда мы заранее знаем, сколько раз код должен быть выполнен. Это похоже на цикл while, в котором сначала проверяется условие, а затем выполняется только код, написанный внутри. Давайте теперь посмотрим, как работает цикл for:

Давайте теперь посмотрим на пример, в котором мы будем использовать цикл for для печати первых 10 чисел:

для (x в 1:10) {print (x)}

Вывод:

[11 [1] 2 [1] 3 [1] 4 [15 [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

Программирование на R: функции

Функция - это блок организованного многократно используемого кода, который используется для выполнения одного связанного действия. В R есть в основном два типа функций:

Предопределенные функции : Это встроенные функции, которые могут использоваться пользователем для выполнения своей работы. легкостьр. Например: meaп( Икс) , стым( Икс) , sqrт ( Икс ), toupper( Икс ), так далее.

Определяемые пользователем Функции: Эти функции создаются пользователем для удовлетворения конкретных требований пользователя. Ниже приведен синтаксис для создания функции вР:

 func  имя_ции  <– функция (arg_1, arg_2 и hellip){ // Тело функции }

Рассмотрим следующий пример простой функции для генерации суммы квадратовиз2 числа:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Выход: [1] 25

Надеюсь, вам понравилось читать этот блог по программированию на R. В этом руководстве мы рассмотрели все основы R, так что вы можете начать практиковаться прямо сейчас. После этого блога о программировании на R я придумываю больше блогов о R для аналитики, так что следите за обновлениями.

Теперь, когда вы поняли основы R, ознакомьтесь с от Edureka, надежной компании по онлайн-обучению с сетью из более чем 250 000 довольных учащихся по всему миру. Обучение Edureka Data Analytics с R поможет вам получить опыт в программировании на R, манипулировании данными, исследовательском анализе данных, визуализации данных, интеллектуальном анализе данных, регрессии, анализе настроений и использовании RStudio для изучения реальных ситуаций в розничной торговле и социальных сетях.

Есть вопрос к нам? Пожалуйста, укажите это в разделе комментариев этого блога «R-программирование», и мы свяжемся с вами как можно скорее.