Как запускать сценарии Hive?



Это руководство по запуску сценариев Hive. Запуск этого скрипта сократит время и усилия, которые мы вкладываем в написание и выполнение каждой команды вручную.

Apache Hive, представляющий собой пакет хранилища данных, созданный на основе Hadoop, все чаще используется для анализа данных, интеллектуального анализа данных и прогнозного моделирования. Организации ищут профессионалов с прочной поддержкой . В этом посте давайте посмотрим, как запускать сценарии Hive. Как правило, мы используем сценарии для одновременного выполнения набора операторов. Сценарии Hive используются примерно так же. Это сократит время и усилия, которые мы вкладываем в написание и выполнение каждой команды вручную.

Сценарии Hive поддерживаются в версиях Hive 0.10.0 и выше. Поскольку версия Hive 0.90 установлена ​​в CDH3, мы не можем запускать сценарии Hive в CDH3. Вы можете попробовать следующие шаги в CDH4, так как в нем установлена ​​версия Hive 0.10.0. Вы знаете, как создать сценарий Hive? Если нет, нажмите чтобы получить больше разъяснений.





Master-Hive-Now

Теперь давайте посмотрим, как писать сценарии в Hive и запускать их в CDH4:



фибоначчи в c ++

Шаг 1. Написание сценария Hive.

Чтобы написать Hive Script, файл должен быть сохранен с расширением .sql. Откройте терминал в дистрибутиве Cloudera CDH4 и введите следующую команду для создания сценария Hive.
Команда: sudo gedit sample.sql

При выполнении указанной выше команды откроется файл со списком всех команд Hive, которые необходимо выполнить.



В этом скрипте будет создана, описана таблица, а данные будут загружены и извлечены из таблицы.

1. Создание таблицы в Hive:

Команда: создать таблицу product (productid: int, productname: string, price: float, category: string) строки форматировать поля с разделителями, заканчивающиеся символами ','

Здесь product - это имя таблицы, а {productid, productname, price, category} - столбцы этой таблицы.

Поля, заканчивающиеся символом «,», указывают на то, что столбцы во входном файле разделены символом «,».

По умолчанию записи во входном файле разделяются новой строкой.

2. Описание таблицы:

Команда: описать продукт

3. Загрузка данных в таблицу.

Чтобы сначала загрузить данные в таблицу, нам нужно создать входной файл, содержащий записи, которые необходимо вставить в таблицу.

Создадим входной файл.

Команда: sudo gedit input.txt

Отредактируйте содержимое файла, как показано на рисунке.

4. Получение данных:

Для получения данных используется команда выбора.

Команда: Выберите * из продукта

Приведенная выше команда используется для получения значения всех столбцов, присутствующих в таблице. Скрипт должен выглядеть так, как показано на изображении ниже.

На этом мы закончили писать сценарий Hive. Теперь файл sample.sql можно сохранить.

Шаг 2: Запуск сценария Hive

Ниже приводится команда для запуска сценария Hive:

Команда: улей –f /home/cloudera/sample.sql

При выполнении сценария убедитесь, что указан полный путь к расположению файла сценария.

Мы видим, что все команды выполняются успешно.

Вот как скрипты Hive запускаются и выполняются в CDH4.

Hive - важнейший компонент Hadoop, и ваш опыт работы с Hive поможет вам найти высокооплачиваемую работу в Hadoop! В Edureka есть специально подобранный курс Hadoop, который поможет вам освоить такие концепции, как MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume и Sqoop. Нажмите кнопку ниже, чтобы начать.

Есть вопрос к нам? Укажите их в комментариях, и мы свяжемся с вами.

Похожие сообщения:

как использовать мощность в Java

Команды Hive

Модели данных улья