Apache Hive, представляющий собой пакет хранилища данных, созданный на основе Hadoop, все чаще используется для анализа данных, интеллектуального анализа данных и прогнозного моделирования. Организации ищут профессионалов с прочной поддержкой . В этом посте давайте посмотрим, как запускать сценарии Hive. Как правило, мы используем сценарии для одновременного выполнения набора операторов. Сценарии Hive используются примерно так же. Это сократит время и усилия, которые мы вкладываем в написание и выполнение каждой команды вручную.
Сценарии Hive поддерживаются в версиях Hive 0.10.0 и выше. Поскольку версия Hive 0.90 установлена в CDH3, мы не можем запускать сценарии Hive в CDH3. Вы можете попробовать следующие шаги в CDH4, так как в нем установлена версия Hive 0.10.0. Вы знаете, как создать сценарий Hive? Если нет, нажмите чтобы получить больше разъяснений.
Теперь давайте посмотрим, как писать сценарии в Hive и запускать их в CDH4:
фибоначчи в c ++
Шаг 1. Написание сценария Hive.
Чтобы написать Hive Script, файл должен быть сохранен с расширением .sql. Откройте терминал в дистрибутиве Cloudera CDH4 и введите следующую команду для создания сценария Hive.
Команда: sudo gedit sample.sql
При выполнении указанной выше команды откроется файл со списком всех команд Hive, которые необходимо выполнить.
В этом скрипте будет создана, описана таблица, а данные будут загружены и извлечены из таблицы.
1. Создание таблицы в Hive:
Команда: создать таблицу product (productid: int, productname: string, price: float, category: string) строки форматировать поля с разделителями, заканчивающиеся символами ','
Здесь product - это имя таблицы, а {productid, productname, price, category} - столбцы этой таблицы.
Поля, заканчивающиеся символом «,», указывают на то, что столбцы во входном файле разделены символом «,».
По умолчанию записи во входном файле разделяются новой строкой.
2. Описание таблицы:
Команда: описать продукт
3. Загрузка данных в таблицу.
Чтобы сначала загрузить данные в таблицу, нам нужно создать входной файл, содержащий записи, которые необходимо вставить в таблицу.
Создадим входной файл.
Команда: sudo gedit input.txt
Отредактируйте содержимое файла, как показано на рисунке.
4. Получение данных:
Для получения данных используется команда выбора.
Команда: Выберите * из продукта
Приведенная выше команда используется для получения значения всех столбцов, присутствующих в таблице. Скрипт должен выглядеть так, как показано на изображении ниже.
На этом мы закончили писать сценарий Hive. Теперь файл sample.sql можно сохранить.
Шаг 2: Запуск сценария Hive
Ниже приводится команда для запуска сценария Hive:
Команда: улей –f /home/cloudera/sample.sql
При выполнении сценария убедитесь, что указан полный путь к расположению файла сценария.
Мы видим, что все команды выполняются успешно.
Вот как скрипты Hive запускаются и выполняются в CDH4.
Hive - важнейший компонент Hadoop, и ваш опыт работы с Hive поможет вам найти высокооплачиваемую работу в Hadoop! В Edureka есть специально подобранный курс Hadoop, который поможет вам освоить такие концепции, как MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume и Sqoop. Нажмите кнопку ниже, чтобы начать.
Есть вопрос к нам? Укажите их в комментариях, и мы свяжемся с вами.
Похожие сообщения:
как использовать мощность в Java