Обработка больших данных с помощью Apache Spark и Scala



Apache Spark стал великим достижением в области обработки больших данных.

как использовать наведение в css

IST: 7:00 - 08:00, 17 октября 2014 г.





PDT: 18:30 - 19:30, 16 октября 2014 г.

Количество мест ограничено !! Заполните форму справа и забронируйте себе слот сегодня.



Привет всем, 18 октября 2014 года мы проводим бесплатный веб-семинар по Apache Spark и Scala. Название вебинара: «Обработка больших данных с помощью Apache Spark и Scala» . На этом веб-семинаре будут обсуждаться основные темы, касающиеся Apache Spark и Scala. Любые вопросы или сомнения могут быть прояснены во время сеанса.

Темы для обсуждения:

  • Что такое большие данные?
  • Что такое Spark?
  • Почему Spark?
  • Экосистема Spark
  • Замечание о Scala
  • Почему именно Скала?
  • Hello Spark - Руки на

Почему Spark?

Apache Spark - это платформа кластерных вычислений с открытым исходным кодом для кластеров сообщества Hadoop. Он считается одним из лучших механизмов анализа и обработки крупномасштабных данных с его непревзойденной скоростью, простотой использования и сложной аналитикой. Ниже перечислены преимущества и функции, которые делают Apache Spark популярным в области оперативной и исследовательской аналитики:

  • Программы, разработанные в Spark, работают в 100 раз быстрее, чем программы, разработанные в Hadoop MapReduce.
  • Spark компилирует 80 операторов высокого уровня.
  • Spark Streaming обеспечивает обработку данных в реальном времени.
  • GraphX ​​- это библиотека для графических вычислений.
  • MLib - это библиотека машинного обучения для Spark.
  • Первоначально написанный на Scala, Spark может быть встроен в любую операционную систему на основе JVM, в то же время может также использоваться в режиме REPL (чтение, оценка, обработка и загрузка).
  • Он имеет мощные возможности кэширования и сохранения на диске.
  • Spark SQL позволяет ему эффективно обрабатывать SQL-запросы
  • Apache Spark можно развернуть через Apache Mesos, Yarn в HDFS, HBase, Cassandra или Spark Cluster Manager (собственный менеджер кластеров Spark).
  • Spark имитирует функциональный стиль Scala и API коллекций, что является большим преимуществом для разработчиков Scala и Java.

Потребность в Apache Spark:

Spark приносит отрасли огромные преимущества с точки зрения скорости, разнообразия задач, которые он может выполнять, гибкости, качественного анализа данных, рентабельности и т. Д., Что является потребностями дня. Он предоставляет ИТ-отрасли высококачественные решения для анализа больших данных в реальном времени, удовлетворяя растущий спрос клиентов. Аналитика в реальном времени максимально использует возможности бизнеса. Его совместимость с Hadoop позволяет компаниям быстро внедрять его. Существует острая потребность в экспертах и ​​разработчиках, обученных Spark, поскольку это относительно новая технология, которая находит все большее распространение.