как использовать наведение в css
IST: 7:00 - 08:00, 17 октября 2014 г.
PDT: 18:30 - 19:30, 16 октября 2014 г.
Количество мест ограничено !! Заполните форму справа и забронируйте себе слот сегодня.
Привет всем, 18 октября 2014 года мы проводим бесплатный веб-семинар по Apache Spark и Scala. Название вебинара: «Обработка больших данных с помощью Apache Spark и Scala» . На этом веб-семинаре будут обсуждаться основные темы, касающиеся Apache Spark и Scala. Любые вопросы или сомнения могут быть прояснены во время сеанса.
Темы для обсуждения:
- Что такое большие данные?
- Что такое Spark?
- Почему Spark?
- Экосистема Spark
- Замечание о Scala
- Почему именно Скала?
- Hello Spark - Руки на
Почему Spark?
Apache Spark - это платформа кластерных вычислений с открытым исходным кодом для кластеров сообщества Hadoop. Он считается одним из лучших механизмов анализа и обработки крупномасштабных данных с его непревзойденной скоростью, простотой использования и сложной аналитикой. Ниже перечислены преимущества и функции, которые делают Apache Spark популярным в области оперативной и исследовательской аналитики:
- Программы, разработанные в Spark, работают в 100 раз быстрее, чем программы, разработанные в Hadoop MapReduce.
- Spark компилирует 80 операторов высокого уровня.
- Spark Streaming обеспечивает обработку данных в реальном времени.
- GraphX - это библиотека для графических вычислений.
- MLib - это библиотека машинного обучения для Spark.
- Первоначально написанный на Scala, Spark может быть встроен в любую операционную систему на основе JVM, в то же время может также использоваться в режиме REPL (чтение, оценка, обработка и загрузка).
- Он имеет мощные возможности кэширования и сохранения на диске.
- Spark SQL позволяет ему эффективно обрабатывать SQL-запросы
- Apache Spark можно развернуть через Apache Mesos, Yarn в HDFS, HBase, Cassandra или Spark Cluster Manager (собственный менеджер кластеров Spark).
- Spark имитирует функциональный стиль Scala и API коллекций, что является большим преимуществом для разработчиков Scala и Java.
Потребность в Apache Spark:
Spark приносит отрасли огромные преимущества с точки зрения скорости, разнообразия задач, которые он может выполнять, гибкости, качественного анализа данных, рентабельности и т. Д., Что является потребностями дня. Он предоставляет ИТ-отрасли высококачественные решения для анализа больших данных в реальном времени, удовлетворяя растущий спрос клиентов. Аналитика в реальном времени максимально использует возможности бизнеса. Его совместимость с Hadoop позволяет компаниям быстро внедрять его. Существует острая потребность в экспертах и разработчиках, обученных Spark, поскольку это относительно новая технология, которая находит все большее распространение.