Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.

Книга поможет Вам:
Узнать, как развертывать интерактивные, пакетные и потоковые приложения;
Вы исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3;
Вы овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.

Купить этот курс за 109 рублей

Возможно Вас заинтересует

[Инсталогия] Монетизация экспертного блога (2019)

Автор: Инсталогия Название: Монетизация экспертного [...]

[Udemy] Цифровая криминалистика и бинарные эксплойты с Python (2018)

Автор: Udemy Название: Цифровая криминалистика [...]

[ManVip] Качаем деньги из Facebook (2018)

Автор: ManVip Название: Качаем деньги [...]

Hello Blogger. Конференция по блогам и нишевым социальным сетям

Digital-среда стремительно развивается. Те классические [...]

[Чекчурин Юрий] НЛП-Практик. Как харизматически убеждать людей (модуль 7) (2015)

Название: НЛП-Практик. Как харизматически убеждать [...]

Синельников (2011)

Возлюби болезнь свою. Как стать [...]

[Дмитрий Коренко] Д.р.у.з.ь.я 3.0 (2019)

[Дмитрий Коренко] Д.р.у.з.ь.я 3.0 (2019) [...]

[Ivanovinvest] Чек-лист для переезда в Сан Франциско (2020)

[Ivanovinvest] Чек-лист для переезда в [...]

Савченко (2014)

Таро и отношения (2014г ) [...]

[Тата Феодориди] Я-Ребенок 3.0 (2022)

Для кого этот курс: При [...]

[Алексей Маматов] Супер Мозг (2018) [VIP пакет]

Автор: Алексей Маматов Название: Супер [...]

[Влад Ясько] Инстаграм-маркетолог 2.0 (2019)

Автор: Влад Ясько Название: Инстаграм-маркетолог [...]

[Александра Митрошина] Личный бренд блогера и монетизация инстаграма (2019)

Автор: Александра Митрошина Название: Личный [...]

[Яков Осипенков] Ответы на экзамен Google Analytics (2020)

Автор: Яков Осипенков Название: Ответы [...]

[Хатчисон Дот] Сад бабочек

[Хатчисон Дот] Сад бабочек Роман [...]

[Udemy] Wireshark: Packet Analysis and Ethical Hacking: Core Skills (2019)

Автор: Udemy Название: Wireshark: Packet [...]

Добавить комментарий