Вивчаємо Spark. Блискавичний аналіз даних

DatabaseBooks3

Обычная цена ₴900.00

Сумма налога включена.
Зміст і уривки з глав «Книга« Вивчаємо Spark »займає перші позиції в моєму списку рекомендацій для тих, хто бажає познайомитися з цим популярним фреймворком з метою створення додатків для обробки величезних обсягів даних.» - Бен Лорика (Ben Lorica), провідний фахівець по роботі з даними, O'Reilly Media Обсяг оброблюваних даних у всіх областях людської діяльності продовжує рости швидкими темпами. Чи існують ефективні прийоми роботи з ним? У цій книзі розповідається про Apache Spark, відкритій системі кластерних обчислень, яка дозволяє швидко створювати високопродуктивні програми аналізу даних. C допомогою Spark ви зможете маніпулювати величезними обсягами даних за допомогою простого API на Python, Java і Scala. Написана розробниками Spark, ця книга допоможе дослідникам даних і програмістам швидко включитися в роботу. Вона розповість, як організувати паралельне виконання завдань лише кількома рядками коду, і охоплює приклади від простих пакетних додатків до програм, які здійснюють обробку потокових даних і використовують алгоритми машинного навчання. За допомогою цієї книги ви: познайомитеся з особливостями Spark, такими як розподілені набори даних, кешування в пам'яті і інтерактивні оболонки; вивчіть потужні вбудовані бібліотеки Spark, включаючи Spark SQL, Spark Streaming і MLlib; навчитеся користуватися єдиної парадигмою програмування замість суміші інструментів, таких як Hive, Hadoop, Mahout і Storm; дізнаєтеся, як розгортати інтерактивні, пакетні і потокові додатки; досліджуєте можливості використання різних джерел даних, включаючи HDFS, Hive, JSON і S3; опануєте просунутими прийомами програмування на основі Spark, такими як поділ даних на розділи і застосування спільно використовуваних змінних.