Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Helion

  • Rok wydania: 2023
  • Format: 16.5x23.5cm
  • Oprawa: Miękka
Wysyłka:
1 - 3 dni robocze
Sugerowana cena
69,00 PLN
Nasza cena
57,13 PLN
Oszczędzasz 18%
Najniższa cena w ciągu ostatnich 30 dni: 47,25 zł



Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark podstawowe metody stosowane w nauce o danych pełne implementacje analiz dużych publicznych zbiorów danych konkretne przypadki użycia narzędzi uczenia maszynowego kod, który łatwo dostosujesz do swoich potrzeb PySpark: systemowa odpowiedź na problemy inżyniera danych!

Producent:
Helion SA
Kościuszki 1c
44-100 Gliwice (Polska)
tel: (32) 230-98-63
email: gpsr@grupahelion.pl


Szczegóły

Tytuł: Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
Autor: Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Wydawnictwo: Helion
ISBN: 9788383220697
Tytuł oryginału: Advanced Analytics with PySpark: Patterns for Learning from Data at Scale Using Python and Spark
Język oryginału: angielski
Tłumacz: Watrak Andrzej
Języki: polski
Rok wydania: 2023
Ilość stron: 192
Format: 16.5x23.5cm
Oprawa: Miękka
Waga: 0.53 kg

Recenzje