Ilość danych we wszystkich domenach wciąż rośnie. Jak możemy skutecznie je wykorzystywać? W książce Poznajemy Sparka przedstawiono Apache Spark, system open source do przetwarzania klastrów, dzięki któremu pisanie i uruchamianie aplikacji analizy danych jest szybsze. Za pomocą Sparka można stawić czoła dużym zbiorom danych za pośrednictwem prostych interfejsów w językach Python, Java i Scala.
Dzięki tej pracy, napisanej przez deweloperów Sparka, naukowcy zajmujący się danymi i inżynierowie dowiedzą się, jak przedstawiać równoległe zadania za pomocą kilku wierszy kodu oraz jak pisać aplikacje od prostych zdań wsadowych do przetwarzania strumieniowego i systemów uczących się. Informacje zawarte w książce pozwolą im na:.
? szybkie zgłębienie możliwości Sparka, takich jak rozproszone zbiory danych, buforowanie w pamięci oraz interaktywna powłoka
? wykorzystywanie wbudowanych bibliotek, łącznie z Spark SQL, Spark Streaming oraz MLlib
? wykorzystywanie paradygmatu programowania zamiast łączenia i dopasowywania narzędzi takich jak Hive, Hadoop, Mahout i Storm
? poznawanie sposobu wykorzystywania aplikacji interakcyjnych, wsadowych i strumieniowych
dołączanie źródeł danych, np. HDFS, Hive, JSON i S3
Szczegóły
Tytuł: Poznajemy Sparka Błyskawiczna analiza danychAutor: Holden Karau, Andy Konwinski, Patrick Wendel, Matei Zaharia
Wydawnictwo: Wydawnictwo Naukowe PWN
ISBN: 9788301184674
Tytuł oryginału: Learning spark
Język oryginału: angielski
Tłumacz: Sikorski Witold, Dąbkowska-Kowalik Małgorzata
Języki: polski
Rok wydania: 2016
Ilość stron: 260
Format: 16.5x23.5cm
Oprawa: Miękka
Waga: 0.46 kg
Recenzje
Informacje:
Klienci, którzy kupili oglądany produkt kupili także:
Metody i modele eksploracji danych
Wydawnictwo Naukowe PWN
Złożoność obliczeniowa
Helion
Wzorce implementacyjne
Helion
Java. Uniwersalne techniki programowania
Wydawnictwo Naukowe PWN
Text Mining: metody, narzędzia i zastosowania
Wykorzystanie SAS Text Analytics
Wykorzystanie SAS Text Analytics
Wydawnictwo Naukowe PWN
Big Data w przemyśle
Jak wykorzystać analizę danych do optymalizacji kosztów procesów?
Jak wykorzystać analizę danych do optymalizacji kosztów procesów?
Wydawnictwo Naukowe PWN