Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.
Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
Helion
Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Opracowanie Zbiorowe
Oprawa miękka |
Wydanie: 1 |
ISBN: 978-83-832-2069-7 |
EAN: 9788383220697 |
Liczba stron: 192 |
Cena detaliczna: 69,00 zł |
41,42 zł
41,42 zł - najniższa cena z 30 dni przed obniżką
69,00 zł - cena detaliczna
Dodaj do koszyka
Do koszyka
Kup w pakiecie
Kupuj więcej i oszczędzaj
Opis
Inni klienci sprawdzali również
Inne książki tego autora
Recenzje
Zapraszamy do napisania własnej recenzji, możesz wysłać do nas tekst przez formularz.
Powiedz, co sądzisz o tej książce
Dodaj recenzję+
Komentarze
Podziel się opinią z innymi czytelnikami i fanami księgarni.
Komentarze nie są potwierdzone zakupem