Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Språk
Engelsk
Format
Kategori

Fakta og dokumentar

Optimus is a Python library that works as a unified API for data cleaning, processing, and merging data. It can be used for handling small and big data on your local laptop or on remote clusters using CPUs or GPUs.

The book begins by covering the internals of Optimus and how it works in tandem with the existing technologies to serve your data processing needs. You'll then learn how to use Optimus for loading and saving data from text data formats such as CSV and JSON files, exploring binary files such as Excel, and for columnar data processing with Parquet, Avro, and OCR. Next, you'll get to grips with the profiler and its data types - a unique feature of Optimus Dataframe that assists with data quality. You'll see how to use the plots available in Optimus such as histogram, frequency charts, and scatter and box plots, and understand how Optimus lets you connect to libraries such as Plotly and Altair. You'll also delve into advanced applications such as feature engineering, machine learning, cross-validation, and natural language processing functions and explore the advancements in Optimus. Finally, you'll learn how to create data cleaning and transformation functions and add a hypothetical new data processing engine with Optimus.

By the end of this book, you'll be able to improve your data science workflow with Optimus easily.

© 2021 Packt Publishing (E-bok): 9781801077750

Utgivelsesdato

E-bok: 3. september 2021

Andre liker også ...

Derfor vil du elske Storytel:

  • Over 700 000 lydbøker og e-bøker

  • Eksklusive nyheter hver uke

  • Lytt og les offline

  • Kids Mode (barnevennlig visning)

  • Avslutt når du vil

Det mest populære valget

Unlimited

For deg som vil lytte og lese ubegrenset.

219 kr /måned
  • 1 konto

  • Ubegrenset lytting

  • Lytt så mye du vil

  • Over 700 000 bøker

  • Nye eksklusive bøker hver uke

  • Avslutt når du vil

Benytt tilbud
Familiens førstevalg

Family

For deg som ønsker å dele historier med familien.

Fra 289 kr/måned
  • 2-3 kontoer

  • Ubegrenset lytting

  • Lytt så mye du vil

  • Over 700 000 bøker

  • Nye eksklusive bøker hver uke

  • Avslutt når du vil

2 kontoer

289 kr /måned
Benytt tilbud

Basic

For deg som lytter og leser av og til.

149 kr /måned
  • 1 konto

  • 20 timer/måned

  • Lytt opp til 20 timer per måned

  • Over 700 000 bøker

  • Nye eksklusive bøker hver uke

  • Avslutt når du vil

Benytt tilbud

Lytt og les ubegrenset

Kos deg med ubegrenset tilgang til mer enn 700 000 titler.

  • Lytt og les så mye du vil
  • Utforsk et stort bibliotek med fortellinger
  • Over 1500 serier på norsk
  • Ingen bindingstid, avslutt når du vil
Prøv gratis
NO - Details page - Device banner - 894x1036
Cover for Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark