Simplify Big Data Analytics with Amazon EMR: A beginner's guide to learning and implementing Amazon EMR for building data analytics solutions

Språk
Engelsk
Format
Kategori

Fakta og dokumentar

Amazon EMR, formerly Amazon Elastic MapReduce, provides a managed Hadoop cluster in Amazon Web Services (AWS) that you can use to implement batch or streaming data pipelines. By gaining expertise in Amazon EMR, you can design and implement data analytics pipelines with persistent or transient EMR clusters in AWS.

This book is a practical guide to Amazon EMR for building data pipelines. You'll start by understanding the Amazon EMR architecture, cluster nodes, features, and deployment options, along with their pricing. Next, the book covers the various big data applications that EMR supports. You'll then focus on the advanced configuration of EMR applications, hardware, networking, security, troubleshooting, logging, and the different SDKs and APIs it provides. Later chapters will show you how to implement common Amazon EMR use cases, including batch ETL with Spark, real-time streaming with Spark Streaming, and handling UPSERT in S3 Data Lake with Apache Hudi. Finally, you'll orchestrate your EMR jobs and strategize on-premises Hadoop cluster migration to EMR. In addition to this, you'll explore best practices and cost optimization techniques while implementing your data analytics pipeline in EMR.

By the end of this book, you'll be able to build and deploy Hadoop- or Spark-based apps on Amazon EMR and also migrate your existing on-premises Hadoop workloads to AWS.

© 2022 Packt Publishing (E-bok): 9781801077729

Utgivelsesdato

E-bok: 25. mars 2022

Andre liker også ...

Derfor vil du elske Storytel:

  • Over 700 000 lydbøker og e-bøker

  • Eksklusive nyheter hver uke

  • Lytt og les offline

  • Kids Mode (barnevennlig visning)

  • Avslutt når du vil

Det mest populære valget

Unlimited

For deg som vil lytte og lese ubegrenset.

219 kr /måned
  • 1 konto

  • Ubegrenset lytting

  • Lytt så mye du vil

  • Over 700 000 bøker

  • Nye eksklusive bøker hver uke

  • Avslutt når du vil

Benytt tilbud
Familiens førstevalg

Family

For deg som ønsker å dele historier med familien.

Fra 289 kr/måned
  • 2-3 kontoer

  • Ubegrenset lytting

  • Lytt så mye du vil

  • Over 700 000 bøker

  • Nye eksklusive bøker hver uke

  • Avslutt når du vil

2 kontoer

289 kr /måned
Benytt tilbud

Basic

For deg som lytter og leser av og til.

149 kr /måned
  • 1 konto

  • 20 timer/måned

  • Lytt opp til 20 timer per måned

  • Over 700 000 bøker

  • Nye eksklusive bøker hver uke

  • Avslutt når du vil

Benytt tilbud

Lytt og les ubegrenset

Kos deg med ubegrenset tilgang til mer enn 700 000 titler.

  • Lytt og les så mye du vil
  • Utforsk et stort bibliotek med fortellinger
  • Over 1500 serier på norsk
  • Ingen bindingstid, avslutt når du vil
Prøv gratis
NO - Details page - Device banner - 894x1036
Cover for Simplify Big Data Analytics with Amazon EMR: A beginner's guide to learning and implementing Amazon EMR for building data analytics solutions