Слушайте и четете

Открийте безкрайна вселена от истории

  • Слушайте и четете неограничено
  • Над 500 000 заглавия
  • Ексклузивни и Storytel Original заглавия
  • Можете да прекратите лесно по всяко време
Пробвайте Storytel
BG - Details page - Device banner - 894x1036

Apache Flume: Distributed Log Collection for Hadoop: If your role includes moving datasets into Hadoop, this book will help you do it more efficiently using Apache Flume. From installation to customization, it's a complete step-by-step guide on making the service work for you.

Език
Английски
Format
Категория

Документални

Apache Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data. Its main goal is to deliver data from applications to Apache Hadoop's HDFS. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with many failover and recovery mechanisms.

Apache Flume: Distributed Log Collection for Hadoop covers problems with HDFS and streaming data/logs, and how Flume can resolve these problems. This book explains the generalized architecture of Flume, which includes moving data to/from databases, NO-SQL-ish data stores, as well as optimizing performance. This book includes real-world scenarios on Flume implementation.

Apache Flume: Distributed Log Collection for Hadoop starts with an architectural overview of Flume and then discusses each component in detail. It guides you through the complete installation process and compilation of Flume.

It will give you a heads-up on how to use channels and channel selectors. For each architectural component (Sources, Channels, Sinks, Channel Processors, Sink Groups, and so on) the various implementations will be covered in detail along with configuration options. You can use it to customize Flume to your specific needs. There are pointers given on writing custom implementations as well that would help you learn and implement them.

By the end, you should be able to construct a series of Flume agents to transport your streaming data and logs from your systems into Hadoop in near real time.

© 2013 Packt Publishing (Е-книга): 9781782167921

Дата на публикуване

Е-книга: 16 юли 2013 г.

Разгледай още от

    Другите харесаха също...

    Избери своя абонамент:

    • Над 500 000 заглавия

    • Сваляте книги за офлайн слушане

    • Ексклузивни заглавия + Storytel Original

    • Детски режим (безопасна зона за деца)

    • Лесно прекратявате по всяко време

    Най-популярен

    Unlimited

    Най-добрият избор. Открийте хиляди незабравими истории.

    7.66 € | 14.99 лв. /месец
    • 1 профил

    • Неограничен достъп

    • Избирайте от хиляди заглавия

    • Слушайте и четете неограничено

    • Прекратете по всяко време

    Пробвайте сега

    Unlimited Годишен

    12 месеца на цената на 8. Избирайте от хиляди заглавия.

    61.35 € | 119.99 лв. /година
    7 дни безплатно
    Спестете 33%!
    • 1 профил

    • Неограничен достъп

    • 5.11 € | 9.99 лв. на месец

    • Слушайте и четете неограничено

    • Прекратете по всяко време

    Пробвайте 7 дни безплатно

    Family (2 акаунта)

    Споделете историите със семейството или приятелите си.

    11.24 € | 21.99 лв. /30 дни
    • 2 профила

    • Неограничен достъп

    • Потопете се заедно в света на историите

    • Слушайте и четете неограничено

    • Прекратете по всяко време

    Пробвайте 7 дни безплатно

    Family (3 акаунта)

    Споделете историите със семейството или приятелите си.

    13.29 € | 25.99 лв. /30 дни
    • 3 профила

    • Неограничен достъп

    • Потопете се заедно в света на историите

    • Слушайте и четете неограничено

    • Прекратете по всяко време

    Пробвайте 7 дни безплатно