Słuchaj i czytaj kiedy chcesz

Romans na spacerze? Kryminał w drodze do pracy? Wciągający thriller, gdy gotujesz? Z ponad 500 tys. tytułów do wyboru, nigdy nie zabraknie Ci najlepszych historii. Zacznij słuchać już dziś - ale uważaj, te emocje uzależniają!

  • Wypróbuj przez 7 dni
  • Czytaj i słuchaj jak chcesz i ile chcesz
  • Ponad 500 000 tytułów
  • Tytuły dostępne wyłącznie w Storytel oraz Storytel Originals
  • Łatwa rezygnacja w dowolnym momencie
Wypróbuj
PL - Details page - Device banner - 894x1036
Cover for Ultimate Multimodal Transformer Models

Ultimate Multimodal Transformer Models

Język
Angielski
Format
Kategoria

Literatura Faktu

One Architecture. Infinite Intelligence.

Book Description

Transformer architectures have become the unified foundation of modern AI — powering language models, computer vision systems, and multimodal applications that process text, images, and speech together. Ultimate Multimodal Transformer Models provides a comprehensive, hands-on guide to mastering every major Transformer variant, from foundational encoder-decoder architectures to cutting-edge vision-language models and production GenAI systems.

You begin with the core building blocks of Transformer architecture and text data preparation, then progressively advance through encoder-only models, generative LLMs, RAG, Agentic workflows, and efficient fine-tuning using PEFT, LoRA, and QLoRA. The book then transitions into Vision Transformers, covering ViT, DETR, SAM, CLIP, and Flamingo, before bringing everything together in real-world multimodal applications combining text, vision, and speech using PyTorch and Hugging Face throughout.

By the end of the book, you will be proficient to build, fine-tune, and deploy Transformer-based AI systems across text, vision, and multimodal domains with confidence, applying the right architecture and strategy for every real-world use case!

What you will learn

? Build and deploy Transformer models for text, vision, and multimodal AI tasks.

? Fine-tune large language models efficiently using PEFT, LoRA, and QLoRA techniques.

? Develop production-ready GenAI applications using RAG pipelines and Agentic AI workflows.

? Apply LLMs to real-world NLP tasks including summarization, question answering, and classification.

? Implement Vision Transformers, DETR, and SAM for object detection and image segmentation tasks.

? Integrate multimodal AI systems combining text, vision, and speech using CLIP and Flamingo architectures.

Table of Contents

1. The Rise of Transformer Models in Sequence Learning

2. Text Data Preparation for Transformer Models

3. Building Blocks of Transformer Architecture

4. Encoder-only Transformer Configurations

5. Generative Transformers and LLM Architectures

6. Customizing LLMs Using Retrieval-Augmented Generation (RAG)

7. Efficient Fine-Tuning Techniques with PEFT and LoRA

8. Orchestrating LLMs with Tools and Memory

9. Introduction to Vision Transformer Models

10. Vision Transformers for Image Classification

11. Object Detection and Segmentation with Transformer Architectures

12. Vision-Language Models and Multimodal LLMs

13. Real-World Multimodal GenAI Applications

14. Image Generation with Vision Transformers

15. The Future of GenAI with Transformers

Index

© 2026 Orange Education Pvt Ltd (E-book): 9788169646833

Wydanie

E-book: 2 czerwca 2026

Wybierz swoją subskrypcję:

  • Ponad 500 000 tytułów w cenie jednego abonamentu

  • Wypróbuj przez 7 dni

  • Słuchaj i czytaj w trybie offline

  • Ekskluzywne produkcje audio Storytel Original

  • Tryb dziecięcy Kids Mode

  • Anuluj kiedy chcesz

Najpopularniejsze

Unlimited

Dla tych, którzy chcą słuchać i czytać bez limitów.

39.90 zł /30 dni

  • 1 konto

  • Słuchanie bez limitów

  • Anuluj w dowolnym momencie

Wypróbuj

Unlimited na rok

Dla tych, którzy chcą słuchać i czytać bez limitów.

39.90 zł /30 dni

  • 1 konto

  • Słuchanie bez limitów

  • Anuluj w dowolnym momencie

Rozpocznij subskrypcję

Basic

Dla tych, którzy słuchają i czytają od czasu do czasu.

22.90 zł /30 dni

  • 1 konto

  • 10 godzin / miesiąc

  • Anuluj w dowolnym momencie

Wypróbuj

Family

Dla tych, którzy chcą dzielić się historiami ze znajomymi i rodziną.

Od 59.90 zł /30 dni

  • 2–3 konta

  • Słuchanie bez limitów

  • Anuluj w dowolnym momencie

Ty + 1 członek rodziny2 konta

59.90 zł /30 dni

Wypróbuj