오디오북 라이프의 시작

격이 다른 오디오북 생활을 경험해보세요!

  • 언제든 손쉽게 구독해지 가능
  • 무제한 청취
  • 총 5만권 이상의 영/한 오디오북
  • 온가족을 위한 다양한 오디오북
지금 바로 시작해보세요!
kr all devices
Cover for Text Generation Inference (TGI): Deploying Transformers with Streaming and Batching

Text Generation Inference (TGI): Deploying Transformers with Streaming and Batching

언어학습
영어
형식
컬렉션

논픽션

"Text Generation Inference (TGI): Deploying Transformers with Streaming and Batching"

This book is for engineers and platform practitioners who need to move transformer inference from demos into reliable, high-performance production systems. Rather than treating serving as a thin wrapper around model.generate(), it addresses the real tensions that emerge under live traffic: latency versus throughput, streaming responsiveness versus compute cost, and hardware efficiency versus operational simplicity. Readers building chat systems, internal AI platforms, or GPU-backed inference services will find a rigorous guide to what actually governs TGI behavior in production.

Across the book, you will build a working mental model of TGI’s runtime architecture, request flow, streaming semantics, and continuous batching scheduler. It explains prefill and decode execution, token-budget controls, time-to-first-token behavior, multi-GPU sharding, replication trade-offs, and inference optimizations such as attention and memory techniques. The result is practical decision-making skill: how to size deployments, tune throughput-latency trade-offs, expose stable APIs, integrate streaming clients, and diagnose bottlenecks with metrics and tracing.

The treatment assumes experience with transformers, GPU-based model serving, and modern infrastructure patterns such as HTTP APIs, proxies, and observability tooling. Its distinguishing strength is operational depth: the material is organized around deployment decisions, failure modes, compatibility boundaries, and performance trade-offs, making it es

© 2026 NobleTrex Press (전자책): 6610001219109

출시일

전자책: 2026년 5월 8일

태그

언제 어디서나 스토리텔

  • 국내 유일 해리포터 시리즈 오디오북

  • 5만권이상의 영어/한국어 오디오북

  • 키즈 모드(어린이 안전 환경)

  • 월정액 무제한 청취

  • 언제든 취소 및 해지 가능

  • 오프라인 액세스를 위한 도서 다운로드

인기

스토리텔 언리미티드

5만권 이상의 영어, 한국어 오디오북을 무제한 들어보세요

13800 원 /월

처음이시라면 30일간 0원
  • 사용자 1인

  • 무제한 청취

  • 언제든 해지하실 수 있어요

지금 바로 시작하기

패밀리

친구 또는 가족과 함께 오디오북을 즐기고 싶은 분들을 위해

매달 21500 원 원 부터

  • 2-3 계정

  • 무제한 청취

  • 언제든 해지하실 수 있어요

본인 + 1 가족 구성원2 개 계정

21500 원 /월

지금 바로 시작하기