DEEPSPEED IN PRODUCTION: inference OPTIMIZATION and MODEL: Deploy LLMs efficiently with optimized serving, quantization, low latency for real time applications
Prijzen vanaf
VERGELIJK ALLE AANBIEDERS
(2)
45,55
Uitgelicht
|
45,55 |
Naar shop
|
|
45,55 |
Naar shop
|
Pages: 288, Hardcover, Independently published
Prijzen voor het laatst bijgewerkt op: