Salesforce оптимизирует затраты на LLM с помощью компонентов инференса AWS SageMaker
Salesforce снизила затраты на инференс LLM в 8 раз благодаря компонентам SageMaker, решающим проблему неэффективного использования GPU при работе с моделями разного размера и нагрузки.
