IBM выпускает Granite Embedding R2 — семейство моделей для эффективного поиска информации
IBM представила семейство моделей Granite Embedding R2 для поиска информации с улучшенной производительностью и поддержкой длинных контекстов.
IBM представила семейство моделей Granite Embedding R2 для поиска информации с улучшенной производительностью и поддержкой длинных контекстов.
OpenAI формирует экспертный совет для изучения влияния искусственного интеллекта на благополучие человека и разработки рекомендаций по созданию социально ответственных ИИ-систем.
AWS представляет решение для управления IoT-устройствами через голосовые команды с использованием Amazon Bedrock AgentCore, устраняя необходимость в множестве приложений.
Salesforce перешла на Amazon Bedrock для развертывания кастомизированных LLM, сократив время вывода моделей в продакшен с месяцев до часов и устранив необходимость резервирования GPU-мощностей.
Подробный разбор математики MoE-моделей: от расчета памяти до вычислительной сложности. Почему 8x7B на самом деле означает 13B активных параметров.
Полное руководство по RAG: от архитектуры до лучших практик. Узнайте, как настроить извлечение, оптимизировать промпты и интегрировать LLM для максимальной эффективности.
Узнайте, как использовать Prompt Chaining для улучшения работы с языковыми моделями: техники, шаблоны и лучшие практики для решения сложных задач.
Узнайте, как получать структурированные данные от ИИ с помощью промптинга в форматах JSON, XML, YAML. Практическое руководство с примерами и шаблонами.
Практическое руководство по мультимодальному адаптивному промтингу: техники, шаблоны и лучшие практики для эффективного использования AI.
Nvidia начинает продажи компактного AI-суперкомпьютера DGX Spark за $3999. Устройство помещается на столе и обеспечивает производительность дата-центра для работы с моделями до 200 млрд параметров.