Tencent выпустила ИИ-модель на 440 мегабайт для офлайн-перевода на смартфонах
Компания Tencent представила компактную нейросеть Hy-MT1.5-1.8B, которая обеспечивает качественный перевод на 33 языках полностью в офлайн-режиме.
Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка.
Компания Tencent представила компактную нейросеть Hy-MT1.5-1.8B, которая обеспечивает качественный перевод на 33 языках полностью в офлайн-режиме.
Apple представила фреймворк LaDiR, который позволяет языковым моделям проверять несколько вариантов решения задачи параллельно перед выдачей ответа.
Исследователи во главе с Алеком Рэдфордом создали модель Talkie, ограниченную знаниями 1930 года, чтобы изучить пределы экстраполяции ИИ без современных данных.
OpenAI представила новое руководство по промптингу для GPT-5.5, призывая разработчиков отказаться от наследия старых моделей ради повышения эффективности.
Китайский разработчик DeepSeek снизил цены на использование новой модели V4-Pro на 75% и радикально удешевил кэширование в своем API.
OpenAI прекратила развитие Codex как отдельной линейки, объединив возможности программирования с основной моделью GPT-5.5 для улучшения агентных функций.
OpenAI выпустила GPT-5.5 — модель с упором на автономное выполнение задач и использование инструментов. Производительность выросла, но стоимость API увеличилась вдвое.
DeepSeek выпустила превью-версию модели V4, продолжая развивать сегмент open-source ИИ и конкурировать с мировыми технологическими гигантами.
Новое исследование выявило, что использование данных из соцсетей для обучения нейросетей ведет к потере логических навыков и деградации когнитивных функций ИИ.
OpenAI готовится представить GPT-5.5 Spud — промежуточную модель с повышенной эффективностью токенов, которая уже обходит конкурентов в тестах на логику и дизайн.