Scale AI

LLM

Новый бенчмарк Audio MultiChallenge показал, насколько плохо ИИ понимает живую речь
18 декабря, 2025

Scale представила бенчмарк Audio MultiChallenge, который тестирует голосовые ИИ на реалистичных диалогах с исправлениями и паузами. Лидером стал Gemini 3 Pro, а GPT-4o значительно отстал.

Читайте далее Новый бенчмарк Audio MultiChallenge показал, насколько плохо ИИ понимает живую речь
Машинное обучение

Разметка данных для ИИ создала экономику на $5,7 млрд и 200 тысяч рабочих мест
16 декабря, 2025

Исследование Oxford Economics по заказу Scale показало, что индустрия аннотации данных в США создала экономику на $5,7 млрд и почти 200 тыс. рабочих мест, привлекая высокообразованных экспертов.

Читайте далее Разметка данных для ИИ создала экономику на $5,7 млрд и 200 тысяч рабочих мест
Разработка

Как создать долгоиграющего ИИ-агента для предприятия на базе Agentex и Temporal
20 ноября, 2025

Scale и Temporal представили руководство по созданию автономных агентов для предприятий, способных работать месяцами и привлекать людей только для ключевых решений.

Читайте далее Как создать долгоиграющего ИИ-агента для предприятия на базе Agentex и Temporal
Безопасность

Создан первый фреймворк для биологических ИИ-моделей
20 ноября, 2025

Исследование показывает, что фильтрация данных в био-моделях не обеспечивает полной защиты. Опасные знания сохраняются в скрытых слоях и могут быть восстановлены с помощью простых техник.

Читайте далее Создан первый фреймворк для биологических ИИ-моделей
Машинное обучение

Специализированные RL-агенты превосходят GPT-5 в корпоративных задачах
10 ноября, 2025

Специализированные RL-агенты Scale демонстрируют до 46,9% точности против 21,9% у GPT-5 в корпоративных задачах, открывая новую эру адаптированных AI-решений для бизнеса.

Читайте далее Специализированные RL-агенты превосходят GPT-5 в корпоративных задачах
Безопасность

Scale AI объединяется с корейским институтом для разработки стандартов безопасности ИИ
29 октября, 2025

Scale AI и Корейский институт безопасности ИИ объявили о стратегическом партнерстве для разработки глобальных стандартов оценки и регулирования искусственного интеллекта.

Читайте далее Scale AI объединяется с корейским институтом для разработки стандартов безопасности ИИ
Безопасность

Ответ на современные угрозы: новый подход к тестированию ИИ
29 октября, 2025

Эксперты по безопасности ИИ предупреждают: традиционные методы кибербезопасности неэффективны против поведенческих угроз искусственного интеллекта. Необходим новый подход к красному тестированию моделей.

Читайте далее Ответ на современные угрозы: новый подход к тестированию ИИ
Машинное обучение

Конкурент Scale AI в сфере сбора данных привлек $15 млн ради вознаграждений для персонала
10 октября, 2025

Стартап Datacurve привлек $15 млн для конкуренции с Scale AI в сборе высококачественных данных для ИИ. Компания использует систему вознаграждений для привлечения разработчиков.

Читайте далее Конкурент Scale AI в сфере сбора данных привлек $15 млн ради вознаграждений для персонала
Машинное обучение

Малые языковые модели превосходят GPT-4 в юридическом анализе благодаря методу Rubrics as Rewards
8 октября, 2025

Метод Rubrics as Rewards позволяет малым ИИ-моделям превосходить GPT-4 в специализированных задачах через структурированное обучение с детализированными критериями оценки.

Читайте далее Малые языковые модели превосходят GPT-4 в юридическом анализе благодаря методу Rubrics as Rewards
LLM

Scale запускает SEAL Showdown — рейтинг LLM на основе отзывов реальных пользователей
23 сентября, 2025

Scale запустила SEAL Showdown — первый рейтинг языковых моделей на основе оценок реальных пользователей из 100+ стран с детальной сегментацией по демографии.

Читайте далее Scale запускает SEAL Showdown — рейтинг LLM на основе отзывов реальных пользователей