Новый бенчмарк BullshitBench проверяет способность ИИ распознавать абсурдные задачи
Бенчмарк BullshitBench выявил неспособность ведущих ИИ-моделей распознавать абсурдные и логически противоречивые запросы, заставляя их галлюцинировать.
Бенчмарк BullshitBench выявил неспособность ведущих ИИ-моделей распознавать абсурдные и логически противоречивые запросы, заставляя их галлюцинировать.
Исследование Sonatype выявило новую проблему ИИ в безопасности: вместо галлюцинаций модели теперь выбирают бездействие, оставляя уязвимости в коде.
Новое исследование подтверждает, что нейросети демонстрируют высокую «индивидуальную» оригинальность, но при масштабировании выдают поразительно однообразный контент. Это ставит под вопрос долгосрочную ценность LLM как инструмента для поиска прорывных решений.
OpenAI закрывает видеогенератор Sora и прекращает партнерство с Disney, чтобы сфокусироваться на развитии робототехники и агентских ИИ-систем.
Финансовые директора американских компаний прогнозируют сокращение административных должностей в пользу технических специалистов из-за внедрения ИИ.
Китайские открытые модели ИИ захватывают рынок, позволяя Пекину конкурировать с США несмотря на дефицит чипов и экспортные ограничения.
Hugging Face представила Reachy Mini – компактного настольного робота с открытым исходным кодом, призванного стать физическим интерфейсом для LLM и алгоритмов компьютерного зрения. Устройство ориентировано на разработчиков и предлагает две версии: Lite и Wireless.
Серийный предприниматель Бретт Эдкок, основатель Figure AI, запустил новый проект Hark, который сфокусируется на создании физического устройства для переосмысления взаимодействия человека с ИИ. К команде присоединился бывший ведущий дизайнер Apple, Абидур Чоудхури.
Использование алгоритмов машинного обучения и спутниковых данных InSAR позволяет обнаруживать подготовку оползней и лавин на ранних стадиях, автоматизируя мониторинг тысяч склонов.
Фармацевтические компании объединяют лекарства с ИИ, создавая персонализированную терапию, которая угрожает рынку дженериков и требует новых правил регулирования.