Бенчмарк PrediBench оценивает, как LLM предсказывают события для ставок на Polymarket
Новый бенчмарк PrediBench тестирует способность ИИ-моделей предсказывать реальные события через прогнозные рынки Polymarket. Модели ежедневно делают ставки на актуальные события.
