BigCodeArena запускает платформу для оценки моделей генерации кода через выполнение программ
BigCodeArena — новая платформа для оценки моделей генерации кода через выполнение программ. Позволяет сравнивать модели, запускать код и голосовать за лучшие результаты на основе реальной работоспособности.
