OpenAI по своему бенчмарку посчитал, что GPT-5 сравнялся с людьми в профессиональных задачах
OpenAI представила бенчмарк GDPval, где GPT-5 показывает паритет с человеческими экспертами в 40.6% случаев, а Claude Opus 4.1 — в 49%. Тестирование охватывает 9 отраслей и 44 профессии.
