AI-эксперт скептически оценивает обучение с подкреплением для языковых моделей
Андрей Карпати критикует обучение с подкреплением для LLM, предлагая интерактивные среды и системное промпт-обучение как альтернативные парадигмы для следующего прорыва в ИИ.
