Google выяснил, что «глубина мышления» повышает точность LLM и сокращает расходы вдвое
Google показал, что длина ответа снижает точность, а «глубокие» токены её повышают. Think@n отбрасывает слабые варианты на раннем этапе и почти вдвое уменьшает расходы при росте качества.
