Новая архитектура Ling 2.0 Sparse ускоряет обработку длинных контекстов в три раза
Новая архитектура Ling 2.0 Sparse объединяет разреженные механизмы внимания с Mixture of Experts, обеспечивая трехкратное ускорение обработки длинных контекстов в языковых моделях.
