FilBench: бенчмарк для оценки языковых моделей теперь понимает филиппинские языки
Hugging Face представил FilBench — первый бенчмарк для оценки LLM на филиппинских языках. Тестирование 41 модели выявило лидеров и слабые места, особенно в генерации текста.
