Featured image for microsoft dobavila v copilot instrumenty council i critique sravnivayushhie rezultaty gpt i claude

Microsoft добавила в Copilot инструменты Council и Critique, сравнивающие результаты GPT и Claude

Компания Microsoft представила два значимых обновления для своего инструмента Copilot Researcher — функции Critique и Council. Эти нововведения позволяют нейросетям GPT от OpenAI и Claude от Anthropic работать в тандеме над одной задачей, что должно существенно повысить точность ответов. Как сообщает издание ForkLog, такой гибридный подход направлен на минимизацию ошибок в сложных исследованиях.

Функция Critique представляет собой мультимодальную систему глубокого анализа, созданную для решения трудоемких исследовательских процессов. В основе этого инструмента лежит синергия нейросетей от разных лабораторий, где каждая модель выполняет свою специфическую роль. Вы сможете наблюдать, как одна нейросеть берет на себя планирование и создание черновика, а вторая выступает в роли строгого рецензента.

«Одна модель направляет фазу генерации, планируя задачу, итерируя поиск информации и создавая первоначальный вариант. Другая отвечает за проверку и доработку, выступая в качестве экспертного рецензента», — говорят представители Microsoft

Методы борьбы с галлюцинациями

Основная цель внедрения Critique — борьба с так называемыми галлюцинациями ИИ, когда алгоритмы выдают вымышленные факты за реальные. Разработчики пояснили, что сегодня большинство инструментов работают без внешнего контроля, в то время как новая система обеспечивает перекрестную проверку данных и корректность цитирования. Это обновление призвано сделать результаты работы ИИ более надежными для профессионального использования.

В ходе внутреннего тестирования DRACO, которое охватывает сотню сложных задач в десяти различных областях, система Critique набрала 57,4 балла. Для сравнения, модель Claude Opus 4.6 в одиночку показала результат в 42,7 балла. Такие цифры наглядно демонстрируют преимущество коллективного «разума» машин над изолированной работой даже самых продвинутых алгоритмов.

Объединение моделей разных вендоров — это признание того, что ни один ИИ-гигант пока не создал универсального «оракула». Однако за красивой оберткой сотрудничества скрывается операционная перегруженность: запуск двух тяжелых LLM для одной правки текста выглядит как попытка забивать гвозди микроскопом. Пока Microsoft пытается склеить чужие достижения, реальная архитектурная эффективность остается под вопросом, а пользователь рискует получить лишь более вежливые и согласованные, но все еще не безупречные галлюцинации.

Соревнование моделей в режиме Council

Вторая новинка, получившая название Council, использует совершенно иной подход к решению проблем. Вместо тесного сотрудничества нейросети GPT и Claude запускаются параллельно и готовят независимые отчеты, которые затем выводятся на экран рядом друг с другом. После этого в дело вступает третья модель-арбитр, которая анализирует оба текста и составляет резюме, подсвечивая точки согласия и противоречия между аргументами.

Разница между двумя режимами проста: в Critique нейросети помогают друг другу, а в Council — фактически соревнуются за право быть более убедительными. На данный момент Critique уже интегрирована как стандартный режим в Researcher, в то время как Council необходимо выбирать в меню вручную. Оба инструмента уже доступны участникам программы Microsoft Frontier, что позволяет протестировать их в реальных рабочих условиях.

Стоит напомнить, что в марте корпорация также представила интеллектуального агента Cowork для пакета Microsoft 365. Этот цифровой помощник способен выполнять комплексные поручения в рамках всей экосистемы приложений, включая электронную почту Outlook, мессенджер Teams и таблицы Excel. Таким образом, компания планомерно превращает свои инструменты в полноценную среду для автоматизации офисной деятельности.

Похожие записи