Microsoft представила новые открытые модели AI Phi-4, способные конкурировать с гигантами вроде OpenAI

В среду Microsoft анонсировала ряд новых «открытых» моделей искусственного интеллекта, среди которых самая мощная соперничает с моделью o3-mini от OpenAI, как минимум в одном из тестов. Все новые модели, лицензированные по типу «pemissively», включают Phi 4 mini reasoning, Phi 4 reasoning и Phi 4 reasoning plus и относятся к категории «reasoning». Это значит, что они способны больше времени уделять проверке фактов при решении сложных задач. Эти модели расширяют линейку «small model» Microsoft Phi, о которой компания впервые заявила год назад, создавая основу для разработчиков, работающих на границах ИИ.

Phi 4 mini reasoning прошёл обучение на основе примерно 1 миллиона синтетических математических задач, созданных моделью рассуждений R1, разработанной китайским стартапом AI DeepSeek. Согласно информации от Microsoft, размер этой модели составляет около 3,8 миллиарда параметров, и она ориентирована на образовательные приложения, включая «встроенное обучение» для легких устройств.

Количество параметров в модели обычно коррелирует с её производительностью: модели с большим количеством параметров, как правило, демонстрируют лучшие результаты, чем их менее мощные аналоги. Phi 4 reasoning с 14 миллиардами параметров была обучена на основе высококачественных веб-данных и, по мнению Microsoft, идеально подходит для приложений в области математики, науки и программирования.

Phi 4 reasoning plus является адаптированной версией ранее выпущенной модели Phi-4, преобразованной в модель рассуждений для повышения точности в определённых задачах. Microsoft утверждает, что производительность Phi 4 reasoning plus близка к производительности модели R1, которая имеет значительно больше параметров (671 миллиард). Внутренние тесты компании сравнительно оценили Phi 4 reasoning plus и o3-mini на платформе OmniMath, где проверялись математические навыки.

Модели Phi 4 mini reasoning, Phi 4 reasoning и Phi 4 reasoning plus доступны на платформе разработки искусственного интеллекта Hugging Face, где опубликованы также подробные технические отчёты.

«Путем использования дистилляции, обучения с подкреплением и качественных данных, эти новые модели сочетают оптимальный размер и производительность», — отметила Microsoft в своём блоге. «Они достаточно компактны для работы в условиях низкой задержки, но при этом обладают высокой способностью к рассуждениям, сравнимой с гораздо большими моделями. Это сочетание позволяет даже устройствам с ограниченными ресурсами эффективно решать сложные задачи».