Admin
Администратор
Microsoft выпустила новую мультимодальную модель Phi-4-reasoning-vision-15B, которая сочетает эффективность и скорость работы.
Модель способна работать с изображениями, документами, графиками и интерфейсами, а также решать задачи по математике и естественным наукам.
Phi-4-reasoning-vision-15B — это компактная модель на 15 млрд параметров, разработанная Microsoft. Она предназначена для широкого спектра задач, включая генерацию подписей к фотографиям, анализ чеков, чтение документов и взаимодействие с графическими интерфейсами. Модель использует смешанный подход: для простых задач она даёт быстрый ответ, а для сложных включает режим пошагового рассуждения. Обучение модели проводилось на 200 млрд токенов данных, что значительно меньше, чем у конкурентов. Microsoft утверждает, что Phi-4-reasoning-vision-15B демонстрирует высокую точность и скорость при умеренных затратах на вычисления. Модель уже доступна через Microsoft Foundry, Hugging Face и GitHub.