Admin
Администратор
Компания OpenAI представила три новые голосовые модели для API, которые способны революционизировать взаимодействие с голосовыми ассистентами.
Модели GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper предлагают улучшенные возможности для сложных диалогов, живого перевода и потокового распознавания речи.
OpenAI представила три новые голосовые модели для API: GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper. GPT-Realtime-2 предназначена для сложных диалогов и умеет удерживать контекст. GPT-Realtime-Translate поддерживает более 70 языков и переводит речь в реальном времени. GPT-Realtime-Whisper распознаёт речь прямо во время разговора. Эти модели позволяют разработчикам создавать сервисы, которые могут управлять приложениями голосом, переводить речь и распознавать её без задержек. OpenAI считает, что голосовые интерфейсы станут особенно полезными в ситуациях, где печатать неудобно.