OpenAI выпустила три голосовые модели:
- GPT-Realtime-2: голосовая модель с рассуждением уровня GPT-5 для живых диалогов, умеет обрабатывать сложные разговоры и естественно вести диалог.
- GPT-Realtime-Translate: модель перевода в реальном времени, которая переводит речь с 70 языков на 13 языков, учитывая темп речи говорящего.
- GPT‑Realtime‑Whisper: расшифровывает речь в режиме реального времени по мере того, как говорит говорящий.
Все модели ориентированы на разработчиков, создающих голосовые приложения, которые должны реагировать естественно и почти без задержек.
Протестировать модели можно в OpenAI Playground и Codex.
2
2
1 комментарий