MAIL.TELSAT.AZ - Разместить объявление
  • 301

Amazon представила новую голосовую модель Nova Sonic

Amazon сделала важный шаг в области искусственного интеллекта, представив новую генеративную модель Nova Sonic, которая может обрабатывать речь локально и создавать естественно звучащие разговоры. Новинка станет конкурентом OpenAI и Google.

Nova Sonic предлагает более гибкий и реалистичный опыт общения, чем ранние модели, такие как Alexa. По сравнению с новыми ИИ-системами, старые голосовые помощники вроде Alexa и Siri звучат механически, тогда как Nova Sonic меняет это восприятие.

Самая доступная голосовая модель

Nova Sonic доступна через платформу разработки Bedrock от Amazon и поддерживает двустороннюю потоковую передачу с новым API, что делает её удобной для разработчиков. По заявлениям Amazon, эта модель на 80% дешевле в эксплуатации по сравнению с GPT-4o от OpenAI, что делает её самой экономичной ИИ голосовой моделью на рынке.

Рохит Прасад, глава подразделения AGI, сообщил, что компоненты Nova Sonic уже используются в новом поколении помощника Alexa Plus. По его словам, Nova Sonic опережает конкурентов в области "больших оркестровочных систем", способных точно перенаправлять запросы в нужные приложения.

Точнее и быстрее

По данным компании, Nova Sonic превосходит конкурентов по точности распознавания речи. Даже если пользователь бормочет, говорит с ошибками или находится в шумной среде, модель способна правильно интерпретировать запрос. В тестах на английском, французском, немецком, итальянском и испанском языках средняя ошибка распознавания составила лишь 4,2%, а в шумных условиях на 46,7% точнее, чем GPT-4o.

Время отклика Nova Sonic — 1,09 секунды, что быстрее, чем у API OpenAI в реальном времени.

ИИ следующего поколения

Amazon рассматривает Nova Sonic не только как голосовую модель, а как первый шаг к созданию ИИ-систем, способных выполнять любые задачи, как человек. Прасад также сообщил, что в будущем появятся мультимодальные модели, способные понимать изображения, видео и другие сенсорные данные.

Недавно представленная модель Nova Act, способная использовать браузер, также входит в эту стратегию. Такие функции, как Alexa Plus и "Buy for Me", уже задействуют эти технологии.