Долгожданный продвинутый голос ChatGPT может появиться ‘на следующей неделе’

скриншот. два человека, сидящие за столом, разговаривают по мобильному телефону в расширенном голосовом режиме OpenAI
OpenAI

Генеральный директор и соучредитель OpenAI Сэм Альтман сообщил в X (ранее Twitter) В четверг, что его расширенная голосовая связь начнет распространяться “на следующей неделе”, хотя только для нескольких избранных подписчиков ChatGPT-Plus.

Компания планирует “запустить альфа-версию с небольшой группой пользователей, чтобы собирать отзывы и расширяться на основе того, что мы узнаем”.

Усовершенствованный голосовой интерфейс, который устраняет текстовые подсказки и позволяет пользователям напрямую общаться с искусственным интеллектом, как с обычным человеком, был первоначально анонсирован в мае одновременно с выпуском GPT-4o во время мероприятия компании Spring Update. В отличие от существующих цифровых помощников, таких как Siri и Google Assistant, которые предоставляют только готовые ответы на запросы пользователей, усовершенствованный голос ChatGPT обеспечивает ответы, похожие на человеческие, практически без задержек, и на нескольких языках.

Модель GPT-4o способна реагировать на аудиовходы в среднем за 320 миллисекунд, что соответствует тому, как быстро люди реагируют на обычный разговор. Как вы можете видеть в демонстрационном видео ниже, модель может общаться с несколькими пользователями одновременно, импровизировать темы для разговора и вопросы как на английском, так и на португальском, а также передавать их с помощью человеческих эмоций, включая “смех”.

Пока ничего не известно о том, как компания будет отбирать участников для альфа-пробной версии, за исключением того, что они будут подписчиками уровня ChatGPT Plus стоимостью 20 долларов в месяц. Альфа-релиз изначально был запланирован на июнь, хотя эта дата была перенесена “для достижения нашей планки запуска” и улучшения способности обнаруживать и отклонять запрещенные формы контента, а также для поддержки ИТ-инфраструктуры компании в связи с ожидаемым увеличением нагрузки на пользователей.

Как компания объявила в июне, полное внедрение функции произойдет не раньше, чем этой осенью, и ее точные сроки, опять же, будут зависеть от того, “соответствует ли она нашей высокой планке безопасности и надежности”.

Предоставление ChatGPT возможности непринужденно общаться со своими пользователями — это огромное достижение. Устранение необходимости в контекстном окне снижает требования к пользовательскому оборудованию и расширяет потенциальные возможности интеграции и варианты использования искусственного интеллекта (например, расширяет доступ к пользователям с ограниченной подвижностью тела или ловкостью).

Это также может помочь ускорить внедрение технологии широкой общественностью, снизив барьер для входа для менее технически подкованных пользователей, которым комфортно взаимодействовать со своими компьютерами через “привет, Siri”, но они бледнеют от перспективы быстрого внедрения.

StarsChoice.ru
Не копируйте текст!