상세 컨텐츠

본문 제목

OpenAI, 차세대 오디오 모델로 편리해진 AI 음성 비서

IT 소식

by 웨어러블서치 2025. 3. 25. 15:06

본문

반응형

A new suite of audio models to power voice agents, now available to developers worldwide.

음성 에이전트를 구동하는 새로운 오디오 모델 모음이 이제 전 세계 개발자에게 제공됩니다.


사진출처) OpenAI

 

OpenAI는 지난 3월 24일 월요일에 ChatGPT에서 실시간 대화를 가능하게 하는 AI 음성 기능인 고급 음성 모드의 업데이트를 발표하여 AI 어시스턴트를 더욱 개성 있게 만들고 사용자를 방해하는 빈도를 줄였다고 합니다.

OpenAI 학습 후 연구원인 마누카 스트라타(Manuka Stratta)는 공식 YouTube 채널에 게시한 동영상을 통해 이러한 변경 사항을 발표했습니다. 놀랄만큼 자연스러운 대화를 나누는 영상은 하단의 유튜브 링크를 통해 확인할 수 있습니다.

사용자가 생각을 하거나 심호흡을 하기 위해 잠시 멈출 때 AI 음성 비서가 사용자를 방해하는 빈번한 문제가 어느정도 해결된 것을 확인할 수 있습니다.

ChatGPT의 무료 사용자도 AI 어시스턴트와 대화할 때 방해받지 않고 일시 정지할 수 있는 새로운 버전의 고급 음성 모드를 이용할 수 있습니다. OpenAI의 플러스(Plus), 팀(Teams), 에듀(Edu), 비즈니스(Business), 프로 티어(Pro Tier) 구독자를 포함한 ChatGPT 유료 사용자도 이제 고급 음성 모드를 사용할 때 중단되는 빈도가 확실히 줄어들고 AI 어시스턴트의 성격도 개선되었다고 합니다.

OpenAI는 유료 사용자를 위한 새로운 AI 음성 비서가 “더 직접적이고, 매력적이며, 간결하고, 구체적이고, 창의적인 답변을 제공합니다.” 이야기 합니다.

고급 음성 모드의 개선은 AI 음성 비서 분야에서 다른 경쟁업체들이 많은 불만 얻고 있을때 나온 업데이트라 더욱 재미있는 것 같습니다.

AI 스타트업인 세서미(Sesame)에서는 최근 자연스러운 음성의 AI 음성 비서인 마야와 마일스로 큰 인기를 끌고 있습니다. 세서미는 오큘러스의 공동 창업자 브렌단 이리베(Brendan Iribe)가 설립한 스타트업으로 현재 AI 음성비서와 함께 스마트 안경도 개발하고 있습니다. LLM 기반 버전의 Alexa 출시를 준비하고 있는 Amazon과 같은 대기업들도 AI 음성 비서 분야에 더욱 적극적으로 뛰어들고 있습니다.

 

사진출처) OpenAI


※ 기사 내용 참조

[TechCrunch] OpenAI says its AI voice assistant is now better to chat with | by Maxwell Zeff | 6:10 PM PDT · March 24, 2025 | https://techcrunch.com/2025/03/24/openai-says-its-ai-voice-assistant-is-now-better-to-chat-with/

[OpenAI] Introducing next-generation audio models in the API | March 20, 2025 | https://openai.com/index/introducing-our-next-generation-audio-models/

[OpenAI YouTube] New ChatGPT voice mode updates ⬇️ | https://youtu.be/mm4djPNO8os

 


https://pf.kakao.com/_UCxoxnT

 

웨어러블서치

기술이 어디를 향하고 개인과 사회에 어떤 영향을 미치는지 연구합니다.

pf.kakao.com

 

728x90
반응형

관련글 더보기

댓글 영역

웨어러블서치님의
글이 좋았다면 응원을 보내주세요!