OpenAI says it has reduced costs for the AI-powered chatbot by 90% since December.
OpenAI는 12월 이후 AI 기반 챗봇 비용을 90% 줄였다고 말합니다.
OpenAI는 인공지능 챗봇 ChatGPT와 함께 오픈 소스 음성-텍스트 모델의 기업용 호스팅 버전인 위스퍼 API (Whisper API)를 출시했습니다. 일반적으로 API(Application Programming Interface)는 소프트웨어 애플리케이션을 구축하기 위한 프로토콜, 루틴 및 도구의 집합을 의미합니다. API는 서로 다른 소프트웨어 구성 요소가 서로 상호 작용하여 데이터와 기능을 교환할 수 있는 방법을 제공하여 다양한 시너지(Synergy)를 낼 수 있습니다.
위스퍼는 OpenAI가 개발한 자동 음성 인식 시스템으로 오랜 시간 학습된 자동 음성 인식(ASR) 시스템으로 여러 언어를 이해하고, 영어로 번역이 가능합니다. 음성파일은 M4A, MP3, MP4, MPEG, MPGA, WAV 및 WEBM을 포함한 다양한 형식의 파일을 만들 수 있습니다.
Google, Amazon 및 Meta와 같은 IT 대기업에서 소프트웨어 및 서비스의 핵심으로 고성능 음성 인식 시스템을 대규모 자본을 들여 개발해왔습니다. OpenAI 회장이자 공동 창업자인 그렉 브록만(Greg Brockman)은 웹에서 수집한 680,000시간의 다국어 및 멀티태스킹 데이터에 대하여 학습을 했기 때문에 고유한 억양, 배경 소음 및 전문 용어에 대한 인식이 향상되었다는 것을 강조하며, 저렴한 가격에 공급이 가능하다고 소개 합니다.
브록만(Brockman)은 미국의 IT 언론사인 테크크런치(TechCrunch)와의 화상 통화에서 "우리는 인공지능 모델을 출시했지만 실제로 전체 개발자 생태계를 구축하기에는 아직 충분하지 않았습니다."라고 말하며, “위스퍼 API를 통해 오픈 소스로도 대형 모델과 동일한 서비스를 얻을 수 있도록 최적화했습니다. 훨씬 더 빠르고 매우 편리합니다.”
브록만의 말에 의하면 대부분의 기업이 음성 인식 기술을 채택하는 데 많은 장벽이 있었다고 합니다. 2020년 시장 조사 기관인 스태티스타(Statista)의 설문 조사에 따르면 대부분의 기업이 음성 변환과 같은 기술을 채택하지 않은 가장 큰 이유로 정확성, 억양 또는 방언 관련 인식 문제 및 비용을 꼽았습니다.
하지만 위스퍼에는 한계가 있습니다. 특히 '다음 단어'를 예측하는 영역에서 라고 합니다. 이 시스템은 많은 양의 노이즈 데이터에 대해 훈련되었기 때문에 OpenAI는 Whisper가 실제로 말하지 않은 단어를 문자에 포함할 수 있다고 합니다. 아마도 오디오에서 다음 단어를 예측하고 오디오 녹음 자체를 문자로 표기하기 때문일 수 있습니다. 게다가 위스퍼는 훈련 데이터에 잘 표현되지 않은 언어에서 말하는 사람의 오류율로 인해 여러 언어에서 똑같이 수행되지 않는다고 합니다.
2020년 스탠포드 연구에 따르면 아마존, 애플, 구글, IBM, 마이크로소프트의 시스템은 흑인 사용자보다 백인 사용자에게서 훨씬 적은 오류(약 19%)를 기록했습니다. 그만큼 학습양이 적은 경우 오류가 많다는 것이기도 합니다.
위스퍼의 음성-문자 기능이 포함된 앱, 서비스등에서 사용되며 학습하며 개선되고 있다고 합니다. 한국에서 빠르게 성장하고 있는 AI 기반 언어 학습앱 스픽(Speak)에 적용된 위스퍼API는 교육서비스에도 가능성을 보여주고 있습니다.
위스퍼API가 음성 텍스트 변환 시장에 성공적으로 진입할 수 있다면 Microsoft에 상당한 이익이 될 수 있다고 합니다. 한 보고서에 따르면 2021년 22억 달러에서 2026년까지 54억 달러의 가치가 될 수 있습니다.
브록만은 "우리의 인공지능에 대한 목표는 우리가 진정으로 보편적 지능이 되기를 원한다는 것입니다."라고 말했습니다. "우리는 정말로, 유연하게, 당신이 가지고 있는 모든 종류의 데이터, 당신이 성취하고자 하는 어떤 종류의 작업을 도움이 되기를 원하고, 함께 성장할 수 있기를 원합니다."
※ 기사 내용 참조
[TechCrunch] OpenAI debuts Whisper API for speech-to-text transcription and translation | By Kyle Wiggers | 3:00 AM GMT+9•March 2, 2023 | https://techcrunch.com/2023/03/01/openai-debuts-whisper-api-for-text-to-speech-transcription-and-translation/
[MarTech] OpenAI debuts Whisper API for speech-to-text transcription and translation | By Constantine von Hoffman | March 2, 2023 at 1:55 pm | https://martech.org/openai-unveils-chatgpt-api-at-very-low-prices/
[Whisper] https://openai.com/research/whisper
키아누리브스, 곰팡이를 죽이는 치명적인 화합물 케아누마이신의 어원이 되다. (0) | 2023.03.07 |
---|---|
NASA는 인류를 위해 오픈소스 소프트웨어 뿐 아니라 오픈 사이언스를 시작합니다. (0) | 2023.03.06 |
Apple은 2024년 부터 Qualcomm 모뎀을 사용하지 않을 예정입니다. (0) | 2023.03.02 |
선사과 후결재, 스냅챗의 새로운 대화형 AI 도입 (0) | 2023.02.28 |
Nokia, 휴대폰 제조사 HMD 유럽에 생산기지 구축 중 (0) | 2023.02.27 |
댓글 영역