구글, 다양한 미디어(영상, 사진, 음성, 음악) 생성형 AI 공개

IT 소식

by 웨어러블서치 2025. 4. 10. 16:16

Veo 2 can now automatically remove objects, expand videos, and apply cinematic style presets.

이제 Veo 2에서 자동으로 오브젝트를 제거하고, 동영상을 확장하고, 시네마틱 스타일 사전 설정을 적용할 수 있습니다.

구글이 클라우드 기반 AI 개발 플랫폼인 Vertex AI(버텍스 AI)를 통해 영상, 이미지, 음성, 음악 등 다양한 미디어를 생성하고 편집할 수 있는 새로운 생성형 AI 도구들을 공개했습니다. 이는 콘텐츠 제작 방식에 상당한 변화를 가져올 수 있는 중요한 발표로 평가되며, 구글 클라우드 넥스트(Google Cloud Next) 행사에서 발표되었습니다. 이번 업데이트는 Vertex AI의 기능 확장을 통해 AI 기술의 적용 범위를 미디어 창작 영역까지 넓히려는 구글의 전략을 보여줍니다.

1. 동영상 생성 및 편집 역량 강화: Veo 2

동영상 AI 모델인 Veo 2(베오2)는 사용자가 보다 정교하게 영상 콘텐츠를 제작하고 편집할 수 있도록 기능이 확장되었습니다. 고급 제어 기능으로 텍스트 설명을 기반으로 영상을 생성할 뿐만 아니라, 타임랩스, 드론 촬영 시점, 특정 방향의 카메라 패닝 등 시네마틱 기법 사전 설정을 선택하여 결과물의 촬영 구도, 카메라 각도, 속도 등을 제어할 수 있습니다.

영상 편집 기능도 향상되었습니다.

· 인페인팅(Inpainting): 영상 내 원치 않는 배경 이미지, 로고, 방해 요소 등을 자동으로 제거하는 기능이 추가되었습니다.

· 아웃페인팅(Outpainting): 원본 영상의 프레임을 다른 형식이나 크기로 확장할 때, AI가 생성한 영상으로 새로운 공간을 자연스럽게 채워 넣어 화면을 확장합니다. 이는 Adobe의 이미지용 생성형 확장(Generative Expand) 기능과 유사합니다.

· 보간(Interpolation): 두 개의 정지된 이미지를 지정하면, 그 사이를 연결하는 자연스러운 동영상 프레임을 생성하여 전환 효과를 만들 수 있습니다.

Veo 2는 생성된 결과물에 SynthID 디지털 워터마크를 추가하여 AI 생성 콘텐츠임을 식별할 수 있다고 합니다.

2. 이미지 생성 및 편집 정교화: Imagen 3

텍스트-이미지 변환 모델인 Imagen 3(이미젠3)는 이미지 생성 능력과 더불어 편집 기능이 개선되었습니다.

· 향상된 객체 제거: 이미지 내 특정 객체를 제거할 때 주변 요소의 왜곡을 최소화하고 더욱 자연스러운 결과물을 제공하도록 자동 객체 제거 기능이 크게 향상되었습니다.

· 인페인팅(Inpainting) 개선: 이미지에서 누락되거나 손상된 부분을 재구성하는 기능의 품질이 향상되었습니다.

구글에 따르면 로레알, 크래프트 하인즈와 같은 기업들은 이미 Veo 2와 Imagen 3를 마케팅 콘텐츠 제작에 활용하고 있으며, 크래프트 하인즈는 이를 통해 기존 8주가 소요되던 작업을 8시간으로 단축하는 등 상당한 생산성 향상을 경험했다고 합니다.

3. 텍스트 기반 음악 생성: Lyria

텍스트 설명을 입력받아 음악을 생성하는 모델인 Lyria(리리아)가 Vertex AI에서 비공개 미리보기(Private Preview) 단계 정도로만 제공된다고 합니다. 향후 프로덕션 환경에서 즉시 활용 가능한 수준의 음악 제작을 목표로 하고 있다고 합니다.

저작권 부분이 걱정되지만, 음악 창작의 새로운 패러다임을 제시할 가능성이 높으며, 전문가뿐만 아니라 일반 사용자에게도 창의적인 음악 경험을 제공할 잠재력을 지니고 있습니다.

4. 맞춤형 음성 생성 및 분석: Chirp 3

음성 AI 모델인 Chirp 3에는 다음과 같은 새로운 기능이 추가되었습니다.

· 인스턴트 커스텀 보이스(Instant Custom Voice): 단 10초 분량의 오디오 입력만으로 특정 개인의 목소리를 모방한 사실적인 맞춤형 음성을 생성할 수 있습니다.

· 개선된 전사(Transcription) 기능: 여러 사람이 동시에 말하는 오디오에서 각 화자를 식별하고 분리하여 더욱 명확한 텍스트 변환 결과를 제공하는 기능이 미리보기로 출시되었습니다.

이번 구글의 발표는 Vertex AI 플랫폼을 중심으로 비디오, 이미지, 음악, 음성 등 미디어 전반에 걸쳐 생성형 AI 모델의 포트폴리오를 완성했다는 점에서 의미가 있습니다. Vertex AI는 이를 통해 다양한 미디어 유형에 걸쳐 생성형 AI 모델을 제공하는 플랫폼이 될 것으로 보입니다.

이러한 도구들은 초기에는 기업 고객을 대상으로 제공되지만, 향후 콘텐츠 제작 산업 전반의 워크플로우 효율화와 창작 방식의 혁신을 가속화할 잠재력을 지니고 있습니다. 더불어 구글은 효율성에 최적화된 Gemini 2.5 Flash 모델을 통해 Vertex AI에 곧 제공할 예정이며, AI 에이전트 간의 상호작용 및 타사 플랫폼 연동 기능 강화 등 기업용 AI 솔루션 전반에 걸친 업데이트도 함께 발표했습니다.

AI 기술이 미디어 생성 및 편집, 그리고 비즈니스 프로세스 자동화 영역에서 더욱 핵심적인 역할을 수행하게 될 것으로 예상됩니다.

`※ 기사 내용 참조

[TheVerge] You can now give Google’s AI video model camera directions | by Jess Weatherbed | Apr 10, 2025, 2:15 AM GMT+9 | https://www.theverge.com/news/645906/you-can-now-give-googles-ai-video-model-camera-directions

[Google Blog] New video, image, speech and music generative AI tools are coming to Vertex AI. | Apr 09, 2025 | https://blog.google/products/google-cloud/cloud-next-gen-ai-vertex-ai-updates/

[Google YouTube] Veo 2: Camera pre-sets | https://youtu.be/JBHhSnzcPl0

https://pf.kakao.com/_UCxoxnT

웨어러블서치

기술이 어디를 향하고 개인과 사회에 어떤 영향을 미치는지 연구합니다.

pf.kakao.com

728x90

저작자표시

'IT 소식' 카테고리의 다른 글

챗GPT 돌고래 버전? 구글, 돌고래와 대화하는 AI '돌핀젬마' 공개! (1)	2025.04.15
애플 비전 프로 '더 가볍고 저렴한' 업그레이드 계획 발표 (2)	2025.04.14
잠드는 것이 어렵다면 '인지적 셔플링'을 활용해 보세요. (1)	2025.04.09
갤럭시 S25시리즈, 실시간 화면공유 AI 기능 업데이트 (5)	2025.04.08
구글 제미나이 AI, 마이크로소프트 코파일럿에 적용?! (3)	2025.04.07