시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.11.22 [05:25]

전체기사　l　로그인　l　ID/PW 찾기

이슈
건설
경제
사회
환경/건강
문화/예술
전국
종합
포토
영상(탐방)

문화/예술

이슈

서울대 공대 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발

최항서기자

| 기사입력 2024/11/11 [13:35]

이슈

서울대 공대 컴퓨터비전 연구팀, 끝없이 영상 생성하는 AI 비디오 생성 기술 개발

최항서기자

| 입력 : 2024/11/11 [13:35]

- 짧은 클립만 생성하는 기존 모델 한계 극복해 영화, 광고 등 활용 가능성 높여

- 인공지능 분야 최고 권위 국제학술대회 NeurIPS 2024의 발표 논문 채택

서울대 한보형 교수 연구팀이 NeurIPS 2024에서 '피포 디퓨전'이라는 새로운 비디오 생성 AI 기술을 발표했다. 이 기술은 추가 학습 없이 텍스트 조건에 맞춰 무한한 길이의 비디오를 생성하며, 대각선 디노이징, 잠재 파티셔닝, 앞서보기 디노이징 등의 혁신적 기법을 활용해 비디오 품질과 생성 속도를 향상시켰다.

▲좌측부터 김지환 연구원(협동과정 인공지능전공 석사과정), 강준오 연구원(전기정보공학부 박사과정), 한보형 교수(전기정보공학부, 협동과정 인공지능전공)

서울대학교 공과대학은 전기정보공학부 한보형 교수가 지도하는 컴퓨터비전 연구팀(CVLAB)이 별도의 학습 없이 무한한 길이의 비디오를 생성할 수 있는 혁신적인 인공지능(AI) 기술 ‘피포 디퓨전(이하 FIFO-Diffusion)’을 개발했다고 밝혔다.

기존 영상 생성 모델의 한계를 극복한 FIFO-Diffusion은 디퓨전 모델에 기반한 비디오 생성 기술의 새로운 방법론을 제시했다는 평가를 받고 있다. 이 기술을 제안한 논문 ‘FIFO-Diffusion: Generating Infinite Videos from Text without Training’은 지난 10월에 인공지능 및 기계학습 분야의 최고 권위 국제학술대회 ‘NeurIPS 2024 (Neural Information Processing Systems, 신경정보처리시스템학회)’의 발표 논문으로 채택돼 학계와 산업계의 주목을 받은 바 있다. NeurIPS는 인공지능 및 딥러닝 분야의 최신 연구 성과와 혁신적 기술이 발표되는 자리로 매년 엄격한 심사를 통과한 우수한 논문이 발표 논문으로 선정된다.

기존의 비디오 생성 모델은 영상 길이가 길어질수록 메모리 소모가 급격히 증가해 대규모 하드웨어 자원이 필요했을 뿐 아니라 프레임 간 일관성 유지에 어려움이 있어 부자연스러운 영상을 생성하는 한계가 있었다. 이에 연구팀은 메모리 사용량을 일정하게 유지하면서도 각 프레임이 자연스럽게 연결되는 영상을 생성하는 FIFO-Diffusion을 개발했다. 이 획기적인 기술은 사전에 짧은 클립을 통해 훈련된 디퓨전 모델이 추가 학습 없이 텍스트 조건에 맞춰 무한한 길이의 비디오를 생성하도록 설계됐기 때문에 고화질의 비디오를 장시간 생성할 수 있다.

특히 이번 연구에서는 비디오 품질 개선을 위해 세 가지의 혁신적 기법이 활용돼 관심을 끌었다. 먼저 각기 다른 노이즈 레벨의 비디오 프레임을 일련의 큐(queue) 형태로 동시에 처리하는 ‘대각선 디노이징(diagonal denoising)’ 기법을 통해 디퓨전 모델이 품질 저하 없이 무한히 긴 비디오를 생성하는 것을 가능케 했다. 이어서 프레임을 여러 블록으로 나눠 병렬 처리하는 ‘잠재 파티셔닝(latent partitioning)’ 기법으로 프레임 간 노이즈 레벨 차이를 줄였다. 그리고 새로 생성될 프레임들이 이전에 생성된 더 깨끗한 프레임을 참조하도록 하는 ‘앞서보기 디노이징(lookhead denoising)’ 기술을 도입해 후반 프레임의 손실을 감소시켜 더욱 선명한 비디오 출력을 구현할 수 있었다. 마지막으로 연구진은 비디오 생성 속도와 품질을 한결 높인 이 기법들을 다중 GPU에 병렬로 적용해 효율성을 극대화함으로써 무한히 긴 영상을 생성하는 비디오의 실현 가능성을 입증했다.

FIFO-Diffusion 기술은 향후 영화, 광고, 게임, 교육 등 다양한 콘텐츠 산업에서 널리 활용될 것으로 기대된다. 기존의 텍스트 기반 비디오 생성 모델들은 3초 이내의 짧은 클립만 생성할 수 있어 실제 콘텐츠 제작에 이용되기 어려웠지만, 이러한 제약을 뛰어넘은 FIFO-Diffusion 기술이 상용화되면 길이 제한 없이 더 자연스러운 비디오를 생성할 수 있기 때문이다. 또한 학습을 위한 대규모 하드웨어 자원이나 방대한 데이터를 필요로 하지 않는 강점 덕분에 FIFO-Diffusion이 AI에 기반한 영상 콘텐츠 제작을 한층 활성화할 전망이다.

연구를 지도한 한보형 교수는 “기존 비디오 생성 모델의 한계를 깬 FIFO-Diffusion은 별도의 학습 없이 무한한 길이의 비디오를 생성한다는 새로운 개념을 수립했다는 점에서 의미가 남다르다”며 “향후 이 기술을 바탕으로 다양한 후속 연구를 이어 나갈 계획”이라고 밝혔다. 논문의 주 저자인 김지환 연구원은 “이번 개발로 비디오 생성 기술이 영상 콘텐츠 분야에서 폭넓게 사용될 수 있는 토대가 마련됐다”고 연구의 의미를 설명했다.

한편 연구 논문의 공동 제1저자인 김지환, 강준오 연구원은 현재 서울대 컴퓨터비전 연구실에서 비디오 생성 분야의 후속 연구를 심도 깊게 수행하고 있다.

최항서기자의 다른기사보기

전체댓글보기

포토뉴스

내장산·소백산국립공원 가을 단풍 절정

많이 본 기사

HD현대중공업, 캐나다 잠수함 사업 수주 본격화

TS, 드론 조종자 자격시험 및 비행 승인 방법 안내

현대엔지니어링-현대제철, 국내 최대 모듈러 건축 테스트베드 'H-모듈러 랩' 구축

LH 법정자본금 15조 원 증액, 공공임대주택 공급 안정화 기대

필터 교체 필요없는 미세 버블 공기 정화 시스템 개발

케이메디허브 지원 간암치료제, 美 FDA 임상 1상 승인 쾌거

전북도, 2024년 한의약 육성 지역계획 평가 최우수기관 선정

美 뉴스위크, 현대차 아이오닉 9 · 기아 EV9 GT, '2025 가장 기대되는 신차' 선정

두산건설, 순환골재 콘크리트 조성물 건설업계 최초 특허 획득

감귤부산물 고부가가치 소재 산업화 기반 기술 개발

이슈 많이 본 기사

멀티모달 AI로 연료전지 성능 예측 기술 개발...미래형 에너지 솔루션..

국내 연구진, 비화재보 획기적 감소 지능형 화재감지 기술 개발

산화물 결정구조 제어로 고성능 고체산화물 연료전지 기능소재 개발

피부 탄력 340% 향상시키는 LED 마스크 개발

필터 교체 필요없는 미세 버블 공기 정화 시스템 개발

최신기사

전북 서해안 세계지질공원, 전국 만족도 조사서 7개 항목 1위 쾌거

충남-대전, 35년 만에 행정구역 통합 추진

대형건설사와 함께하는 인천시, ‘2024년 협력업체 만남의 날’행사 개최

HD현대사이트솔루션, '2024 스마트건설 챌린지' 철도 분야 최우수 혁신상 수상

광명시, MZ세대 공무원, 도시문제 해결할 스마트한 아이디어 공개

회원약관 ㅣ 개인정보처리방침 ㅣ 청소년보호정책 ㅣ 기사제보 ㅣ 기사검색

대한건설경제ㅣ 주소 :서울시 강동구 고덕로 399, 102동 3104호(고덕센트럴푸르지오)ㅣ 전화 :02-566-1952 / 010-5911-2989ㅣ
등록번호 : 서울 아55476 ㅣ 등록일 : 2024. 05. 29. | E-mail : phs88212@naver.com
회사명 : 대한건설경제 ㅣ 발행/편집인 : 최항서 | 발행일: 2024. 06. 14.｜청소년보호책임자 : 최항서
Copyright ⓒ 2024 대한건설경제. All rights reserved.