시작페이지로　l　즐겨찾기　l　RSS　l　편집 2024.11.21 [14:16]

전체기사　l　로그인　l　ID/PW 찾기

이슈
건설
경제
사회
환경/건강
문화/예술
전국
종합
포토
영상(탐방)

문화/예술

이슈

KAIST, 차세대 새로운 패러다임 동영상 인식기술 개발

박한수기자

| 기사입력 2024/07/23 [09:51]

이슈

KAIST, 차세대 새로운 패러다임 동영상 인식기술 개발

박한수기자

| 입력 : 2024/07/23 [09:51]

- 전기및전자공학부 김창익 교수 연구팀, 동영상 인식 기술의 새로운 패러다임을 여는 초고효율 모델 '비디오맘바(VideoMamba)' 개발

- 낮은 연산 복잡도 및 메모리 사용량과 빠른 추론 속도로 자율주행, 의료, 스포츠 등 다양한 응용 분야에서 활용 기대

챗GPT와 같은 거대 언어 모델의 근간이 되는 트랜스포머로 구축된 기존 비디오 모델보다 8배 낮은 연산량과 4배 낮은 메모리 사용량으로도 높은 정확도를 기록했으며, 추론 속도 또한 기존 트랜스포머 기반 모델 대비 4배의 매우 빠른 속도를 달성한 동영상 인식기술이 KAIST 연구진에 의해 개발됐다.

KAIST(총장 이광형)는 전기및전자공학부 김창익 교수 연구팀이 초고효율 동영상 인식 모델 ‘비디오맘바(VideoMamba)’를 개발했다고 23일 밝혔다.

비디오맘바는 기존 트랜스포머 기반 모델들이 가지고 있는 높은 계산 복잡성을 해결하기 위해 설계된 새로운 동영상 인식 모델이다. 기존의 트랜스포머 기반 모델들은 셀프-어텐션(self-attention)이라는 메커니즘에 의존해 계산 복잡도가 제곱으로 증가하는 문제를 가지고 있었다.

김창익 교수 연구팀의 비디오맘바는 선택적 상태 공간 모델(Selective State Space Model, Selective SSM: 입력에 따라 동적으로 매개변수를 조정하여 시퀀스 데이터의 문맥을 더 잘 이해하는 상태 공간 모델) 메커니즘을 활용해 선형 복잡도(입력 데이터의 크기에 비례하여 계산량이 증가하는 알고리즘 복잡도)로 효율적인 처리가 가능하다. 이를 통해 비디오맘바는 동영상의 시공간적 정보를 효과적으로 포착해 긴 종속성을 가진 동영상 데이터도 효율적으로 처리할 수 있다.

김창익 교수 연구팀은 동영상 인식 모델의 효율성을 극대화하기 위해 비디오맘바에 1차원 데이터 처리에 국한된 기존 선택적 상태 공간 메커니즘을 3차원 시공간 데이터 분석이 가능하도록 고도화한 시공간적 전방 및 후방 선택적 상태 공간 모델(spatio-temporal forward and backward SSM)을 도입했다. 이 모델은 순서가 없는 공간 정보와 순차적인 시간 정보를 효과적으로 통합해 인식 성능을 향상한다. 연구팀은 다양한 동영상 인식 벤치마크에서 비디오맘바의 성능을 검증했다.

연구팀이 개발한 비디오맘바는 영상 분석이 필요한 다양한 응용 분야에서 효율적이고 실용적인 솔루션을 제공할 수 있다. 예를 들어, 자율주행에서는 주행 영상을 분석해 도로 상황을 정확하게 파악하고, 보행자와 장애물을 실시간으로 인식해 사고를 예방할 수 있다. 의료 분야에서는 수술 영상을 분석해 환자의 상태를 실시간으로 모니터링하고 긴급 상황 발생 시 신속히 대처할 수 있다. 스포츠 분야에서는 경기 중 선수들의 움직임과 전술을 분석해 전략을 개선하고, 훈련 중 피로도나 부상 가능성을 실시간으로 감지해 예방할 수 있다.

연구를 주도한 김창익 교수는 “비디오맘바의 빠른 처리 속도와 낮은 메모리 사용량, 그리고 뛰어난 성능은 우리 생활에서의 다양한 동영상 활용 분야에 큰 장점을 제공할 것이다”고 연구의 의의를 설명했다.

이번 연구에는 KAIST 전기및전자공학부 박진영 석박사통합과정, 김희선 박사과정, 고강욱 박사과정이 공동 제1 저자, 김민범 박사과정이 공동 저자, 그리고 KAIST 전기및전자공학부 김창익 교수가 교신 저자로 참여했다. 연구 결과는 올해 9월 이탈리아 밀라노에서 열리는 컴퓨터 비전 분야 최우수 국제 학회 중 하나인 ‘European Conference on Computer Vision(ECCV) 2024’에서 발표될 예정이다. (논문명: VideoMamba: Spatio-Temporal Selective State Space Model)

한편, 이번 연구는 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행됐다. (No. 2020-0-00153, 기계학습 모델 보안 역기능 취약점 자동 탐지 및 방어 기술 개발)

그림 1. 비디오맘바의 트랜스포머 기반 비디오 인식 모델 대비 낮은 메모리 사용량과 빠른 추론속도

그림 2. 비디오맘바 내부의 시공간적 전방 및 후방 선택적 상태 공간 모델 상세 구조

박한수기자의 다른기사보기

전체댓글보기

포토뉴스

내장산·소백산국립공원 가을 단풍 절정

많이 본 기사

HD현대중공업, 캐나다 잠수함 사업 수주 본격화

TS, 드론 조종자 자격시험 및 비행 승인 방법 안내

현대엔지니어링-현대제철, 국내 최대 모듈러 건축 테스트베드 'H-모듈러 랩' 구축

LH 법정자본금 15조 원 증액, 공공임대주택 공급 안정화 기대

필터 교체 필요없는 미세 버블 공기 정화 시스템 개발

케이메디허브 지원 간암치료제, 美 FDA 임상 1상 승인 쾌거

전북도, 2024년 한의약 육성 지역계획 평가 최우수기관 선정

美 뉴스위크, 현대차 아이오닉 9 · 기아 EV9 GT, '2025 가장 기대되는 신차' 선정

두산건설, 순환골재 콘크리트 조성물 건설업계 최초 특허 획득

감귤부산물 고부가가치 소재 산업화 기반 기술 개발

이슈 많이 본 기사

멀티모달 AI로 연료전지 성능 예측 기술 개발...미래형 에너지 솔루션..

국내 연구진, 비화재보 획기적 감소 지능형 화재감지 기술 개발

산화물 결정구조 제어로 고성능 고체산화물 연료전지 기능소재 개발

피부 탄력 340% 향상시키는 LED 마스크 개발

필터 교체 필요없는 미세 버블 공기 정화 시스템 개발

최신기사

HD현대사이트솔루션, '2024 스마트건설 챌린지' 철도 분야 최우수 혁신상 수상

광명시, MZ세대 공무원, 도시문제 해결할 스마트한 아이디어 공개

'초월; 삶, 시간을 넘어 공간을 잇다' 아르헨티나에서 개최

현대차·기아, 한국도로공사와 '돌발상황 자동알림' 교통안전 혁신 서비스 개발

LH, 전북 전주서 '2024 레디코리아 4차 훈련' 실시...전기차 화재 대응 강화

회원약관 ㅣ 개인정보처리방침 ㅣ 청소년보호정책 ㅣ 기사제보 ㅣ 기사검색

대한건설경제ㅣ 주소 :서울시 강동구 고덕로 399, 102동 3104호(고덕센트럴푸르지오)ㅣ 전화 :02-566-1952 / 010-5911-2989ㅣ
등록번호 : 서울 아55476 ㅣ 등록일 : 2024. 05. 29. | E-mail : phs88212@naver.com
회사명 : 대한건설경제 ㅣ 발행/편집인 : 최항서 | 발행일: 2024. 06. 14.｜청소년보호책임자 : 최항서
Copyright ⓒ 2024 대한건설경제. All rights reserved.