영상보안 멀티모달 AI 개인정보 탐지·비식별화 기술
페이지 정보

조회 656회 작성일 25-12-23
관련링크
-
관련링크
https://blog.naver.com/icerti_official/224014226855
280회 연결
본문
문서·영상·음성 데이터 자동 비식별화
개인정보 유출의 현실, 수작업과 부분 자동화의 한계
![]()
2024년 개인정보 침해 신고가 17만 건을 넘어섰습니다. 공식 통계보다 더 심각한 문제는 국내 기업과 기관 현장에서 벌어지고 있습니다.
- 계약서·행정문서 등 텍스트 데이터
- CCTV·의료 영상 등 이미지·동영상 데이터
대부분 기관은 여전히 수작업 편집이나 포맷별 부분 자동화 툴에 의존하고 있습니다.
문서 속 주민번호는 마스킹할 수 있어도, 영상 속 얼굴이나 차량번호판은 사람이 일일이 편집해야 하는 현실입니다.
특히 건설·의료·공공 등 민감 데이터가 집중되는 업종에서는 내부 감사와 감독 부담이 급증하고 있습니다.
멀티모달 AI의 혁신 가능성
텍스트(Text), 이미지·영상(Video), 음성(Audio) 등 서로 다른 데이터 유형을 동시에 이해하고 탐지·처리하는 AI 기술입니다.
최근 OpenAI, Google 등 글로벌 기업이 Vision-Language 모델 기반 연구를 잇달아 발표했지만, 실제 국내 환경에서 상용 구현된 사례는 극히 제한적입니다.
아이서티와 고려대학교 HIAI 연구진의 협력이 새로운 전환점을 만들어내고 있습니다.
- Vision + NLP 융합 모델: 고려대 HIAI의 선도 논문 기반 기술
- 산업 데이터셋: 아이서티가 다년간 축적한 건설·공공·의료 현장 데이터
- 상용화 추진: 2026년 출시를 목표로 PoC 단계에서 실증 연구 및 엔진 고도화 진행
멀티모달 AI 개인정보 보호, 왜? 필요한가?
현대 산업 및 공공기관, 의료 현장에는 문서·영상·음성 등 다양한 비정형 데이터가 혼재되어 있습니다.
하지만 기존 솔루션들은 다음과 같은 한계에 직면해 있습니다.
- 데이터 포맷별 개별 처리 및 수작업 의존
- 실시간 자동화 및 대용량 처리 불가능
- 법규제 및 감사 대응 준비 부족
아이서티와 고려대는 산학 협력을 통해 텍스트, 이미지, 영상, 음성을 한 번에 자동 탐지하고 비식별화하여
로그·보고서 자동 산출까지 지원하는 국내 최초 엔진을 연구개발하고 있습니다.