이제는 ‘보는’ 인공지능이다! 인공지능(AI) 이미지 인식의 모든 것 – LG 공식 블로그
본문 바로가기

이제는 ‘보는’ 인공지능이다! 인공지능(AI) 이미지 인식의 모든 것

작성일2019-02-14

“오늘 날씨 어때?” 음성을 인식하는 인공지능은 AI 스피커, 각종 가전제품 등에 적용되며 우리의 일상으로 자리 잡았습니다. 말 한마디면 내가 원하는 것을 척척 들어주는 음성인식 인공지능(AI) 덕분에 가능해진 일입니다.

이제 여기서 한 단계 더 나아가 인공지능이 보는 것까지 인식한다면 어떨까요? 인간의 눈을 대체하는 인공지능, 이미지 인식 인공지능(AI)에 대한 이야기입니다.

로봇의 눈이 클로즈업되어 있고, AI 라는 글자가 그 옆으로 보인다.

인공지능, 이제 듣는 것을 넘어 보는 것까지!

사물을 보고 스스로 인식하는 ‘AI 이미지 분석 기술’

렌즈를 갖다 대기만 하면 알아서 피사체를 분석해주는 AI 카메라, 신기하다고 생각하신 적 한 번쯤은 있으실 텐데요. 이처럼 인공지능은 음성뿐만 아니라 이미지 분석 분야에서도 새롭게 각광받고 있습니다.

물방울 모양을 손에 들고 살펴보는 듯한 사람의 실루엣

사실 이미지 분석 기술은 기존에도 컴퓨터 비전(Computer Vision)을 중심으로 연구되어 온 분야였습니다. 이것이 최근에는 더욱 발전된 인공신경망 기술인 딥러닝(Deep Learning)을 통해 사람의 시각처럼 높은 정확도와 다양한 사물 인식이 가능한 AI 이미지 분석으로 한 단계 진화하여 등장했습니다.

LG V40 ThinQ에 탑재된 구글 렌즈로 텍스트를 검색해 보고 있는 모습. 음료수 병에 적힌 '힘내세요, 파워- 씨'라는 문구가 보인다.

LG V40 ThinQ에 탑재된 구글 렌즈. 구글 어시스턴트와 연동되어 이미지를 인식한다.

인물이나 피사체의 움직임을 정교하게 인식하여 촬영하는 LG V40 ThinQ의 카메라, 사진을 ‘음식’, ‘동물’ 등으로 자동 분류해 주는 구글 포토, 카메라를 비추면 어떤 사물인지 알려주는 구글 렌즈 등이 실생활에서 찾아볼 수 있는 AI 이미지 분석 기술의 사례입니다.

이미지 분석의 관건, ‘노이즈’ 분석하기

AI 이미지 분석의 핵심 기술은 바로 ‘노이즈(Noise)’를 얼마나 판별해 내느냐 하는 것입니다.

예를 들어, 판다곰(동물) 사진에 노이즈를 삽입했을 경우, 사람은 여전히 판다곰으로 정확히 판단하지만 AI는 각각의 데이터(픽셀)로 이미지를 분석하기 때문에 긴팔원숭이로 잘못 인식하는 경우가 있습니다.

일반적인 판다곰 사진(왼쪽), 이 사진에 노이즈를 삽입해 흐릿하게 보이는 사진(오른쪽)

일반적인 판다곰 사진(왼쪽)에 노이즈를 삽입하게 되면(오른쪽), 사람은 그대로 판다곰으로 인식하지만 AI는 긴팔원숭이로 잘못 인식하기도 한다.

비슷한 형태와 색을 띈 사진들. 가장 위부터 순서대로 갈색 푸들(왼쪽)-프라이드 치킨(오른쪽), 치와와의 얼굴(왼쪽)-블루베리가 들어간 머핀(오른쪽), 흰 털이 가득한 풀리(왼쪽)-흰색 대걸레(오른쪽)의 모습.

이미지 분석을 혼란스럽게 만드는 사례들

또한, 노이즈는 아니지만 객체의 구도와 모양, 그리고 색이 유사하여 이미지 분석을 혼란스럽게 만드는 경우들도 있습니다. 모양이나 질감이 유사한 경우, 위 사진처럼 푸들을 치킨으로, 치와와를 머핀으로, 풀리를 청소도구로 잘못 인식하는 문제가 발생할 수 있습니다.

AI 이미지 분석 전문가에게 물었다!

Q.AI 이미지 인식에서 노이즈 외 판별에 핵심이 되는 요소는 또 무엇이 있나요?

AI 이미지 인식에서 중요한 요소는 판별하고자 하는 이미지의 특징(feature)을 포착하고 추상화하는 것입니다.

예를 들면 고양이 얼굴의 경우 뾰족한 귀, 가는 눈, 수염 등 고양이를 대표하는 특징을 잘 포착하고 이를 추상화하여 다양한 품종의 고양이 얼굴을 모두 고양이로 판별하게끔 만들어야 합니다.

조금 어려우시죠? 하지만, 사람들의 머릿속에는 고양이의 이미지가 분명합니다. 그런데 고양이 이미지를 말로 표현하다 보면 굉장히 제한적입니다. 바로 사람의 인식은 고해상도인 것에 비해 표현은 저해상도이기 때문입니다.

AI 이미지 인식에서는 바로 이러한 차이를 메우기 위해 깊은 인공신경망으로 특징 포착과 추상화를 동시에 진행하게 됩니다.

LG CNS AI/빅데이터담당 내 AI연구팀 이주열 팀장

AI 이미지 분석, 어떻게 활용될까?

인공지능을 통한 이미지 분석이 각광받고 있는 것은 다양한 산업 분야에 활용할 수 있기 때문입니다. 생산시설, 무인 스토어, 보안 검색대까지 AI 이미지 분석은 유용함을 넘어 이제 필수로 여겨지고 있습니다.

@스마트팩토리

전자제품에 들어가는 유리기판 제조 생산 공장에서는 부품 불량의 원인이 되는 기포와 먼지를 구별해 내는 것이 매우 중요합니다. AI 이미지 분석 기술이 스마트팩토리에 적용되면 사람이 일일이 확인하는 것보다 오류 발생 확률을 현저히 낮추고 불량 판정률을 높일 수 있게 됩니다.

실제로 LG CNS의 AI 이미지 분석 기술은 제조 공장에서 불량 여부를 판별하는 비전검사 영역에 이미 적용되어 있습니다.

공장의 어느 생산라인

@보안 검색대

기존의 보안 검색대는 물건을 올리면 엑스레이로 촬영하여 사람이 이를 하나하나 판별해야 했습니다. 여기에 AI 이미지 분석 기술이 적용되면 보다 정확하게 촬영 이미지를 분석하여 반·출입 불허 물품을 자동으로 검색할 수 있게 됩니다.

보안 검색대의 모습

@무인 스토어

무인 스토어의 셀프 계산대. 여기에도 AI 이미지 분석 시스템이 적용되어 있습니다. 실제로 LG사이언스파크의 LG CNS 연구동에 위치한 편의점에는 이 기술이 적용되어 있어, 구매자가 고른 제품을 계산대에 올리면 상품들을 자동으로 인식하여 계산하는 것까지 가능합니다.

텅 빈 슈퍼마켓에 물건을 실은 카트 한 대가 서 있다.

이러한 기술의 발전을 바탕으로, 최근에는 정지 이미지를 넘어 동영상 분석으로까지 AI 기술이 발전하고 있는데요. 동영상 분석은 시간에 따른 변화를 분석한다는 점에서 더욱 고도화된 기술을 필요로 합니다.

무언가를 그리듯 붓으로 물감 묻은 선을 그리고 있는 로봇의 손.

이미지 인식을 넘어, 이미지를 생성하는 단계까지 발전하고 있는 인공지능

또한, 이미지 분석을 넘어 이미지 자체를 생성하는 AI 기술도 큰 발전을 이루고 있습니다. GAN(Generative Adversarial Network)이라는 이 AI 기술은 인공지능을 통해, 유사하지만 실제로 존재하지 않는 이미지를 생성합니다. 분석에 필요한 데이터를 생성할 수도 있고, 미술 · 디자인과 같은 창작 활동 등에서도 활용할 수 있습니다.

5G 통신 기술의 발전이 이루어지면서 AI 이미지 분석은 더욱 발전할 전망입니다. 전과는 달리 매우 빠른 속도의 통신이 가능해지면서 지금보다 이미지나 동영상을 주고받기가 더 수월해지고, 고해상도의 콘텐츠를 통해 딥러닝 또한 정확해지기 때문입니다.

AI 이미지 분석 전문가에게 물었다!

Q. AI 이미지 인식 기술에서 보완되어야 할 점은 무엇인가요?

AI 이미지 인식 기술은 사람보다 더 정확해지고 있지만, 문제는 AI가 그만큼 방대한 양의 데이터를 학습해야만 한다는 점입니다. 사람은 몇 장의 사진만으로도 어떤 사물인지 쉽게 학습할 수 있는데, 현재의 AI는 수만 장의 사진을 학습해야 하기 때문이죠.

그러나 사람이 정답을 알려주어야 하고, 알고리즘 역시 사람이 직접 선택해야 합니다. 더욱이 AI가 내놓는 결과의 타당성을 최종적으로는 사람이 판단해야 하죠. 이런 부분에서 아직은 사람이 AI의 선생님 역할을 해야 하는 상황이라고 할 수 있습니다.

이러한 부분들이 아직 극복된 건 아니지만, 최근에는 마치 사람처럼 ‘학습하는 방법 자체를 학습하는 기술(메타 학습, Meta Learning)’을 도입하여 문제를 해결하려는 긍정적인 시도들이 있습니다.

LG CNS AI/빅데이터담당 내 AI연구팀 이주열 팀장

AI 이미지 분석 글로벌 경진대회 4, LG CNS 주목할 만한 기술력

이런 가운데 LG CNS가 지난해 말 AI 이미지 분석과 관련해 의미 있는 행보를 보였습니다. 전 세계적으로 권위 있는 AI 학회인 ‘인공신경망 학회(NeurIPS : Neural Information Processing System, 이하 NeurIPS)’ 주최 AI 경진대회에서 톱 5에 진입하는 성과를 거둔 것입니다.

특히 유수의 대학 연구팀에 이어 톱 5 수상팀 중 유일하게 기업으로서 수상한 것이라 그 의미가 더욱 큽니다.

NeurIPS에서 연구성과를 설명하고 있는 LG CNS 연구원. 벽에 붙은 안내문을 가리키는 한 사람과 그 앞에서 설명을 듣는 사람들이 보인다.

NeurIPS에서 연구성과를 설명하고 있는 LG CNS 연구원

이번 경진대회에서 공격진은 인물, 동물, 각종 사물 등의 사진에 다양한 유형의 노이즈를 삽입하고, 수비진은 정확한 AI 알고리즘을 만들어 얼마나 이미지를 잘 판별하는지를 평가받는 방식이었는데요, LG CNS는 수비진으로 참가했습니다.

총 340개 팀이 참가한 이 대회는 7월 말부터 약 3개월이라는 긴 기간 동안 진행되었는데요. LG CNS는 글로벌 톱 5에 진입한 성과를 인정받아 NeurIPS 콘퍼런스에 초청돼 AI 딥러닝 기술을 발표하기도 했습니다.

AI 이미지 분석 전문가에게 물었다!

Q. LG CNS를 대표해 경진대회에 직접 참가해 수상하셨는데, 수상 소감 한 말씀 부탁드려요.

현재 AI는 글로벌 무한 기술 경쟁이 치열한 분야라고 생각합니다. 여기서 우리의 수준이 얼마나 왔는지, 또 어디까지 해볼 수 있는지 부딪쳐 보자는 생각으로 대회에 참가했는데요.

분명 아직은 더욱 보강해야 할 부분도 있겠지만, 더욱 열심히 노력하면 좋은 결과가 있을 것이라는 자신감을 얻었습니다. 이 자신감이 이번 경진대회 참가로 얻은 최대 수확이라고 생각합니다.

LG CNS AI/빅데이터담당 내 AI연구팀 이주열 팀장

사람의 눈이 클로즈업되어 있고 그 위로 인공지능을 형상화하는 아이콘들이 여러 개 겹쳐져 있다.

이미지를 분석하고 판단하는 AI 이미지 분석 기술. 딥러닝 인공지능, 5G 통신의 발달과 함께 다양한 산업에서 더욱 빛을 발할 이 기술은 앞으로 어떻게 발전해 나갈까요?

LG Blog 운영진 프로필

LG 블로그는 LG의 혁신 기술, 디자인, 사회공헌활동(CSR) 등 LG의 주요 소식을 포함, LG 임직원들의 이야기, 채용 정보, 생활 속 정보 등 다양한 정보를 여러분께 빠르게 전달해드리겠습니다. 많은 이야기와 함께 여러분과 더 큰 공감대를 형성하고 싶습니다. :)