[인공지능 기술 발전의 역사] #2. 최근 AI 기술 트렌드 – 인지에서 학습, 추론, 행동까지 – LG 공식 블로그
본문 바로가기

[인공지능 기술 발전의 역사] #2. 최근 AI 기술 트렌드 – 인지에서 학습, 추론, 행동까지

작성일2018-03-28

최근 5년간 인공지능은 매우 빠른 속도로 진화하고 있습니다. 과거 이론에 머물거나 제한적인 기능만을 수행했던 인공지능은 이제 실제 구현을 통해 그 성능을 증명해내고 다양한 현실 문제에 하나씩 적용되기 시작했습니다.

인지 지능의 발전 – 인간처럼 보고, 듣는 기계의 등장

인공지능은 여러 분야에서 사람의 능력을 넘어서는 수준으로 구현되고 있습니다. 광범위한 분야에서 사람처럼 외부의 정보를 인식하고, 학습하며, 추론하고, 행동하는 인공지능에 대한 연구가 활발하게 진행되고 있는데요. 특히 시각, 청각지능 분야의 발전으로 인해 사람보다 더 높은 정확도로 사물을 인식하고, 사람과 비슷한 수준으로 언어를 이해할 수 있게 되었습니다.

(1) 인간의 능력을 뛰어넘는 시각 지능

인간의 시각 지능에 해당하는 이미지 인식 분야에서는 이미 인간 수준을 넘어선 인공지능이 구현되고 있습니다. 단순히 이미지 속 사물의 종류를 인식하는 것을 넘어 이미지나 영상 속 상황을 이해할 수 있게 되었는데요. 가령 사람 얼굴 사진을 보면 남성, 여성 등과 같은 외형적 특성을 인식할 뿐 아니라 눈, 코, 입 모양의 상관 관계를 분석해 표정을 인지하거나, 감정을 추측할 수도 있게 된 것입니다.

인간 수준 이상의 시각 지능을 가진 인공지능은 시각 정보를 자유롭게 변형하거나 전혀 새로운 이미지를 생성해내기도 합니다. 계절적 특성을 이해한 인공 지능이 하나의 풍경 사진을 여름, 겨울 사진으로 변경하거나, 동식물의 특성을 정확히 이해해 외형을 자유롭게 변형하기도 합니다. 이런 가상 이미지는 완성도도 높아 사람들이 쉽게 구분해낼 수 없을 정도입니다.

시각 인지 지능은 산업 영역에도 적용되고 있는데요. 카메라, 초음파 센서 같은 저가의 범용 센서와 딥러닝 기반의 시각 지능으로 지능형 자율 주행 기술을 구현할 수 있고, 직접적으로 엔터테인먼트, VR/AR과 같은 영상 콘텐츠 산업에도 핵심 역량으로 작용할 수 있습니다. 뿐만 아니라 단순한 콘텐츠 산업을 넘어 교육, 쇼핑, 교통 등 인간의 시각이 관련된 거의 모든 산업에 직간접적으로 영향을 미칠 수 있습니다.

볼 줄 아는 인공지능의 시작, LG V30S ThinQ

볼 줄 아는 인공지능의 시작, LG V30S ThinQ

LG전자도 스마트폰 LG V30S ThinQ’에 볼 줄 아는 인공지능, ‘비전 AI’를 탑재했습니다. 카메라로 사물을 비추면 자동으로 사물을 인식해 최적의 촬영 모드를 추천해 주는 ‘AI 카메라’와 사진을 찍으면 피사체의 정보를 검색해주고, 어디서 살 수 있는지 쇼핑 정보를 알려주며, QR코드를 스캔해주는 ‘Q렌즈’, 촬영 환경의 어두운 정도를 분석해 기존보다 최대 2배까지 밝은 사진을 찍게 해주는 ‘브라이트 카메라’ 등의 인공지능 기술이 적용됐습니다.

(2) 인간 수준의 언어 인식/이해 지능 구현

음성인식 분야의 인공지능 연구는 매우 오래 전부터 진행되어 왔지만 아직까지 자유로운 대화가 가능할 수준까지는 구현되지 못하고 있습니다. 언어 인식 분야의 인공지능이 빠르게 발전하지 못한 것은 기존의 ‘사람 중심’의 방법론 때문입니다. 언어학을 전공한 전문가가 일일이 단어 간의 관계를 설정하는 방식으로 구현되었기 때문에 언어의 확장성이 낮고, 새로운 언어나 전문적인 영역의 언어의 경우엔 사람이 직접 개입해야 했죠.

인공지능-인지지능의 발달 (9)

하지만 최근 음성 인식 분야에도 딥러닝이 적용되면서 사람에 의존하지 않고 인공지능이 데이터에 기반한습을 통해 스스로 언어를 이해하는 방식으로 전환되고 있습니다. 방대한 데이터를 기반으로 개별 단어가 아닌 구문 단위로 이해하고 각각의 단어를 수백 개의 차원으로 구성된 벡터 공간에 위치시켜 단어별 상관 관계를 정의하는 개념인데요.

데이터를 기반으로 구성된 언어 모델은 기존 방식에 비해 확장성이 높고, 특정 분야에 종속되지 않습니다. 새로운 언어가 추가되거나 전문성이 필요한 특정 분야에 활용할 경우 관련 데이터를 기계에 학습 시켜 모델은 업데이트하면 됩니다. 또한 전혀 새로운 언어도 충분한 데이터만 확보된다면 과거에 비해 매우 빠르고 쉽게 인식할 수 있습니다.

예를 들어 한국어의 경우 과거엔 한국어에 대한 전문성과 경험을 갖고 있는 국내 기업들의 언어 인식/이해의 정확도가 글로벌 대비 높았지만 최근 구글, 페이스북 등은 데이터를 기반으로 종전과 비교가 안될 속도로 한국어 인식 성능을 높이고 있습니다. 구글은 언어 인식/이해 분야에 딥러닝 기술을 적용한지 2년 만에 인식 가능 언어를 32개(2017년 3월 기준)까지 확장했고, 마이크로소프트, 바이두 또한 다양한 언어에 대해 인간 수준의 언어 이해 지능을 구현해 내고 있습니다.

인간 수준의 언어 인식/이해 지능을 갖게 된 인공지능은 사람의 목소리를 자유롭게 생성해 내기도 합니다. 과거 기계가 만들어낸 사람 목소리는 개별 단어, 구문을 조합하는 형태였기 때문에 발음이나 억양이 부자연스러웠지만, 딥러닝이 적용되면서 개별 단위의 발음, 악센트뿐만 아니라 문장 단위에서의 억양까지 매우 정교하게 구현해 냅니다.

딥러닝은 자연스러운 말하기뿐만 아니라 특정 사람의 목소리를 반복 학습해 그 사람의 특징을 완벽히 모사하기도 하는데요. 국내 기업 네이버도 유명 연예인의 목소리를 학습하고 특징을 모델링해 가상으로 생성된 목소리로 동화책을 읽어주는 서비스를 선보이기도 했습니다. 이런 언어 인식/이해 기술의 혁신은 애플 시리, 아마존 알렉사 같은 지능형 비서 서비스를 더 활성화시킬 것으로 전망됩니다.

네이버의 음성인식 인공지능 플랫폼 ‘클로바’를 탑재한 LG 씽큐 허브

네이버의 음성인식 인공지능 플랫폼 ‘클로바’를 탑재한 LG 씽큐 허브

LG유플러스의 ‘U+ 우리집 AI’는 LG유플러스의 IPTV와 가정용 사물인터넷(IoT)에 네이버의 음성인식 인공지능 플랫폼 ‘클로바’를 접목시킨 AI 스마트홈 서비스입니다.

이 서비스의 핵심은 AI 스피커인데요. 말 한마디로 집안의 조명이나 전자제품을 켜고 끄거나, 음성으로 정보를 검색하고, 주문부터 결제까지 말로 쇼핑할 수 있습니다. IPTV와 연결되어 영화나 드라마의 제목을 몰라도 한두 개의 키워드만 말해주면 원하는 콘텐츠를 찾아주지도 하지요. 여기에 네이버의 인공지능 통번역 서비스인 ‘파파고’를 탑재해 영어, 중국어, 일본어 3개국어 번역과 쌍방향 영어 대화 기능도 지원합니다.

[U+우리집AI] 고마워, 나에게 와줘서 - YouTube (1080p) 0000070767ms

학습 지능의 발전 – 스스로 지식을 키워가는 강화학습

2012년 시작된 딥러닝의 발전은 2016년 알파고의 출현을 기점으로 전환점을 맞았습니다. 그 동안 딥러닝이 깊이(Deep)와 성능 분야에서 경쟁을 해왔다면 알파고의 출현 이후, 학습(Learning) 경쟁을 하게 된 것입니다.

(1) 강화학습의 등장

강화학습 기반의 인공지능 학습 과정의 과거의 방식과 전혀 다릅니다. 기존 기계학습 기반의 인공지능은 목표 달성을 위해 사람이 일일이 모델링하고 구현해야 했다면, 강화학습 방법에선 인공지능이 스스로 현재의 환경을 인식하고 행동하며 목표를 달성해 나갑니다. 게다가 이런 방식은 범용적으로 활용 가능해 새로운 환경에서도 학습을 반복하게 되면 하나의 알고리즘을 가지고 매우 다양한 환경에 적용 가능합니다.

구글은 이런 강화학습의 잠재력을 빨리 인지하고 발 빠르게 움직이고 있는 기업 중 하나입니다. 구글의 딥마인드는 강화학습에 딥러닝을 접목하여 게임 환경에서의 인공지능을 구현했는데요. 인공지능은 매 순간 자신이 처한 환경과 행동 가능한 옵션들을 인지하고 각 행동에 대해 최대의 보상을 얻을 수 있는 행동을 반복적으로 선택하게 됩니다.

알파고의 경우도 마찬가지입니다. 매 수를 둘 때마다 다양한 착점 중 가장 승률이 높을 것으로 계산된 수를 선택한 거죠. 알파고는 매일 128만 번에 이르는 반복학습을 통해 바둑을 두는 과정을 깨우쳐 나갔다고 합니다. 알파고를 통해 시작된 강화학습 연구는 선행 연구 기관들의 오픈소스 공개 덕분에 2016년 이후 빠르게 발전하고 있습니다.

(2) 3차원 및 현실 세계에 적용된 강화학습

최근 강화학습의 주요 연구들은 3차원 또는 실제 물리적 환경을 고려한 상황에서 이뤄지고 있습니다. 완벽한 정보를 파악할 수 있었던 2차원과는 달리 3차원 환경에서 인공지능은 전체 정보 중 매우 제한된 부분 정보만 갖게 되는데요. 마치 2차원의 미로는 한눈에 맵이 다 파악되지만 3차원의 미로는 현재 시점에서 공개된 정보만 보게 될 뿐 보이지 않는 길에 대한 정보를 갖지 못하는 것과 같습니다.

이 경우 강화학습 기반의 인공지능은 과거의 경험을 기억할 수 있는 별도의 메모리를 설계하거나, 학습을 통해 쌓은 지식을 일반화해 새로운 환경에 적용하게 됩니다.

실제로 주요 기업의 연구소에서는 강화학습을 실제 제품, 서비스에 적용하려는 연구 개발이 활발히 진행되고 있습니다. 자동차 자율주행 외에도 스마트 팩토리 내 다양한 제조 공정, 로봇 등에 강화학습 기반의 인공지능이 앞으로 빠르게 적용될 것으로 전망되며 이렇게 되면 현실 세계의 인간처럼 학습하는 기계가 머잖아 인간과 협력 혹은 경쟁하는 것도 가능하게 될 것으로 보입니다.

이렇게 사용자와 환경을 학습해 진화하는 인공지능은 최근 가전제품에도 적용되고 있습니다. LG전자는 ‘고객 입장에서 생각하고 사용자를 실질적으로 배려한다’는 지향점을 갖고 ‘LG ThinQ™’라는 인공지능 브랜드를 내놓았는데요.

LG전자의 글로벌 인공지능 브랜드, 'LG 씽큐(ThinQ) '

LG전자의 글로벌 인공지능 브랜드, ‘LG 씽큐(ThinQ) ‘

인공지능 스스로 에어컨

올해 출시된 ‘LG 휘센 씽큐 에어컨’은 기존 에어컨이 사람이 주로 머물던 공간을 학습하던 것에서 더 나아가 온도나 습도, 공기질 같은 생활환경은 물론 사용자가 에어컨을 사용하는 패턴이나 사용자의 언어까지 학습합니다. 이렇게 학습한 정보를 토대로 알아서 공기청정이나 제습 등 상황에 맞는 코스로 작동하게 되지요. 쓰면 쓸수록 에어컨은 더 많은 정보를 학습하여 사용자에 최적화된 기능을 제공하게 됩니다.

‘LG 트롬 씽큐 세탁기’‘LG 씽큐 TV’도 마찬가지입니다. 세탁기는 날씨 정보와 사용자가 자주 입는 옷감의 종류를 파악해서 세탁 코스를 자동으로 설정하고, TV는 자주 보는 프로그램이나 좋아하는 배우 등을 기억해뒀다 유사한 프로그램이나 좋아하는 배우가 출연한 영화를 추천해 주기도 합니다. 이들 가전제품은 스스로 학습하며 개별적으로 똑똑해지기도 하지만 동시에 제품들끼리 서로 정보를 교환하며 기능을 확장합니다.

102-720x720

추론/행동 지능의 발전

(1) 추론, 관계 추론이 가능한 인공지능의 등장 

추론은 오랫동안 인간의 고유 영역으로 여겨지며 기계적으로 구현하기에는 매우 어려운 분야 중 하나였습니다. 텍스트, 이미지 같은 정보를 인식해 문맥적 의미를 이해해야 할 뿐 아니라 같은 정보라도 상황에 따라 변하는 문맥적 관계를 고려해야 하기 때문입니다.


하지만 최근 발전된 딥러닝, 그 중에서도 학습 알고리즘의 진화로 추론 분야의 인공지능도 빠르게 연구, 개발되고 있습니다. 구글의 딥마인드는 지난해 6월 관계형 추론이 가능한 인공지능을 구현한 논문을 발표했습니다. 관계형 추론은 단순히 개별 정보를 인식하고 이해하는 것을 넘어 각 정보를 사이의 상대적인 관계를 파악해 논리적인 결론에 도달해야 하기 때문에 구현하기가 어려웠는데요. 딥마인드는 이런 관계형 추론에서 더 나아가 예측까지 가능한 인공지능을 제안했습니다.

각 객체 간의 관계를 이해하고 예측이 가능한 인공지능은 단순히 방대한 데이터 속에서 인간보다 빠르고 정확하게 답을 찾는 것이 아니라 사람처럼 생각하며 추론하는 것이 가능해진 것을 의미합니다. 미리 정의된 관계를 학습하는 것을 넘어 인간 같이 유연한 사고가 가능해진 거죠.

이런 추론 분야의 발전은 향후 다양한 산업에 영향을 미칠 것으로 예상되는데요. 예를 들어 지능형 자율주행차에 관계형 지능이 적용되면 단순히 차간 거리, 속도, 표지판을 통한 판단 뿐만 아니라 차선을 급하게 변경하는 자동차의 향후 추행 패턴을 추론/예측하여 주의하거나 초보 운전 차량의 움직임을 추론해 회피하는 등이 기능 구현이 가능해집니다. 관계형 지능은 이 밖에도 제조 공정, 금융, 보안 등 다양한 분야에 적용 가능할 것으로 예상됩니다.

“엇, 옆 차가 이상하네, 피해야겠다.” 스스로 추론/예측하는 인공지능은 자율주행차에도 적용될 수 있습니다.

“엇, 옆 차가 이상하네, 피해야겠다.” 스스로 추론/예측하는 인공지능은 자율주행차에도 적용될 수 있습니다.

(2) 미래 상황을 예측하고 계획하는 인공지능

행동은 추론과 마찬가지로 인공지능이 인간 수준으로 구현되기 매우 어려운 분야로 생각되어 왔습니다.

인간 수준의 행동이란 단순히 현재만을 고려해 행동하는 것이 아니라 현재의 행동이 미래에 미치는 영향을 고려하고 동시에 최종적인 목적 달성을 위해 매 순간 계획(Planning)과 결정(Decision)이 동반되어야 하기 때문입니다. 그렇기 때문에 현재 시점에서 최선의 선택이 아니어도 장기적 관점에서 목적 달성에 도움이 된다면 차선책을 선택해 행동하는 것도 필요합니다.

영화 에는 범죄를 미리 예측하고 예방할 수 있는 기술이 등장합니다. (이미지 출처: 네이버 영화)

영화 <마이너리티 리포트>에는 범죄를 미리 예측하고 예방할 수 있는 기술이 등장합니다.
(이미지 출처: 네이버 영화)

기존 강화학습의 경우 인공지능은 매 순간 최고의 보상을 받을 수 있는 행동을 반복하며 목표를 달성하도록 설계되었습니다.

하지만 최근의 연구는 인공지능이 매 순간의 행동이 미래에 미치는 영향을 상상해 최적의 행동을 선택하도록 합니다. 이 과정에서 최종 목적을 달성하기 위해 인공지능은 장기적 관점에서 계획하고 행동합니다. 현재 시점에서 손해가 되는 선택이더라도 이런 행동이 최종 목적 달성을 위한 과정이라고 판단되면 행동하는 것입니다.

그 동안 매우 어렵고 오랜 시간이 걸릴 것으로 예상되었던 행동 분야의 인공지능 구현은 추론 분야의 지능 발달과 함께 향후 인공지능 분야 연구에 큰 혁신을 만들어갈 것으로 전망됩니다.

머잖아 사람처럼 감정을 느끼고 행동하는 AI도 만날 수 있게 되지 않을까요?

지금까지 시각, 언어 인식 인공지능부터 추론하고 예측하는 인공지능까지 최근의 인공지능 연구 트렌드와 적용 사례에 대해 알아보았습니다. 다음 편에서는 인공지능 분야에서 진행되고 있는 새로운 시도들과 전망에 대해 알아보겠습니다.

LG Blog 운영진 프로필

LG 블로그는 LG의 혁신 기술, 디자인, 사회공헌활동(CSR) 등 LG의 주요 소식을 포함, LG 임직원들의 이야기, 채용 정보, 생활 속 정보 등 다양한 정보를 여러분께 빠르게 전달해드리겠습니다. 많은 이야기와 함께 여러분과 더 큰 공감대를 형성하고 싶습니다. :)