말 잘 듣는 스마트폰, Q보이스로 응답하라. – LG 공식 블로그
본문 바로가기

말 잘 듣는 스마트폰, Q보이스로 응답하라.

작성일2012-08-31

안녕하세요. 사랑해요 LG입니다.

범죄를 예측해 범죄자를 미리 검거하는 내용을 담은 SF영화 <마이너리티 리포트>는 세계적인 감독 스티븐 스필버그와 톰 크루즈의 작품으로 우리에게 깊은 인상을 심어주었는데요. 주인공 톰 크루즈의 말 한마디에 집에 불이 켜지고 벽에 영상이 플레이 되던 영화 속 장면 기억하시나요? 이 영화에 등장하는 기술이 바로 음성인식기술이랍니다. 기기가 사람의 말을 인식해 해당하는 명령을 수행하는 것이죠.

복잡한 조작 없이 말로 제품의 기능을 이용할 수 있는 편리함으로 IT 업계가 주목하는 혁신적인 음성인식기술들이 최근 스마트 폰에 탑재되었는데요. LG의 Q보이스와 타사의 S보이스, 시리가 그것이죠. 이제 영화가 아닌 현실에서 지능형 음성인식기술을 적용한 말 잘 듣는 스마트폰을 만나볼 수 있답니다. 응답하라, 2012! 그 당당한 주인공이 될 ‘LG Q보이스’의 놀라운 기능을 한 번 살펴볼까요?

Q보이스 기능을 탑재하고 있는 LG Optimus LTE2

차원이 다른 응답 정확도

자막: 위키피디아에서 소녀시대 찾아줘.
자막: 위키피디아에서 소녀시대에 대해 검색합니다.

“위키피디아에서 소녀시대를 찾아줘!”라는 질문에 LG의 Q보이스는 실제 위키피디아 화면을 보여줍니다. LG의 Q보이스가 사용자의 의도에 맞는 결과를 보여주는 응답 정확도에서 타사 지능형 음성인식보다 뛰어나다는 걸 알 수 있는데요. 음성 인식을 할 때 이해를 못 한 부분을 웹검색으로 넘기는 대신, 정확히 알아듣는 Q보이스는 사용자의 질문에서 ‘위키피디아’라는 필요한 쿼리를 추출해서 실행하는 것이랍니다. ‘편리’하려 사용하는 기능인데 ‘답답함’으로 돌아오면 안 되는 것이니까요.

연속적 대화도 이해하는 지능형 음성인식기술

자막: 지금 뉴욕은 몇시지?
자막: 지금 뉴욕의 현재 시간은 7월21일 오전 7시 34분입니다.
자막: 그럼 파리는?
자막: 프랑스 파리의 현재 시간은 7월21일 오후 12시 34분입니다.

LG의 Q보이스는 연속적 대화도 이해합니다. “지금 뉴욕은 몇 시지?” 하고 물은 후 “그럼 파리는?” 하고 물으면 ‘몇 시지?’라는 어미를 생략했음에도 이전 질문과 연속된 질문이라는 점을 인식하고 그에 맞는 답을 해줍니다.

기억이나 학습을 통한 테이터가 있습니다. 일단 그 데이터를 통해 자기 경험에서 찾아보는 것이죠. 사람의 언어라는 것이 수많은 다양성을 갖고 있기 때문에 데이터를 찾는 것은 한계가 있고요. 데이터 기반으로 '추론'하는 거죠. 확률적인 모델로 이 사람이 말한 것은 내 경험과 내 학습에 비교해 봤을 때 '아마 이것일 거야'라고 말입니다   최정규 책임연구원 : LG전자 CTO 미래 IT융합연구소

명령이 아닌 일상 언어로 말을 건네다

Q보이스는 “발산”, “지도” 등 단어형의 명령어로 질문하지 않아도 되는 장점 역시 가지고 있는데요.
“발산까지 가는 길 알려줘!”라고 일상적 언어로 말 건네면 지도에서 가는 길 찾아 길을 안내해주는 기능이죠. 뿐만 아니라 “맛집 찾아줘!”라고 하면 사용자가 질문한 위치 인근에 있는 맛집 정보를 알려줄 수도 있답니다. 이 같이 실생활에서의 ‘실제’ 편의를 극대화한 Q보이스의 음성인식기능은 사용자 의도를 파악하고 면밀히 분석한 고객 경험 자료를 바탕으로 완성도를 높인 것이라 하죠.

감성의 품격을 갖춘 대화기능

Q보이스 매력은 여기서 끝나지 않습니다. 말만 잘 듣는 게 아니라 감성의 품격을 갖춘 스마트폰이라면 더욱 반하지 않을 수 없을 텐데요. “사랑해!” 라고 하면 LG Q보이스가 재치 있고 위트 넘치는 답변을 해준답니다.
마치 친구와 대화를 나누는 것 같은 재미를 느낄 수 있죠. 상냥하면서도 재치 있는 Q보이스의 이러한 감성적 답변들은 사용자가 필요로 하는 모든 것, 즉 명령을 잘 수행하는 것 외에 때로 감정적 위안까지도 줄 수 있었으면 하는 바람에서 만들어졌다고 합니다.

LG의 자체 솔루션인 '베르니케'


자막: 최미영에게 전화.
자막: 최미영에게 연결하겠습니다.
자막: 최미영에게 문자.
자막: 메시지 내용을 말씀하세요.
자막: 내일 만나.
자막: 최미영에게 메시지를 전송 할까요?
자막: 보내.

LG Q보이스는 인식률이 높고 답변 정확도가 높은데다 재치까지 겸비한 덕에 폭발적인 반응을 얻고 있는데요. 답변 만족도가 높아 답변 전담 아르바이트가 있는 것 아니냐는 ‘100만 아르바이트설’까지 등장하고 있답니다. LG전자 Q보이스의 인식률이 높은 것은 LG의 자체 솔루션인 ‘베르니케’를 이용하기 때문입니다. 이는 문장을 조각조각 잘 나눠서 위치와 분류를 통해 전체 맥락을 이해하는 것인데요, 단순히 단어나 어절에 대한 커멘트 인식이 아니라 전체 문장을 인식하는 중요한 기술이라 할 수 있습니다.

초창기 단순 단어인식에서 2000년에 들어서면서 음성합성, 음향기술 등 기반 기술을 거쳐 온 LG의 25년 동안의 언어 처리 연구가 Q보이스 개발의 밑거름이 되었다고 할 수 있는데요. 일상 언어로 말을 걸고 연속 대화를 자연스럽게 할 수 있는 Q보이스가 탄생하기까지. LG인들의 숨은 노력과 아름다운 열정이 있었기에 가능한 일이었겠죠?

LG는 Q보이스와 같은 지능형 음성인식기술을 향후 TV, 로봇 청소기등 다양한 전자제품에 적용할 예정입니다. 터치로 스마트폰 기능을 찾을 필요도, TV를 켜고자 리모컨을 찾을 필요도 없는 것이죠. 그 새로운 세상의 모습은 또 어떨지 기대가 됩니다.

말 한마디로 모든 것이 내 뜻대로 되는 세상, LG의 Q보이스가 시작합니다.LG

LG Blog 운영진 프로필

LG 블로그는 LG의 혁신 기술, 디자인, 사회공헌활동(CSR) 등 LG의 주요 소식을 포함, LG 임직원들의 이야기, 채용 정보, 생활 속 정보 등 다양한 정보를 여러분께 빠르게 전달해드리겠습니다. 많은 이야기와 함께 여러분과 더 큰 공감대를 형성하고 싶습니다. :)