SW융합 | 소프트웨어 중심사회

내 손안의 알파고, 시리 VS 빅스비 승자는 누구?

SW중심사회 2017-06-16 590명 읽음

스마트폰 기업들의 음성인식 비서 프로그램의 경쟁이 매우 치열합니다. 

시리(Siri)라는 서비스로 일찌감치 앞서간 애플의 뒤를 이어 구글은 최근 구글 어시스턴트(Google Assistant)를, MS는 코타나(Cortana) 출시하고 뒤를 쫓고 있습니다. 스마트폰 시장에서 1,2위를 다투고 있는 삼성전자도 갤럭시 S8을 출시하면서 빅스비(Bixby)라는 독자적인 음성인식 서비스를 시장에 내놓았습니다. 삼성전자는 빅스비(Bixby)를 스마트폰을 넘어 다양한 전자제품에 탑재해 애플의 시리(Siri) 를 비롯한 다른 음성비서 서비스와 경쟁하겠다고 밝혔습니다.

 

이중에서 가장 최신 스마트폰에 탑재되고 있는 시리(Siri)와  빅스비(Bixby) 두개의 음성인식 비서 프로그램을 통해 음성인식 비서 서비스의 현재 수준은 어느정도이고 향후 음성비서 서비스가 어떻게 발전하게 될 지 살펴보려고 합니다.

 

 

일단 두 프로그램의 기본적인 개요부터 살펴보겠습니다.

2011년 첫 출시되어 끊임없는 기능개선을 해오며 명실상부한 대표적인 음성인식 비서 프로그램의 선구자인 시리(Siri)는 이미 20개의 언어를 인식할 수 있고, 다양한 애플의 기본 프로그램을 구동하거나 실행할 수 있는 기능을 보유하고 있습니다. 

 

삼성의 빅스비(Bixby)는 2017년 3월에 처음 선을 보인 신참내기 인공지능 음성인식 비서 프로그램입니다. 

그럼에도 시리(Siri)와 맞설 유일한 프로그램으로 주목받고 있는 것은 바로 시리(Siri)의 제작사의 멤버들이 새롭게 창립한 비브랩스라는 회사에서 만들어낸 프로그램이라는 점 때문입니다.  때문에 시리(Siri)의 부족했던 부분을 가장 잘 해결해줄 것으로 많은 전문가들이 기대를 하고 있습니다.

 

 

시리와 빅스비, 두 인공지능 프로그램의 특징과 차이는?

 

1) 음성인식 비서에 최적화된 시리(Siri)

 

애플과 함께 ‘시리(Siri)’를 만든 뉘앙스 커뮤니케이션즈는 음성인식 전문 글로벌 기업으로, 음성 관련 솔루션을 다양하게 보유하고 있습니다. 음성을 텍스트로 변환하거나 텍스트를 음성으로 바꾸는 원천 기술을 보유하고 있으며, 현재 전세계의 음성인식 시장에서 약 70%의 점유율을 보이고 있습니다. 음성인식을 비롯해 목소리로 화자를 확인하는 기술 분야에서 독보적인 글로벌 1위 자리를 지키고 있습니다.

 

(2011년 애플의 컨퍼런스에서 최초로 발표된 시리(Siri) 발표당시 프리젠테이션)

 

시리(Siri)는 음성 명령이 내려지면 그 명령을 해석하여 검색이나 앱을 실행시키는 등의 액션을 실행합니다. 검색결과의 향상을 도와주는 것은 자연어 처리입니다. 음성을 인식해 입력된 자연어를 해석한 후 관련된 검색 또는 앱 실행을 결합해 원하는 결과물을 제공합니다. 

 

시리(Siri)를 통해서 날씨, 주식, 주요스포츠 경기 등의 검색결과를 안내하고, 전화번호를 검색해 전화를 걸고 문자메시지를 보낼 수도 있습니다. 페이스북이나 트위터에 말로 포스팅을 발행하거나 이메일을 작성해서 전송할 수도 있습니다. 다시 말하면 ’시리(Siri)’는 음성 명령을 기반으로 그 명령을 실행하는 개인비서 역할을 아이폰이나 macOS 같은 스마트 디바이스에서 충실히 구현한 서비스입니다.

 

자연어 처리 (NLP, Natural Language Processing) : 평소에 글로 쓰거나 대화를 할때 사용하는 자연어를 기계적으로 분석해 컴퓨터가 이해할 수 있는 형태로 만들거나 또는 컴퓨터의 처리 결과를 인간이 이해할 수 있는 언어로 만드는 기술.

 

2) 개방성을 무기로 시리 다음을 넘보는 빅스비(Bixby)

 

빅스비(Bixby)를 제대로 이해하려면 삼성의 인수로 한배를 타게 된 제작사 비브랩스(VIV Labs)의 기술에 대해 이해할 필요가 있습니다.  비브랩스(VIV Labs)의 비브(VIV)는 시리(Siri)를 만든 개발자들이 애플을 떠나 새롭게 선보인 인공지능 음성비서 프로그램입니다. 비브(VIV)를 이끄는 대그 키틀로스는 테크크런치 디스럽트(TechCrunch Disrupt)에서  비브(VIV)를 선보이며 대화를 통해 무생물과 전자기기에 생명력을 부여하려 한다고 이야기했습니다.  비브(VIV)는 생명력을 뜻하는 의미를 가지고 있습니다. 

 

전문가들은  비브(VIV)가 시리(Siri)를 넘어설 수 있는 인공지능과 음성인식을 갖췄다고 평가하며 향후 기술적 발전에 주목하고 있습니다. 그 이유는 애플의 플랫폼에 철저하게 귀속되는 시리(Siri)와는 달리 외부서비스 제공자들이 자유롭게 참여해 각자의 서비스를 자연어 기반의 인공지능 인터페이스에 연결할 수 있는 개방성 때문입니다. 서비스가 확장될수록 애플의 매우 한정된 앱과 연동이 되던 시리와 큰 차이를 보일 것이라고 전망됩니다.

 

(시리를 넘어, VIV의 기술을 설명하는 대그 키틀로스)

 

머신러닝 (Machine Learning) : 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술. (=기계학습)
컴퓨터를 인간처럼 학습시켜 스스로 규칙을 형성할 수 있지 않을까 하는 시도에서 비롯되어 주로 통계적인 접근 방법을 사용하는데, 독감을 예로 들면, "독감이 걸린 사람은 대부분 열이 많이 나고 오한이 있고 구토 증상이 있었다"라는 통계에 기반하여 독감을 진단하는 것이다. 예시를 보면 알 수 있듯이 이는 인간이 하는 추론 방식과 유사하다. 머신러닝은 인공지능, 검색엔진, 광고, 마케팅, 로봇 등 활용범위를 계속 넓혀가고 있다.

 

비브랩스(VIV Labs)는 비브(VIV)의 핵심기술을 개방형 서비스 생태계 조성에 필요한 자연어 인식(Natural Language Understanding)과 머신 러닝(Machine Learning) 기능이라고 설명하며 향후 삼성전자의 모든 기기와 서비스를 통합하는 플랫폼이 될 것이라고 발표했습니다. 

대그 키틀로스(Dag Kittlaus)는 "소비자들이 어떤 장소에서 어떤 기기를 사용하든 쉽고 빠르게 원하는 바를 얻게 하는 것이 우리가 추구하는 미래"라며, "삼성전자의 다양한 기기들의 어플리케이션과 서비스에 단일화된 대화형 인터페이스를 전달할 기회를 제공할 수 있을 것"이라고 밝혔습니다.

 

비브(VIV)는 개방성의 의미를 아래와 같이 설명하기도 합니다. “영화를 보고 싶으면 어떤 영화 표를 예매해주고, 피자를 먹고 싶을 때는 피자를 주문하는 등 기기에서 제공하지 않는 서비스라도 외부에 있는 여러 업체들이 자신들의 서비스를 인공지능 비서를 통해 제공할 수 있다는 것이 개방성이다.”

 

피자나 커피를 주문하려면 별도의 써드파티 애플리케이션을 사용했던 현재의 스마트폰이 인공지능 비서를 통해 애플리케이션 없이도 바로 원하는 기능을 수행할 수 있게 됩니다. 이렇게 되면 현재 많은 인공지능 플랫폼을 통해 제공되는 단편적인 서비스와 비교할 수 없을 정도로 많은 서비스로 늘어날 것으로 예상됩니다.  삼성전자는 이를 인터페이스 혁명이라고 부르며 향후 사용자가 자연어로 지시하는 명령을 자연스럽게 수행할 수 있는 대화형 인터페이스로 변화될 것이라고 예측했습니다.

 

삼성전자의 이인종 부사장은 “많은 사람들이 AI라고 하면 최근 많은 관심을 얻은 알파고를 생각하지만 바둑을 잘 두는 기계가 우리 일상 생활에 어떤 여향 미칠까 생각하면 막막하다”면서 “삼성이 생각하는 AI는 '인텔리전스' 보다는 '인터페이스'에 있으며 인공지능을 활용한 새로운 인터페이스의 혁명이 가능할 것”이라고 말했습니다.

 

빅스비 VS 시리, 두 응용프로그램의 특징

 

 

이전의 음성 인식은 정해진 단어(키워드)를 인식하여 동작했습니다. 예를 들어 날씨정보를 알려줄때는 '날짜, 지역, 날씨' 세개의 키워드를 입력받아 처리해서 결과를 알려주는 방식입니다. 

시리(Siri)나 빅스비(Bixby)는 자연어 처리를 통해 키워드가 아니라 문맥을 파악합니다. 내용의 핵심 키워드가 없어도 문맥을 파악하여 그 주제를 이해하게 되는 것입니다. 아직 기능은 완성도가 높지않아 문맥 인식 기능은 상황에 따라서 될 때도 있고 잘 안 될 때도 있지만 계속 발전할 것으로 보입니다.

 

시리(Siri)는 초기단계에서는 인식율이 높지 않아 많은 실망을 안겨줬지만, 기반이 되는 IOS의 업데이트와 새로운 단말기인 애플워치 등과 결합되면서 점차 높은 인식율과 다양한 기능을 제공하는 형태로 발전하고 있습니다. 대형 브랜드와의 제휴를 통해 정보제공과 관련한 지능을 높이고 있습니다.

특히 시리(Siri)의 검색은 울프럼알파 라고 불리우는 기술을 이용합니다. 울프럼 리서치에서 만든 이 검색엔진은 ‘세계의 모든 체계화된 지식을 즉시 계산하고 접근할 수 있도록 한다”라는 목표로 개발되는 프로그램입니다. 기본적인 계산과 검색뿐만 아니라 다양한 잡다한 지식까지 전부 계산해서 보여줍니다. 온라인 백과사전과 연산엔진을 통합한 셈이라고 하면 이해하면 됩니다.

 

빅스비(Bixby)는 터치, 음성, 카메라 촬영 등 여러 입력 수단을 혼합해 이용할 수 있다는 것이 장점입니다. 보이스(Voice), 비전(Vision), 리마인더(Reminder), 홈(Home) 이라고 불리는 기능들을 이용해 “빅스비, 어제 찍은 사진 보여줘”라고 말하면 곧바로 사진들을 나열해 보여주며, 여기서 원하는 사진들만 손가락으로 고른 뒤 다시 “빅스비, 뉴욕 폴더 만들어서 넣어줘”라고 명령하면 ‘뉴욕’ 폴더를 생성해 선택한 사진만 모아줍니다.

 

비전(Vision)이라는 사물을 인식하는 기능도 있습니다. 콜라병을 촬영해 사진 속에서 ‘COLA’라는 글자만 추출해 주고 이미지를 누르면 방금 찍은 콜라와 비슷한 사진을 인터넷에서 찾아 보여줍니다. 방금 찍은 콜라를 살 수 있는 쇼핑몰로 연결해 주는 것도 가능합니다.

 

홈(Home)은 사용자가 딱히 노력하지 않아도 원하는 정보와 콘텐츠를 쉽게 활용하도록 해주는 게 특징입니다. 자주 사용하는 연락처나 최근에 들었던 음악 등 다양한 정보를 보여줍니다. 유튜브에서 인기 영상을 추천해주거나 페이스북 등과의 협업을 통해 ‘지금 이 시각’ 가장 화제인 트렌드 키워드나 뉴스를 제공합니다.

특정 상황에서 필요한 앱을 알아서 제시합니다. 예를 들어 친구와 약속이 있는 날에는 시간·장소 등을 확인해 관련 앱을 활용, 약속 장소 근처에 분포한 맛집 정보를 제공할 수 있습니다.

 

하지만 빅스비는 서비스를 시작한지 아직 1년도 안되는 프로그램입니다. 이용 데이터가 쌓일수록 더 정교해지는 딥러닝 기술을 바탕으로 개발되었기 때문에, 만족할만한 서비스를 보여주기 위해서는 어느 정도 시간이 필요할 것으로 보입니다. 

 

 

2017년 스마트폰의 승패는 인공지능 기술에서 갈릴 것

 

성장 정체에 직면한 스마트폰의 향후 핵심적인 판매전략은 인공지능 서비스가 될 것으로 보입니다. 인공지능 능력은 얼마나 방대한 데이터를 확보하느냐에 달린 만큼 스마트폰 기반 플랫폼 시장의 치열한 경쟁도 예상됩니다.

 

애플은 지난 2011년 아이폰4s에서 처음 시작된 시리를 아이폰 출시 10주년을 맞아 대대적인 업그레이드를 추진하고 있습니다. 머신러닝 분야의 권위자인 '카네기멜론대 루스 살라쿠디노프' 교수를 자사 인공지능 연구팀장으로 영입하고 인공지능 소프트웨어 벤처기업 튜리(Turi)를 인수하는 등 인공지능 기술 확보에 공을 들이고 있습니다. 구글은 구글 I/O에서 인공지능을 활용한 음성 비서 서비스 '구글 어시스턴트'를 발표했고, 구글 어시스던트 기반의 스마트폰 ‘픽셀'을 출시하며 스마트폰의 인공지능 서비스 경쟁에 불을 붙였습니다.

 

삼성전자는 빅스비를 통해 현재 시중에 나온 인공지능 관련 서비스에서 한 단계 발전한 서비스를 제공할 포부로 사업을 추진하고 있습니다. 특히 다양한 가전을 다루고 있는 삼성전자만의 특징을 활용해 스마트TV를 포함한 스마트 가전제품 분야의 활용을 도울 수 있는 형태로 발전해 나갈 것으로 예상됩니다.

 

음성인식 비서 서비스는 간단한  '음성 명령’과 ‘검색결과 노출 및 어플리케이션의 실행' 이라는 기본적인  기능을 넘어서고 있습니다. 인공지능기술이 확대되면 조작 방법에서 음성의 빈도가 훨씬 늘어나게 될 것입니다. 지금까지는 처리 성능이 떨어져 사람이 그에 맞는 조작 체계를 익힌 것 뿐입니다. 키보드, 마우스를 활용하거나 디스플레이를 터치해서 입력방식은 스마트폰이 인간의 말을 이해하게 되면 '대화'라는 자연스러운 행동으로 바뀌게 될 것입니다. 

 

스마트폰에서부터 시작한 음성인식 비서 서비스는 아마존의 ‘에코’나 애플의 AI스피커 ‘홈팟’처럼 모든 가전 및 IT분야 기기들로 확산될 것입니다. 나아가 자동차산업 등 전 분야에서 글로벌 기업들이 인공지능 음성인식을 통한 기능제어 및 치열한 경쟁을 벌이게 될 것입니다.  우리는 그 시작점이 되는 음성인식 비서 서비스의 발전을 생생하게 지켜보고 있습니다.

머지않아 음성인식을 통해 모든 일과 생활을 처리하게 되는 시대가 오게되면 그 초기기술의 시작점이며 첫 걸음을 뗀 스마트폰의 음성인식 비서 서비스의 시작과 발전을 흐뭇하게 추억하게 될 지도 모르겠습니다.

 

 

 

 

관련 콘텐츠

홈페이지 만족도

콘텐츠 내용에 만족하십니까? 현재 페이지의 만족도를 평가해 주십시요. 의견을 수렴하여 빠른 시일 내에 반영하겠습니다.

등록