전문가 칼럼 | 소프트웨어 중심사회

소프트웨어 캐스트 이동 전문가 칼럼

빅데이터 성공을 이끄는 스몰데이터의 저력 

SW중심사회 2017-04-20 3757명 읽음

 


“수많은 양의 데이터를 면밀히 분석해 통찰력 있는 스토리를 도출할 수 있으신가요? 그렇다면 에어비앤비가 가보지 못한 곳을 향해 전진할 수 있게 합류하십시오.” 공유경제 서비스로 가장 큰 성공을 일궈낸 에어비앤비가 빅데이터 전문가를 모시는 글이다. 실제로 에어비앤비의 채용 사이트에 가보면 회사가 어떤 식으로 빅데이터를 활용하고 있는지 자세한 설명이 나와 있다. 얼핏 보면 방을 빌려주고 게스트를 연결하는 간단한 서비스처럼 보이지만, 그동안 축적한 데이터 기반으로 지역별, 리뷰 평점이나 댓글 수 등을 종합적으로 분석해 숙박 수요 예측 툴을 제공해 적정한 숙박 가격을 가이드하고, 호스트의 선호도에 대해 분석해 서비스의 신뢰도를 높이고 있다. 

 

2007년 10월, 명문 디자인스쿨을 졸업한 라이언 체스키(Brian Joseph Chesky)와 존 게비아(Joe Gebbia)는 생활고에 시달렸다. 특히 스타트업의 꿈을 품고 둥지를 튼 샌프란시스코의 월세는 감당하기 힘들 정도로 비쌌다고 한다. 이에 이들은 자신들이 거주하는 집의 여유 공간을 여행객들에게 유료로 제공하자는 아이디어를 냈다. 근처에서 열리는 디자인 컨퍼런스 참가자에게 방을 빌려주고, 식사와 비즈니스 인맥까지도 제공하며 숙박료를 벌어들인 것이었다. 이들은 직접 경험한 사례를 바탕으로 사업을 구체화했고, 이듬해인 2008년 8월부터 본격적으로 서비스를 제공하기 시작했다. 

 

에어비앤비는 사업 초창기 여러 시행착오를 겪은 것으로 알려져 있다. 집주인들에게 낯선 이를 집안에 들이는 불안감을 해소하고자 최대 10억 원을 배상하는 배상금 제도를 마련했고, 집주인과 여행객 양측으로부터 수수료를 받는 서비스 체계도 안정화하기 위해 고군분투했다. 숙박 예약률을 높이기 위해 페이스북 등의 온라인 채널에 광고도 냈지만, 생각보다 성과가 저조한 일도 있었다. 특히 뉴욕 지역은 눈에 띄게 예약률이 낮았다. 이에 에어비앤비는 현지의 집주인들을 찾아 인터뷰를 진행했고, 다른 지역보다 사진 품질이 떨어진다는 공통점을 확인한 후 숙박 장소를 멋지게 촬영해줄 전문 사진작가를 고용해 문제를 해결했다. 

 

 

에어비앤비가 당면한 과제를 풀어나가며 성공을 이끈 이면에는 소수의 데이터를 바탕으로 가설을 설정하고, 실험을 통해 의사결정을 짓는 일련의 과정들이 있었다. 일례로 전문 사진작가를 고용한 문제를 자세히 살펴보자. 에어비앤비는 현지 집주인과의 인터뷰 결과 예약에 영향을 미치는 특징으로 숙박시설의 사진 품질을 뽑아냈다. 사진 품질과 예약율의 상관관계와 연관성을 검증하는 회귀분석 기법으로, 에어비앤비는 그다지 멋스럽지 않은 사진을 올린 등록 숙박시설의 사진을 고품질의 촬영 사진으로 교체하면서 실효성 여부를 따져봤다. 그리고 그 결과 기대 이상으로 예약률이 높아지자 전문 사진작가 촬영지원 서비스를 본격적으로 제공하기 시작한 것이다.

 

새로운 기능을 추가하고 디자인을 바꿀 때도 데이터 분석은 계속됐다. 재미있는 사실은 많은 기업이 선호하는 빅데이터 데이터 분석이 아니라, 소규모의 데이터를 잘 활용해 의사결정에 도움이 될 결과를 도출한 점이다. 이를테면 숙박비의 가격 범위를 넓혔을 때와 그렇지 않았을 때, 즉시 예약 기능을 넣었을 때와 그렇지 않을 때, 뉴스레터 디자인을 바꿨을 때와 그렇지 않을 때 등 의사결정을 위한 가설을 설정한 후 소규모 데이터의 A/B 테스트와 파일럿 실험을 진행해왔다. 그리고 충분한 시간 동안 디자인 개선이 회원 활동에 영향을 주지 않는다, 뉴스레터 개인화 기능이 필요하다는 등을 확인해 서비스에 적용했다. 소수의 데이터에서도 의미 있는 스토리를 만들어 실험하고, 그 결과를 서비스 개선에 반영한 일련의 과정은 지금의 에어비앤비를 만든 원동력인 셈이다. 

 

에어비앤비의 사례에서 우리는 한 가지 결과를 얻을 수 있다. 빅데이터 분석으로 효과를 거둔 기업들은 작은 데이터를 이용한 분석 결과에서 효과를 입증한 후 점점 더 데이터를 확대해 독보적인 분석 체계를 갖추었다는 점이다. 이는 스몰데이터의 중요성을 말할 때마다 항상 거론되는 레고(LEGO)의 사례에서도 찾아볼 수 있다. 2000년대 초 파산 위기에 놓였던 레고는 수차례 빅데이터를 분석한 결과, 디지털 세대는 이전 세대와는 달리 인내심이 부족하므로 더는 레고와 같이 복잡한 블록에 흥미를 느끼지 않는다는 결론을 얻었다. 이들의 관심을 얻기 위해선 블록 크기를 키우고 제품을 단순화해야 한다는 것이었다. 

 

 

하지만 빅데이터 결과로 만든 제품들은 성적이 저조했고, 이 상황에서 판매 담당자들이 레고 마니아로 통하는 청소년을 만나 새로운 결과를 마주하게 되었다. 청소년들의 세상에서는 본인이 선택한 것을 발전시켜 성취해낸 증거가 되는 물건에 애착을 갖는다는 것이었다. 이후 레고는 빅데이터 결과와는 전혀 다르게, 성취감을 높이고 애착을 증폭시키고자 블록의 크기를 줄이고 조립 설명서도 상세하게 만들어 파산 위기를 넘기게 되었다. 빅데이터로는 발견할 수 없는 스몰데이터가 한 기업을 위기에서 탈출시킨 것이다.  

 

최근 들어 빅데이터와 함께 스몰데이터의 가치가 높이 평가되기 시작했다. 스몰데이터가 데이터 분석 시장을 지배할 것이라는 주장도 심심치 않게 나오고 있다. 그렇다고 빅데이터가 필요 없다는 얘기는 아니다. 아마존의 구매 추천 서비스처럼 빅데이터는 개개인의 특성에 맞는 맞춤형 서비스를 가능케 했고, 텍스트, 오디오, 비디오 등 구조화되지 않은 비정형 데이터들로부터 전체적인 구조나 패턴을 도출하는 데 도움을 주고 있다. 즉, 상관관계를 유추해 미래를 예측해야 할 때는 빅데이터가 효과적이다.  

 

하지만 일대일 고객 맞춤형 서비스를 도입하려 한다면 얘기는 달라진다. 고객의 행태와 마케팅 결과에 대한 원인과 이유에 대해 분석하기 위해 스몰데이터를 활용해야 한다. 소규모이지만 의미가 있는 스몰데이터의 분석 결과는 빅데이터의 추세와 패턴에 명확한 이유를 불어넣어 실용적인 결과를 낳기 때문이다. 또한, 개인의 취향이나 필요, 건강 상태, 생활양식 등 사소한 행동에서 나오는 스몰데이터는 쉽고 간단해 빠르게 분석할 수 있고, 관리가 쉽고 효율적이라는 장점까지 있다.  

 

실제로 빅데이터와 스몰데이터는 접근 방식부터 다르다. 일례로 빅데이터는 2054년 미래 사회를 배경으로 한 스티븐 스필버그 감독의 <마이너리티 리포트>에서 소개돼 화제가 되었던 범죄 예측 시스템을 현실화시켰다. 많은 양의 범죄 관련 데이터에서 범죄에 영향을 미칠 수 있는 요인을 분석하고 과거의 범죄 패턴을 분석해 다음 범죄가 언제 어디서 일어날지를 경고하는 방식으로 예측 정보를 제공한다. 

 

반면, 스몰데이터는 범죄자를 추리하는 데 효과적이다. 최근 인기리에 방영 중인 생활밀착형 추리 퀸에 대한 드라마를 봐도 이해할 수 있는 일. 드라마의 주인공인 설옥은 살인 현장을 살펴보고 관계자를 심문하면서 범죄자의 직업과 성격, 취향 등을 유추하며 사건의 원인을 하나씩 풀어나간다. 이처럼 개개인의 관찰을 통해 정확한 결과를 도출해내는 과정은 스몰데이터 분석이라 말할 수 있다. 

 

 

정리하면 빅데이터는 전수 소비자들을 대상으로 기록할 수 있는 모든 행동 데이터들을 실시간으로 축적한 방대한 양의 데이터를 분석하는 기술이다. 본격적인 사물인터넷 시대에 돌입하면서 다양한 형식의 대용량 데이터가 빠른 속도로 생성되고 사용되고 있는 만큼, 3V(Variety, Volume, Velocity) 특성의 빅데이터가 중요성이 주목받고 있다. 이에 반해 스몰데이터는 일종의 샘플링 기반으로 정량적, 정성적 조사를 통해 추출한 데이터로, 빅데이터가 놓칠 수 있는 개개인의 맞춤형 정보들을 끄집어낸다. 그리고 이 둘은 최근 갑자기 생긴 새 기술이라기보다 오래전부터 사용되어 온 데이터 분석 기술로, 시대의 흐름에 따라 어느 하나가 더 강조되어 온 것이었다. 

 

하지만 빅데이터와 스몰데이터의 결합만큼 이상적인 것도 없다. 일례로 세계적인 스포츠 의류 브랜드 언더아머(Under Amour)는 빅데이터 및 스몰데이터 분석을 통해 소비자 타깃을 재조정하고 사업을 추진하는 것으로 잘 알려져 있다. 이곳은 자사 고객층과 흡사한 피트니스 트래커 구매자들의 빅데이터를 분석해 연령대별 세그먼트 특징을 도출한 후, 각 세그먼트별로 심층 인터뷰를 진행해 제품을 왜 구매했고, 제품 구매 시 어떤 부분에 가장 많이 신경을 쓰는 지 등을 조사한다. 스몰데이터 분석을 통해 이른바 감정적 구매동기를 확인하는 과정으로, 빅데이터와 스몰데이터 결과에 따라 연령대별로 차별화된 스포츠 의류 전략을 세워 사업을 추진하고 있다. 

 

KT금융도 최근 데이터 분석 인력을 200여 명 더 늘린다는 발표와 함께 내부 고객에 대한 스몰데이터 분석을 강조하겠다고 했다. 빅데이터 분석에서 30대 여성들이 금요일 저녁마다 외식을 즐긴다는 결과가 나와도 모든 30대 여성들에게 해당하는 내용은 아니기 때문이란 해석이다. 혼밥을 즐기는 여성도 있거니와 기혼자도 있을 테니 분석 대상을 좀 더 작은 세그먼트로 나눠 스몰데이터 분석 결과에 따른 맞춤형 혜택을 제공하겠다는 의도이다. 즉, 데이터 분석에서 중요한 것은 ‘양’보다 ‘질’이라는 데 초점이 맞춰지고 있다. 미국 기업들이 부정확한 불량 데이터로 연간 6,000억 달러 이상 손해 보고 있다는 조사를 봐도 의미 있는 데이터 분석이야 기업 경쟁력이라 해도 과언이 아니다. 

 

이런 이유로 전문가들은 빅데이터 분석에 앞서 스몰데이터 분석의 자질부터 갖추길 주문한다. 빅데이터를 활용해 앞으로 나아갈 방향을 결정하고, 스몰데이터 분석으로 유의미한 분석결과를 확보해 나가라는 조언이다. 그러기 위해 큰 비용과 많은 시간을 들여 빅데이터 시스템을 도입하기에 앞서 내부에 확보해 둔 데이터가 유의미한 결과를 도출할 것인지 확인하고, 회사에 왜 데이터 분석이 필요하며 소비자로부터 어떤 정보를 얻을 것인지를 고민해야 한다고 말한다. 그래야만 한 때 유행처럼 번졌던 특정 대상의 핀포인트 마케팅(Pinpoint Marketing)도 가능해지고, 모두가 선호하는 개인 맞춤형의 서비스가 실현될 수 있다. 데이터 분석이 필요한 이유와 방법론을 다시금 재점검해야 할 때다.  

 

 

※전문가 칼럼의 내용은 SW중심사회의 편집 방향과 다를 수 있음을 밝힙니다.

홈페이지 만족도

콘텐츠 내용에 만족하십니까? 현재 페이지의 만족도를 평가해 주십시요. 의견을 수렴하여 빠른 시일 내에 반영하겠습니다.

등록