본 칼럼은 “커빙(cubbying)” 서비스를 운영 중인 (주)내일비의 임준원 대표가 연재하는 칼럼으로 콘텐츠와 콘텐츠 관리에 관한 이야기를 4주간에 걸쳐 기고할 것입니다.
콘텐츠의 범람으로 인한 빅데이터 문제
하루 동안에 페이스북에는 2억 5천 개의 사진이 업로드 되고 있고, 6억 개의 글들에 ‘좋아요’와 ‘댓글’이 생기고 있습니다. 이러한 인터넷 상의 활동은 개개인의 인생의 흔적이 데이터가 되고, 수치화 되어 우리에게 큰 의미로 다가오고 있습니다. 주요 SNS(사회 관계망 서비스)에서 쏟아내는 정보량만 해도, 트위터(tweeter)에서만 하루 평균에 7 테라바이트를 창출하고 있으며 페이스북(facebook)은 10 테라바이트의 정보를 쏟아내고 있습니다. 또한 유튜브(YouTube)의 하루 평균 동영상 재생건수는 40억 회에 이르고 있습니다.
이러한 SNS를 비롯한 인터넷 등을 활용한 전 세계의 디지털 정보량은 2011년 한해 기준으로 1.8ZB라고 합니다. 이 수치가 쉽게 감이 오지 않으실 겁니다. 1.8ZB라면 대한민국 모든 사람 (약4875만명, 2010년 기준)이 18만년 동안 쉬지 않고 1분마다 트위터에 3개의 글을 게시하는 양과 같고 2시간짜리 HD영화 2천억 개와 맞먹는 정보량입니다. 이러한 디지털 정보량은 계속해서 증가할 것으로 예상되고 있습니다. 벌써 2012년에는 2.7ZB의 정보량을 쏟아내고 있으며, 2015년에는 7.9ZB로 2년에 2배꼴로 디지털 정보량이 증가할 것으로 예상되고 있습니다. [1]
이러한 정보와 콘텐츠의 홍수 속에서 다음과 같은 경험을 하는 사람들이 종종 있을 겁니다. 제 친구의 경험과 말을 빌리자면 “키우고 있는 애완용 도마뱀이 알을 낳자 어떻게 해야 될지 인터넷 검색을 해보지만, 수많은 답변이 나를 더 헷갈리게만 한다. 차라리 잘 정리된 목차의 책 한 권이 나에게는 효율적이었다.“ 이러한 예시뿐만 우리는 수많은 사람들의 의견과 전문가와 비전문가의 콘텐츠가 혼재되고 범람하면서 정보의 선택이나 분석에 있어서 어려움을 겪곤 합니다. 즉, 우리는 일상생활에서도 “빅데이터 문제”를 겪게 되었습니다. 개인의 콘텐츠가 디지털화되고 쌓이게 되면서, 이제 “빅데이터 문제”는 기업들만이 아닌 나와 내 주변 사람들이 흔히 겪는 문제가 되었습니다.
이와 같은 빅데이터 문제 또는 콘텐츠의 범람의 문제를 해결하기 위하여 우리는 정보의 필터가 필요합니다. 그 필터라는 말을 시대에 따라 CMS(content management system)이라고도 불리고, 요즘에 와서는 디지털 큐레이션이라고도 불리고 있습니다. 이들이 과연 효과적으로 문제들을 해결하고 있는지, 그리고 커빙(Cubbying) 에서는 이 문제들을 어떠한 시각으로 다루고 어떻게 해결하려고 하는지에 대해서 본 칼럼에서 4주간 다루게 될 것입니다.
전 세계에서의 빅데이터 사업의 중요성 증대
전 세계의 디지털 정보량은 2년마다 약 2배씩 증가하고, 그 콘텐츠의 범위도 넓어지고 있으며, 빅데이터의 범주 또한 점점 커지고 있습니다.[2] 이러한 디지털 데이터들이 모여서 빅데이터 구성하며, 데이터량에 비해 버려지는 데이터가 대부분입니다. 또한 전체 찾아진 데이터의 약 23%만이 유용하게 쓰일 것으로 추정됩니다.[3] 현실의 상황을 간략히 정리하자면, 데이터의 사용량은 급격히 느는데 비해 그의 활용도는 현저히 낮다고 할 수 있습니다. 기업의 입장에서 이러한 엄청난 데이터를 데이터 마이닝을 통해 필요한 데이터를 선별하고 분석 및 가공하여 고객에게 맞춰진 정확한 정보를 제공한다면 고객의 필요를 알아낼 수 있으며, 효과적인 마케팅 기법 뿐 고객에게도 기업에게도 생산적인 경험을 제공할 수 있습니다. 2012년 이후, 기업의 경쟁력을 좌우하는데 있어서는 빅데이터 활용능력이 가장 중요한 이슈로 떠오르고 있습니다.
2011년 5월 맥킨지 자료에 따르면, 빅데이터를 활용하게 되면 미국 의료 분야에서 매년 3,300억 달러 가치의 생산 가능 효과가 있다고 분석하고 있습니다. 이 액수는 연간 스페인 전체 의료비 지출의 2배에 달하는 돈입니다. 또한 유럽 공공 분야에서 빅 데이터를 활용하면 2,500억 유로의 절감 효과를 볼 수 있는데 이 액수는 그리스 GDP와 비슷한 금액입니다.
이제 빅데이터는 세계적으로 IT산업의 핵심 키워드로 대두되고 있으며, 글로벌 조사·연구기관들은 빅데이터 시장 규모의 성장을 예상하고 있습니다. IDC(International Data Corporation)는 전 세계 빅데이터 시장이 2015년 169억 달러 규모로 성장 할 것이라고 전망하고 있으며, 일본 야노경제연구소(Yano Research Institute)는 2017년도 빅데이터 시장규모는 6,300억 엔, 2020년도에는 1조 엔을 넘을 것으로 예측하고 있습니다.
또한, 빅데이터의 도입 및 활용은 빅데이터 시장뿐만 아니라 전체 산업과 IT시장 지출에도 영향을 미칠 것으로 전망되고 있습니다. 영국 비즈니스 연구센터(Cebr) 는 빅데이터 도입으로 향후 5년(’12~’17년)간 영국 산업 전체에 2,160억 파운드(약 395조 원)의 경제적 효과 전망하고 있으며, 가트너(Gartner)는 빅데이터 이슈에 따라 형성된 전 세계 IT시장지출이 2016 년에는 545억 달러로 증가 예측하고 있습니다. 더불어 가트너는 2012년에 이어, 2013년의 10대 전략 기술로 빅데이터 선정하고 있습니다.
빅데이터의 활용
빅데이터를 활용하는 방법에는 방대한 데이터에서 유의미한 자료를 도출하여 활용하는 빅데이터의 분석과 방대하고 분산되어 있는 빅데이터를 효과적으로 이용할 수 있도록 수집, 편집 등에 도움을 주는 빅데이터의 관리가 있습니다.
(1) 빅데이터의 분석
빅터이터의 분석기술로는 Text Mining, Opinion Mining, Social Network Analytics, Cluster Analysis 등이 존재하고 있습니다. 빅데이터의 분석기술을 통한 빅데이터의 국·내외, 기업, 국가의 활용은 매우 활발하게 이루지고 있습니다. 국내에서는 이미 데이터와 관련한 거의 모든 IT 업체가 빅데이터 시장 진출을 선언했으며, 포털이나 통신업체도 빅 데이터 시장에 뛰어든 형국입니다. 모두들 엄청난 성장을 예상하고 있지만, 정작 국내 시장에 대해서는 얼마 정도 규모가 될 것이며, 어느 정도 성장할 것이라는 데이터는 누구도 갖고 있지 못하는 것이 현실입니다. 또한 현재까지 실제 성과를 낸 업체들은 사실상 몇 개 되지 않으며 얼마나 성장할 지 장담할 수 없는 것이 바로 국내 빅데이터 시장입니다. 그러나 그만큼 엄청난 성장잠재력이 내포되어 있으며, 경쟁력을 갖추기 위한 노력이 끊임없이 이루어지고 있습니다. 글로벌 솔루션에 대응하기 위해 가격 경쟁력을 보유한 국산 솔루션들이 2012년 10월 말에서 2013년 상반기 사이에 출시될 예정입니다. 또한 빅데이터 관련 기관 및 기업 간의 네트워크 구축을 위한 움직임 전개되고 있습니다. 그 대표적인 예가 ‘빅데이터 솔루션 포럼(BIGSF)입니다. 와이즈넛, 투비소프트, 야인소프트, 큐브리드, 클라우다인, 한국키스코, 비투엔컨설팅, 이노룰스 등 국내 SW 및 컨설팅 기업 8개사 협업으로 기술력을 바탕으로 중소기업 연합체를 형성하여 고유 솔루션 및 서비스를 제공하는 ‘빅데이터 솔루션 포럼(BIGSF)’에서 빅데이터 통합서비스 ‘싸이밸류(Cyvalue)’ 출시를 예정하고 있습니다. [5]
(2) 빅데이터의 관리
빅데이터의 관리방법에는 앞에서 언급했듯이 CMS와 큐레이션이 그 대표적인 예입니다.
CMS는 사용자의 콘텐츠를 관리하기 위한 툴을 말합니다. CMS는 일반적으로 새로운 소식을 알리는 글이나 관리자 매뉴얼, 기술 문서, 판매 지침, 상품 소개 페이지와 같은 컨텐츠의 보관과 버전 관리, 배포에 주로 사용됩니다. 현황으로는 클라우드 서비스 업체와 협업체제, 혹은 그들이 직접 운영하는 경우가 많습니다. 그 예로는 워드프레스 CMS 툴이 있습니다. 개인이 워드프레스를 운영하며 역할 관리, 작업 흐름 관리, CMS로서의 텍스트패턴 관리(콘텐츠 관리)를 할 수 습니다. 옵션 선택으로 간단히 설치 할 수 있으며, Plug-in 기능도 제공되고 있습니다.
SNS의 비약적인 성장에 힘입어 큐레이션 관련 SNS서비스도 성행하고 있습니다. 빅데이터 수집을 위한 큐레이션, 마케팅을 위한 큐레이션 서비스로 성행하고 있으며 특히, 핀터레스트 서비스는 내가 원하는 이미지 정보를 큐레이션하는 SNS서비스로 페이스북의 방문시간과 같은 시간을 기록하고 있습니다. 이러한 빅데이터 관리 방법에 대해서는 앞으로의 칼럼에서 더욱 자세하게 살펴보고자 합니다.
커빙(Cubbying)
콘텐츠 범람에 따른 현 시대 상황에, 사용자들이 효과적이고 편리하게 콘텐츠를 이용하기 위해 다양한 분석과 관리 툴이 존재한다는 것을 알게 되었을 것입니다. ㈜내일비의 메인 서비스인 커빙은 “콘텐츠 허브” 라는 키워드를 갖고 베타 서비스를 운영 중입니다. 콘텐츠를 손 쉽게 수집하고 관리하고 분석하고 배포할 수 있는 하나의 플랫폼을 지향하기에 “콘텐츠 허브”를 핵심 목표로 삼고 있습니다.
[커빙 서비스 구조]
분석과 관리를 위해서는 콘텐츠 수집이 중요하고, 기본적으로 제공되어야 하는 기능이기에, 커빙(Cubbying)에서는 원 클릭만으로 사용자가 웹 상에 업로드 한 모든 콘텐츠를 자동으로 수집할 수 있는 기능을 제공합니다. 현재는 “소셜 네트워크 서비스(SNS)” 상의 콘텐츠를 주로 다루고 있기에 “커빙(Cubbying)”의 수집 기능은 빅데이터 문제를 해결하기 위한 과정 중, social listening을 완벽히 해결한다고 할 수 있습니다.
<Social Contents/Data의 처리 과정>
‘Social Listening’ 분야는 전세계적으로 초기 단계에 위치한 서비스 영역이며 지금 시점에서 충분한 경쟁력을 확보하여 글로벌 서비스 리더로 성장이 가능합니다. 물론, 콘텐츠를 한 곳에 모을 수 있고 어디서든 접근한다는 개념에서 보면 “iCloud(애플)”, “Dropbox”, N드라이브(NHN)” 등 수 많은 클라우드 서비스가 그 역할을 수행하고는 있습니다. 그러나 이들은 사용자가 직접 자신의 콘텐츠를 하나하나 찾아서 올려야 하는 작업이 필수인데 비해, “커빙(Cubbying)”은 사용자가 처음 인증작업만 해주면 모든 콘텐츠를 자동으로 수집한다는 점에서 차별화되어 있습니다.
또한, 수집 된 콘텐츠의 관리 및 분석을 위해 본문에서 설명했던 기존 서비스/제품 등이 제공하는 핵심 기능을 커빙(Cubbying)에서는 웹/모바일에서 편리하게 한 곳에서 제공합니다. 커빙은 지금 이 순간에도 사용자들의 보다 쉬운 콘텐츠 관리 및 이용을 위해 지속적으로 서비스를 발전시키고 있습니다.
끝으로 다음 주에는 콘텐츠의 범람에 대한 해결책 중 하나인 CMS(Content Management System)에 대해서 상세히 알아보도록 하겠습니다, 과거, 현재와 미래의 CMS툴의 모습, 그리고 CMS 툴로서의 커빙의 모습에 대해서 적고자 합니다.
글 : 임준원(james@nalebe.com)
편집: 신율(shinkumsa@gmail.com)
About Cubbying : 커빙 / 페이스북 / 블로그 / 트위터
참고 자료
- [1] CAD&Graphics 2013년 02월호
- [2] 디지털유니버스보고서
- [3] 전자신문 분석 2012.5
- [4] 한국 정보화 진흥원 2012.9
- [5] ETnews, 2012.11.18