2009년 10월 22일 목요일

데이터를 보다 효과적으로 전달하기 (Mashup and Visualization 팁)

Business school에 있으면서 마케팅 수업을 많이 들었었다. 그 중 가장 흥미로웠고 많은 배움을 얻은 것은 Hanssen 교수가 강의한 Marketing Strategy라는 강의였는데, 수업을 통해 얻은 가장 큰 교훈은, 정량적인 (Quantitative) 접근 방법이 실제로 많은 회사들에서 사용된다는 것과, 그런 방법이 실제로 매출과 순익 증대에 도움이 된다는 것이다. 이 수업에서 팀을 짜서 한 학기동안 MarkStrat이라는 시뮬레이션 게임을 했었다. 우리 팀에 숫자에 강한 친구들이 많아서 꽤 좋은 성적을 올릴 수 있었는데, 이 게임의 핵심은 얼마나 데이터를 잘 활용하느냐이다. 경쟁사의 움직임, distribution channel, 각 segment 의 선호도, segment의 성장률 등 모든 것이 숫자로 담겨 있고, 우리의 임무는 그걸 활용해서 제품, 광고, 판매 전략을 세우는 것이었다. 매출이 높다고 우승하는 것이 아니라 ROI 성장이 가장 높은 팀이 우승한다. 몇달 전 Marissa Meyer의 podcast를 들었는데, 구글이 얼마나 data에 obsessive한지에 대해서 얘기해서 인상깊었던 적이 있다. 실제로 내가 만난 구글의 한 직원은, 구글은 모든 것을 다 데이터로 증명해야 해서 가끔 힘들 때가 있다고 한다. Data-driven company, 그래서 구글은 다른 회사보다 더 강한 지도 모르겠다.

wiredrive.com.jpg
Anderson에는 AMR (Applied Management Research)이라는 프로그램이 있다. 2학년 때 두 학기에 걸쳐서 실제 회사에서 market research & strategy formulation 프로젝트를 하는 거다. 회사에서는 $12,500을 지불하고, MBA 학생들로 구성된 5명의 팀은 2학기라는 시간을 commit한다. 우리는 Wiredrive라는 회사의 프로젝트를 했었다. 여기서 내가 맡았던 일은 7년간의 회사의 고객 데이터, 세일 데이터, 그리고 invoice data 등을 가지고 고객 insight를 뽑아내는 것이었다. 그 때 태어나서 Excel을 가장 많이 써본 것 같다. 원하는 방법으로 데이터를 가공하기 위해 Visual Basic programming도 배워서 쓰며 참 뿌듯했던 기억이 난다. 거기에 Conjoint Analysis를 붙여서 전달했는데, 결과는 대성공이었고, 우리 고객은 그게 바로 자기들이 원했던 것이라며 기뻐했다.

Sun에 입사해서 어떻게 팀에, 그리고 조직에 기여할까 고민하다가 정량적인 시장 데이터가 있으면 좋겠다는 생각에 Survey 를 해보기로 했다. Anderson에 있을 때는 Qualtrics라는 툴을 사용했었는데, 알아보니 연간 사용료가 1만불이나 되서 다른 survey tool을 모두 사용해보고 나서 SurveyMonkey를 사용하기로 결정했다. 월 $20이라는 저렴한 가격때문이기도 하지만, 무엇보다 인터페이스가 좋고 기능이 풍부해서이다. 지금 와서 생각해보니 정말 훌륭한 결정이었다. SurveyMonkey를 쓰면서, "이런 기능이 있으면 좋을텐데"라고 생각하고 찾아보면 이미 있어서 감탄을 여러 번 했다. 정말 최고의 Survey tool이 아닐까 싶다. 그런 걸 겨우 $20에 사용하다니 공짜나 다름없다. Chart 기능도 훌륭하다. 아래와 같은 차트를 그냥 툴에서 만들어준다. 나를 제일 감탄시킨 것은 filtering 기능인데, 특정 질문에 특정 대답을 한 사람들의 응답을 따로 분석하기가 아주 쉽게 되어 있었다.


약 1달에 걸쳐 2000명의 데이터를 모았고, 약 1주일에 걸쳐서 분석을 한 결과 아주 재미있는 데이터를 많이 찾아낼 수 있었다. 특히 각 segment별로 다른 의견을 가지고 있다는 것을 알게 되었고, 실제 제품 전략에 활용될 수 있는 insight를 얻었다.

SurveyMonkey의 또 다른 장점은, 각 응답자들의 IP 정보를 기록한다는 것이다. Excel sheet 에 가득 찬 IP를 보며 이걸로 뭔가 재미난 걸 할 수 없을까 생각하다가, IP를 이용해서 위치 정보를 얻어내고, 이를 지도에 표시하면 좋겠다는 결론에 이르렀다. 먼저 IP를 위치 데이터로 변환하는 과정이 필요했다. Google에서 찾아보니 다양한 서비스가 있었는데, 내가 원하는 형태로 데이터를 얻을 수 없거나, DB 가격이 너무 비쌌다. 그러다 MaxMind라는 걸 찾았는데, 여기에서 lite version의 DB를 공짜로 배포하고, DB에서 데이터를 가져오는 API까지 제공하고 있었다. Java API가 있길래 오랜만에 Eclipse를 열었다. 간단한 코드를 만들어서 IP주소로부터 도시 주소, 나라 이름, 위도, 경도 등을 뽑아낼 수 있었다.

[code]class LookupCity {
    public void doLookup(String[] args) {
        try {
            LookupService cl = new LookupService("/Users/sungmoon/Downloads/GeoLite/GeoLiteCity.dat",
                        LookupService.GEOIP_MEMORY_CACHE );
            for (int i=0; i<args.length; i++) {
                Location l = cl.getLocation(args[i]);
                System.out.println(l.city);
            }
        }
        catch (IOException e) {
            System.out.println("IO Exception");
        }
    }
}[/code]

이제 survey 참가자들의 위치 정보를 얻었으니 이를 지도에 표현해야 했다. Flash의 visualization 툴들을살펴보고, Google visualization, Google Maps API 등을 봤는데 Google 툴이 사용하기 쉽게 잘 되어 있어서 이걸 사용하기로 했다. Google Visualization API Gallery에 재미난 게 많이 있었는데, 그 중 GeoMap을 사용하면 내가 원하는 걸 그릴 수 있었다. Javascript 소스 코드를 약간 수정해서 다음과 같은 interactive 한 지도를 만들 수 있었다. (실제 동작 화면 및 소스를 보려면 여기를 클릭)



이정도도 괜찮았지만 Google Maps 위에 표현해보면 더 재미있겠다 싶어 Google Maps API를 뒤졌다. 역시 구글... 정말 사용하기 쉽게 API를 잘 만들어놓았다. 샘플 코드를 참고하자 얼마 시간이 걸리지 않아 아래와 같이 설문조사에 응답한 사람들을 지도 위에 표현할 수 있었다. (실제 동작 화면 및 소스를 보려면 여기를 클릭) 이걸 보여주자 다들 너무 재미있어했다. 브라질에서 온 동료는 자기가 태어난 도시에 응답자가 있는지 보고 싶어했고, 폴란드에서 온 동료도 자기 나라쪽을 보여달라고 하며 거기 찍힌 Flag 를 보고 재미있어했다.



정보를 지도에 표현하는 것까지는 했고... 설문 조사 결과는 chart로 예쁘게 만들어서 보여주면 되는데, comment가 문제였다. open comment choice에 1000개가 넘는 comment가 달려, 이를 visual하게 보여주는 방법이 없을까 생각하다가, 블로그 tag를 cloud에 표현하는 방법이 생각났다. 즉, 더 많이 나타나는 단어를 더 크게 보여주는 것이다. 코드를 만들어볼까 하다가 툴이 있겠지 싶어 찾아봤더니... 아니나 다를까 Wordle이라는 아주 좋은 툴을 찾았다. 아래는 Wordle로 만든 결과이다. 사람들이 정말 좋아했다.



MBA 와서 앞으로 coding할 일은 없겠구나 싶어 좀 씁쓸했는데 그나마 그 기술을 간단한 툴을 통해 써먹을 수 있게 되서 다행이다. 이번에 배운 것들.. 앞으로 쓸 일이 많을 것 같다.

댓글 2개:

mahabanya :

코딩 경험이 있는 사람들이란;ㅂ;



하면서 봤습니다. 재미있는 과정에 재미있는 결과에 재미있는 툴이네요. 덕분에 앞으로 필요할지 모르는 툴 몇 개에 대한 정보를 얻어 갑니다.

Sungmoon Cho :

@mahabanya - 2009/10/27 20:28
하하하 예... 나중에 꼭 유용하게 사용하셨으면 좋겠네요. 사람들은 언제나 visual한 걸 좋아하지요. 저도 그렇고...