김강화 인터보그인터내내셔널 대표
디지털 트랜스포메이션(DX)은 최적 데이터를 가질 때 성공의 지름길이 열리는 것이다. 사용자 및 고객이 온라인, 오프라인, 모바일 등 다양한 경로를 넘나들며 상품을 검색하고 구매할 수 있도록 한 채널인 옴니채널은 고객 데이터를 취득할 수 있는 최적의 기반이다. 따라서 옴니채널이 DX 지름길의 하나라고 말할 수 있다.
우리 생활에 침투한 스마트폰의 급속한 보급과 정보처리 기술의 발달로 개인과 기업이 축적하여 다룰 수 있는 데이터가 증가하고 대규모 데이터 활용이 가능해졌다. 방대한 데이터의 실시간 처리도 가능해져 데이터 활용의 중요성은 계속 높아지고 있다.
그래서 데이터의 활용으로부터 새로운 가치를 제안할 수 있는 인재, ‘데이터 사이언티스트’가 요구되고 있다. 데이터 사이언티스트는 대량의 데이터를 분석하고 그 데이터를 실행 가능한 사업 전략으로 변환하는 일을 한다. 이것은 쉬운 일은 아니지만, 기업에 매우 중요하고, 앞으로도 더욱 중요하게 되어 기업의 승패에 좌우되는 결정적인 역할을 할 수도 있을 것이다.
데이터 사이언티스트는 다양한 의사 결정 국면에서 데이터에 근거하고 합리적인 판단을 할 수 있게 의사 결정자를 지원하는 직무 또는 그것을 하는 사람이다. 통계 해석이나 IT의 스킬과 더불어 비즈니스나 시장 트렌드 등 폭넓은 지식이 요구된다.
‘데이터 사이언스란, 알고리즘이나 통계 등 정보과학 이론을 활용해 데이터를 분석하여 유익한 지견을 찾아내는 것’을 말한다. 그리고 ‘데이터 사이언티스트란 데이터 사이언스력, 데이터 엔지니어링력을 기반으로 데이터에서 가치를 창출하고 비즈니스 과제에 답을 찾아내는 프로페셔널’로 정의할 수 있다.
데이터 사이언티스트는 먼저 데이터 드리븐(Data Driven)을 이해해야 한다. 데이터 드리븐이란 경험이나 촉 등이 아닌 다양한 종류와 방대한 양의 정보를 축적하는 빅데이터와 알고리즘에 의해 처리된 분석 결과를 바탕으로 비즈니스 의사 결정과 과제 해결 등을 수행하는 차세대 업무 프로세스이다. 빅데이터 활용의 최대 가치이기도 하다. 데이터 드리븐을 모르고는 빅데이터는 거의 활용하기가 쉽지 않다. 데이터 드리븐은 크게 4개의 축 즉, ①데이터의 수집 ②데이터의 분석(가시화) ③의사 결정(액션) ④가치의 향상으로 이루어져 있다.
데이터 사이언스의 영역. 출처: www.data-artist.com
데이터 드리븐을 하기 위해서는 데이터 분석 툴인 BI(비즈니스 인텔리전스)를 사용해야 한다. BI에는 리포팅(대시보드), OLAP 분석(온라인 분석 처리), 데이터 마이닝(Data Mining), 시뮬레이션 등이 있다. 그리고 DMP(데이터 매니지먼트 플랫폼), MA(마케팅 자동화), WEB 해석 툴, SFA(세일즈포스 오토메이션), CRM(고객관계관리)도 이해 내지 활용해야 한다.
데이터 사이언티스트에 필요한 스킬에 대해 살펴보자. 데이터 사이언스는 변화가 빠르고 분야로서의 명확한 정의도 없기 때문에 데이터 사이언티스트가 가지고 있는 기술은 다양하다. 그들 대부분이 대학 등에서 통계학, 데이터 분석, 수학 등의 어떤 훈련을 받거나 자격증을 가지고 있다. 그리고 대체로 데이터 저장, 통계학, 기계 학습 등에 사용되는 언어(특히 Python, R, Hadoop, SQL 등)를 통한 프로그래밍 경험을 가지고 있다. 처음 배운다면 데이터 해석에 있어서 특히 인기가 있는 파이션(Python)이 최적일 것이다. 또한 MATLAB, SAS, Minitab과 같은 다른 데이터 분석 프로그램을 알고 있다면 더욱 도움이 될 것이다.
그러나 이 부문은 데이터 분석가 및 외주로 처리할 수도 있다. 기계 학습(인공지능에 의한 학습)이나 통계학, 데이터 분석에 관한 지식이 없는 사람들에게 제대로 설명하는 능력도 매우 중요하다. 획기적인 분석 및 발견이 있었음에도 불구하고 잘 설명하지 못하면 아무 소용이 없다. 의사 전달을 적절히 해내는 능력은 오늘날 모든 기술자에게 필요한 소프트 스킬이다. 데이터 사이언티스트를 지원한다면, 현재 하고 있는 분야의 내외를 불문하고, 복수의 분야에서의 경험이 가치를 가질 수 있다. 일을 진행하면서 창의력을 발휘하면서 다양한 각도에서 문제를 해결하는 능력이 있으면 매우 도움이 될 것이다. 새로운 문제에는 혁신적이고 고유한 해결법이 요구되는 경우가 많기 때문이다.
그럼 데이터 사이언티스트의 전형적인 직무를 알아보자. 데이터 사이언티스트 역할에 관해서는 어느 조직에나 공통되는 확고한 직무 내용이 결정되고 있는 것은 아니지만 대체로 다음과 같은 직무는 담당할 가능성이 높을 것이다.
① 통일성 없는 대량의 데이터의 수집과 보다 이용하기 쉬운 포맷으로 변환
② 사업 과제를 데이터 주도형의 수법을 이용하고 해결
③ SAS, R, Python을 포함한 폭넓은 프로그래밍 언어에 의한 작업(외주 처리 가능)
④ 통계 정보의 정확한 이해(통계적 검정, 통계적 분포를 포함)
⑤ 분석 수법에 관한 최신 동향 파악(기계 학습, 딥-러닝, 텍스트 애널리틱스 등)
⑥ IT부문 및 업무 부문과의 소통과 콜라보레이션
⑦ 데이터에 잠재된 질서나 패턴의 발견과 비즈니스의 최종 이익에 기여하는 경향의 특정
고객 데이터의 최적 기반인 옴니채널에서 취득한 데이터를 비즈니스 혹은 경영 과제를 해결하는 직업이 데이터 사이언티스트이다. 향후 가장 매력적인 직업이 될 것이 틀림없고 이런 인력의 양성 및 확보가 옴니채널 구축의 지름길이 될 것이며, 향후 기업의 운명에도 크게 영향력을 행사할 것임에 틀림이 없을 것이다. 다음 연재에서 데이터 사이언스 업무 흐름에 대해 구체적으로 언급하겠다.