2024.05.07 (화)
굿모닝아이텍이 빅데이터 준비를 위한 기반 플랫폼 구축 사업을 가속화한다. 굿모닝아이텍은 스마트 시대를 맞아 기존의 정형화된 데이터외에 소셜, 동영상, 로그 데이터 등의 생성이 급증함에 따라 향후 이런 비정형 데이터가 새로운 비즈니스를 견인할 수 있을 것으로 보고, 기반 기술 확충을 강화하고, 주요 고객사를 중심으로 시범 사업에 나서고 있다.
방창완 편집국장 bang@ciociso.com
굿모닝아이텍의 김영일 상무는 “수많은 비정형 데이터가 쏟아져 나오고 있는 상태에서 이를 의미 있는 내용으로 변환하기 위해서는 기존의 시스템 환경으로는 불가능하다”며 “빅데이터 시대에 맞춰 새로운 분석도구를 통해 이를 효율적으로 활용해야 한다”고 말했다. 다양한 비정형 데이터가 만연되어 있는 환경에서는 데이터 운영의 패러다임도 바뀌어야한다는 것.
새로운 데이터 구조는 더미 형태로 데이터를 단순히 쌓아놓는 것이 아니라 데이터를 하나의 허브 형태로 두고 분산되어 있는 다양한 데이터를 필요시마다 끌어와 분석하는 구조가 필요하다는 것이다. 구글의 경우도 검색자가 의도하는 단어를 검색창에 쓰게 되면 의도를 반영해 제일 앞단에 필요한 내용들을 보여주는 알고리즘을 운영하는 것처럼 지능적이면서 창의적인 발상이 필요하다는 것이다.
분산파일 시스템으로 효율성 높여
기존의 관계형데이터베이스 형태로는 성능과 비용 문제 때문에 이런 구조를 만들어 갈 수 없다. 김영일 상무는 “2천 만건의 데이터를 접속하는데 한 대의 컴퓨팅 파워로 가능할 수는 없다. 방대한 데이터를 저장하고, 이를 활용할 수 있는 기술이 필요하다”고 말했다. 이는 대량의 데이터를 하나의 서버에 저장하는 것이 아니라, 분산 저장시켜 컴퓨팅 자원의 과도한 집중도를 막고 효율적으로 운영할 수 있는 방법이다. 이를 업계에서는 분산파일시스템 개념으로 이해하고 있다.
이미 저장된 데이터의 위치를 알기만 하면 되기 때문에 메타데이터(데이터의 지도)를 갖추고 있으면 필요한 데이터에 손쉽게 접근할 수 있다. 김영일 상무는 “데이터 분석의 리더는 CMO(마케팅 총 책임자)가 되어야 하지만 때에 따라서 CIO와의 역할분담을 적절하게 가져가는 전략이 필요하다”고 지적했다.
운영 방식에 있어서는 우선 분석 대상의 데이터가 있어야 한다. 아이디어를 통해 가설이 세워지면 데이터 분석을 통한 검증이 필요하다. 저장된 데이터는 추출과 함께 변환되며 목적에 적합한 분석이 이뤄지게 된다. 이런 기본 구조 속에서 검색과 프로그램, 연관관계에 대한 파악이 가능해 질 수 있다는 것이다.
김 상무는 빅데이터를 운영하기 위해서는 어떤 데이터든지 모을 수 있는 인프라가 갖춰져야 하며 이에 대한 기반 플랫폼이 ‘하둡’이라고 강조했다. 굿모닝아이텍이 국내에 구축하는 빅데이터 인프라는 ‘클라우데라 엔터프라이즈’ 솔루션이다. 지난 2008년에 설립된 클라우데라社는 빅데이터 업계에서 선두를 달리고 있는 검증된 기업으로, 데이터에 대한 수집 및 배포 등 BI(비즈니스인텔리전스)를 시각화하기 위한 인프라를 제공해 준다.
클라우데라는 ‘싱글데이터 플랫폼’을 지향해 단일 환경에서 대용량 데이터의 수집과 저장, 분석 작업이 이뤄지도록 도와준다. 보안에 있어서도 여러 개의 인증처리와 통합관리를 가능하게 해준다.
김영일 상무는 “빅데이터 플랫폼을 구축하려면 필요 인프라를 구축하고, 이를 설치하는데 많은 시간과 비용이 들 수 있다. 이를 손쉽게 해결해 줄 수 있다. 클라우데라는 데이터 분석외에도 모니터링, 로그검색, 리포팅 등 빅데이터 분석에 필요한 모든 요소를 하나의 운영 환경에서 가능하도록 제공해 주고 있다”고 강조했다.
또한 권한을 갖고 있는 사용자가 데이터에 접근할 수 있도록 통합 인증체계를 구현함으로써 제품에 대한 신뢰도를 강화시켰다. 이밖에 데이터 활용에 대한 추적이 가능함으로써 향후 데이터가 사용되는 정확한 출처를 확인할 수 있다.
굿모닝아이텍은 앞으로 클라우데라의 국내 파트너사로써 관련 기술에 대한 지원 및 상용화를 위해 적극 나설 계획이다.