2024.05.09 (목)

  • 맑음속초8.5℃
  • 맑음7.0℃
  • 구름조금철원7.7℃
  • 맑음동두천8.5℃
  • 맑음파주7.3℃
  • 구름조금대관령-0.7℃
  • 맑음춘천7.1℃
  • 맑음백령도10.4℃
  • 맑음북강릉10.3℃
  • 구름조금강릉12.0℃
  • 맑음동해7.3℃
  • 맑음서울11.1℃
  • 맑음인천11.4℃
  • 맑음원주9.3℃
  • 맑음울릉도9.3℃
  • 맑음수원8.6℃
  • 맑음영월6.1℃
  • 맑음충주7.1℃
  • 맑음서산6.7℃
  • 맑음울진5.1℃
  • 맑음청주11.0℃
  • 맑음대전8.4℃
  • 맑음추풍령7.9℃
  • 안개안동6.5℃
  • 맑음상주7.5℃
  • 맑음포항8.4℃
  • 맑음군산8.6℃
  • 맑음대구6.9℃
  • 맑음전주9.7℃
  • 맑음울산6.3℃
  • 맑음창원9.0℃
  • 맑음광주10.4℃
  • 맑음부산9.8℃
  • 맑음통영9.9℃
  • 맑음목포11.4℃
  • 맑음여수12.0℃
  • 맑음흑산도11.5℃
  • 맑음완도11.2℃
  • 맑음고창7.0℃
  • 맑음순천8.0℃
  • 맑음홍성(예)8.3℃
  • 맑음7.0℃
  • 맑음제주12.6℃
  • 맑음고산12.9℃
  • 맑음성산10.3℃
  • 맑음서귀포11.9℃
  • 맑음진주8.0℃
  • 맑음강화7.6℃
  • 맑음양평8.9℃
  • 맑음이천8.8℃
  • 맑음인제3.8℃
  • 맑음홍천6.5℃
  • 맑음태백0.4℃
  • 맑음정선군2.2℃
  • 맑음제천5.4℃
  • 맑음보은6.4℃
  • 맑음천안6.5℃
  • 맑음보령8.0℃
  • 맑음부여7.8℃
  • 맑음금산5.9℃
  • 맑음8.0℃
  • 맑음부안8.6℃
  • 맑음임실6.6℃
  • 맑음정읍7.6℃
  • 맑음남원7.1℃
  • 맑음장수4.7℃
  • 맑음고창군7.4℃
  • 맑음영광군7.4℃
  • 맑음김해시7.8℃
  • 맑음순창군7.4℃
  • 맑음북창원9.1℃
  • 맑음양산시8.1℃
  • 맑음보성군8.9℃
  • 맑음강진군9.5℃
  • 맑음장흥9.7℃
  • 맑음해남7.9℃
  • 맑음고흥7.5℃
  • 맑음의령군6.8℃
  • 맑음함양군5.4℃
  • 맑음광양시10.1℃
  • 맑음진도군7.5℃
  • 맑음봉화5.0℃
  • 맑음영주5.8℃
  • 맑음문경6.5℃
  • 맑음청송군3.9℃
  • 맑음영덕8.5℃
  • 맑음의성4.4℃
  • 맑음구미7.4℃
  • 맑음영천4.6℃
  • 맑음경주시4.9℃
  • 맑음거창5.5℃
  • 맑음합천7.7℃
  • 맑음밀양7.1℃
  • 맑음산청7.0℃
  • 맑음거제8.9℃
  • 맑음남해11.0℃
  • 맑음6.8℃
기상청 제공
기획연재 | 데이터품질관리 ② 한국연구재단(NRF)
  • 해당된 기사를 공유합니다

COLUMN

기획연재 | 데이터품질관리 ② 한국연구재단(NRF)

   
 
한국연구업적통합정보(KRI), 대한민국 학술 및 연구개발의 초석되다 최근 기업에서 운영하는 정보시스템의 규모가 확대되고, 복잡도가 증가함에 따라 데이터의 정확성, 중복성, 일관성 등과 같은 데이터품질관리(DQM, Data Quality Management) 요소가 중요한 이슈로 떠오르고 있습니다. 이에 발맞춰 BizIT는 한국데이터베이스진흥원과 함께 데이터 품질관리 활동이 우수한 기업들을 3회에 걸쳐 소개합니다. 이들 사례를 통해 우수한 데이터 관리 체계와 현황, 도입 사례 및 적용 방법론 등을 공유하고 적용하는 데 필요한 도움을 받을 수 있을 것입니다. 정나리 기자 nrjeong@ciomediagroup.com 인터뷰 순서 1 이송호 윕스 상무 2 이경우 한국연구재단 정보팀장 3 정찬윤 한국감정원 실장 이질적 데이터의 합일 원칙은 ‘고객’과 ‘데이터’ 한국연구재단은 전 학문 분야를 아우르는 국가 기초연구지원시스템의 효율화 및 선진화를 목적으로 한국학술진흥재단, 한국과학재단, 국제과학기술협력재단의 세 개 기관이 통합해 2009년 6월 26일에 새롭게 출범한 연구지원관리전문기관이다. 학술 및 연구개발 활동과 인력의 양성 및 활용을 보다 효율적이고 공정하게 수행함으로써 국가의 학술 및 과학기술 진흥과 연구역량 제고에 기여한다. 한국연구재단은 2009년 3개 기관 통합 이후, 정보시스템 통합에 주력하고 있다. 이에 따라 새로운 구조를 만들어 데이터 통합을 하고자 했다. 그 과정에서 중요한 것이 데이터 표준, 데이터 관리 운영 체계, 데이터 품질 향상에 대한 3단계 전략이다. 이경우 한국연구재단 정보팀장은 이번 통합에서 중요하게 여긴 키워드 두 개로 ‘고객’과 ‘데이터’를 꼽았다. ‘고객’이라는 관점에서 어떻게 ‘데이터’를 통합, 정제하고 품질을 향상시킬 수 있을 것인가에 초점을 맞춘 것이다. 이 팀장은 “현재 수행하고 있는 차세대 통합정보시스템 구축은 고객과 데이터를 핵심 키워드로 하여 기존 정보시스템에서 별도로 관리하고 있는 데이터를 통합하는 작업으로 약 130억 원이 투입된 프로젝트”라면서 “그 가운데 인력정보인 한국연구업적통합정보(Korean Researcher Information, 이하 KRI)가 한국데이터베이스진흥원(DQC-V) 인증의 골드클래스를 획득한 것”이라고 밝혔다. 21만 명의 연구 데이터 표준화로 신뢰성 향상 KRI(한국연구업적정보)는 우리나라 대다수 연구자들의 연구 업적 및 인력 정보를 일컫는다. KRI는 대학과 재단이 연구자 정보를 통합 관리하고 실시간으로 공유하는 서비스로서 국내 연구자 약 21만 명의 정보를 수록하고 있으며, 국내 주요 대학 400여 개 대학과의 시스템 연계를 통해 실시간으로 정보를 공유하고 있다. 3개 기관의 이질적인 데이터 인프라와 구조가 통합되면서 얼마나 일관성 있게 맞춰져 나가며, 그 과정에서 품질을 얼마나 잘 가져갈 것인가가 현재 통합 시스템에서 중요한 이슈 중 하나다. 때문에 기존 연구사업 데이터의 정제 및 이를 유지할 수 있는 데이터 품질관리체계 구축이 필요한 상황이었다. 또한 업무규칙 및 사업 형태에 따라 다양하게 변화되는 데이터 흐름 및 이력정보가 발생하면서, 데이터 흐름분석 및 체계적인 이력관리를 통한 지속적인 데이터 변화관리가 필요했다. 2007년 8월부터 구축에 착수해 2008년 3월 25일에 오픈한 KRI 서비스는 연구자들의 연구업적정보 중복등록에 따른 번거로움을 해소하고, 연구업적 검증을 통해 연구지원사업의 투명성을 제고할 수 있어, 이를 통해 연구자가 연구에 전념할 수 있는 연구 환경이 조성됐다. 이경우 팀장은 “한국연구재단은 교육 및 과학기술 분야에서 170여 개의 다양한 연구사업 업무를 지원함에 따라 사업별 다양한 업무규칙과 다양한 데이터가 산재해 있다”면서 “메타데이터 및 코드데이터의 통합 및 표준화를 추진하여 종합적인 데이터 관리가 필수적”이라고 강조했다. 덧붙여 “KRI 사업 이전에는 연구자가 재단의 시스템에 직접 자신의 정보를 입력하는 방식으로 운영되고 있어, 연구자 정보에 대한 확인이 불가능했고, 정보의 신뢰도도 보증하기 어려웠다”면서 “KRI의 도입으로 연구자의 소속 기관(주로 대학)을 통해 연구자 정보를 수집하고, 대학에서는 교원평가를 통해 연구자 정보를 1차 검증하므로 정보의 신뢰도를 확보했다”고 밝혔다. 현재 KRI와 협정을 체결한 기관은 426개며, 이 가운데 314개 기관을 연계하는 작업이 끝났다. 한국연구재단의 데이터는 단순히 많은 데이터가 아니라 분류에 따른 층위가 분명한 데이터로, 사업수행정보, 연구성과정보, 내부경영정보 데이터 영역으로 구분된다. 그 가운데 사업수행정보는 핵심데이터 영역으로 재단의 사업 수행에 따른 단계별 모든 정보가 축적되며, 3개 기관 통합으로 인한 기존 데이터의 통합과 일관성, 정확성에 중점을 두고 있다. 이번의 경우 데이터 품질 관리 이전에 전사차원 데이터 통합이 선결과제였다. 통합 후 데이터품질확보(MD, Model Manager AMP)와 데이터품질관리가 이뤄지며, 데이터 품질관리 역시 DQM에서 MDM(Master Data Management)의 단계로, 전략적 방향성을 갖고 추진된다. 업무 효율성과 신뢰도 제고에 기여 이경우 팀장은 “내년 상반기에는 대 고객 서비스 수준 제고를 위해 통합연구사업 DB품질 인증도 진행할 계획”이라고 밝혔다. 또한 2차 사업에서는 DQM 기반의 품질관리체계 구축과 MDM 기반으로 확장, 2013년에는 EA(Enterprise Architecture) 구축까지 진행할 예정이다. 데이터 품질 관리 도입으로 어떤 효과가 발생했을까? 이 팀장은 “정보의 신뢰도가 높아지면서 각종 통계 및 정보의 주요 사업에 활용됐다”고 말했다. 한국연구재단의 모든 데이터는 공유를 목적으로 하므로, 대학정보공시, 대학 연구 활동 실태조사, 고등교육 통계조사, 행정안전부 국가인재 DB 등에 활용된다. 또한 연구업적의 질적 평가 기반 구축에 사용된다. WCU(World Class University) 사업 등에서 이를 활용하여 직접 평가를 진행 중이다. 그러나 여기서 만족하지 않고 한국연구재단은 연구사업의 변화하는 기준을 맞추기 위해 지속적으로 노력하고 있다. 이 팀장은 “연구자의 연구수준에 대한 평가를 양적평가에서 질적 평가로 전환할 수 있는 기반이 마련돼, 이에 대한 준비를 하고 있다”면서 “얼마나 많은 논문을 발표했는지와 얼마나 우수한 논문을 발표했는지 차이를 알 수 있도록 서비스를 제공하는 것”이라고 덧붙였다. 이경우 팀장은 성공적인 데이터 품질관리 도입을 위해 “10년 뒤를 내다보라”고 말했다. 어떤 것이든 표준은 일단 제정돼 공표되면 이후에는 이를 변경하는 게 쉽지 않다. 따라서 장기적인 관점에서 사업계획을 수립해야 하고, 당연히 충분한 예산과 인력의 확보는 필수적이다. 이경우 한국연구재단 경영관리본부 정보팀장 개발부터 운영까지 일관성 있는 관리체계 도입 한국연구업적정보시스템(KRI)에서 데이터품질 관리가 중요한 이유는 무엇인가? KRI는 국내 모든 학문 분야의 학술 및 연구개발 활동 정보를 수록하고 있으며, 시스템 연계를 통해 국내 주요 대학에 실시간으로 정보를 제공하고 있다. 따라서 연구자들의 연구업적은 대학에서의 교수 업적관리에 직접 활용되고 있어 개인 업적관리의 기본 자료일 뿐만 아니라 각 대학별 연구업적 정보는 대학 정보공시의 기준자료가 되므로 대학 차원에서도 매우 민감한 데이터다. 한국연구재단은 어떤 점에 중점을 두고 데이터 품질 관리를 하는가? 연구과제 기준정보인 마스터데이터(Master Data)의 품질 관리 측면과 개발 단계부터 운영 단계까지 체계적인 데이터 관리체계 구축에 중점을 뒀다. 연구사업의 주요 정보는 크게 연구인력 정보(KRI), 연구사업 정보로 나뉘며, 연구사업 정보에서 마스터데이터의 정제 및 일원화에 중점을 두고 있으며, 이를 통해서 연구사업 정보의 일관성 및 완전성을 높이고자 일부 오프라인으로 수행됐던 연구과제 정보도 전산화하여 정보의 누락을 막았다. 또한, 정보시스템 개발단계에서부터 데이터 표준화 및 모델을 관리하고, 이로부터 생성된 물리 데이터베이스를 정기적인 갭 분석을 통해 현행화함으로써 개발단계에서부터 운영까지 일관성 있고 신뢰성 있는 데이터 관리체계를 도입했다. 지속적인 데이터 품질 관리 확산을 위해 향후 어떤 계획과 전략을 갖고 있는가? 통합된 데이터의 지속적인 품질관리가 중요하다. 연구사업의 특성 상 마스터데이터가 매우 중요하기 때문에 내년에는 MDM을 도입해 핵심데이터를 관리할 예정이다. 또한 2013년에는 EA(Enterprise Architecture)를 구축해 전사 차원의 거버넌스 기반을 마련하고자 한다. 최근 공공정보의 활용 측면에서 행정안전부 고시인 공공정보 제공지침에 따라 공공기관이 다양한 정보를 국민에게 제공하고 있다. 이에 재단도 추후 연구사업과 관련된 우수한 품질의 정보를 제공할 예정이다.