연구데이터란?

[연구데이터관리 #1]

서론

연구환경의 변화와 연구데이터

과학기술의 발전과 연구환경의 디지털화되면서 연구데이터의 생산이 폭발적으로 증가되었습니다. 데이터 기반의 연구 환경에 따라 주요 국가들에서는 연구데이터가 국가 과학기술 경쟁력의 핵심 동력임을 인식하고 관련 정책 수립, 제도 도입, 예산 투입을 추진하고 있습니다.

특히 연구성과물을 포함하여 연구데이터까지도 개방하고 공유하려는 ‘오픈 사이언스’ 운동이 점차 확산되고 있습니다. 오픈 사이언스는 공적 자금을 통해 생산된 연구결과물에 대한 쉬운 접근과 재활용을 가능하도록 하여 연구자뿐 아니라 기업과 사회 구성원에게 사회경제적 편익을 제공하고자 하는 운동입니다.

이는 오픈데이터에서 한걸음 더 나아가 공적자금이 투입된 학술 연구의 논문보고서 등 최종 결과만이 아닌 ‘과정’도 일반에게 디지털 포맷으로 공유, 다양한 사람들의 연구 참여 · 검증 · 협업과 새로운 시도를 증진하는 방식을 의미합니다.

연구데이터 공유의 필요성

연구데이터의 공유와 활용은 연구결과의 신뢰도를 높이며, 연구개발 경쟁력과 효율성을 강화시킵니다.

  • 연구데이터의 수집, 가동, 처리 등에 투자되는 시간과 비용을 저감하여 연구개발 주기를 획기적으로 감축
  • 필요한 연구데이터를 재활용함으로써 투자 효율성 증대
  • 연구데이터 공개를 통해 연구 재현성 및 투명성 확보
  • 데이터 기반 커뮤니티 형성으로 학제 간 융합 및 공동 연구 활성화


  국가 연구데이터 공유의 시작, 데이터 관리계획(Data Management Plan), KISTI Issue Brief 13호

‘서랍 속 연구데이터 함께 쓰는 빅데이터로 새롭게 거듭난다’ 과학기술정보통신부 보도자료

연구데이터의 정의

국제적으로 합의를 이룬 ‘연구데이터(Research Data) 정의는 존재하지 않습니다. 국가별로 연구데이터에 대한 정의는 매우 다양하지만 ‘연구개발 과정 또는 그 결과로서 생산되거나 수집된 모든 데이터를 의미한다고 볼 수 있습니다.

국 가 정 의
한국 연구개발 과제 수행 과정에서 실시하는 각종 실험, 관찰, 조사 및 분석 등을 통하여 산출된 사실 자료로서 연구결과의 검증에 필수적인 데이터
OECD 과학 연구의 주요 출처로 사용되는 사실적 기록(수치, 문자, 이미지, 음성 등)으로 정의되며, 연구 결과를 검증하는 데 필요한 데이터
미국 연구 전 주기과정에서 발생하는 데이터이며, 연구자가 수집할 정보와 수집 방법, 정보 처리, 분석 계획 등을 포함
영국 연구데이터 관리에 관한 지침서를 통해 데이터 관리 차원에서 연구의 전 주기에서 생성되는 데이터
호주 사실, 관찰, 이미지, 컴퓨터 프로그램 결과, 기록, 경험의 행태에서 생성되는 데이터

연구데이터의 종류

종류 내용 
실험 데이터 실험 장비에서 생산되는 데이터 예) 가속기, 화학/바이오 실험 데이터
관측 데이터 관측 장비를 통해 생산되는 데이터 예) 망원경, 전자현미경, 인공위성 등
시뮬레이션 데이터 모델링을 통해 생산된 데이터 예) 기후 모델링, 경제전망 모델링
파생 데이터 원천 데이터로부터 재생산된 데이터 예) 텍스트 마이닝, 3D 모델링
참조 데이터 평가를 거쳐 신뢰성이 공연된 데이터 예) 플라스마 물성 표준, 뇌 MRI 영상 참조 표준 데이터
조사 데이터 설문조사 등을 통해 생산된 데이터 예) 시장조사, 예측 조사

연구데이터의 형태 및 데이터 수집 방법

ㆍ연구데이터의 형태  : 수치(numerical), 공간(spacial), 도표(graphical),  문서(text) 등

<데이터 수집 방법 >

연구데이터란 무엇인지 알아보았습니다.

다음으로는 연구데이터를 관리해야하는 법적인 근거는 무엇인지, 연구데이터 관리 정책에 대해 살펴보겠습니다.

댓글 0