학술논문

빅데이터 분석과 데이터 마이닝을 위한 저작권 제한
Copyright Limitations and Exceptions for ‘Big Data’ Analysis and ‘Data Mining’
Document Type
Article
Source
계간 저작권, 30(1), 117, pp.29-61 Mar, 2017
Subject
법학
Language
한국어
ISSN
1226-0967
Abstract
Text and data mining (TDM) is the use of automated analytical techniques to analyse text and data for patterns, trends and other useful information. TDM is the process of deriving information from machine-read material. It works by copying large quantities of material, extracting the data, and recombining it to identify patterns. TDM is considered to be a tool to facilitate research at all levels and bring to light new aspects of and insights into existing data by analysing, combining, isolating or synthesizing information with the aid of an automated tool. TDM almost always involves copying, but not all copying amounts to copyright infringement. However, many researchers want to keep a durable copy of the articles that underlie their TDM analysis as a reference to validate their results. In other cases, the durable outputs of TDM may have some copyrighted content, such as images. Researchers using TDM in their research risk infringing copyright unless they had specific permission from the copyright owner. This paper gives a brief overview of the copyright issues under which TDM practices fall and legal solutions for a copyright exception for TDM.
빅데이터의 가치는 데이터를 분석하여 개인과 사회에 유용한 결과를 가져올 수 있다는 데 있다. 최근 기존 연구 데이터를 비롯한 수많은 정보를 활용한 텍스트 및 데이터 분석기술이 발달하고 있다. 이러한 빅데이터의 분석기법들 중에서 텍스트 마이닝(text mining)과 데이터 마이닝(data mining)이 주목을 받고 있다. 빅데이터를 구성하는 것은 데이터이므로 그 데이터에 저작물성이 있다면 빅데이터를 처리함에 있어서 저작권 문제가 발생할 수 있다. 그러나 빅데이터 분석을 위한 데이터 마이닝의 경우, 외형적으로는 저작물의 복제 등 이용행위가 행해지지만, 그 과정은 저작물의 표현 자체를 이용하는 것이 목적이 아니라 저작물에 포함된 아이디어나 배경 정보 등을 추출하는 것을 목적으로 하는 경우가 대부분이다. 이와 같이 ‘저작물 이용의 실질’을 충족하지 아니하는 빅데이터 분석을 위한 데이터 마이닝의 경우 빅데이터 산업 활성화를 위하여 저작권 행사가 제한될 필요가 있다. 본 논문은 빅데이터 분석을 위한 처리과정, 즉 데이터 소스단계, 수집단계, 저장단계, 처리단계, 분석단계 등 각 단계별로 발생할 수 있는 저작권 문제를 검토하고, 입법론적 개선 가능성을 모색하고자 한다.