개발자

영국 국립도서관, 디지털 정보기록을 위한 Web Archieve 프로젝트 착수

지구빵집 2010. 3. 10. 11:25
반응형
KISTI 미리안『글로벌동향브리핑』 2010-03-04

영국 국립도서관은 최근 영국 내 모든 무료접속 웹사이트들을 기록 및 보관하기 위한 UK Web Archive라는 프로젝트에 도입하여 일상생활의 큰 부분을 차지해버린 인터넷의 역할을 강조하기 시작하였다.

이는 일본, 프랑스, 그리고 미국 등과 같은 일부 선진국들에서 인터넷의 유비쿼터스적 특성에 따라 각종 정보가 사라지고 있음을 감안하여 도서 및 신문 등의 출판매체 등과 같은 형식으로 지적자산을 영구보전할 필요성을 느껴 이를 도서관리시스템에 도입한 것과 마찬가지로 영국 또한 여기에 반응한 것으로 보인다.

특히 도서와 같은 유형의 정보들보다 빠른 시간내에 사라지는 정보매개체인 웹사이트들의 특징을 반영, 역사 속으로 사라지는 무수한 정보들을 놓치지 않고 기록하겠다는 의도로 보인다.

물론 모든 웹사이트가 기록 및 보관될 예정은 아니라고 한다. 문화적 소장가치 혹은 동시대의 특성을 잘 보여주는 학술/연구/기관 웹사이트들이 해당될 것이며, 이러한 웹사이트들의 정보를 관리하는 것 역시 도서관의 임무라는 생각에서 이번 프로젝트를 진행하고 있는 것으로 파악되었다.

최근 영국 국립도서관에서 의한 연구보고서에는 평균 웹사이트의 운영주기가 44일에서 75일 가량인 것으로 밝혀졌으며, 전체 영국에서 운영되고 있는 웹사이트 중 최소 10퍼센트 이상이 6개월 단위로 사라지거나 폐쇄되어 정보가 유실되는 사태가 벌어지고 있음을 보여주기도 하였다.

게다가 무수한 웹사이트들의 정보는 수시로 업데이트가 되면서 정보의 연속성이 부족할 뿐 아니라 그 순간 기록되지 않으면 보전할 방법이 마련되어있지 않은 상태이기에, 정부 및 연구소와 관련된 기관 웹사이트들의 경우는 정보기록 문제가 보다 심각하다고 할 수 있겠다.

이러한 이유로, 영국 국립도서관에 디지털로 소장될 정보들은 앞선 시간에 과거를 돌아볼 수 있는 주제들로 분류되어질 것이며, 예를 들면 `경기침체,` `선거,` `환경문제` 등이 해당될 수 있을 것이라고 한다.

이번 프로젝트에 사용된 정보기술의 핵심기술인 데이터 추출, 변형, 그리고 콘텐츠 관리 및 저장과 관련된 사안을 IBM社로부터 제공받았으며, 영국 전체 온라인 콘텐츠 중 1퍼센트에 해당되는 부분 만이 저장될 예정이라고 한다. 이는 콘텐츠 보유자들의 허가를 받아야 하는 영국의 법적 제한 때문에 기록 및 보관이 불가능한 상황인 것을 감안한 것이고, 시간소모와 처리비용 문제 역시 감안된 수치라고 한다.

하여 영국 문화관광부는 디지털정보기록과 관련한 규제완화를 신청할 예정이며, 이것이 통과되었을 경우 web harvesting 스키마를 이용해 영국의 모든 웹사이트들의 도메인을 스냅샷으로 찍어 정보와 함께 보관하는 2차 프로젝트를 시작할 예정이라고 한다.

현재 영국 정부가 디지털정보기록과 관련된 강력한 의지를 보여 국립도서관을 통해 프로젝트를 추진하고 있지만, 여기에 대한 비판의 시각도 만만치 않다. 인터넷에 존재하는 웹사이트 수는 셀 수 없이 많은데, 이러한 웹사이트들 중에서 일부 주제에 맞는 웹사이트들을 선별작업을 통해 기록 및 보관하는 작업은 시간낭비 및 비용소모가 크다는 단점을 지적하고 있다.

영국의 디지털정보기록을 위한 Web Archieve 프로젝트가 어떠한 결과로 결실을 맺게 될지 주목해 볼 시점이라 생각된다.

출처 : http://www.computing.co.uk/computing/analysis/2258751/saving-web-future
반응형