【摘要】
數位化資料雖然有使用上的便利性、具檢索性以及儲存空間小等優勢,然而,到目前為止它所引發的弊端也著實不少,它所涉及的問題多,範圍廣,其中之一就是有關數位資源的長久保存與維護議題。本文從數位資源長久保存的重要性談起,接著探討圖書館的館藏管理與保存活動、數位資訊保存與維護的困難,以及學者專家們所提出的一些保存策略,供圖書館從事館藏資源數位化時之參考與省思,防止重要資訊的遺失或破壞。
【Abstract】
Digital information can help the prevention of data loss due to natural disasters and deterioration of printing materials. However, the advantages of digital information, such as accessibility, retrieval functions, and minimal space, are accompanied with problems on preservation and maintenance. In order to provide suggestions for the library that is working on digitalizing collection, this article intends to discuss preservation of digital information from the following perspectives: library collection management and development, projects on digital collection, difficulties of digital preservation, and strategies proposed by scholars.
關鍵詞:數位館藏;維護;保存;館藏管理
Keywords: digital collections;maintenance;preservation;collection management
一、前言
中國圖書館學會2000年4月研訂的「圖書館事業發展白皮書」指出圖書館事業的五大願景為:保存文化紀錄、維護知的權利、統整資訊資源、滿足資訊需求、推動終身學習。而為達成這五項願景,圖書館應追求七項發展目標,其中第三項發展目標為善用資訊科技,文化紀錄保存數位化。(註1)足見圖書館自動化、網路化、館藏數位化等思潮已打入圖書館發展事業核心,數位館藏今後將扮演著舉足輕重的角色。
數位化資料雖然有各種優勢存在,如使用上的便利性、可檢索性、儲存空間小等,然而,到目前為止其所引發的弊端也著實不少。不可否認的不論是將館藏數位化或是直接引進數位館藏,都不會是一件單純的工作,所涉及的問題多,範圍廣,其中之一就是有關數位資源的長久保存與維護議題,尤其圖書館的保存任務並不是為保存而保存,更希望能夠將前人的知識紀錄永續傳承與使用,隨時維護讀者知的權利,滿足其資訊需求。
二、數位資源長久保存的重要性
古埃及亞歷山大城圖書館收藏的手稿毀於一場火災。早期的印刷書刊因年久變質成了一堆無法辨認的廢紙。歷史最悠久的電影片有許多已被當作廢品回收處理,以取得其中所含的銀。遺憾的是在Internet的發展過程中,歷史可能重演。(註2)
歷史確實已經重演,黃鴻珠教授(註3)與陳昭珍教授(註4)均曾引述美國資料維護及取閱委員會(Commission Research Libraries Group)與研究圖書館聯盟(Research Libraries Group)合組的數位化資訊檔案專責小組(Task Force on Archiving of Digital Information)於探討數位資料保存問題時,列舉數個以數位化典藏的資訊,若干年後發生資料無法閱讀的後遺症個案(註5),第一個個案是美國1960年代所做的人口普查資料,存於UNIVAC Tape II-A,到1976年欲閱讀該批資料時,只找到二部可以閱讀的機器,一在華府史密斯索尼亞(Smithsonian)的博物館,一在日本,經大費周章後,方將該批資料轉出,結果發現該資料極其珍貴。而1964年麻省理工學院及卡內基美隆大學(Carnegie Mellon University)的第一封電子郵件,因系統的改變並未保存下來;1970年代,比利時的人造衛星觀測資料,特別是有關亞馬遜河變遷的資料也已遺失。以上案例明確點出電子資訊技術(digital technology)的限制與數位資訊遺失的可能,而諸如此類的例子相信不勝玫舉,值得借鏡與深思。
三、從電子館藏發展方向與館藏管理看保存活動
ALA Glossary of Library And Information Science一書表示:「館藏發展是指包含決定及協調選書政策、評估讀者及潛在讀者的需求、館藏使用調查、館藏評鑑、確認館藏需求、選擇資料、資訊共享的規畫、館藏維護,以及館藏淘汰等有關館藏的發展活動」。(註6)同樣地,數位館藏發展也應擬出一套資源選擇與評估標準,包含ownership與access的考量,其他活動亦當訂定發展政策以供遵循。此外,由於各個學科使用者資訊需求行為模式、接受程度均不盡相同,使用資料的方式也會不同。如(圖一)所示,在資訊加值過程、館藏資源管理上,除了考量物件本身特性,也要考慮到使用者利用問題,對資訊物件的保存與功能性做取捨,即analyticity、integrity、transferability、longevity的抉擇。換言之有些資源目前著重的是analyticity與transferability,尚未考慮長期的保存問題,但從另一個角度思考,這些狀態或許也都處於過渡時期而已,可以再轉移的。至於紙本的保存是較經得起時間的考驗,缺點則是較不能節省讀者檢索時間。
![]() |
(圖一)Goal values.
(資料來源:Ross Atkinson,"Managing Traditional Materials in an Online Environment:Some Definitions and Distinctions for a Future Collection Management",LRTS 42:1(1997),pp.12.)
Ross Atkinson認為館藏管理(collection management)相較於館藏發展,係指對資訊物件(objects of information)在選擇進館收藏後依據圖書館的需求(如宗旨與功能)從事的資訊加值或淘汰的重新調整(delete value)。(註7)這也意謂著今後圖書館在建立館藏時,應充分掌握館藏資訊特徵,發揮高度判斷力及智慧,在排除著作權與版權問題後,隨著各種需要去改變其原始型態,重新創作出適合的館藏形式,以符合典藏、保存及取用等原則,公正地、理智地將過去與未來相融合,完成圖書館提供資訊承傳的神聖使命。
目前圖書館對電子館藏的建置方式大致有1.將實體館藏電子化、2.引進現成的電子資源、3.運用網路上免費的電子資源等三種。關於使用者需求的考量上,圖書館首先必須確認圖書館進行數位化工作的目的為何?或為保存珍貴文獻,或以方便使用者利用為主。誠如某些特藏,像藝術作品、名人手稿、善本書、古版書、絕版書等,為避免因為直接使用而造成的損傷,又期能走出冷氣室廣受利用,增加特藏資料的能見度,則需進行數位化工作。若為後者,則必須對使用者需求加以了解及調查,列出優先順序。
圖書館界在數位化館藏時,建立館藏特色、重視資源完整性仍為主要導向,彼此間的互助合作更是勢在必行,不論是成立數位聯盟或是分工合作(自行處理或外包)進行數位化,都需要彼此凝結共識,分析資源整體分布情形,發揮團體智慧,各司其職,以免重複浪費或是三不管。對電子資料的長久保存上,不僅期待能提供給現在的讀者,也希望能提供給未來的讀者使用,亦正是數位圖書館服務責無旁貸的新使命。
四、數位化與數位資訊保存維護的困難
就載體形式的轉換過程言,包括對紙本館藏或藝術品進行數位化時,大致都會有費用龐大、處理專業技術不易獲得、耗費時間等問題(註8),足見館藏數位化所投入心血與金錢所費不貲,況且知識無價,不是用金錢單一因素可計量的。而除了content的保存外,資料的原件是否需要保存?如何保存?這些議題對現階段的保存與維護言,在在困擾著我們。另外,網路上有許多值得參考的資源,圖書館佷少有系統地去蒐集這些資料。然而這些網路資源產生得快,消失得也很快,如何妥善保存,讓未來讀者也能利用,完全無法確定。(註9)以上都是圖書館進行保存、維護作業或者該不該保存、如何取捨時的一大挑戰。其困難點總結如下:(註10)
陳昭珍教授(註11)也指出數位資料不易長久保存的最大原因,在於資訊科技典範的快速轉移,包括軟硬體、網路架構等各種層面,由於數位資訊數量的快速增加,即使投入可觀的人力與金錢,也不一定能即時跟上轉移腳步。此外數位媒體的壽命短且容易損壞,造成數位資料的無用,也是電子資源長久保存的嚴重挑戰。
五、數位館藏維護
館藏發展的三大要素為:採購、淘汰與維護。相較於傳統圖書館因社會、自然等原因,而對館藏採取各種保護措施,諸如防晒、防蟲、防潮等各種環境控制,這些措施都是針對載體本身而設,而數位館藏維護則必須考慮下列三種層次的問題:(註12)
為解決上述三種問題,使數位資料載體保有可信賴性與可用性,我們必須對大量儲存媒體與軟體為能提供檢索與演算的需求,就檔案結構特性、描述性詮釋資料、以及顯示、計算與分析的能力,制定一套長期保存策略(註15)以克服難題。
六、數位館藏的保存策略
數位資訊維護的威脅主要有四方面:技術過時、資源不充足、規畫不完善以及媒體本身的問題。(註16)數位館藏的保存策略理應根據數位典藏政策與電子館藏發展政策,以及完善的規畫行事,不過就目前環境與技術言,尚未發展一成熟的作業模式,亦即沒有一標準答案與完全適當又經濟的方法。很多策略與辦法都在發展當中,這些策略包括:(註17)(註18)
以上所提供之策略各有所長,而各數位資訊物件使用環境也不一樣,其中像多媒體型式與動態型式的數位資訊之保存問題就不易處理。然而,不論數位資訊格式有多複雜、種類有多繁多,檔案館與圖書館界應積極協商與對談,試圖為這新興且缺乏經驗的數位世界之保存議題設法找出因應解決之道。
七、數位資訊保存維護的省思
數位館藏是否需要保存以及如何保存,首先應擬訂數位典藏政策,以網路資源而言,在徵集方面,Robert D. Cameron提供了四項基本原則:Link to the Original Source、Identify or Implement Reliable Mirrors、Identify or Implement Value-Added Features以及Maintain the Links。圖書館針對此四種作法,所須投入難易程度不一,像Maintain the Links即可輕易透過電腦程式解決,如MOMspider或Verify_links就是一種自動連結、偵測錯誤的機制。(註20)比較令人憂心的是連結點突然消失造成的資訊遺失現象,故就典藏言,可另分成四種層級:連結級、鏡錄級、服務級與典藏級。(註21)
圖書館、檔案館或是其他保存維護機構,都負有保存之責,但彼此間仍有差異,然而隨著社會變遷與技術環境的改變,以及政治與經濟因素的介入,這些機構可能要適度妥協而不能一昧堅持、固執,如圖書館方面,對那些已存在的讀者力量就不容小歔,其需求絕對會影響到圖書館對資訊物件的保存決策,因為圖書館存在的最大原因就是為了提供讀者服務。
數位典藏與電子館藏發展政策是要制訂,但在制訂之前,若剔除經濟與政治因素,完全回歸文化承傳與資訊利用時,我們不禁仍要思考:1.館藏數位化的目標究竟是為了防止舊資料的流失,還是建立未來更好的館藏?2.究竟是要保存舊資料的外貌、格式,還是其中的內容、思想?3.究竟要維護、複製舊資料的內容,還是賦予它新的精神?(註22)
長久以來,圖書館員背負著保存文化紀錄使命,總保有些許的『Warranty Syndrome』色彩,若能去除這單一思維模式,方可突破瓶頸,挑戰詭譎多變的未來。原則上,不同資訊物件有其特色、生命週期與價值,採取不同作法是較適當的,其中有些可以保存舊有的形式,有些則需要創新,賦予新生命或有所取捨。這種種判斷絕非憑少數人之聰明才智逕行決策,而是需要透過團結群體的力量,利用各種調查與研究,共同思考創作出最適當的模式,訂定各種保存維護策略,對館藏資源做歸類,將其中重要、好的資訊保存下來,因為科技不斷進步發展,但還原與重建原貌的工作就沒那麼簡單。至於知識性、常用的資料,則可利用像OCR等技術,製作資料庫以供檢索取用,配合媒體維護與技術維護,提供持續性的服務。
八、結語
好的電子資源能永久保存與永續使用是大家的期望,這對肩負歷史承傳的圖書館員言,是光榮使命。發展至今,雖然尚未研究出適當模式,而許多現實因素仍有待克服,如智慧財產權與版權(重製權)等法律議題,不過,電子化資源確實已成為我們追求知識的重要來源之一。世界上很多國家、機構、學術單位已積極投入電子化相關計畫,並將其研究結果、心得、作法與建議積極透過網路完全公開供眾分享,因此,除了有計畫性的進行研擬策略,建立最佳轉換程序之外,應不斷追求新知、注意新科技的限制與應用、吸取他人寶貴經驗與研究成果對數位館藏保存實作有相當助益。
綜上所論,數位化館藏的典藏、轉移或更新是項繁重、花錢耗時的工作,數位資訊對保存言,若不審慎處理,即可能一會兒功夫就消失殆盡。為避免重複浪費或有漏網資訊,各相關單位,包括各個圖書館、檔案館、資訊提供商等都應一起分擔解憂,分工合作、分配責任歸屬、產生規模經濟,降低維護成本。另外,也應支持與建立一國家數位圖書館機制,負起數位典藏、保存之統籌協調與運作,進而達到電子資源的Universal Available Publications。此外,重視各種對話,從人文關懷精神出發,慎選儲存媒體、重視使用者研究、使用者的評鑑以及館員的教育與訓練也都是數位館藏維護與保存的相關課題。
【註釋】