Digital Preservation

Page 1

อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

บทที่ 10 การอนุรักษสารสนเทศดิจิทัล (Digital Preservation) บทนํา ปจจุบันสารสนเทศผลิตออกมาในรูปของดิจิทัลมากขึ้น ทั้งสารสนเทศที่เกิดมาในรูปดิจิทัลโดยกําเนิด (Born digital) และสารสนเทศที่ถูกแปลงใหอยูในรูปดิจิทัล (Reborn Digital) และผลิตออกมาในหลายรูปแบบ ตั้งแตจดหมายอิเล็กทรอนิกส เว็บเพจ ไปจนถึงสื่อ ผสม ทั้งนี้เนื่องจากพัฒนาการของเทคโนโลยีการพิมพ อิเ ล็ ก ทรอนิก ส เริ่ ม ตั้ ง แต ก ารใช โ ปรแกรมประมวลคํ า (Word processor) มาใช ใ นการพิ มพ ผนวกกั บ ความสามารถของ เครื่องแสกน และกลองดิจิทัล ซึ่งชวยใหการสรางเอกสารดิจิทัลทําไดงายและมีคุณภาพดีขึ้น ในราคาที่ถูกลงเรื่อย ๆ และเนื่องดวยขอดีหลาย ๆ ประการของขอมูลดิจิทัล อาทิ แกไขปรับปรุงงาย เผยแพรงาย ทั้งโดยผานเครือขายคอมพิวเตอรหรือโดยอาศัยสื่อบันทึกขอมูลรูปแบบตาง ๆ ที่นับวันจะมีขนาดเล็กลงแตมี ความจุมากขึ้น จัดเก็บไดหลากหลายรูปแบบไฟล (File format) ขึ้นอยูกับวัตถุประสงคและการนําไปใช รวมทั้ง ความพรอมของผูใช นอกจากนี้สารสนเทศที่อยูในรูปดิจิทัลยังเรียกดูขอมูลไดงาย ผูใชจะเรียกดูขอมูลจาก สวนใดของเอกสารก็ได และโดยอาศัยเครือขายคอมพิวเตอรผูใชสามารถเขาถึงสารสนเทศไดโดยไมมีขอจํากัด ดานเวลาและระยะทาง อยางไรก็ตาม จากการที่สารสนเทศดิจิทัล เปนทรัพยากรที่มีการเปลี่ยนแปลงอยูเสมอ ตามสิ่งแวดลอมดานเทคโนโลยีที่มีการเปลี่ยนแปลงอยูตลอดเวลาทั้งในสวนของฮารดแวร ซอฟตแวร และ สื่อบันทึกขอมูล ทําใหหองสมุดและหนวยงานตาง ๆ ที่เกี่ยวของกับการอนุรักษมรดกทางปญญาและวัฒนธรรม ของชาติ จะตองเผชิญกับคําถามและความทาทายในการหาวิธีการที่ดีที่สุดและเหมาะสมที่สุดในการเก็บรักษา สารสนเทศดิจิทัลใหมีอายุการใชงานที่ยืนยาวและสามารถเรียกออกมาใชงานไดในอนาคต เมื่อตองยอมรับ ขอเท็จจริงที่วาทรัพยากรสารสนเทศดิจิทัลเหลานี้มีอายุการใชงานเพื่อใหบริการบนชั้น (Shelf life) ไมถึง 10 ป เราจะมั่นใจไดอยางไรวา สารสนเทศที่เราสรางขึ้นมาในวันนี้ จะสามารถเขาถึงและเรียกออกมาใชไดอยาง ครบถวนและสมบูรณในอนาคตเมื่อเทคโนโลยีมีการเปลี่ยนแปลง และเมื่อยุคของเรากลายเปนอดีตลูกหลานใน อนาคตจะสามารถเรียกใชขอมูลที่บรรพบุรุษสรางสรรคไวใหในวันนี้ไดอยางไร ขอเท็จจริงเหลานี้ แสดงถึงความ จําเปนเรงดวนที่ผูที่เกี่ยวของจะตองวางแผนเพื่อปองกันไมใหมรดกทางปญญาและวัฒนธรรมของชาติตอง สูญหายไปพรอมกับการเปลี่ยนแปลงของเทคโนโลยี

การอนุรักษสารสนเทศดิจิทัล (Digital Preservation) คืออะไร ตามความหมายของคําวา “อนุรักษ” ซึ่งหมายถึง รักษาใหคงเดิม (พจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๒๕) ดังนั้นในที่นี้จึงใชคําวา อนุรักษ แทนคําวา “Preservation” ซึ่งเปนคําภาษาอังกฤษ Digital Preservation หรือการอนุรักษสารสนเทศดิจิทัลเปนกิจกรรมที่เกี่ยวของกับการจัดการดานตาง ๆ เพื่อใหทรัพยากรสารเทศดิจิทัลสามารถเขาถึงและเรียกออกมาใชไดอยางสมบูรณ ตลอดไป ตราบเทาที่ตองการ และจําเปน ภายใตสภาวะการเปลี่ยนแปลงตลอดเวลาของเทคโนโลยี (RLG/OCLC, WWW, 2001 and Digital Preservation Coalition, WWW, 2002) ซึ่งสารสนเทศดิจิทัลจะรวมทั้งสารสนเทศดิจิทัลโดยกําเนิด (Born digital) และสารสนเทศที่ถูกแปลงใหอยูในรูปดิจิทัล (Born digital or Digitization materials) เปาหมายของ Digital preservation หรือ การอนุรักษคือ เพื่อรักษาความสามารถในการแสดง (Display) การคนคืน (Retrieve) และการใชดิจิทัลคอลเล็คชั่น (Digital collection) ไดภายใตการเปลี่ยนแปลงอยางรวดเร็ว 121


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

ของเทคโนโลยี โครงสรางพื้นฐานและองคประกอบขององคกร ซึ่งประเด็นที่ตองศึกษาไดแก (Cornell University Library, WWW, 2003) - การเก็บรักษาตัวเอกสาร รวมทั้ง Metadata สคริปตและ โปรแกรม ของเอกสาร (เชน ตองมั่นใจวา รวมทั้ง ฮารดแวรและซอฟตแวรที่จะใชเพื่ออาน สื่อที่บันทึกสารสนเทศ มีการทํา Back-up สารสนเทศดังกลาว ตองไดรับการดูแลรักษาเชนกัน) - การรักษาสภาพการใชของสารสนเทศดิจิทัล เชน สวนตอประสานกับผูใช หรือการติดตอกับผูใช ตองเปนปจจุบัน ผูใชตองสามารถคนคืน และปรับแตงสารสนเทศเพื่อตอบสนองความตองการของ ตนได - การรักษาความปลอดภัยของคอลเล็คชั่น เชน การกําหนดนโยบายเกี่ยวกับสิทธิในการเขาใช คอลเล็ ค ชั่ น การพั ฒ นา การดู แ ลรั ก ษาโปรแกรมการจั ด การเรื่ อ งสิ ท ธิ ก ารเข า ใช บ ริ ก ารที่ มี คาธรรมเนียม ซึ่งสอดคลองกับงานของ สตีเฟน แชปแมน (Stephen Chapman) ซึ่งอธิบายวา การเก็บ รักษา ทรัพยากรเพื่อใหผูใชสามารถเขาถึงไดนั้น ตองการมากกวาการเก็บรักษาตัววัสดุ แตยังตองการองคประกอบอีก 3 ดาน คือ การเก็บรักษาตัวเนื้อหาของสารสนเทศ (Preservation of the material or its "information content") การเก็บรักษาระบบ หรือเครื่องมือที่จําเปนตอการชี้ตําแหนง การคนคืน และ การแสดงทรัพยากร และผูใชที่ สามารถใชขอมูลดังกลาวได (Chapman, WWW, 2003)

แบบจําลองขององคกรทีท่ ําหนาที่เก็บรักษาสารสนเทศดิจิทลั OAIS Reference Model (Consultative for Space Data System, WWW, 2002) OAIS (Open Archival Information System) อยูภายใตการดูแลของ ISO เปนรางมาตรฐานเกี่ยวกับ ระบบ หรือองคกรการเก็บรักษาขอมูลใหมีอายุการใชงานที่ยาวนาน และสามารถเรียกอกมาใชไดโดยผูใชที่เปน กลุมเปาหมายหลัก (Designated Community) OAIS จะนําเสนอรูปแบบขององคประกอบที่จําเปนตอการสราง ระบบเพื่อสนับสนุนบริการเก็บรักษาขอมูล จําแนกหนาที่ในการเก็บรักษาสารสนเทศดิจิทัลออกเปน 7 ประการ ดังนี้ 1. Common Services เปนการเตรียมความพรอมเกี่ยวกับเทคโนโลยีพื้นฐานดานตาง ๆ ที่จะใชใน การติดตอสื่อสาร และการทํางานรวมกัน ไดแก • Operating system services เปนบริการในสวนของการดูแลระบบ และการจัดเตรียม สวนตอประสานเพื่อใหคอมพิวเตอรตางแพลตฟอรม หรือ คอมพิวเตอรที่ใชโปรแกรมประยุกต ตางกันสามารถทํางานรวมกันได • Network services เปนการเตรียมความพรอมดานเครือขายเพื่อการสื่อสารขอมูลผาน เครือขายคอมพิวเตอรระดับตาง ๆ เพื่อความสะดวกในการเขาถึงและเรียกใชขอมูลทั้งจาก ระยะใกลและไกล จากคอมพิวเตอรของผูใช รวมทั้งการรักษาความปลอดภัยของเครือขาย ไดแก การเขาถึงขอมูล (Access) การพิสูจนตัวจริง (Authentication) การรักษาความลับ

122


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

(Confidentiality) การรักษาบูรณภาพ (Integrity) การปฏิเสธการเขาใชไมได (Nonrepudiation) และการควบคุมดูแลการสื่อสารระหวางผูสงและผูรับในเครือขาย • Security services เปนบริการรักษาความปลอดภัยของขอมูล ซึ่งจะจําแนกระดับการรักษา ความปลอดภัยตามความสําคัญของขอมูล เชน ผูจัดสงขอมูลเขามาในระบบตองไดรับการ พิสูจนตัวจริง ผูที่จะเขาถึงขอมูลในระดับตาง ๆ ตองไดรับการพิสูจนตัวจริงและตรวจสอบ สิ ท ธิ ใ นการใช แ ละการทํ า งาน ข อ มู ล ที่ จ ะจั ด เก็ บ ถาวร และข อ มู ล ที่ จั ด ส ง ให ผู ใ ช ต อ งมี บูรณภาพ เปนตน 2. Ingest หรือ การรับขอมูลเขา ทําหนาที่ ดังนี้ • ตรวจรับ Submission Information Package (SIP) หรือสารสนเทศที่จัดสงมาจากผูผลิตที่ เปนสมาชิกวาถูกตองสมบูรณหรือไม การจัดสงขอมูลเขามาอาจมาจากหลายวิธี เชน FTP, อาน จากสื่อบันทึกขอมูล เชน CD-ROM หรืออาจจัดสงเขามาทางไปรษณียในรูปแบบที่ ไมใชดิจิทัล • การตรวจสอบคุณภาพของ SIP ที่จัดสงเขามา SIP ตองสามารถทํางานไดอยางสมบูรณ • นํา SIP ที่ตรวจสอบคุณภาพแลวมาจัดทํา Archival Information Package (AIP) หรือการ จั ด ทํ า ให อ ยู ใ นรู ป แบบที่ จ ะเก็ บ รั ก ษาในระยะยาว เช น การแปลงให อ ยู ใ นรู ป แบบไฟล มาตรฐานที่กําหนด จัดทํา Descriptive Information เพื่อบรรยายลักษณะเอกสารและใช ประโยชนในการเขาถึงสารสนเทศ และจัดทํา Preservation Description Information ( หรือ Preservation Metadata) หรือขอมูลที่อธิบายหรือใหรายละเอียดเกี่ยวกับการเก็บรักษา สารสนเทศดังกลาว โดยจะจัดทําขอมูลนี้แยกจากตัว SIP

3. Archival Storage เปนการจัดเก็บขอมูลเพื่อเก็บรักษาในระยะยาว ดังนี้ • ตรวจรับเพื่อนํา AIPs มาเก็บไวในสวนการจัดเก็บขอมูลถาวร • จั ด ลํ า ดั บ ความสํ า คั ญ ของข อ มู ล เพื่ อ แบ ง ลํ า ดั บ ชั้ น ของการจั ด เก็ บ การเรี ย กใช แ ละการรั ก ษา ความปลอดภัย

123


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

เตรียมการสํารองขอมูล และขอมูลที่เกี่ยวของในการจัดทําขอมูลขึ้นมาใหม (Reproduce) หรือ การโอนยายขอมูล เพื่อไมใหขอมูลสูญหาย และไมใหการทํางานเสียหาย • การตรวจสอบขอผิดพลาดและเตรียมการแกไขขอผิดพลาดที่อาจเกิดขึ้น • การบันทึกขอมูลลงบนสื่อบันทึกขอมูลที่สามารถเคลื่อนยายได เชน Compact disc แตสามารถ ทํางานผานระบบเครือขายได เพื่อความปลอดภัยของขอมูลกรณีที่เกิดภัยพิบัติ • จัดเตรียมขอมูลในรูปแบบที่ผูใชสามารถเขาถึงและนําไปใชได 4. Data Management ไดแก หนาที่ในการจัดการขอมูล ดังนี้ • Administer database ไดแก การทําหนาที่ดูแลบูรณภาพของการจัดการขอมูลในฐานขอมูล ซึ่ง ขอมูลที่อยูในความดูแลไดแก Preservation Descriptive Information และ System information ซึ่งเปนขอมูลสนับสนุนการดําเนินงานเก็บรักษาสารสนเทศดิจิทัล • รับคําคน (Queries ) จากผูใชมาประมวลผลและสงผลการคนใหกับผูใช • จัดทํารายงานตามคําขอของงานตาง ๆ เชน Ingest, Access หรือ Administration • แกไขปรับปรุงขอมูล 5. Administration หรือการทําหนาที่ในสวนของการบริหารจัดการ ดังนี้ • ทําการเจรจาเพื่อหาขอตกลงรวมกัน กับผูผลิตสารสนเทศ ในการจัดสงสารสนเทศ สิทธิในการ จัดการและการเปนเจาของสารสนเทศ • ทําหนาที่ติดตามดูแลการทํางานของระบบการเก็บรักษาขอมูลทั้งระบบ เพื่อจัดทํานโยบายและ มาตรฐานดานตาง ๆ เพื่อความสมบูรณของระบบ • ดูแลการแกไขปรับปรุงขอมูล • ดูแลความปลอดภัยของสถานที่ • จัดทํานโยบายและมาตรฐานในการเก็บรักษาสารสนเทศ • ตรวจสอบความถูกตองของการนําขอมูลเขามาในระบบใหเปนไปตามเงื่อนไขที่กําหนดไว • ดูแลจัดการขอมูลใหพรอมใชตามการรองขอ • การเตรียมความพรอมในสวนของการบริการลูกคา เชน การจัดเก็บคาบริการ การรับขอคิดเห็น จากลูกคา เปนตน 6. Preservation Planning หรือการวางแผนในการอนุรักษสารสนเทศดิจิทัล ดังนี้ • ติดตามการใชงานของกลุมผูใชหลัก และผูผลิต เพื่อปรับปรุงระบบใหสอดคลองกับความตองการ และการใชงานของผูใช ทั้งในสวนของ คอมพิวเตอรแพลตฟอรม รูปแบบแฟมขอมูล และ สื่อบันทึกขอมูล • ติดตามเทคโนโลยีดิจิทัล ทั้งในสวนของคอมพิวเตอรแพลตฟอรม (ฮารดแวร และซอฟตแวร) และ มาตรฐานของขอมูล ทั้งนี้เพื่อสามารถเลือกวิธีการอนุรักษขอมูลที่เมาะสมที่สุด และวางแผนการ เก็บรักษาขอมูลไดถูกตองเหมาะสม • พัฒนาวิธีการและมาตรฐานในการอนุรักษขอมูล เพื่อสามารถตอบสนองความตองการของผูใช และเพื่อใหสอดคลองกับพัฒนาการของเทคโนโลยี •

124


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

พัฒนารูปแบบของสารสนเทศ (Information packaging) วางแผนการโอนยายขอมูล เพื่อนํา นโยบายจากฝายบริหารมาปฏิบัติ 7. Access เปนกิจกรรมการเตรียมความพรอมในการเขาถึงสารสนเทศ ดังนี้ • ประสานกิ จ กรรมการเข า ถึ ง สารสนเทศของผู ใ ช โดยการจั ด เตรี ย มส ว นต อ ประสานกั บ ผู ใ ช ในการเขาใชสารสนเทศในระบบ • จัดทํา Deliver Information Package (DIP) หรือสารสนเทศฉบับที่จะจัดสงใหกับผูใช เพื่อความ สะดวกในการจัดสงขอมูล และความสะดวกในการเรียกใชงานของผูใช • การจัดสงขอมูลใหกับผูใชทั้งในแบบออนไลนและออฟไลน ตามความตองการของผูใช •

สรุปการทํางานของ OAIS ไดดังภาพ (Consultative for Space Data System, WWW, 2002)

125


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

126


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

วิธีการเก็บรักษาสารสนเทศดิจิทัล (Digital Preservation Strategies) วิธีการเก็บรักษาขอ มูลดิจิทัลสามารถทําไดหลายวิธี ไดแก Data Refreshing, Technology preservation, Technology emulation, Information Migration และ Encapsulation ซึ่งมีรายละเอียดดังนี้ 1. Data Refreshing ไดแก การคัดลอก (Copy) ขอมูลจากสื่อบันทึกขอมูลหนึ่งไปจัดเก็บยังสื่อบันทึกขอมูลอีกตัวหนึ่ง เมื่อสื่อบันทึกขอมูลเดิมลาสมัย หรือกอนที่สื่อบันทึกขอมูลเดิมจะเสื่อมสภาพ หรือใชงานไมได เชน คัดลอกขอมูล จาก Floppy disk ไปเก็บใน CD-ROM หรือ คัดลอกขอมูลจาก CD-ROM ไปเก็บใน DVD เปนตน การ Refreshing จะเกี่ยวของเฉพาะการเปลี่ยนตัวสื่อที่ใชบันทึกขอมูลเทานั้น จะไมมีผลใด ๆ ตอรูปแบบ (Format) ของขอมูล จึงเปนวิธีการเก็บรักษาขอมูลที่ไมมีความเสี่ยงตอความเสียหายของสารสนเทศดิจิทัล สารสนเทศจะ ยังคงมีบูรณภาพ (Integrity) หรือ ครบถวนสมบูรณเหมือนเดิมทุกประการ อยางไรก็ตาม เนื่องจากสื่อบันทึก ขอมูลดิจิทัลมีอายุการใชงานที่คอนขางสั้น ดังนั้นจึงจําเปนตองมีการยายขอมูลจากสื่อหนึ่งไปเก็บไวยังสื่อที่ ใหมกวา อยูตลอดเวลา และปญ หาสํา คัญ คือ ไม ส ามารถกํา หนดช ว งเวลาที่ แ นน อนได วา เมื่อ ใดควรมีการ โอนยายขอมูลไปเก็บยังสื่อบันทึกขอมูลตัวใหมเพื่อความปลอดภัยไมสูญหายของขอมูล เนื่องจากหากทําชาไป อาจไม สามารถเรี ย กขอ มูลออกมาใชไ ดเพราะเทคโนโลยีต กรุ น ไปแล ว แต ห ากทํา เร็ว เกิ น ไปก็จ ะสิ้น เปลือ ง คาใชจาย Refreshing จึงยังไมใชวิธีการที่เหมาะสมในการเก็บรักษาขอมูลในระยะยาว 2. Technology Preservation ในการเก็บรักษาขอมูลมีหลักสําคัญคือ ขอมูลจะตองสามารถเรียกออกมาอานและนํามาประมวลผลได ในอนาคต ซึ่งแนนอนวาจะตองอาศัยอุปกรณในการอานขอมูลจากสื่อบันทึกขอมูลดังกลาว เชน Disk drive ดังนั้น Technology preservation จึงไดแก การเก็บรักษาสิ่งแวดลอมดานเทคโนโลยีที่จะใชในการอานเอกสาร ดิจิทัล ทั้งในสวนของฮารดแวรและซอฟตแวร เชน ระบบปฏิบัติการ (Operating System) โปรแกรมเดิมที่ใชอาน หรือสรางขอมูล (Original application software) ไดรฟที่ใชอานขอมูลจากสื่อบันทึกขอมูล (Media drives) เปนตน วิธีการนี้ จึงมีลักษณะคลายกับพิพิธภัณฑที่ตองเก็บรักษาทั้งฮารดแวรและซอฟตแวรที่ใชในการอาน ขอมูลที่เกิดขึ้นในแตละยุคสมัยไวอยางสมบูรณที่สุด ขอดีของวิธีการนี้คือ การรักษา “Look and Feel” ของ สารสนเทศดิจิทัล เนื่องจากเปนการเรียกดูจากสภาวะแวดลอมเดิม ดังนั้น สิ่งที่เกิดขึ้นจะมีลักษณะเหมือนเดิม ทุกประการ สําหรับสารสนเทศดิจิทัลบางประเภท Technology preservation อาจจะเปนวิธีการเก็บรักษาที่ดี ที่สุดสําหรับการเก็บรักษาในระยะสั้น เนื่องจากวิธีการนี้จะรับรองไดวาสารสนเทศที่จัดเก็บไวจะสามารถเขาถึง และเรี ย กออกมาใช ไ ด อ ย า งแน น อน เนื่ อ งจากมี ก ารเก็ บ รั ก ษาสิ่ ง แวดล อ มด า นเทคโนโลยี ไ ว อ ยา งสมบู ร ณ เชนเดียวกับการเก็บรักษาตัวทรัพยากรสารสนเทศดิจิทัล (Lee, Slattery, Lu, Tang and McCrary, 2002) อยางไรก็ตาม การอนุรักษดวยวิธีนี้มีสิ่งที่ตองพิจารณาคือ ปริมาณสถานที่หรือพื้นที่ที่จะตองใชในการจัดเก็บ ฮารดแวรและซอฟตแวรที่เกี่ยวของ และตนทุนที่จะเกิดขึ้นในการบํารุงรักษา เพื่อเก็บรักษาสภาพแวดลอมดาน เทคโนโลยีเหลานี้ใหใชงานไดในอนาคต โดยเฉพาะในสวนของฮารดแวรซึ่งยอมเสื่อมสภาพไปตามกาลเวลา และ อะไหล ที่ใ ช ใ นการซอ มบํ า รุง ซึ่ ง อาจเลิก การผลิต ไปแลว ซึ่ง เปน ขอ จํา กั ดที่ สํา คัญ ของการเก็บ รัก ษาดว ยวิ ธี Technology preservation

127


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

3. Technology Emulation จะมีลักษณะคลายกับวิธี Technology preservation คือ จะมุงเนนที่การเก็บรักษาโปรแกรมดั้งเดิมที่ ใชสรางเอกสาร โดยมีแนวคิดหลักคือ การเลียนแบบ (Emulation) สภาพแวดลอมดานแพลตฟอรม (Platform) เพื่อให สามารถอานเอกสารดิจิทัล โดยใช โปรแกรมดั้งเดิมที่ใชในการสรางขอมูลได โดยเปน การทํางานบน แพลตฟอรมใหมที่นํามาใชงานแทนแพลตฟอรมเดิม โดยจะพัฒนา Emulator Program ซึ่งเปนโปรแกรมจําลอง สภาพแวดลอมดานแพลตฟอรมเดิมขึ้นมา ไดแก ฮารดแวร และระบบปฏิบัติการ ที่สามารถเรียกอานขอมูลจาก โปรแกรมดั้งเดิมได เชน โปรแกรม Commoder 64 พัฒนาขึ้นมาใหสามารถเรียกใชงานโปรแกรมที่ทํางานบน PC ได (National Library of Autralia, WWW, 2002) ดังนั้น Technology emulation จึงไมรวมการจัดเก็บฮารดแวร และระบบปฏิบัติ การเดิมไวดวยเปาหมายหลักของ Technology emulation ก็คือ นอกจากรักษาเนื้อหา (Content) แลวยังตองการรักษา “Look and Feel” ของสารสนเทศดิจิทัลใหคงลักษณะเหมือนเดิมทุกประการ ดวย ดังนั้น สิ่งที่จําเปนสําหรับวิธีการนี้คือ การลอกแบบบริบทดานเทคนิคของทรัพยากรที่จะทําใหการเรียกใช สารสนเทศดิจิทัลในอนาคตทําไดอยางสมบูรณ และเมื่อมีแพลตฟอรมออกมาใหมก็ยอมตองสราง Emulation program ขึ้ นมาใหมเสมอ อยางไรก็ตาม การคาดหมายเกี่ยวกับเทคโนโลยีที่จะเกิดขึ้นในอนาคตเพื่ อ สรา ง Emulation program ยังคงเปนสิ่งที่คาดการไดยาก และตองใชการลงทุนสูง (TASI, WWW, 2002) และดวย หลักการของ Technology emulation ทําใหนักวิจัยหลายคนเชื่อวา Technology emulation เปนวิธีการที่ดีที่สุด ในการเก็บรักษาสารสนเทศดิจิทัลในระยะยาว (Deegan and Tanner, 2002; Ganger, WWW, 2000; Rothenenberg, WWW,1999; TASI, WWW, 2002) อยางไรก็ตาม เฮนดเลย (Hendley) ชี้วา Technology emulation นาจะเหมาะนํามาใชในกรณีที่ไมสามารถแปลง (Convert) ทรัพยากรสารสนเทศดิจิทัลใหเปน Software independent format ได (Hendley, 1998) และในงานของแกงเกอร (Ganger) ที่ศึกษาถึงขอดี ขอดอยของ Technology emulation ไดใหขอสรุปวา Technology emulation ไมใชวิธีการที่ดีที่สมบูรณที่สุดใน การเก็บรักษาสารสนเทศดิจิทัล แตตองใชรวมกับวิธีการอื่น ๆ ขึ้นอยูกับความเหมาะสมของแตละสถานการณ (Ganger, WWW, 2000) 4. Information Migration วิธีการนี้จะแตกตางจาก 3 วิธีการแรก เนื่องจาก 3 วิธีแรกจะเนนที่เทคโนโลยีที่ใชในการเขาถึงและการ เรียกใชสารสนเทศดิจิทัลโดยไมยุงเกี่ยวกับรูปแบบ (Format) ของตัวสารสนเทศ แต Information Migration จะ เนนที่การโอนยาย (Transfer) สารสนเทศจากฮารดแวรและซอฟตแวรระบบหนึ่ง (HW/SW Configuration) ไปสู อีกระบบหนึ่ง หรือจากฮารดแวรและซอฟตแวรรุนหนึ่ง (HW/SW Generation) ไปยังอีกรุนหนึ่ง จุดมุงหมายหลัก ของ Information Migration คือ บูรณภาพ (Integrity) หรือการเก็บรักษาความถูกตองสมบูรณ ของสารสนเทศ ดิ จิ ทั ล และรั ก ษาความสามารถในการค น คื น การแสดงผล และการนํ า ข อ มู ล ไปใช ไ ด แ ม เ ทคโนโลยี จ ะมี การเปลี่ยนแปลงอยูเสมอ อยางไรก็ตาม วิธีการนี้มีขอดอยตรงที่ อาจทําใหเอกสารดิจิทัลสูญเสีย “Look and feel” หลังจากโอนยายขอมูล และที่สําคัญคือ อาจทําใหขอมูลบางสวนสูญหายระหวางการโอนยายขอมูล โดยเฉพาะขอมูลที่มีลักษณะซับซอน เชน เอกสารมัลติมีเดีย และเว็บเพจ เปนตน สิ่งที่ตองพิจารณาสําหรับวิธีการ Migration คือ การกําหนดตารางเวลาที่เหมาะสมในการโอนยาย ขอมูล (Migrate) เนื่องจากการคาดการณถึงความเปลี่ยนแปลงของเทคโนโลยีเปนสิ่งที่ทําไดยาก และขณะที่การ กําหนดระยะเวลาที่ขอมูลจะตองสามารถเขาถึงไดเปนประเด็นสําคัญที่ตองคํานึงถึงของวิธีการ Migration ยังมี

128


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

อีกสิ่งหนึ่งที่ตองใหความสําคัญเชนกัน คือ การรักษาความถูกตองสมบูรณของขอมูลใหมีอยูตลอดอายุการ เก็บรักษาของสารสนเทศ ทั้งนี้เพื่อสามารถใชเปนหลักฐานอางอิงได โดยเฉพาะในการทําธุรกรรมตาง ๆ การ เก็บรักษาบูรณภาพของเอกสาร (Record integrity) ประกอบดวย ความนาเชื่อถือ (Reliable) ความสมบูรณ ของเอกสาร (Completeness) การมีความจริงแท (Authenticity) และ มีเนื้อหาถูกตอง (Possess sufficient context) (National Archives of Australia, WWW, 1997) ความนาเชื่อถือ (Reliability) หมายถึง เอกสารตองเชื่อถือได ความนาเชื่อถือนี้พิจารณาจาก รูปแบบ และกระบวนการสรางเอกสาร และความนาเชื่อถือของบุคคลที่เกี่ยวของกับการสรางเอกสารนั้น ๆ ซึ่งจะให ความเชื่อถือที่ตัวสถาบันมากกวาบุคคล ความสมบูรณ (Completeness) เอกสารที่สมบูรณ จะประกอบดวย การใหขอมูลเกี่ยวกับ เวลาและ สถานที่ในการรับ-สงเอกสาร รายละเอียดเกี่ยวกับผูสงและผูรับ (ผูที่เอกสารจะถูกสงไปถึง) การลงลายมือชื่อ แสดงตัว การแจงชื่อเรื่อง หรือหัวขอของเอกสาร หรือการแสดงความจํานงของผูเขียน ความจริงแท (Authenticity) ความจริงแทของเอกสาร เปนความตองการในการเก็บรักษาประวัติ ความเปนมาในการสรางเอกสาร การโอนยายเอกสาร การใช และการเก็บรักษา ตั้งแตเริ่มตนการสรางจนถึง ปจจุบัน และมีประเด็นหนึ่งที่ตองพิจารณาคื อ เอกสารนั้นตองเปนเอกสารตนฉบับหรือไม ซึ่งในบริบทของ เอกสารอิเล็กทรอนิกสจะตางจากเอกสารกระดาษ ซึ่งเอกสารกระดาษจะหมายถึงการเก็บรักษาตัวเลมของ เอกสาร แตในบริบทของเอกสารอิเล็กทรอนิกส คําวา ตนฉบับ (Original) จะหมาถึง ตัวเนื้อหา (Content) โครงสราง (Structure) และ บริบท (Context) ของการทํางานเดิม ไมไดหมายความวาตองเก็บทุกคุณลักษณะ ของฮารดแวรและซอฟตแวรดั้งเดิม ดังนั้น จึงหลีกเลี่ยงไมไดวา อาจมีการสูญหายบางสวนเกิดขึ้นในระหวาง ขั้นตอนของการทํา Migration จากซอฟตแวรรุนหนึ่ง (Version) ไปอีกรุนหนึ่ง หรือจากแพลตฟอรม (Platform) เกาไปยังแพลตฟอรมใหม ซึ่งการสูญหายนี้อาจจะยังสามารถยอมรับไดตราบใดที่ยังสามารถเก็บรักษาสิ่งที่แสดง ถึงความถูกตอง หรือความจริงแทของเอกสารเอาไวได บริบท (Context) จะเกี่ยวของกับการเชื่อมโยงระหวางการทํางาน หรือ การเชื่อมโยงระหวางเอกสาร หรือตัวขอมูลกับกระบวนการในการบริหารจัดการที่เกี่ยวของ ตัวอยางเชน การเชื่อมโยงที่เกิดขึ้นจํานวนมาก ระหว า งการทํ า งานแต ล ะครั้ ง เช น ข อ มู ล ของผู โ ดยสารที่ เ มื่ อ มาถึ ง สนามบิ น จะเชื่ อ มโยงกั บ ข อ มู ล ของ กองตรวจคนเขาเมืองและหนวยงานดานการทองเที่ยว เปนตน 5. Encapsulation วิธีการ Encapsulation มีจุดมุงหมายเพื่อแกไขปญหาการตกรุนของเทคโนโลยีในสวนของรูปแบบ แฟมขอมูล (File formats) โดยการจัดทํารายละเอียดเกี่ยวกับการแปล Digital object จัดรวมไวเปนสวนหนึ่งของ encapsulate information วิธีการนี้จะเกี่ยวของกับการสราง Original application เคยที่ใชสรางและเขาถึง ทรัพยากรสารสนเทศดิจิทัลบนคอมพิวเตอรแพลตฟอรมในอนาคต สวนหนึ่งของกระบวนการนี้อาจตองทําการ Migration เพื่อใหตัวทรัพยากรอยูในรูปแบบไฟลที่จัดการไดงายขึ้น Encapsulation ไดแก เทคนิคในการรวมตัวทรัพยากรสารสนเทศดิจิทัล และทุกอยางที่จําเปนตอการ สรางและเขาถึงทรัพยากรสารสนเทศดิจิทัล นั้น ๆ เขาไวดวยกันใน Container ที่สรางขึ้น ซึ่ง AOIS ไดอธิบาย ความหมายของวิธีการ encapsulation ไววา เปนการจัดเก็บตัวทรัพยากรสารสนเทศ (Information package) และขอมูลที่ใชอธิบายวิธีการจัดเก็บทรัพยากร (Preservation description หรือ Preservation metadata)

129


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

ไวดวยกันใน Information packaging (OAIS, WWW, 2002) วิธีการ Encapsulation มีจุดมุงหมายเพื่อแกไข ปญหาการตกรุนของเทคโนโลยีในสวนของรูปแบบแฟมขอมูล (File formats) เนื่องจากรายละเอียดของวิธีการ แปล Digital bit ในทรัพยากรสามารถเปนสวนหนึ่งของ Encapsulated information วิธีการ Encapsulation จะสําเร็จไดก็โดยการใช Physical หรือ Logical structures ที่เรียกวา "Containers" หรือ "Wrappers" เพื่อสราง ความสัมพันธระหวางทุกองคประกอบของสารสนเทศ เชน ตัวทรัพยากรกับขอมูลสนับสนุนอื่น ๆ อาทิ Persistent identifier (การระบุตําแหนง/ที่อยูของสารสนเทศดิจิทัลอยางตอเนื่องแมเมื่อสารสนเทศมีการเปลี่ยนแปลงที่อยู ทั้งนี้เพื่อใหผูใชสามารถเขาถึงสารสนเทศได) Metadata และ Software specification สําหรับการทํา Emulation วิธีการ Encapsulation อาจประกอบดวยทั้ง Analogue components และ Digital components ตัวอยางในสวนของ Analogue components จะเปนคําแนะนําที่มนุษยสามารถอานได เชน คําแนะนําที่เขียนไว บนตัวสื่อบันทึกขอมูล หรือ กลอง หรือ วัสดุที่หอหุมตัววัสดุสารสนเทศ โดยจะเปนคําแนะนําในการใช สื่อบันทึก และวิธีการแปลขอมูลที่อยูในสื่อ (Carrier) โดยในสวนของ Analogue components อาจตองมีการเปลี่ยนหรือ Refresh ประเภทของขอมูลสนับสนุน (Supporting information) ที่ตองเก็บรวมไวในการ Encapsulation (แตตองแยกออกไวตางหากกับตัวทรัพยากรสารสนเทศดิจิทัล ไดมีการอธิบายไวใน OAIS ซึ่งอางอิงจากรายงาน การศึกษาเรื่อง "Preserving Digital Information" from the Task Force on Archiving of Digital Information” อาจสรุปไดวา สารสนเทศเหลานี้ไดแก ขอมูลที่เปนตัวแทนที่จะใชในการแปลบิตที่เหมาะสมตอการเขาถึงขอมูล ที่จะอธิบายแหลง (Source) ของวัสดุสารสนเทศดิจิทัล บริบทที่จะอธิบายความสัมพันธระหวางวัสดุสารสนเทศ ดิจิทัลสารสนเทศที่อยูภายนอก Container การอางอิงเพื่อชี้ไปยังที่อยูของวัสดุสารสนเทศ และ ขอกําหนดที่ แนนอนในการสรางเอกสารที่หามมีการเปลี่ยนแปลง ทางเลือกในการจัดเก็บขอมูลที่เปนตัวแทนเพื่อใชในการถอดรหัส Bit stream ของวัสดุสารสนเทศ ดิจิทัลที่เก็บรักษาไว ก็คือ การจัดเก็บสิ่งที่จะบงชี้ไปยังตําแหนงที่จัดเก็บสารสนเทศแตละตัว ซึ่งควรจะจัดเก็บไวที่ แหลงเดียวกัน (Repository) หรือ เก็บไวที่ศูนยกลาง งานวิจัยที่เกี่ยวของ เชน การวิจัยเรื่อง “Bento container” ของ Apple computer เพื่อศึกษาการเพิ่ม ความสามารถในการเขากันได (Compatibility) ของขอมูลระหวางโปรแกรมคอมพิวเตอรแตละตัว โดย Bento จะ เปนรูปแบบเฉพาะในการจัดเก็บและแลกเปลี่ยนตัวเนื้อหาที่มีลักษณะผสมผสาน และออกแบบมาเพื่อเปน แพลตฟอรมและเนื้อหาที่เปนกลาง ดังนั้น Bento จะสราง Container ที่สะดวกตอการขนสงขอมูลที่มีลักษณะ ผสมผสานทุกประเภทระหวางแพลตฟอรมที่หลากหลาย ในสวนงานวิจัยในปจจุบัน ผูที่สนับสนุนการใชวิธีการนี้ ในการเก็บรักษาสารสนเทศดิจิทัล คือ เจฟ โรเธ็นเบิรก (Jeff Rothenberg) ในงานศึกษาเรื่อง "Avoiding Technological Quicksand" อีกคนหนึ่งคือ ไมเคิล เดย (Michael Day) แหง CEDARS (Metadata for Preservation CEDARS Project Document AIW01 Issues และ Approaches to Preservation Metadata) และ ทอม เชฟเพิรด(Tom Shepard) แหง UPF (Universal Preservation Format (UPF) ในงานเรื่อง Conceptual Framework (Lee, Slattery, Lu, Tang and McCrary, 2002) อยางไรก็ตาม จะเห็นวา วิธีการ Encapsulation ดูคลายกับเปนวิธีการหนึ่งของ Information migration แมว าข อมูลที่เปนทางการเหลา นี้จะชว ยเลื่อนเวลาของการทํา Migration ออกไปบา ง แตอ ยา งไรก็ตาม Encapsulated information ก็ยังตองการการทํา Migration เชนเดียวกัน

130


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

ประเด็นที่ตองพิจารณาในการอนุรักษสารสนเทศดิจิทัล ประเด็นดานที่เกี่ยวของกับการอนุรักษสารสนเทศดิจิทัล มี ดังนี้ 1. Preservation Metadata Preservation metadata พัฒ นาขึ้น มาเพื่อ สนับ สนุน และอํา นวยความสะดวกในการเก็บ รั กษา สารสนเทศดิ จิ ทั ล ในระยะยาว หากจะพู ด ให เ จาะจงก็ คื อ Preservation metadata อาจจะนํ า มาใช ใ น การจัดการดิจิทัลคอลเล็คชั่น เชน จัดเก็บ ขอมูลเชิงเทคนิค (Technical information) ที่จะใชสนับสนุนการ ตัดสินใจและการปฏิบัติในการอนุรักษสารสนเทศดิจิทัล จัดเก็บขอมูลเกี่ยวกับการอนุรักษที่ทําผานมา บันทึกผล ที่เกิดจากการอนุรักษขอมูลดวยวิธีการตาง ๆ แสดงถึงความมั่นใจดาน Authenticity ของทรัพยากรสารสนเทศ ดิจิทัล แต Preservation metadata จะไมใชขอมูลเกี่ยวกับ การจัดการคอลเล็คชั่น (Collection management) และการจัดการดานสิทธิ (Management of rights) อาจกลาวโดยสรุปวา Preservation metadata คือ ขอมูล หรือรายละเอียดเชิงเทคนิคตาง ๆ ที่จําเปนตอการอนุรักษสารสนเทศดิจิทัล อาทิ รูปแบบไฟล โครงสรางของ ข อ มู ล วิ ธี ก ารเรี ย กใช ข อ มู ล ประวั ติ ก ารอนุ รั ก ษ ที่ ทํ า ผ า นมา ทั้ ง ในส ว นของวิ ธี ก ารและการตั ด สิ น ใจ ดั ง ที่ กิลลิแลนด-สเว็ทแลนด (Gilliland-Swetland) กลาววา การที่ทรัพยากรสารสนเทศดิจิทัลจะถูกสรางขึ้นมาได และสามารถที่จะอยูรอดไดเพื่อใหสามารถเรียกกลับมาใชไดอีก โดยกระบวนการ Migration จากคอมพิวเตอร ฮารดแวรและซอฟตแวรรุนหนึ่งไปยังอีกรุนหนึ่ง หรือโดยการลบออกมาแลวจัดสงไปยังระบบใหมทั้งหมดไดนั้น จําเปนจะตองอาศัย Metadata ที่จะบอกถึงวิธีการเขาถึงและเรียกใชขอมูลดังกลาว (Deegan and Tanner, 2002) ดังนั้น preservation metadata จึงมีความสําคัญในการอนุรักษสารสนเทศดิจิทัล ในฐานะที่เปนขอมูลใน การจัดการการเก็บรักษาสารสนเทศดิจิทัลอีกที ขณะที่ Descriptive metadata schemas เชน MARC หรือ Dublin Core จะใชเพื่อ อธิบายลักษณะ และการคนหาทรัพยากรสารสนเทศดิจิทัล อาจกลาวไดวา Preservation metadata เปนเซ็ตยอยของ Administrative metadata เนื่องจากใหขอมูลในสวนของการจัดการสารสนเทศ และขอมูลในดานเทคนิค เกี่ยวกับวิธีการเขาถึงเนื้อหาของทรัพยากรสารสนเทศดิจิทัล รวมทั้ง Authenticity information เชน คุณลักษณะ ด า นเทคนิ ค ประวั ติ ก ารเก็ บ รั ก ษา และข อ มู ล เกี่ ย วกั บ สิ ท ธิ ใ นการปกิ บั ติ เ พื่ อ อนุ รั ก ษ ข อ สารสนเทศดิ จิ ทั ล (National Library of Australia. Preservation Services Branch, WWW, 2003) งานวิจัยดาน Preservation metadata มีการศึกษาพัฒนาอยางกวางขวาง เพื่อหาแนวทางในการ กําหนด Metadata elements set อยางเหมาะสม โดยหลายโครงการไดยึดการพัฒนา Preservation metadata ตามรูปแบบของ OAIS ทั้งนี้ เพื่อใหมั่นใจวาครอบคลุมขอมูลที่จําเปนตอการอนุรักษสารสนเทศดิจิทัลไวทั้งหมด OAIS ไดจําแนกขอมูลที่เปนตอการอนุรักษสารสนเทศดิจิทัล ไว ดังนี้ - Content Information - Representation Information - Preservation Description Information (broken down into Reference, Context, Provenance, and Fixity Information) - Packaging Information. กลุมที่ทําการบุกเบิกงานวิจัยดาน Preservation metadata ในกลุมของหองสมุด ไดแก CEDARS (CURL Exemplars in Digital Archives), NEDLIB (The Network European Deposit Library) , PANDORA

131


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

(Preserving and Accessing Networked Documentary Resources of Australia) ของ The National Library of Australia, OCLC/RLG Working Group on Preservation Metadata. ซึ่งไดพยายามพัฒนา Framework เพื่อนํา Preservation metadata ไปใชจริงในทางปฏิบัติ โดยยึดตาม OAIS reference model โดย ทดลองกับทรัพยากรบางประเภท เชน จดหมายเหตุ ภาพถายที่แปลงใหอยูในรูปดิจิทัล (Digitised images) เปนตน 2. Authenticity and Integrity Authenticity ของทรัพยากรสารสนเทศดิจิทัล จะหมายถึง ระดับความเชื่อมั่นที่ผูใชจะไดรับจาก ทรัพยากรสารสนเทศดิจิทัลวา ทรัพยากรจะยังคงเหมือนเดิมกับที่มีการอางอิงไวหรือไม (เนื้อหาของทรัพยากร ตองเปนอยางที่ควรจะเปน หรือเปนอยางที่แจงไว แสดงถึงความจริงแทของสารสนเทศ) Integrity หรือ บูรณภาพ คือ ความถูกตองสมบูรณของขอมูล ที่จะไมถูกทําใหเปลี่ยนแปลงไมวากรณี ใด ๆ การที่ตองใหความสําคัญดาน Authenticity เนื่องดวยสภาพแวดลอมแบบดิจิทัลมีความเอื้ออํานวยตอ การแกไข การทําซ้ํา ทั้งการทําซ้ําในรูปแบบเดิมและการผลิตออกมาในรูปแบบใหม วิธีการที่ใชในการแปลง การจัดเก็บ และการโอนยาย หรือ การสรางวัสดุสารสนเทศดิจิทัลอาจทําใหสารสนเทศถูกตัดทอน หรือผิดเพี้ยน ไป หรือขอมูลบางสวนสูญหายไป ดังนั้น ในกระบวนการของการ Migration จากระบบหนึ่งหรือ จากรูปแบบหนึ่ง ไปยังอีกระบบหนึ่งหรือรูปแบบหนึ่ง อาจทําใหขอมูลเปลี่ยนไปจากเดิม ซึ่งขอมูลที่สูญหายไปก็เปนขอมูลหนึ่งที่ ตองถูกเก็บรักษาไวเชนกัน การคาดหวังใหเอกสารสามารถทํางานไดจะขึ้นอยูกับซอฟตแวรและความสัมพันธกับ เอกสารอื่น ๆ ซึ่งคุณลักษณะตาง ๆ เหลานี้มีความจําเปนตอการสรางความนาเชื่อถือดานความจริงแทของ เอกสาร หรือ Authenticity นั่นเอง วิธีการที่เหมาะสมในการเก็บรักษาขอมูลเพื่อคงไวซึ่ง Authenticity ขึ้นอยูกับ วัตถุประสงคของการเก็บรักษาสารสนเทศดิจิทัล วา Authenticity มีความสําคัญมากนอยเพียงใด และตองการ รักษาไวในระดับใด วิธีการเหลานี้ อาทิ การะบุ URI การจัดทํา Metadata การระบุวันที่ การใสลายมือชื่อดิจิทัล เปนตน นอกจากนี้ การสราง Authenticity ยังสามารถใชวิธี Encapsulation และ Encryption หรือการ เขารหัสลับ ในกรณีของการใส Water mark อาจใชไดกับซอฟตแวรบางตัวเทานั้น และใชเพื่อปองกันการทําซ้ํา เทานั้น สวนลายมือชื่อดิจิทัลจะใชเพื่อบันทึกความเปนเจาของและบงบอกถึงบาทของเจาของลายเซ็นที่มีตอ เอกสาร 3. ตนทุน (Costs) แมวาคาใชจายในการอนุรักษสารสนเทศดิจิทัลใหสามารถเขาถึงไดในระยะยาวจะประเมินไดยาก อย า งไรก็ ต าม ค า ใช จ า ย หรื อ ต น ทุ น นี้ เ ป น สิ่ ง สํ า คั ญ ประการหนึ่ ง ที่ ต อ งพิ จ ารณา และควรทํ า การศึ ก ษา เปรียบเทียบตนทุนของวิธีการอนุรักษสารสนเทศดิจิทัลแตละวิธี เนื่องจากตนทุนในการดูแลและเก็บรักษา สารสนเทศ ดิจิทัลในระยะแรกจะสูงกวาสารสนเทศที่อยูในรูปกระดาษ (Phillips, WWW, 1999; Research Libraries Group, WWW, 1996) อยางไรก็ตาม จากบทความเรื่อง Digital Conversion of Research Library Materials สตีเฟน แชปอมน และ แอนเน เคนนี (Stephen Chapman and Anne Kenny) รายงานวา จาก การศึกษาเปรียบเทียบเชิงเศรษฐศาสตรระหวางหองสมุดกระดาษกับหองสมุดดิจิทัล พบวา หองสมุดดิจิทัล มีตนทุน-ประสิทธิผล (Cost-effective) สูงกวาหองสมุดกระดาษ จากขอพิสูจน 4 ขอ คือ สถาบันสามารถใช ดิจิทัลคอลเล็คชั่นรวมกัน ดิจิทัลคอลเล็คชั่นสามารถตอบสนองความตองการของผูใชไดมากกวา การเขาถึง 132


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

แบบอิเล็กทรอนิกสทําใหการเขาใชสารสนเทศเพิ่มมากขึ้น และในระยะยาวดิจิทัลคอลเล็คชั่นจะไมเพิ่มตนทุน ทั้งในสวนของการดูแลรักษาและการจัดสงสารสนเทศ (Chapman and Kenny, WWW, 1996) โทนี เฮนเลย (Tony Hendley) ไดเสนอแนะการวิเคราะหตนทุนของสารสนเทศดิจิทัลออกเปน 7 งาน ไดแก การสรางขอมล (Data creation), การคัดเลือกประเมินขอมูล (Data selection and evaluation), การ จัดการขอมูล (Data management), การแสดงทรัพยากร (Resource disclosure), การใชขอมูล (Data use), การอนุรักษขอมูล (Data preservation) และการจัดการสิทธิ (Rights management) (Hendley, www, 1998) คาใชจายในการประเมินสารสนเทศดิจิทัล อาจประกอบดวย ตนทุนในการจัดการเอกสาร การนํา กระบวนการในการเก็บรักษาทรัพยากรสารสนเทศ เชน การ Refreshing ไปปฏิบัติ ทั้งนี้เพื่อใหมั่นใจไดถึง บูรณภาพของเอกสาร การประเมินโครงสรางของขอมูลกับการเปลี่ยนแปลงที่เกิดจากการเปลี่ยนรูปแบบไฟล การบีบอัด และการเขารหัส นอกจากนี้ตองคํานึงถึงตนทุนในการจัดเก็บขอมูล ซึ่งจะครอบคลุมถึงตนทุนในการ ทําสารสนเทศใหพรอมใช คือสามารถคนหาและเขาถึงได (Hendley, WWW, 1998) แมวาการจัดเก็บทรัพยากรประเภทกระดาษและทรัพยากรประเภทอื่นที่ไมใชสื่อดิจิทัล จะมีตนทุนสูง และมีปญหาอยูบาง อยางไรก็ตาม ทรัพยากรกลุมนี้จะไมมีปญหาสําหรับการใชในระยะยาว ในทางตรงขามหาก เปนสารสนเทศดิจิทัล จะตองทําการดูแลรักษาโปรแกรมสําหรับเรียกใชเอกสารดังกลาวไวดวยเพื่อที่จะสามารถ เรียกใชงานไดในอนาคต ดังนั้นจึงจําเปนตองคํานึงตนทุนในการเก็บรักษาโปรแกรมเหลานี้ดวย 4. การคัดเลือก (Selection) เชนเดียวกับสารสนเทศในรูปแบบดั้งเดิมที่จะไมเก็บทุกอยาง แตจะคัดเลือกเก็บรักษาไวบางรายการ เทานั้น สารสนเทศดิจิทัลก็ตองมีกระบวนการในการคัดเลือกเพื่อจัดเก็บเชนเดียวกัน เพียงแตสารสนเทศดิจิทัลจะ มีกรอบระยะเวลาของการตัดสินใจที่สั้นกวา เนื่องจากสื่อบันทึกขอมูลดิจิทัลมีอายุการใชสั้นและตกรุนเร็ว หอสมุดแหงชาติออสเตรเลียไดกําหนดหลักเกณฑในการอนุรักษทรัพยากรสารสนเทศดิจิทัลเพื่อใหสามารถ เขาถึงไดในระยะยาวไว ดังนี้ : “การเขาถึงทรัพยากรสารสนเทศดิจิทัล ควรจะอนุรักษใหมีไวตราบใดที่ทรัพยากรสารสนเทศนั้นยังมี คุณคา หรือมีความสําคัญ ซึ่งอาจพิจารณาจากความสมดุลระหวางตนทุน และประโยชนที่ไดรับ รวมทั้งความ ตองการและความสนใจของผูใชในอนาคต” (National Library of Australia, www, 2003) หนวยงานที่มีนโยบายในการคัดเลือกทรัพยากรไวในคอลเล็คชั่น ไดแก หองสมุด พิพิธภัณฑและหอง แสดงภาพ ซึ่งนโยบายเหลานี้จะเปนจุดเริ่มตนอยางดีในการคัดเลือกทรัพยากรสารสนเทศดิจิทัลเพื่อทําการ อนุรักษ สําหรับหอจดหมายเหตุเปนหนวยงานที่มีการพัฒนาแนวทางในการคัดเลือกและเก็บรักษาทรัพยากร สารสนเทศมานานแลว ซึ่งจะมีรายละเอียดที่คอนขางชัดเจนทั้งในสวนของเกณฑการคัดเลือกและการกําหนด อายุการเก็บรักษาทรัพยากร อยางไรก็ตาม หากจะนํามาใชกับสารสนเทศดิจิทัลควรตองพิจารณาถึงประเด็นตอนี้ ดวย อาทิ ความนาเชื่อถือในเรื่องความจริงแทของขอมูล (Authenticity) ความสามารถในการเขาถึงไดเสมอ (Accessibility) และ บริบทแวดลอม (Context) อยางไรก็ตาม หลักการที่วา การเขาถึงทรัพยากรสารสนเทศ ดิจิทัล ควรจะอนุรักษใหมีไวตราบใดที่ทรัพยากรสารสนเทศนั้นยังมีคุณคา หรือมีความสําคัญนั้น ยังไมไดเปนที่ ยอมรับโดยทั่วไป ตัวอยางเชน ในที่ประชุมการระดมความคิดเกี่ยวกับหนาที่ความรับผิดชอบในการอนุรักษ ทรัพยากรสารสนเทศดิจิทัลในสหราชอาณาจักรและไอแลนด มีขอคิดเห็นวา เมื่อทรัพยากรไดรับการคัดเลือกแลว

133


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

วาจะตองทําการอนุรักษ ก็ควรที่จะไดรับการอนุรักษไวตลอดไป (Haynes, Streatfield, Jowett, and Blake, www,1997) นอกจากนี้ ยัง มี ป จจั ย อื่ น ๆ อาทิ ความเป น ไปได แ ละต น ทุ น ที่ เกี่ ย วขอ งกั บ การอนุ รั ก ษก ารเข า ถึ ง ทรัพยากร ที่ควรนํามาเปนเกณฑในการพิจารณาคัดเลือกทรัพยากรเชนเดียวกัน และสิ่งที่เกี่ยวของอื่น ๆ ไดแก รูปแบบแฟมขอมูลที่ใช การจัดการเอกสารที่ใช สิทธิ์ที่ติดมากับทรัพยากร ซึ่งจะมีผลตอการจัดหาทรัพยากรที่จะ นํามาใชเพื่อการดูแลรักษาการเขาถึงทรัพยากรสารสนเทศดิจิทัล เมื่อคัดเลือกวัสดุสารสนเทศที่ตองเก็บรักษา ไดแลว ประเด็นตอมาที่ตองพิจารณาควบคูกันไปคือ องคประกอบของทรัพยากรสารสนเทศดิจิทัลที่จะตอง เก็บรักษาไว เชน การเชื่อมโยงไปยังเอกสารอื่น การทํางานรวมกับเอกสารอื่น บริบทที่เกี่ยวของหรือสนับสนุน และ 'Look and Feel' ซึ่งอาจสูญหายไประหวางกระบวนการเก็บรักษา ซึ่งในบางกรณีอาจเปนไปไมไดที่จะ เก็บรักษาองคประกอบเหลานี้ไว เกณฑการพิจารณาเพื่ออนุรักษการเขาถึงทรัพยากรเหลานี้อาจตองนํามา พิจารณาเพื่อปรับปรุงแกไขอีกครั้งเมื่อเวลาผานไป การพิจารณาวาสารสนเทศใดที่ควรจะคัดเลือกเขามาเพื่อทําการเก็บรักษา ควรงมีการกําหนดวิธีการใน การแสวงหาทรัพยากรสารสนเทศดิจิทัลที่มีคุณคา การพิจารณาความคุมคาในการเก็บรักษา และใครที่ตองเปน ผูพิจารณา ทรัพยากรสารสนเทศดิจิทัลบางรายการผูผลิตทรัพยากรเองจะเปนผูนํามาเสนอตอสถาบันบริการ สารสนเทศ อย า งไรก็ ต าม สถาบั น บริ ก ารสารสนเทศยั ง คงต อ งพิ จ ารณาถึ ง กิ จ กรรมที่ ส ามารถกระทํ า กั บ สารสนเทศดังกลาวได โดยเฉพาะประเด็นดานกฎหมายที่เกี่ยวของกับเอกสารดิจิทัล 5. ความรวมมือ (Cooperation) ไดแกการทํางานรวมกันระหวางหอจดหมายเหตุกับหองสมุดดิจิทัล ในการแลกเปลี่ยนขอมูลและใช ขอมูลรวมกันได โดยอาศัยสิ่งแวดลอมที่มีอยูคือ อินเทอรเน็ต รูปแบบและกระบวนการทํางานที่ไดมาตรฐานควร ไดรับการพัฒนาอยางจริงจัง ในสังคมดิจิทัลซึ่งการติดตอสื่อสารและทํางานรวมกันสามารถทําไดผานทางเครือขายคอมพิวเตอร บทบาทและความสัมพันธขององคกรที่เกี่ยวของไดเปลี่ยนแปลงไป ผูออกแบบระบบสารสนเทศและผูจัดหา ผูสรางสรรคผลงาน สํานักพิมพ ผูเผยแพร ผูรวบรวม และผูใหบริการเขาถึงสารสนเทศ ตางตองมีบทบาทในการ สรางความเชื่อมั่นวาสารสนเทศดิจิทัลจะสามารถเขาถึง หรือเรียกออกมาใชไดในระยะยาว เนื่องจากกิจกรรมที่ เกิดขึ้นในแตละหนวยจะสงผลถึงหนวยอื่น ๆ ทั้งในปจจุบันและอนาคต ดังนั้น จึงควรมีการกําหนดบทบาทหนาที่ ความรับผิดชอบของแตละฝายอยางชัดเจน เพื่อความสอดคลองในการทํางานรวมกัน ทั้งในสวนของการสราง การใช การจัดการ การเผยแพร และการอนุรักษสารสนเทศดิจิทัล ลักษณะความรวมมือ อาจใชรูปแบบการกระจายความรับผิดชอบใหกับแตละหนวยงานซึ่งอาจแบง ตามเนื้อหาของสารสนเทศที่รับผิดชอบ เนื่องจาก จะมีความเขาใจและเห็นถึงความสําคัญของสารสนเทศที่ จัดเก็บและใหบริการไดชัดเจนกวา จาก Statement of Principles for the Preservation of and Long-Term Access to Australian Digital Objects, ซึ่งจัดทําโดยหอสมุดแหงชาติออสเตรเลีย ไดกลาวถึงลักษะของความ รวมมือไววา “การจัดหา การคัดเลือก การทํารายการ และการกําหนดอายุของสารสนเทศดิจิทัล จะประสบ ความสําเร็จมากที่สุดดวยความรวมมือในลักษณะการกระจายความรับผิดชอบใหกับแตละสถาบัน” (National Library of Australia, www, 2002)

134


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

บทบาทของผูสรางสรรคผลงาน (Role of Creators) จากรายงานการศึกษาของ the (US) Task Force on Archiving of Digital Information เรื่อง Preserving Digital Information: Final Report and Recommendations กลาววา “หากผูสรางสรรคผงาน/ ผูใหบริการ/เจาของทรัพยากรสารสนเทศดิจิทัลยอมรับถึงความรับผิดชอบเบื้องตนในการเก็บรักษาผลงานของ ตนเอง พวกเขาจะเริ่มมองเห็นหลักการของการเปนสวนหนึ่งในการโอนยาย (Migration) ขอมูล รวมทั้ง กระบวนการอื่น ๆ ในการอนุรักษขอมูลในทั้งขั้นตอนของการสรางสรรคผลงาน และการจัดทํา Metadata ที่ สําคัญและจําเปนตอการอนุรักษสารสนเทศซึ่งสถาบันบริการสารสนเทศจะไดนําไปปฏิบัติตอไป ซึ่งหากไมมี ความรวมมือนี้สถาบันบริการสารสนเทศอาจจะไมสามารถอนุรักษวิธีการเขาถึงทรัพยากรสารสนเทศเหลานี้ได แมวาตองการจะทําก็ตาม นอกจากนี้ หนวยงานขนาดใหญ เชน มหาวิทยาลัย ซึ่งเปนองคกรที่ผลิตสารสนเทศ ออกมาเปนจํานวนมาก หากตองการรวบรวมสารสนเทศของหนวยงานควรตองใหความสําคัญกับการกําหนด หนาที่ความรับผิดชอบในการอนุรักษสารสนเทศที่สรางขึ้นใหสามารถเขาถึงไดในระยะยาว (The Commission on Preservation and Access and The Research Libraries Group, WWW, 1996) บทบาทของสํานักพิมพ (Role of Publishers) บทบาทของสํานักพิมพในการอนุรักษสารสนเทศดิจิทัล คือ การเก็บรักษาสารสนเทศของสํานักพิมพให สามารถเขาถึงและเรียกออกมาใชงานไดในอนาคต และนอกจากนี้ในสวนของสํานักพิมพมีสิ่งที่ตองพิจารณา เพิ่มคือ การจัดเตรียมสารสนเทศดิจิทัลของสํานักพิมพใหอยูในรูปแบบที่เหมาะกับการใชงานในหองสมุดดวย เชน เปนรูปแบบ (Version) ที่สามารถผลิตซ้ําได เชน ในลักษณะของการพิมพออกทางเครื่องพิมพ การบันทึกลง สื่อบันทึกขอมูล การจัดสงทางจดหมายอิเล็กทรอนิกส ภายใตการคุมครองดานลิขสิทธิ์ บทบาทภายในองคกร (Roles within Organizations) ทุกแผนกภายในองคกรที่เกี่ยวของกับการอนุรักษสารสนเทศดิจิทัลใหสามารถเขาถึงไดในระยะยาว ตองไดรับการมอบหมายหนาที่ความรับผิดชอบที่ชัดเจน บุคคลเหลานี้ เชน ผูจัดการฝายธุรกิจ เจาหนาฝาย เทคโนโลยีสารสนเทศและการจัดการ และผูผลิตสารสนเทศแตละคน เปนตน

ตัวอยางโครงการที่ทําการศึกษาเกี่ยวกับการอนุรักษสารสนเทศดิจิทัล (Lee, Slattery, Lu, Tang and McCrary, 2002) 1. Australian projects เริ่มทําการศึกษาเกี่ยวกับ Digital preservation ตั้งแตป 1994 โดยใหความสนใจศึกษาการจัดเก็บ วัสดุดิจิทัลหลากหายประเภท อาทิ เอกสารอิเล็กทรอนิกส (Electronic records) สิ่งพิมพออนไลน (Online publications) ขอมูลเสียงที่อยูในรูปดิจิทัล (Digital audio resources) วิทยานิพนธ (Theses) วัสดุแผนที่ (Cartographic materials) โครงการที่สําคัญไดแก - The Victorian Electronic Records Strategy (VERS) ทําการพัฒนามาตรฐานในการจัดการและ เก็บรักษาเอกสารอิเล็กทรอนิกส ซึ่งวิธีการที่ VERS แนะนําคือ การ Encapsulate ตัวเอกสารและบริบทที่ เกี่ยวของไวกับเอกสารโดยใช XML

135


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

-

The Preserving and Accessing Networked Documentary Resources of Australia (PANDORA) ของหอสมุดแหงชาติออสเตรเลีย ทําการศึกษาการจัดเก็บเอกสารเว็บ โดยมี วัตถุประสงคหลัก คือ ตองการเก็บรักษาสิ่งพิมพออนไลนใหสามารถเขาถึงไดในระยะยาว โดย วิธีการที่ใชคือ Migration โดยทดลองกับเอกสาร HTML โดยทําการทดลองเปลี่ยนแปลง Source code ของเอกสาร HTML โดยนําแท็กที่เลิกใชแลวออกไปและนําแท็กใหมเขามาแทนที่ ทั้งนี้เพื่อให เขากันไดกับเว็บบราวเซอรในอนาคต

2. CEDARS เปนโครงการของ The Consortium of University Research Libraries ซึ่งเปนการรวมตัวกันของ หองสมุดมหาวิทยาลัยและหอสมุดแหงชาติในสหราชอาณาจักรและไอแลนด โครงการนี้ใชรูปแบบของ OAIS ซึ่ง เปนรูปแบบของงานจดหมายเหตุ โดยมีการเก็บรักษาขอมูลเปนระบบยอยรวมอยูดวย โดยโครงการลาสุดเปน การศึกษารวมกันระหวาง NEDLIB ในยุโรป CEDARS ในสหราชอาณาจักร และ PANDORA ในออสเตรเลีย CEDARS มีวัตถุประสงคเพื่อหาวิธีการที่เหมาะสมที่สุดในการเก็บรักษาขอมูล ทั้งนี้เพื่อสามารถใหคําแนะนําแก หองสมุดในการเลือกวิธีการปฏิบัติที่เหมาะที่ดีที่สุด นอกจากนี้ยังทําการศึกษาวิเคราะหถึงคาใชจายในการ เก็บรักษาขอมูล วิธีการที่ CEDARS สนใจศึกษาไดแก Migration, Emulation และ Data refreshing ซึ่งจาก การศึกษาเปรียบเทียบระหวางวิธีการ Migration กับ Emulation ในการเก็บรักษา Older digital materials พบวาทั้งสองวิธีเหมาะกับวัสดุดิจิทัลตางประเภทกัน และเชื่อวาไมมีวิธีใดที่จะสามารถแกปญหาทุกอยางได การ เลือกใชวิธีการอนุรักษเพื่อที่จะสามารถเขาถึงขอมูลไดอยางสมบูรณขึ้นอยูกับธรรมชาติของทรัพยากรแตละ ประเภท และวัตถุประสงคในการอนุรักษ นอกจากนี้ CEDARS ยังสนใจศึกษาในประเด็นการสูญเสียของขอมูล (Information loss) ที่เกิดจากการเก็บรักษาดวยวิธีตาง ๆ 3. CAMiLEON เปนโครงการที่ไดรับทุนสนับสนุนจาก Joint Information Systems Committee (JISC) ซึ่งอยูที่ สหราชอาณาจักร และ The National Science Foundation (NSF) ในสหรัฐอเมริกา โดยประเด็นที่สนใจศึกษา ไดแก การนําเทคโนโลยี Emulation ไปปฏิบัติในการเก็บ รักษาขอมูลดิจิ ทัล โดยสนใจในสวนของการศึกษา ศักยภาพของ Emulation ในการกําหนดอายุของฟงกชันการทํางานตาง ๆ และการรักษา Look and feel ของ วัสดุสารสนเทศดิจิทัล มีจุดมุงหมายเพื่อพัฒนาเครื่องมือ (Tools) แนวทาง (Guide line) และตนทุนของวิธีการ Emulation โดยศึกษาเปรียบเทียบกับวิธีการอื่น ๆ โดยทําการทดสอบกับผูใชทรัพยากรสารสนเทศดิจิทัลทั้งใน สิ่งแวดลอมเดิมและสิ่งแวดลอมเสมือนที่สรางขึ้น โดยนําเสนอแนวทางในการใชวิธีการ Emulation และอภิปราย วา Emulation เปนวิธีการที่ใชไดกับทั้งวัสดุสารสนเทศดิจิทัลที่มีลักษณะซับซอน ซึ่งรวมแฟมขอมูลกระทําการ (Executable file) ไวดวย และวัสดุสารสนเทศที่กระบวนการจัดการไมไดอยูในรูปของอิเล็กทรอนิกส 4. NEDLIB ดําเนินการโดยคณะกรรมการถาวรของ the Conference of European National Libraries (CENL) ในป 1998 โดยไดรับทุนสนับสนุนจาก European Commission’s Telematics Application Programme ซึ่ง ประกอบดวย หอสมุดแหงชาติในยุโรป 8 แหง หอจดหมายเหตุแหงชาติ 1 แหง และ สํานักพิมพชั้นนํา โดยผูนํา ของโครงการคือ หอสมุดแหงชาติเนเธอรแลนด มีวัตถุประสงคเพื่อพัฒนาโครงสรางรูปแบบการทํางานงาย ๆ

136


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

และเครื่องมือพื้นฐานในการสรางระบบเพื่อเก็บรักษาสิ่งพิมพอิเล็กทรอนิกส นอกจากนี้ โครงการนี้ยังประยุกตใช OAIS Migration model ดวย วัตถุประสงคหลักของโครงการ NEDLIB คือ เพื่อทําความขาใจถึงขอดีและขอดอย ของวิธีการเก็บรักษาขอมูลในระยะยาวแตละวิธี โดยทําการจําแนกลักษณะของสิ่งพิมพอิเล็กทรอนิกส และวัสดุ สารสนเทศดิ จิ ทั ล กลุ ม อื่ น ๆ การเก็ บ รั ก ษาที่ เ กี่ ย วข อ ง และความต อ งการด า นความจริ ง แท (Authenticity requirement) และเนนการศึกษาในดานตนทุน-ประสิทธิผล (Cost-effectiveness) ขอหามดานกฎหมาย ขอตกลงกับสํานักพิมพ และความตองการในการเขาถึงของผูใชสารสนเทศ เมื่อมีการนํานโยบายการเก็บรักษา ขอมูลมาใช อยางไรก็ตาม โครงการนี้ไดมุงการศึกษาไปที่ประเด็นดานเทคนิคในการเก็บรักษาขอมูลดิจิทัลซึ่งผูที่ ทําการศึกษาในระยะแรกคือ เจฟ โรเธนเบิรก (Jeff Rothenberg) โดยทดลองสราง Prototype ขึ้นมาเพื่อ ทดสอบวิธีการเก็บรักษาขอมูลตามวิธีการ Emulation โดยใช Commercial emulation tools เปนตัวทดสอบ ผลการทดลองพบวา Emulation นาจะทํางานไดตามทฤษฎี โดยสรุปวา Emulators ที่เหมาะสมสามารถใช แพลตฟอรมที่ตกรุนได 5. Kulturarw Heritage เปนโครงการของ Royal Library ในสวีเดน ทําการทดสอบทฤษฎีการรวบรวม (Collecting) การจัดการ จดหมายเหตุ (Archiving) และ การจัดเตรียมความพรอมเพื่อการเขาถึงเอกสารอิเล็กทรอนิกสของสวีเดน โดยใช Crawler หรือ Robot ในการรวบรวมเว็บเพจของสวีเดนแบบอัตโนมัติ แมวาในปจจุบันโครงการยังไมไดมุงเนน มาที่การเก็บรักษาขอมูล แตโครงการนี้กําลังขยายขอบเขตความรวมมือมายังหนวยงานในยุโรปตอนเหนือซึ่งอาจ ทําใหโครงการนี้เริ่มทําการศึกษาถึงวิธีการเก็บรักษาจดหมายเหตุเหลานี้ในระยะยาว 6. Library of Congress ปจจุบัน The Computer Science and Telecommunications Board (CSTB) แหง The National Academies มอบหมายให The Committee on the Information Technology Strategies รวมกับ Library of Congress เพื่อใหคําแนะนําเกี่ยวกับการเก็บรักษาสารสนเทศดิจิทัล ในรายงานของคณะกรรมการไดรวม ขอเสนอแนะเกี่ยวกับการขยายโครงสรางพื้นฐานดานเทคโนโลยี โดยเฉพาะในสวนของ เครือขาย ฐานขอมูล และการรักษาความปลอดภัยของเทคโนโลยีสารสนเทศ โครงการนํารองของหอสมุดรับสภาอเมริกันที่ทํารวมกับ Internet Archive มีวัตถุประสงคเพื่อจัดการจดหมายตุที่เปนเอกสารเว็บโดยทําการเก็บรักษาเว็บไซตดาน การเมืองทุกแขนง โดยใช Digital Library SunSITE Collection และ Preservation Policy ของ มหาวิทยาลัย แคลิฟอรเนียร เบรกลีย ซึ่งมีการรวบรวมขอมูลดิจิทัลหลายระดับ เปนแนวทาง 7. NARA: Persistent Archives and Electronic Records Management โครงการ NARA (National Archives and Records Administration) เปนโครงการที่ริเริ่มโดย San Diego Supercomputer Center โดยไดรับทุนสนับสนุนจาก NARA มีจุดมุงหมายเพื่อพัฒนาการ ดําเนินงานหมายเหตุอยางตอเนื่อง ทั้งนี้เพื่อสนับสนุนการเลือกสรร การจัดเก็บ การคนพบ และการเก็บรักษา ดิจิทัลคอลเล็คชั่น โดยตองการที่จะเก็บรักษาโครงสรางของดิจิทัลคอลเล็คชั่นใหสอดคลองกับตัววัสดุสารสนเทศ ซึ่งเปนสวนหนึ่งของคอลเล็คชั่น เปาหมายที่สําคัญคือ การเก็บรักษาทั้งตัวขอมูลและบริบทแวดลอมที่จะใชใน การอานขอมูล วัตถุประสงคของโครงการ คือ ตองการเก็บรักษาขอมูลดิจิทัลใหอยูไดเปนรอยป โดยการพัฒนา สิ่งแวดลอมที่สนับสนุนการ Migrate คอลเล็คชั่นไปไวยังซอฟตแวรระบบใหม โครงสรางพื้นฐานที่วางไว

137


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

ประกอบดวย ศูนยซุปเปอรคอมพิวเตอร หองสมุดดิจิทัล สิ่งแวดลอมดานคอมพิวเตอรที่มีอยูทั่วไป และนํา XML มาเปนมาตรฐานในการจัดเก็บขอมูล เพื่อใหสามารถแลกเปลี่ยนขอมูลกันได 8. InterPARES โครงการ The International Research on Permanent Authentic Records Electronic Systems (InterPARES) เปนโครงการวิจัยรวมระดับนานาชาติ โดยความรวมมือของนักวิชาการดานจดหมายเหตุ นั ก วิ ช าการด า นวิ ศ วกรรมคอมพิ ว เตอร สถาบั น จดหมายเหตุ แ ห ง ชาติ และตั ว แทนจากภาคอุ ต สาหกรรม เพื่อพัฒนาองคความรูและทฤษฎีที่จําเปนตอการเก็บรักษาขอมูลใหมีอยูอยางถาวรโดยใชระบบอิเล็กทรอนิกส ขอบเขตการวิจัยประกอบดวย การจําแนกองคประกอบของเอกสารอิเล็กทรอนิกสที่จําเปนตองดูแลรักษา พัฒนา เกณฑในการพิจารณาคัดเลือกเอกสารที่ควรตองเก็บรักษา และสรางกฎในการพัฒนานโยบายการเก็บรักษา ขอมูลทั้งในระดับนานาประเทศ ระดับประเทศ และระดับองคกร โดยไดมีการจําแนกขอบเขตการวิจัยออกเปน 4 ดาน คือ ความจริงแท (Authenticity), การประเมินคา (Appraisal), การเก็บรักษา (Preservation), การวางแผน ยุทธศาสตร (Strategies) โดยในสวนของ Authenticity มีวัตถุประสงคเพื่อ จําแนกองคประกอบของเอกสาร อิเล็กทรอนิกสที่ตองมีการเก็บรักษา ในขณะที่เทคโนโลยีมีการเปลี่ยนแปลง ทั้งนี้เพื่อรักษาความมีอยูจริงของ เอกสาร โดยในขั้นที่หนึ่งจะทําการพัฒนาแนวทางในการวิเคราะหและประเมินเอกสารอิเล็กทรอนิกส โครงการนี้ ตั้งอยูที่ School of Library, Archival and Information Studies, University of British Columbia ประเทศ แคนาดา 9. PRISM โครงการ The Preservation, Reliability, Interoperability, Security Metadata (PRISM) เปน โครงการของ Cornell University ประเทศสหรัฐอเมริกา เปนโครงการระยะ 4 ป ไดรับทุนสนับสนุนจาก Digital Library Initiative เพื่อศึกษาและพัฒนานโยบายและเทคนิคที่จําเปนตอการรักษาบูรณภาพของหองสมุดดิจิทัล โดยมุงเนนที่การศึกษาความสามารถที่จะอยูรอดในระยะยาวของสารสนเทศดิจิทัล ความเชื่อถือไดของทรัพยากร สารสนเทศและบริการสารสนเทศ การทํางานรวมกัน การรักษาความปลอดภัย และ Metadata ทิศทางปจจุบัน ของโครงการนี้มุงไปที่การติดตามบูรณภาพของทรัพยากรสารสนเทศประเภท Web-based และผลักดันนโยบาย ในการเก็บรักษาไปยังเจาของเว็บไซตและผูใชสารสนเทศ การติดตามทรัพยากรจะประกอบดวยการ Capture เว็บเพจแบบอัตโนมัติโดยอาศัย Crawler และการทํางานโดยมนุษยในการรวบรวมขอมูลเกี่ยวกับสถานภาพของ องคกรโดยเฉพาะในสวนของทรัพยากรสารสนเทศและคอลเล็คชั่น วัตถุประสงคที่สําคัญคือ การศึกษาในดาน ตนทุน-ประสิทธิผล และ Event-based metadata เพื่อใหผูใชเขาใจนโยบายในการเก็บรักษาและสามารถนําไป ปฏิบัติได 10. Canadian Projects การศึกษาในเรื่อง E-preservation เปนการศึกษาภายใตความรวมมือของ หอสมุดแหงชาติแคนาดา กับ Canadian Initiative on Digital Libraries (CIDL) โดยมีวัตถุประสงคเพื่อ (1) เพื่อใหชาวแคนาดาสามารถ เข า ถึ ง นโยบายได ง า ย (2) เพื่ อ ทํ า การวิ จั ย เกี่ ย วกั บ การสร า ง การใช และการเก็ บ รั ก ษาดิ จิ ทั ล คอลเล็ ค ชั่ น นอกจากนี้ ยังรวมถึงการจัดซื้อวัสดุดิจิทัล รูปแบบของสารสนเทศดิจิทัล และ Metadata

138


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

11. Preservation Project at National Institute of Standard and Technology (NIST) โครงการของ NIST มีดังนี้ - Longevity testing ทําการศึกษาเกี่ยวกับผลของความรอนและความชื้น และแสง ตออายุการ ใชงานของ Optical discs รวมทั้งศึกษาถึงความเสื่อมสภาพของ Optical discsซึ่งผลการศึกษา จะมีประโยชนทั้งตอการผลิต Optical discs ในอนาคต และการจําแนกประเภทของ Optical discs - Testing of Interchangeability and Interoperability of Optical Disc for Use in High-density Storage Systems such as optical disc “Jukeboxes“ เปนการศึกษาความสามารถของ Optical disc กลุมที่จุขอมูลไดสูงโดยทําการศึกษาควบคูกับ Application และทําการศึกษา การนํา XML มาใชในการเก็บรักษาขอมูล โดยทําการศึกษารวมกับ High Density Storage Association (HDSA) โดยศึกษาความเหมาะสมของสื่อบันทึกกับการใชงานในลักษณะตาง ๆ ซึ่ง รวมทั้งการเก็บรักษาขอมูลดวย - Development of the Turbo Coding System การเก็บรักษาขอมูลดวยวิธี Turbo Cod System จะแตกตางจากการเก็บรักษาขอมูลวิธีอื่น ๆ ที่มุงเนนการเก็บรักษาขอมูลใหสามารถอานไดใน ระยะยาว แตเทคโนโลยีใหมมีจุดมุงหมายเพื่อพัฒนาวิธีการในการคนหา และซอมแซมสารสนเทศ ที่สําคัญจากสื่อบันทึกขอมูลที่เสียหาย หรือจากความผิดพลาดอื่น ๆ โปรแกรมนี้ทําการพัฒนา โดยความรวมมือกับ Carnegie-Mellon University ประเทสหรัฐอเมริกา

สรุป ในบทนี้ไดกลาวถึงความสําคัญองการเก็บรักษาขอมูลดิจิทัล ซึ่งเปนเรื่องเรงดวนที่หนวยงานที่เกี่ยวของ ควรเริ่มศึกษาเพื่อจัดเตรียมนโยบาย และวิธีการที่เหมาะสมที่สุดในการเก็บรักษาขอมูลเหลานี้ เพื่อใหมรดก ทางปญญาที่เกิดขึ้นในวันนี้สามารถตกทอดไปถึงลูกหลานในอนาคต วิธีการเก็บรักษาขอมูลที่ไดนําเสนอขางตน ตางมีความเหมาะสมแตกตางกันไป Refreshing หรือการโอนยายขอมูลจากสื่อบันทึกขอมูลไปยังสื่อใหมที่ ทันสมัยกวา จะเหมาะสําหรับการเก็บรักษาขอมูลในระยะสั้น เปนการแกปญหาความเสื่อมสภาพ หรือการตกรุน ของสื่อบันทึกขอมูล สวนวิธีการ Technology preservation เปนวิธีการที่ใชงบประมาณคอนขางมากทั้งในการ ดูแลรักษาฮารดแวรและซอฟตแวรใหพรอมใชในอนาคต ปญหาคือ จะทําอยางไรกับชิ้นสวนที่เลิกผลิตไปแลวใน อนาคตหากฮารดแวรชํารุดเสียหาย นอกจากนี้ วิธีการนี้ยังมีคาใชจายที่คอนขางสูงในเรื่องของการเตรียมพื้นที่ เพื่อจัดเก็บอุปกรณคอมพิวเตอรและอุปกรณตอพวงทั้งหมดใหอยูในสภาพดีพรอมใชงานได สวนวิธีการที่เหมาะ สําหรับจัดเก็บขอมูลในระยะเวลาที่ยาวขึ้นไดแก Migration Emulation และ Encapsulation นั้น Emulation จะเปนวิธีการที่เหมาะสมในกรณีที่ทรัพยากรที่ตองเก็บรักษามีลักษณะซับซอน (Complex resource) และเปน โปรแกรมประยุกต (Application software) เชน เว็บเพจ เกม หรือโปรแกรมกระทําการ (Executable file) และ Emulation จะเปนทางเลือกที่ดีในกรณีที่ยังมีรูปแบบไฟล (File format) ที่เหมาะสมในการเก็บรักษาสารสนเทศ ดิจิทัล และในกรณีที่ Look and Feel เปนสิ่งสําคัญในการเก็บรักษาสารสนเทศดิจิทัล อยางไรก็ตาม Migration และ Encapsulation จะมีความเหมาะสมกวาในกรณีที่มีความรูเรื่องในเรื่องรูปแบบไฟลเพียงพอ หรือมีรูปแบบ ไฟลที่เหมาะสมในการจัดเก็บทรัพยากรสารสนเทศดิจิทัล หรือทรัพยากรจัดเก็บไวในรูปแบบไฟลที่เปนมาตรฐาน หรือมีการใชอย างแพรห ลาย และในกรณีที่ท รัพยากรสารสนเทศไมมีรูปแบบที่ซับ ซอ น และในกรณี ที่ยั ง มี 139


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

การเรียกใช (Actively access) สวนวิธีการ Encapsulate จะเหมาะกับทรัพยากรที่ไมอยูในสถานการณที่ สามารถเรียกขอมูลออกมาใชงานได ซึ่งการพิจารณาวาวิธีการที่เหมาะสมที่สุดในการเก็บรักษาสารสนเทศ ดิจิทัล อาจพิจารณาจาก ประเภทและความซับซอนของสารสนเทศ การใชงานไดของรูปแบบแฟมขอมูล และ การนําสารสนเทศดิจิทัลไปใชไปใช

ทรัพยากรที่มีเนื้อหาซับซอน

ประเภท หรือ ความซับซอน

โปรแกรมประยุกต ทรัพยากรที่มีเนื้อหาไมซับซอน รูปแบบ แฟมขอมูลที่ รจัก

No Emulation

Yes ยังใชงานอยู

No Encapsulation

Yes Migration

แผนภาพแสดงการเลือกวิธีการที่เหมาะสมในการเก็บรักษาทรัพยากรสารสนเทศดิจิทัล (Lee, Slattery, Lu, Tang and McCrary, 2002)

ดังที่กลาวไวในตอนตนวา วัตถุประสงคของการเก็บรักษาสารสนเทศดิจิทัลในระยะยาวก็เพื่อใหมั่นใจ วาจะสามารถเข า ถึงสารสนเทศดิจิทัลที่จัดเก็บไวไดตลอดเวลา ผู ใ ชในอนาคตจะสามารถเขา ถึงทรัพยากร สารสนเทศดิจิทัลที่เก็บไวในหองสมุดดิจิทัลได โดยใชสิ่งแวดลอมดานคอมพิวเตอรของตนเอง หรือโดย Portable readable devices นั่นหมายความวาสารสนเทศดิจิทัลอาจจะตองถูก Migrate เพื่อสามารถเก็บรักษาไวไดใน ระยะยาว แมวาบางกรณีอาจตองใชวิธีการ Emulation ก็ตาม จะเห็นไดวาการจัดเก็บทรัพยากรสารสนเทศดิจิทัล ในระยะยาวจะตองใชหลายวิธีรวมกันเพื่อใหบรรลุวัตถุประสงคของการจัดเก็บสารสนเทศดิจิทัล และตองอาศัย ความรวมมือของทุกสถาบัน เนื่องจากไมมีหนวยงานใดหนวยงานหนึ่งเพียงหนวยงานเดียวจะสามารถเก็บรักษา ทรัพยากรสารสนเทศดิจิทัลไดทั้งหมด และดวยอินเทอรเน็ตทําใหหองสมุดดิจิทัลทั่วโลกสามารถติดตอและใช สารสนเทศรวมกันได นอกจากนี้ ในสวนของรูปแบบมาตรฐานสําหรับการเก็บรักษาสารสนเทศดิจิทัลควรจะไดรับการพัฒนา เชน เดีย วกั น มาตรฐานจะตอ งสามารถทํ า งานรว มกัน และแลกเปลี่ ยนขอ มู ลกั น ได มี เครื่ อ งมื อ ใหผู พั ฒ นา สามารถแกไขปรับปรุงได มาตรฐานจะใชงานไดเสมอและใชงานได นานกวาการแก ไขแบบไมมีมาตรฐาน 140


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

ดังที่กลาวในตอนตนวา การทํา Migration จากรูปแบบไฟลที่ไดมาตรฐานนั้นงายและถูกกวา และถูกตองกวา รูปแบบไฟลที่ไมไดมาตรฐาน ซี่งมาตรฐานนี้ควรจะมีทั้งในสวนของ Emulation และ Encapsulation และควร จะอยูบน Encoding scheme ที่หลากหลายขึ้นอยูกับประเภทของทรัพยากรดิจิทัล ซี่งปจจุบันมีซอฟตแวรเพียง จํานวนนอยที่สามารถสนับสนุนมาตรฐานนี้ได ดังนั้น จึงเริ่มมีการนํา XML มาใชในการเก็บรักษาสารสนเทศ ดิ จิ ทั ล เนื่ อ งจากข อ ดี ห ลายประการของ XML โดยเฉพาะการไม มี ข อ จํ า กั ด ในประเด็ น ของฮาร ด แวร แ ละ ซอฟตแวรที่จะใชในการดูขอมูล การสนับสนุนการทํางานของเว็บและอินเทอรน็ต ซึ่งการมีมาตรฐานกลางเพียง มาตรฐานเดียวเปนสิ่งที่พึงปรารถนาเมื่อมีการนําระบบการเก็บรักษาขอมูลมาปฏิบัติ วิธีการเก็บรักษาสารสนเทศดิจิทัลที่ประสบความสําเร็จมากที่สุดจะตองประกอบดวยการโอนยาย ขอมูลบนพื้นฐานของมาตรฐาน อยางไรก็ตาม การโอนยา ยขอมูลยังคงตองทําการศึกษาและวิจัยเพิ่มเติม เพื่อพิจารณาในสวนของตนทุนที่เกี่ยวของ สรางตนแบบและการปฏิบัติที่ดีที่สุด นอกจากนี้ การใชการทดสอบ เปนฐานเปนสิ่งจําเปนอีกสิ่งหนึ่งสําหรับการระบุวิธีการโอนยายขอมูล ซึ่งผลของการศึกษาจะเปนประโยชนใน การเลือกเครื่องมือที่เหมาะสมในการโอนยายทรัพยากรสารสนเทศดิจิทัลซึ่งมีรูปแบบแตกตางกัน

บรรณานุกรม Besser, Howard. (2001). Digital preservation of moving image material?. [Online]. Available: http://www.gseis.ucla.edu/~howard/Papers/amia-longevity.html. Chapman, Stephen. (2003). What is digital preservation? [Online]. Available: http://www.oclc.org/events/presentations/symposium/chapman.shtm. Chapman, Stephen and Kenney, Anne R. (1996, October). Digital conversion of research library materials. D-Lib Magazine [Online]. Available: http://www.dlib.org/dlib/october96/cornell/ 10chapman.html. The Commission on Preservation and Access and The Research Libraries Group. (1996). Preserving digital information : report of the task force on archiving of digital information. [Online]. Available: ftp://ftp.rlg.org/pub/archtf/final-report.pdf Consultative for Space Data System. (2002). Reference model for an Open Archival Information System (OAIS). [Online]. Available: http://wwwclassic.ccsds.org/documents/pdf. Cornell University Library/Research Department. (2003). Moving theory into practice digital imaging tutorial. [Online]. Available: http://www.library.cornell.edu/preservation/tutorial/preservation/ preservation-01.html. Depot van Nederlandse Elektronische Publicaties. (2001). Long term preservation - research study. [Online]. Available: http://www.kb.nl/kb/ict/dea/ltp/ltpstudy-overview.pdf. Digital Preservation Coalition. (2002). Definitions and concepts. [Online]. Available: http://www.dpconline.org/graphics/intro/definitions.html.

141


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

Granger, Stewart. (2000). Emulation as a digital preservation strategy. D-Lib Magazine 6(10) [Online]. Available: http://www.dlib.org/dlib/october00/granger/10granger.html. Hendley,T. (1998). Comparison of methods & costs of digital preservation. West Yorkshire: British Library Research and Innovation Center. [Online]. Available: http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html Haynes, D., Streatfield, D., Jowett, T. and Blake, M., (1997). Responsibility for digital archiving and long term access to digital data. British Library Research and Innovation Report, 67. London: British Library Research and Innovation Centre. [Online]. Available: http://www.ukoln.ac.uk/services/papers/bl/jisc-npo67/digital-preservation.html. Lawrence, Gregory W.; Kehoe, William R.; Rieger, Oya Y.; Walters, William H. and Kenney, Anne R. (2000). Risk management of digital information: a file format investigation. Washington, D.C: Council on Library and Information Resources. [Online]. Available: http://www.clir.org/pubs/reports/pub93/pub93.pdf Lee, Kyong-Ho; Slattery, Oliver; Lu, Richang; Tang, Xiao and McCrary, Victor. (January–February 2002). The State of the art and practice in digital preservation. Journal of Research of the National Institute of Standards and Technology. 107(1). [Online]. Available: http://nvl.nist.gov/pub/nistpubs/jres/107/1/j71lee.pdf. National Archives of Australia. (1997). Managing electronic record. [Online]. Available: http://www.naa.gov.au/recordkeeping/er/manage_er/contents.html. National Library of Australia. (2002). Statement of principles for the preservation of and long-term access to Australian digital objects. [Online]. Available: http://www.nla.gov.au/preserve/ digital/princ.html. National Library of Australia. Preservation services branch. (2003). Digital preservation strategies. [Online]. Available: http://www.nla.gov.au/padi/topics/18.html. Phillipss, Magaret E. (1999, June). Ensuring long-term access to online publications. The Journal of Electronic Publishing 4(4) [Online]. Available: http://www.press.umich.edu/jep/0404/phillips.html . Research Libraries Group. (1996) Task force on archiving of digital information. [Online]. Available: http://www.rlg.org/ArchTF/tfadi.index.htm Ross, Seamus. (2000). Changing trains at Wigan: digital preservation and the future of scholarship. Technology and Information Institute (HATII), University of Glasgow. [Online]. Available: http://www.bl.uk/services/preservation/occpaper.pdf. Russell, Kelly. (2001). RLG/OCLC report on the attributes of a reliable digital archive for research repositories draft report. Research Libraries Group and OCLC. [Online]. Available: http://www.rlg.org/longterm.

142


อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ

Rothenberg, Jeff. (1999). Avoiding technological quicksand: finding a viable technical foundation for digital preservation (a report to the council on library and information resources), Washington, DC: Council on Library and Information Resources. [Online]. Available: http://www.clir.org/pubs/reports/rothenberg/pub77.pdf. The State of digital preservation: an international perspective. (2002). Washington, D.C: Council on Library and Information Resources. [Online]. Available: http://www.clir.org/pubs/reports/pub107/pub107.pdf. Technical Advisory Service for Images. (2002). Establishing a digital preservation strategy. [Online]. Available: http://www.tasi.ac.uk/advice/delivering/pdf/digpres2.pdf.

143


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.