อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
บทที่ 10 การอนุรักษสารสนเทศดิจิทัล (Digital Preservation) บทนํา ปจจุบันสารสนเทศผลิตออกมาในรูปของดิจิทัลมากขึ้น ทั้งสารสนเทศที่เกิดมาในรูปดิจิทัลโดยกําเนิด (Born digital) และสารสนเทศที่ถูกแปลงใหอยูในรูปดิจิทัล (Reborn Digital) และผลิตออกมาในหลายรูปแบบ ตั้งแตจดหมายอิเล็กทรอนิกส เว็บเพจ ไปจนถึงสื่อ ผสม ทั้งนี้เนื่องจากพัฒนาการของเทคโนโลยีการพิมพ อิเ ล็ ก ทรอนิก ส เริ่ ม ตั้ ง แต ก ารใช โ ปรแกรมประมวลคํ า (Word processor) มาใช ใ นการพิ มพ ผนวกกั บ ความสามารถของ เครื่องแสกน และกลองดิจิทัล ซึ่งชวยใหการสรางเอกสารดิจิทัลทําไดงายและมีคุณภาพดีขึ้น ในราคาที่ถูกลงเรื่อย ๆ และเนื่องดวยขอดีหลาย ๆ ประการของขอมูลดิจิทัล อาทิ แกไขปรับปรุงงาย เผยแพรงาย ทั้งโดยผานเครือขายคอมพิวเตอรหรือโดยอาศัยสื่อบันทึกขอมูลรูปแบบตาง ๆ ที่นับวันจะมีขนาดเล็กลงแตมี ความจุมากขึ้น จัดเก็บไดหลากหลายรูปแบบไฟล (File format) ขึ้นอยูกับวัตถุประสงคและการนําไปใช รวมทั้ง ความพรอมของผูใช นอกจากนี้สารสนเทศที่อยูในรูปดิจิทัลยังเรียกดูขอมูลไดงาย ผูใชจะเรียกดูขอมูลจาก สวนใดของเอกสารก็ได และโดยอาศัยเครือขายคอมพิวเตอรผูใชสามารถเขาถึงสารสนเทศไดโดยไมมีขอจํากัด ดานเวลาและระยะทาง อยางไรก็ตาม จากการที่สารสนเทศดิจิทัล เปนทรัพยากรที่มีการเปลี่ยนแปลงอยูเสมอ ตามสิ่งแวดลอมดานเทคโนโลยีที่มีการเปลี่ยนแปลงอยูตลอดเวลาทั้งในสวนของฮารดแวร ซอฟตแวร และ สื่อบันทึกขอมูล ทําใหหองสมุดและหนวยงานตาง ๆ ที่เกี่ยวของกับการอนุรักษมรดกทางปญญาและวัฒนธรรม ของชาติ จะตองเผชิญกับคําถามและความทาทายในการหาวิธีการที่ดีที่สุดและเหมาะสมที่สุดในการเก็บรักษา สารสนเทศดิจิทัลใหมีอายุการใชงานที่ยืนยาวและสามารถเรียกออกมาใชงานไดในอนาคต เมื่อตองยอมรับ ขอเท็จจริงที่วาทรัพยากรสารสนเทศดิจิทัลเหลานี้มีอายุการใชงานเพื่อใหบริการบนชั้น (Shelf life) ไมถึง 10 ป เราจะมั่นใจไดอยางไรวา สารสนเทศที่เราสรางขึ้นมาในวันนี้ จะสามารถเขาถึงและเรียกออกมาใชไดอยาง ครบถวนและสมบูรณในอนาคตเมื่อเทคโนโลยีมีการเปลี่ยนแปลง และเมื่อยุคของเรากลายเปนอดีตลูกหลานใน อนาคตจะสามารถเรียกใชขอมูลที่บรรพบุรุษสรางสรรคไวใหในวันนี้ไดอยางไร ขอเท็จจริงเหลานี้ แสดงถึงความ จําเปนเรงดวนที่ผูที่เกี่ยวของจะตองวางแผนเพื่อปองกันไมใหมรดกทางปญญาและวัฒนธรรมของชาติตอง สูญหายไปพรอมกับการเปลี่ยนแปลงของเทคโนโลยี
การอนุรักษสารสนเทศดิจิทัล (Digital Preservation) คืออะไร ตามความหมายของคําวา “อนุรักษ” ซึ่งหมายถึง รักษาใหคงเดิม (พจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๒๕) ดังนั้นในที่นี้จึงใชคําวา อนุรักษ แทนคําวา “Preservation” ซึ่งเปนคําภาษาอังกฤษ Digital Preservation หรือการอนุรักษสารสนเทศดิจิทัลเปนกิจกรรมที่เกี่ยวของกับการจัดการดานตาง ๆ เพื่อใหทรัพยากรสารเทศดิจิทัลสามารถเขาถึงและเรียกออกมาใชไดอยางสมบูรณ ตลอดไป ตราบเทาที่ตองการ และจําเปน ภายใตสภาวะการเปลี่ยนแปลงตลอดเวลาของเทคโนโลยี (RLG/OCLC, WWW, 2001 and Digital Preservation Coalition, WWW, 2002) ซึ่งสารสนเทศดิจิทัลจะรวมทั้งสารสนเทศดิจิทัลโดยกําเนิด (Born digital) และสารสนเทศที่ถูกแปลงใหอยูในรูปดิจิทัล (Born digital or Digitization materials) เปาหมายของ Digital preservation หรือ การอนุรักษคือ เพื่อรักษาความสามารถในการแสดง (Display) การคนคืน (Retrieve) และการใชดิจิทัลคอลเล็คชั่น (Digital collection) ไดภายใตการเปลี่ยนแปลงอยางรวดเร็ว 121
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
ของเทคโนโลยี โครงสรางพื้นฐานและองคประกอบขององคกร ซึ่งประเด็นที่ตองศึกษาไดแก (Cornell University Library, WWW, 2003) - การเก็บรักษาตัวเอกสาร รวมทั้ง Metadata สคริปตและ โปรแกรม ของเอกสาร (เชน ตองมั่นใจวา รวมทั้ง ฮารดแวรและซอฟตแวรที่จะใชเพื่ออาน สื่อที่บันทึกสารสนเทศ มีการทํา Back-up สารสนเทศดังกลาว ตองไดรับการดูแลรักษาเชนกัน) - การรักษาสภาพการใชของสารสนเทศดิจิทัล เชน สวนตอประสานกับผูใช หรือการติดตอกับผูใช ตองเปนปจจุบัน ผูใชตองสามารถคนคืน และปรับแตงสารสนเทศเพื่อตอบสนองความตองการของ ตนได - การรักษาความปลอดภัยของคอลเล็คชั่น เชน การกําหนดนโยบายเกี่ยวกับสิทธิในการเขาใช คอลเล็ ค ชั่ น การพั ฒ นา การดู แ ลรั ก ษาโปรแกรมการจั ด การเรื่ อ งสิ ท ธิ ก ารเข า ใช บ ริ ก ารที่ มี คาธรรมเนียม ซึ่งสอดคลองกับงานของ สตีเฟน แชปแมน (Stephen Chapman) ซึ่งอธิบายวา การเก็บ รักษา ทรัพยากรเพื่อใหผูใชสามารถเขาถึงไดนั้น ตองการมากกวาการเก็บรักษาตัววัสดุ แตยังตองการองคประกอบอีก 3 ดาน คือ การเก็บรักษาตัวเนื้อหาของสารสนเทศ (Preservation of the material or its "information content") การเก็บรักษาระบบ หรือเครื่องมือที่จําเปนตอการชี้ตําแหนง การคนคืน และ การแสดงทรัพยากร และผูใชที่ สามารถใชขอมูลดังกลาวได (Chapman, WWW, 2003)
แบบจําลองขององคกรทีท่ ําหนาที่เก็บรักษาสารสนเทศดิจิทลั OAIS Reference Model (Consultative for Space Data System, WWW, 2002) OAIS (Open Archival Information System) อยูภายใตการดูแลของ ISO เปนรางมาตรฐานเกี่ยวกับ ระบบ หรือองคกรการเก็บรักษาขอมูลใหมีอายุการใชงานที่ยาวนาน และสามารถเรียกอกมาใชไดโดยผูใชที่เปน กลุมเปาหมายหลัก (Designated Community) OAIS จะนําเสนอรูปแบบขององคประกอบที่จําเปนตอการสราง ระบบเพื่อสนับสนุนบริการเก็บรักษาขอมูล จําแนกหนาที่ในการเก็บรักษาสารสนเทศดิจิทัลออกเปน 7 ประการ ดังนี้ 1. Common Services เปนการเตรียมความพรอมเกี่ยวกับเทคโนโลยีพื้นฐานดานตาง ๆ ที่จะใชใน การติดตอสื่อสาร และการทํางานรวมกัน ไดแก • Operating system services เปนบริการในสวนของการดูแลระบบ และการจัดเตรียม สวนตอประสานเพื่อใหคอมพิวเตอรตางแพลตฟอรม หรือ คอมพิวเตอรที่ใชโปรแกรมประยุกต ตางกันสามารถทํางานรวมกันได • Network services เปนการเตรียมความพรอมดานเครือขายเพื่อการสื่อสารขอมูลผาน เครือขายคอมพิวเตอรระดับตาง ๆ เพื่อความสะดวกในการเขาถึงและเรียกใชขอมูลทั้งจาก ระยะใกลและไกล จากคอมพิวเตอรของผูใช รวมทั้งการรักษาความปลอดภัยของเครือขาย ไดแก การเขาถึงขอมูล (Access) การพิสูจนตัวจริง (Authentication) การรักษาความลับ
122
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
(Confidentiality) การรักษาบูรณภาพ (Integrity) การปฏิเสธการเขาใชไมได (Nonrepudiation) และการควบคุมดูแลการสื่อสารระหวางผูสงและผูรับในเครือขาย • Security services เปนบริการรักษาความปลอดภัยของขอมูล ซึ่งจะจําแนกระดับการรักษา ความปลอดภัยตามความสําคัญของขอมูล เชน ผูจัดสงขอมูลเขามาในระบบตองไดรับการ พิสูจนตัวจริง ผูที่จะเขาถึงขอมูลในระดับตาง ๆ ตองไดรับการพิสูจนตัวจริงและตรวจสอบ สิ ท ธิ ใ นการใช แ ละการทํ า งาน ข อ มู ล ที่ จ ะจั ด เก็ บ ถาวร และข อ มู ล ที่ จั ด ส ง ให ผู ใ ช ต อ งมี บูรณภาพ เปนตน 2. Ingest หรือ การรับขอมูลเขา ทําหนาที่ ดังนี้ • ตรวจรับ Submission Information Package (SIP) หรือสารสนเทศที่จัดสงมาจากผูผลิตที่ เปนสมาชิกวาถูกตองสมบูรณหรือไม การจัดสงขอมูลเขามาอาจมาจากหลายวิธี เชน FTP, อาน จากสื่อบันทึกขอมูล เชน CD-ROM หรืออาจจัดสงเขามาทางไปรษณียในรูปแบบที่ ไมใชดิจิทัล • การตรวจสอบคุณภาพของ SIP ที่จัดสงเขามา SIP ตองสามารถทํางานไดอยางสมบูรณ • นํา SIP ที่ตรวจสอบคุณภาพแลวมาจัดทํา Archival Information Package (AIP) หรือการ จั ด ทํ า ให อ ยู ใ นรู ป แบบที่ จ ะเก็ บ รั ก ษาในระยะยาว เช น การแปลงให อ ยู ใ นรู ป แบบไฟล มาตรฐานที่กําหนด จัดทํา Descriptive Information เพื่อบรรยายลักษณะเอกสารและใช ประโยชนในการเขาถึงสารสนเทศ และจัดทํา Preservation Description Information ( หรือ Preservation Metadata) หรือขอมูลที่อธิบายหรือใหรายละเอียดเกี่ยวกับการเก็บรักษา สารสนเทศดังกลาว โดยจะจัดทําขอมูลนี้แยกจากตัว SIP
3. Archival Storage เปนการจัดเก็บขอมูลเพื่อเก็บรักษาในระยะยาว ดังนี้ • ตรวจรับเพื่อนํา AIPs มาเก็บไวในสวนการจัดเก็บขอมูลถาวร • จั ด ลํ า ดั บ ความสํ า คั ญ ของข อ มู ล เพื่ อ แบ ง ลํ า ดั บ ชั้ น ของการจั ด เก็ บ การเรี ย กใช แ ละการรั ก ษา ความปลอดภัย
123
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
เตรียมการสํารองขอมูล และขอมูลที่เกี่ยวของในการจัดทําขอมูลขึ้นมาใหม (Reproduce) หรือ การโอนยายขอมูล เพื่อไมใหขอมูลสูญหาย และไมใหการทํางานเสียหาย • การตรวจสอบขอผิดพลาดและเตรียมการแกไขขอผิดพลาดที่อาจเกิดขึ้น • การบันทึกขอมูลลงบนสื่อบันทึกขอมูลที่สามารถเคลื่อนยายได เชน Compact disc แตสามารถ ทํางานผานระบบเครือขายได เพื่อความปลอดภัยของขอมูลกรณีที่เกิดภัยพิบัติ • จัดเตรียมขอมูลในรูปแบบที่ผูใชสามารถเขาถึงและนําไปใชได 4. Data Management ไดแก หนาที่ในการจัดการขอมูล ดังนี้ • Administer database ไดแก การทําหนาที่ดูแลบูรณภาพของการจัดการขอมูลในฐานขอมูล ซึ่ง ขอมูลที่อยูในความดูแลไดแก Preservation Descriptive Information และ System information ซึ่งเปนขอมูลสนับสนุนการดําเนินงานเก็บรักษาสารสนเทศดิจิทัล • รับคําคน (Queries ) จากผูใชมาประมวลผลและสงผลการคนใหกับผูใช • จัดทํารายงานตามคําขอของงานตาง ๆ เชน Ingest, Access หรือ Administration • แกไขปรับปรุงขอมูล 5. Administration หรือการทําหนาที่ในสวนของการบริหารจัดการ ดังนี้ • ทําการเจรจาเพื่อหาขอตกลงรวมกัน กับผูผลิตสารสนเทศ ในการจัดสงสารสนเทศ สิทธิในการ จัดการและการเปนเจาของสารสนเทศ • ทําหนาที่ติดตามดูแลการทํางานของระบบการเก็บรักษาขอมูลทั้งระบบ เพื่อจัดทํานโยบายและ มาตรฐานดานตาง ๆ เพื่อความสมบูรณของระบบ • ดูแลการแกไขปรับปรุงขอมูล • ดูแลความปลอดภัยของสถานที่ • จัดทํานโยบายและมาตรฐานในการเก็บรักษาสารสนเทศ • ตรวจสอบความถูกตองของการนําขอมูลเขามาในระบบใหเปนไปตามเงื่อนไขที่กําหนดไว • ดูแลจัดการขอมูลใหพรอมใชตามการรองขอ • การเตรียมความพรอมในสวนของการบริการลูกคา เชน การจัดเก็บคาบริการ การรับขอคิดเห็น จากลูกคา เปนตน 6. Preservation Planning หรือการวางแผนในการอนุรักษสารสนเทศดิจิทัล ดังนี้ • ติดตามการใชงานของกลุมผูใชหลัก และผูผลิต เพื่อปรับปรุงระบบใหสอดคลองกับความตองการ และการใชงานของผูใช ทั้งในสวนของ คอมพิวเตอรแพลตฟอรม รูปแบบแฟมขอมูล และ สื่อบันทึกขอมูล • ติดตามเทคโนโลยีดิจิทัล ทั้งในสวนของคอมพิวเตอรแพลตฟอรม (ฮารดแวร และซอฟตแวร) และ มาตรฐานของขอมูล ทั้งนี้เพื่อสามารถเลือกวิธีการอนุรักษขอมูลที่เมาะสมที่สุด และวางแผนการ เก็บรักษาขอมูลไดถูกตองเหมาะสม • พัฒนาวิธีการและมาตรฐานในการอนุรักษขอมูล เพื่อสามารถตอบสนองความตองการของผูใช และเพื่อใหสอดคลองกับพัฒนาการของเทคโนโลยี •
124
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
พัฒนารูปแบบของสารสนเทศ (Information packaging) วางแผนการโอนยายขอมูล เพื่อนํา นโยบายจากฝายบริหารมาปฏิบัติ 7. Access เปนกิจกรรมการเตรียมความพรอมในการเขาถึงสารสนเทศ ดังนี้ • ประสานกิ จ กรรมการเข า ถึ ง สารสนเทศของผู ใ ช โดยการจั ด เตรี ย มส ว นต อ ประสานกั บ ผู ใ ช ในการเขาใชสารสนเทศในระบบ • จัดทํา Deliver Information Package (DIP) หรือสารสนเทศฉบับที่จะจัดสงใหกับผูใช เพื่อความ สะดวกในการจัดสงขอมูล และความสะดวกในการเรียกใชงานของผูใช • การจัดสงขอมูลใหกับผูใชทั้งในแบบออนไลนและออฟไลน ตามความตองการของผูใช •
สรุปการทํางานของ OAIS ไดดังภาพ (Consultative for Space Data System, WWW, 2002)
125
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
126
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
วิธีการเก็บรักษาสารสนเทศดิจิทัล (Digital Preservation Strategies) วิธีการเก็บรักษาขอ มูลดิจิทัลสามารถทําไดหลายวิธี ไดแก Data Refreshing, Technology preservation, Technology emulation, Information Migration และ Encapsulation ซึ่งมีรายละเอียดดังนี้ 1. Data Refreshing ไดแก การคัดลอก (Copy) ขอมูลจากสื่อบันทึกขอมูลหนึ่งไปจัดเก็บยังสื่อบันทึกขอมูลอีกตัวหนึ่ง เมื่อสื่อบันทึกขอมูลเดิมลาสมัย หรือกอนที่สื่อบันทึกขอมูลเดิมจะเสื่อมสภาพ หรือใชงานไมได เชน คัดลอกขอมูล จาก Floppy disk ไปเก็บใน CD-ROM หรือ คัดลอกขอมูลจาก CD-ROM ไปเก็บใน DVD เปนตน การ Refreshing จะเกี่ยวของเฉพาะการเปลี่ยนตัวสื่อที่ใชบันทึกขอมูลเทานั้น จะไมมีผลใด ๆ ตอรูปแบบ (Format) ของขอมูล จึงเปนวิธีการเก็บรักษาขอมูลที่ไมมีความเสี่ยงตอความเสียหายของสารสนเทศดิจิทัล สารสนเทศจะ ยังคงมีบูรณภาพ (Integrity) หรือ ครบถวนสมบูรณเหมือนเดิมทุกประการ อยางไรก็ตาม เนื่องจากสื่อบันทึก ขอมูลดิจิทัลมีอายุการใชงานที่คอนขางสั้น ดังนั้นจึงจําเปนตองมีการยายขอมูลจากสื่อหนึ่งไปเก็บไวยังสื่อที่ ใหมกวา อยูตลอดเวลา และปญ หาสํา คัญ คือ ไม ส ามารถกํา หนดช ว งเวลาที่ แ นน อนได วา เมื่อ ใดควรมีการ โอนยายขอมูลไปเก็บยังสื่อบันทึกขอมูลตัวใหมเพื่อความปลอดภัยไมสูญหายของขอมูล เนื่องจากหากทําชาไป อาจไม สามารถเรี ย กขอ มูลออกมาใชไ ดเพราะเทคโนโลยีต กรุ น ไปแล ว แต ห ากทํา เร็ว เกิ น ไปก็จ ะสิ้น เปลือ ง คาใชจาย Refreshing จึงยังไมใชวิธีการที่เหมาะสมในการเก็บรักษาขอมูลในระยะยาว 2. Technology Preservation ในการเก็บรักษาขอมูลมีหลักสําคัญคือ ขอมูลจะตองสามารถเรียกออกมาอานและนํามาประมวลผลได ในอนาคต ซึ่งแนนอนวาจะตองอาศัยอุปกรณในการอานขอมูลจากสื่อบันทึกขอมูลดังกลาว เชน Disk drive ดังนั้น Technology preservation จึงไดแก การเก็บรักษาสิ่งแวดลอมดานเทคโนโลยีที่จะใชในการอานเอกสาร ดิจิทัล ทั้งในสวนของฮารดแวรและซอฟตแวร เชน ระบบปฏิบัติการ (Operating System) โปรแกรมเดิมที่ใชอาน หรือสรางขอมูล (Original application software) ไดรฟที่ใชอานขอมูลจากสื่อบันทึกขอมูล (Media drives) เปนตน วิธีการนี้ จึงมีลักษณะคลายกับพิพิธภัณฑที่ตองเก็บรักษาทั้งฮารดแวรและซอฟตแวรที่ใชในการอาน ขอมูลที่เกิดขึ้นในแตละยุคสมัยไวอยางสมบูรณที่สุด ขอดีของวิธีการนี้คือ การรักษา “Look and Feel” ของ สารสนเทศดิจิทัล เนื่องจากเปนการเรียกดูจากสภาวะแวดลอมเดิม ดังนั้น สิ่งที่เกิดขึ้นจะมีลักษณะเหมือนเดิม ทุกประการ สําหรับสารสนเทศดิจิทัลบางประเภท Technology preservation อาจจะเปนวิธีการเก็บรักษาที่ดี ที่สุดสําหรับการเก็บรักษาในระยะสั้น เนื่องจากวิธีการนี้จะรับรองไดวาสารสนเทศที่จัดเก็บไวจะสามารถเขาถึง และเรี ย กออกมาใช ไ ด อ ย า งแน น อน เนื่ อ งจากมี ก ารเก็ บ รั ก ษาสิ่ ง แวดล อ มด า นเทคโนโลยี ไ ว อ ยา งสมบู ร ณ เชนเดียวกับการเก็บรักษาตัวทรัพยากรสารสนเทศดิจิทัล (Lee, Slattery, Lu, Tang and McCrary, 2002) อยางไรก็ตาม การอนุรักษดวยวิธีนี้มีสิ่งที่ตองพิจารณาคือ ปริมาณสถานที่หรือพื้นที่ที่จะตองใชในการจัดเก็บ ฮารดแวรและซอฟตแวรที่เกี่ยวของ และตนทุนที่จะเกิดขึ้นในการบํารุงรักษา เพื่อเก็บรักษาสภาพแวดลอมดาน เทคโนโลยีเหลานี้ใหใชงานไดในอนาคต โดยเฉพาะในสวนของฮารดแวรซึ่งยอมเสื่อมสภาพไปตามกาลเวลา และ อะไหล ที่ใ ช ใ นการซอ มบํ า รุง ซึ่ ง อาจเลิก การผลิต ไปแลว ซึ่ง เปน ขอ จํา กั ดที่ สํา คัญ ของการเก็บ รัก ษาดว ยวิ ธี Technology preservation
127
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
3. Technology Emulation จะมีลักษณะคลายกับวิธี Technology preservation คือ จะมุงเนนที่การเก็บรักษาโปรแกรมดั้งเดิมที่ ใชสรางเอกสาร โดยมีแนวคิดหลักคือ การเลียนแบบ (Emulation) สภาพแวดลอมดานแพลตฟอรม (Platform) เพื่อให สามารถอานเอกสารดิจิทัล โดยใช โปรแกรมดั้งเดิมที่ใชในการสรางขอมูลได โดยเปน การทํางานบน แพลตฟอรมใหมที่นํามาใชงานแทนแพลตฟอรมเดิม โดยจะพัฒนา Emulator Program ซึ่งเปนโปรแกรมจําลอง สภาพแวดลอมดานแพลตฟอรมเดิมขึ้นมา ไดแก ฮารดแวร และระบบปฏิบัติการ ที่สามารถเรียกอานขอมูลจาก โปรแกรมดั้งเดิมได เชน โปรแกรม Commoder 64 พัฒนาขึ้นมาใหสามารถเรียกใชงานโปรแกรมที่ทํางานบน PC ได (National Library of Autralia, WWW, 2002) ดังนั้น Technology emulation จึงไมรวมการจัดเก็บฮารดแวร และระบบปฏิบัติ การเดิมไวดวยเปาหมายหลักของ Technology emulation ก็คือ นอกจากรักษาเนื้อหา (Content) แลวยังตองการรักษา “Look and Feel” ของสารสนเทศดิจิทัลใหคงลักษณะเหมือนเดิมทุกประการ ดวย ดังนั้น สิ่งที่จําเปนสําหรับวิธีการนี้คือ การลอกแบบบริบทดานเทคนิคของทรัพยากรที่จะทําใหการเรียกใช สารสนเทศดิจิทัลในอนาคตทําไดอยางสมบูรณ และเมื่อมีแพลตฟอรมออกมาใหมก็ยอมตองสราง Emulation program ขึ้ นมาใหมเสมอ อยางไรก็ตาม การคาดหมายเกี่ยวกับเทคโนโลยีที่จะเกิดขึ้นในอนาคตเพื่ อ สรา ง Emulation program ยังคงเปนสิ่งที่คาดการไดยาก และตองใชการลงทุนสูง (TASI, WWW, 2002) และดวย หลักการของ Technology emulation ทําใหนักวิจัยหลายคนเชื่อวา Technology emulation เปนวิธีการที่ดีที่สุด ในการเก็บรักษาสารสนเทศดิจิทัลในระยะยาว (Deegan and Tanner, 2002; Ganger, WWW, 2000; Rothenenberg, WWW,1999; TASI, WWW, 2002) อยางไรก็ตาม เฮนดเลย (Hendley) ชี้วา Technology emulation นาจะเหมาะนํามาใชในกรณีที่ไมสามารถแปลง (Convert) ทรัพยากรสารสนเทศดิจิทัลใหเปน Software independent format ได (Hendley, 1998) และในงานของแกงเกอร (Ganger) ที่ศึกษาถึงขอดี ขอดอยของ Technology emulation ไดใหขอสรุปวา Technology emulation ไมใชวิธีการที่ดีที่สมบูรณที่สุดใน การเก็บรักษาสารสนเทศดิจิทัล แตตองใชรวมกับวิธีการอื่น ๆ ขึ้นอยูกับความเหมาะสมของแตละสถานการณ (Ganger, WWW, 2000) 4. Information Migration วิธีการนี้จะแตกตางจาก 3 วิธีการแรก เนื่องจาก 3 วิธีแรกจะเนนที่เทคโนโลยีที่ใชในการเขาถึงและการ เรียกใชสารสนเทศดิจิทัลโดยไมยุงเกี่ยวกับรูปแบบ (Format) ของตัวสารสนเทศ แต Information Migration จะ เนนที่การโอนยาย (Transfer) สารสนเทศจากฮารดแวรและซอฟตแวรระบบหนึ่ง (HW/SW Configuration) ไปสู อีกระบบหนึ่ง หรือจากฮารดแวรและซอฟตแวรรุนหนึ่ง (HW/SW Generation) ไปยังอีกรุนหนึ่ง จุดมุงหมายหลัก ของ Information Migration คือ บูรณภาพ (Integrity) หรือการเก็บรักษาความถูกตองสมบูรณ ของสารสนเทศ ดิ จิ ทั ล และรั ก ษาความสามารถในการค น คื น การแสดงผล และการนํ า ข อ มู ล ไปใช ไ ด แ ม เ ทคโนโลยี จ ะมี การเปลี่ยนแปลงอยูเสมอ อยางไรก็ตาม วิธีการนี้มีขอดอยตรงที่ อาจทําใหเอกสารดิจิทัลสูญเสีย “Look and feel” หลังจากโอนยายขอมูล และที่สําคัญคือ อาจทําใหขอมูลบางสวนสูญหายระหวางการโอนยายขอมูล โดยเฉพาะขอมูลที่มีลักษณะซับซอน เชน เอกสารมัลติมีเดีย และเว็บเพจ เปนตน สิ่งที่ตองพิจารณาสําหรับวิธีการ Migration คือ การกําหนดตารางเวลาที่เหมาะสมในการโอนยาย ขอมูล (Migrate) เนื่องจากการคาดการณถึงความเปลี่ยนแปลงของเทคโนโลยีเปนสิ่งที่ทําไดยาก และขณะที่การ กําหนดระยะเวลาที่ขอมูลจะตองสามารถเขาถึงไดเปนประเด็นสําคัญที่ตองคํานึงถึงของวิธีการ Migration ยังมี
128
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
อีกสิ่งหนึ่งที่ตองใหความสําคัญเชนกัน คือ การรักษาความถูกตองสมบูรณของขอมูลใหมีอยูตลอดอายุการ เก็บรักษาของสารสนเทศ ทั้งนี้เพื่อสามารถใชเปนหลักฐานอางอิงได โดยเฉพาะในการทําธุรกรรมตาง ๆ การ เก็บรักษาบูรณภาพของเอกสาร (Record integrity) ประกอบดวย ความนาเชื่อถือ (Reliable) ความสมบูรณ ของเอกสาร (Completeness) การมีความจริงแท (Authenticity) และ มีเนื้อหาถูกตอง (Possess sufficient context) (National Archives of Australia, WWW, 1997) ความนาเชื่อถือ (Reliability) หมายถึง เอกสารตองเชื่อถือได ความนาเชื่อถือนี้พิจารณาจาก รูปแบบ และกระบวนการสรางเอกสาร และความนาเชื่อถือของบุคคลที่เกี่ยวของกับการสรางเอกสารนั้น ๆ ซึ่งจะให ความเชื่อถือที่ตัวสถาบันมากกวาบุคคล ความสมบูรณ (Completeness) เอกสารที่สมบูรณ จะประกอบดวย การใหขอมูลเกี่ยวกับ เวลาและ สถานที่ในการรับ-สงเอกสาร รายละเอียดเกี่ยวกับผูสงและผูรับ (ผูที่เอกสารจะถูกสงไปถึง) การลงลายมือชื่อ แสดงตัว การแจงชื่อเรื่อง หรือหัวขอของเอกสาร หรือการแสดงความจํานงของผูเขียน ความจริงแท (Authenticity) ความจริงแทของเอกสาร เปนความตองการในการเก็บรักษาประวัติ ความเปนมาในการสรางเอกสาร การโอนยายเอกสาร การใช และการเก็บรักษา ตั้งแตเริ่มตนการสรางจนถึง ปจจุบัน และมีประเด็นหนึ่งที่ตองพิจารณาคื อ เอกสารนั้นตองเปนเอกสารตนฉบับหรือไม ซึ่งในบริบทของ เอกสารอิเล็กทรอนิกสจะตางจากเอกสารกระดาษ ซึ่งเอกสารกระดาษจะหมายถึงการเก็บรักษาตัวเลมของ เอกสาร แตในบริบทของเอกสารอิเล็กทรอนิกส คําวา ตนฉบับ (Original) จะหมาถึง ตัวเนื้อหา (Content) โครงสราง (Structure) และ บริบท (Context) ของการทํางานเดิม ไมไดหมายความวาตองเก็บทุกคุณลักษณะ ของฮารดแวรและซอฟตแวรดั้งเดิม ดังนั้น จึงหลีกเลี่ยงไมไดวา อาจมีการสูญหายบางสวนเกิดขึ้นในระหวาง ขั้นตอนของการทํา Migration จากซอฟตแวรรุนหนึ่ง (Version) ไปอีกรุนหนึ่ง หรือจากแพลตฟอรม (Platform) เกาไปยังแพลตฟอรมใหม ซึ่งการสูญหายนี้อาจจะยังสามารถยอมรับไดตราบใดที่ยังสามารถเก็บรักษาสิ่งที่แสดง ถึงความถูกตอง หรือความจริงแทของเอกสารเอาไวได บริบท (Context) จะเกี่ยวของกับการเชื่อมโยงระหวางการทํางาน หรือ การเชื่อมโยงระหวางเอกสาร หรือตัวขอมูลกับกระบวนการในการบริหารจัดการที่เกี่ยวของ ตัวอยางเชน การเชื่อมโยงที่เกิดขึ้นจํานวนมาก ระหว า งการทํ า งานแต ล ะครั้ ง เช น ข อ มู ล ของผู โ ดยสารที่ เ มื่ อ มาถึ ง สนามบิ น จะเชื่ อ มโยงกั บ ข อ มู ล ของ กองตรวจคนเขาเมืองและหนวยงานดานการทองเที่ยว เปนตน 5. Encapsulation วิธีการ Encapsulation มีจุดมุงหมายเพื่อแกไขปญหาการตกรุนของเทคโนโลยีในสวนของรูปแบบ แฟมขอมูล (File formats) โดยการจัดทํารายละเอียดเกี่ยวกับการแปล Digital object จัดรวมไวเปนสวนหนึ่งของ encapsulate information วิธีการนี้จะเกี่ยวของกับการสราง Original application เคยที่ใชสรางและเขาถึง ทรัพยากรสารสนเทศดิจิทัลบนคอมพิวเตอรแพลตฟอรมในอนาคต สวนหนึ่งของกระบวนการนี้อาจตองทําการ Migration เพื่อใหตัวทรัพยากรอยูในรูปแบบไฟลที่จัดการไดงายขึ้น Encapsulation ไดแก เทคนิคในการรวมตัวทรัพยากรสารสนเทศดิจิทัล และทุกอยางที่จําเปนตอการ สรางและเขาถึงทรัพยากรสารสนเทศดิจิทัล นั้น ๆ เขาไวดวยกันใน Container ที่สรางขึ้น ซึ่ง AOIS ไดอธิบาย ความหมายของวิธีการ encapsulation ไววา เปนการจัดเก็บตัวทรัพยากรสารสนเทศ (Information package) และขอมูลที่ใชอธิบายวิธีการจัดเก็บทรัพยากร (Preservation description หรือ Preservation metadata)
129
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
ไวดวยกันใน Information packaging (OAIS, WWW, 2002) วิธีการ Encapsulation มีจุดมุงหมายเพื่อแกไข ปญหาการตกรุนของเทคโนโลยีในสวนของรูปแบบแฟมขอมูล (File formats) เนื่องจากรายละเอียดของวิธีการ แปล Digital bit ในทรัพยากรสามารถเปนสวนหนึ่งของ Encapsulated information วิธีการ Encapsulation จะสําเร็จไดก็โดยการใช Physical หรือ Logical structures ที่เรียกวา "Containers" หรือ "Wrappers" เพื่อสราง ความสัมพันธระหวางทุกองคประกอบของสารสนเทศ เชน ตัวทรัพยากรกับขอมูลสนับสนุนอื่น ๆ อาทิ Persistent identifier (การระบุตําแหนง/ที่อยูของสารสนเทศดิจิทัลอยางตอเนื่องแมเมื่อสารสนเทศมีการเปลี่ยนแปลงที่อยู ทั้งนี้เพื่อใหผูใชสามารถเขาถึงสารสนเทศได) Metadata และ Software specification สําหรับการทํา Emulation วิธีการ Encapsulation อาจประกอบดวยทั้ง Analogue components และ Digital components ตัวอยางในสวนของ Analogue components จะเปนคําแนะนําที่มนุษยสามารถอานได เชน คําแนะนําที่เขียนไว บนตัวสื่อบันทึกขอมูล หรือ กลอง หรือ วัสดุที่หอหุมตัววัสดุสารสนเทศ โดยจะเปนคําแนะนําในการใช สื่อบันทึก และวิธีการแปลขอมูลที่อยูในสื่อ (Carrier) โดยในสวนของ Analogue components อาจตองมีการเปลี่ยนหรือ Refresh ประเภทของขอมูลสนับสนุน (Supporting information) ที่ตองเก็บรวมไวในการ Encapsulation (แตตองแยกออกไวตางหากกับตัวทรัพยากรสารสนเทศดิจิทัล ไดมีการอธิบายไวใน OAIS ซึ่งอางอิงจากรายงาน การศึกษาเรื่อง "Preserving Digital Information" from the Task Force on Archiving of Digital Information” อาจสรุปไดวา สารสนเทศเหลานี้ไดแก ขอมูลที่เปนตัวแทนที่จะใชในการแปลบิตที่เหมาะสมตอการเขาถึงขอมูล ที่จะอธิบายแหลง (Source) ของวัสดุสารสนเทศดิจิทัล บริบทที่จะอธิบายความสัมพันธระหวางวัสดุสารสนเทศ ดิจิทัลสารสนเทศที่อยูภายนอก Container การอางอิงเพื่อชี้ไปยังที่อยูของวัสดุสารสนเทศ และ ขอกําหนดที่ แนนอนในการสรางเอกสารที่หามมีการเปลี่ยนแปลง ทางเลือกในการจัดเก็บขอมูลที่เปนตัวแทนเพื่อใชในการถอดรหัส Bit stream ของวัสดุสารสนเทศ ดิจิทัลที่เก็บรักษาไว ก็คือ การจัดเก็บสิ่งที่จะบงชี้ไปยังตําแหนงที่จัดเก็บสารสนเทศแตละตัว ซึ่งควรจะจัดเก็บไวที่ แหลงเดียวกัน (Repository) หรือ เก็บไวที่ศูนยกลาง งานวิจัยที่เกี่ยวของ เชน การวิจัยเรื่อง “Bento container” ของ Apple computer เพื่อศึกษาการเพิ่ม ความสามารถในการเขากันได (Compatibility) ของขอมูลระหวางโปรแกรมคอมพิวเตอรแตละตัว โดย Bento จะ เปนรูปแบบเฉพาะในการจัดเก็บและแลกเปลี่ยนตัวเนื้อหาที่มีลักษณะผสมผสาน และออกแบบมาเพื่อเปน แพลตฟอรมและเนื้อหาที่เปนกลาง ดังนั้น Bento จะสราง Container ที่สะดวกตอการขนสงขอมูลที่มีลักษณะ ผสมผสานทุกประเภทระหวางแพลตฟอรมที่หลากหลาย ในสวนงานวิจัยในปจจุบัน ผูที่สนับสนุนการใชวิธีการนี้ ในการเก็บรักษาสารสนเทศดิจิทัล คือ เจฟ โรเธ็นเบิรก (Jeff Rothenberg) ในงานศึกษาเรื่อง "Avoiding Technological Quicksand" อีกคนหนึ่งคือ ไมเคิล เดย (Michael Day) แหง CEDARS (Metadata for Preservation CEDARS Project Document AIW01 Issues และ Approaches to Preservation Metadata) และ ทอม เชฟเพิรด(Tom Shepard) แหง UPF (Universal Preservation Format (UPF) ในงานเรื่อง Conceptual Framework (Lee, Slattery, Lu, Tang and McCrary, 2002) อยางไรก็ตาม จะเห็นวา วิธีการ Encapsulation ดูคลายกับเปนวิธีการหนึ่งของ Information migration แมว าข อมูลที่เปนทางการเหลา นี้จะชว ยเลื่อนเวลาของการทํา Migration ออกไปบา ง แตอ ยา งไรก็ตาม Encapsulated information ก็ยังตองการการทํา Migration เชนเดียวกัน
130
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
ประเด็นที่ตองพิจารณาในการอนุรักษสารสนเทศดิจิทัล ประเด็นดานที่เกี่ยวของกับการอนุรักษสารสนเทศดิจิทัล มี ดังนี้ 1. Preservation Metadata Preservation metadata พัฒ นาขึ้น มาเพื่อ สนับ สนุน และอํา นวยความสะดวกในการเก็บ รั กษา สารสนเทศดิ จิ ทั ล ในระยะยาว หากจะพู ด ให เ จาะจงก็ คื อ Preservation metadata อาจจะนํ า มาใช ใ น การจัดการดิจิทัลคอลเล็คชั่น เชน จัดเก็บ ขอมูลเชิงเทคนิค (Technical information) ที่จะใชสนับสนุนการ ตัดสินใจและการปฏิบัติในการอนุรักษสารสนเทศดิจิทัล จัดเก็บขอมูลเกี่ยวกับการอนุรักษที่ทําผานมา บันทึกผล ที่เกิดจากการอนุรักษขอมูลดวยวิธีการตาง ๆ แสดงถึงความมั่นใจดาน Authenticity ของทรัพยากรสารสนเทศ ดิจิทัล แต Preservation metadata จะไมใชขอมูลเกี่ยวกับ การจัดการคอลเล็คชั่น (Collection management) และการจัดการดานสิทธิ (Management of rights) อาจกลาวโดยสรุปวา Preservation metadata คือ ขอมูล หรือรายละเอียดเชิงเทคนิคตาง ๆ ที่จําเปนตอการอนุรักษสารสนเทศดิจิทัล อาทิ รูปแบบไฟล โครงสรางของ ข อ มู ล วิ ธี ก ารเรี ย กใช ข อ มู ล ประวั ติ ก ารอนุ รั ก ษ ที่ ทํ า ผ า นมา ทั้ ง ในส ว นของวิ ธี ก ารและการตั ด สิ น ใจ ดั ง ที่ กิลลิแลนด-สเว็ทแลนด (Gilliland-Swetland) กลาววา การที่ทรัพยากรสารสนเทศดิจิทัลจะถูกสรางขึ้นมาได และสามารถที่จะอยูรอดไดเพื่อใหสามารถเรียกกลับมาใชไดอีก โดยกระบวนการ Migration จากคอมพิวเตอร ฮารดแวรและซอฟตแวรรุนหนึ่งไปยังอีกรุนหนึ่ง หรือโดยการลบออกมาแลวจัดสงไปยังระบบใหมทั้งหมดไดนั้น จําเปนจะตองอาศัย Metadata ที่จะบอกถึงวิธีการเขาถึงและเรียกใชขอมูลดังกลาว (Deegan and Tanner, 2002) ดังนั้น preservation metadata จึงมีความสําคัญในการอนุรักษสารสนเทศดิจิทัล ในฐานะที่เปนขอมูลใน การจัดการการเก็บรักษาสารสนเทศดิจิทัลอีกที ขณะที่ Descriptive metadata schemas เชน MARC หรือ Dublin Core จะใชเพื่อ อธิบายลักษณะ และการคนหาทรัพยากรสารสนเทศดิจิทัล อาจกลาวไดวา Preservation metadata เปนเซ็ตยอยของ Administrative metadata เนื่องจากใหขอมูลในสวนของการจัดการสารสนเทศ และขอมูลในดานเทคนิค เกี่ยวกับวิธีการเขาถึงเนื้อหาของทรัพยากรสารสนเทศดิจิทัล รวมทั้ง Authenticity information เชน คุณลักษณะ ด า นเทคนิ ค ประวั ติ ก ารเก็ บ รั ก ษา และข อ มู ล เกี่ ย วกั บ สิ ท ธิ ใ นการปกิ บั ติ เ พื่ อ อนุ รั ก ษ ข อ สารสนเทศดิ จิ ทั ล (National Library of Australia. Preservation Services Branch, WWW, 2003) งานวิจัยดาน Preservation metadata มีการศึกษาพัฒนาอยางกวางขวาง เพื่อหาแนวทางในการ กําหนด Metadata elements set อยางเหมาะสม โดยหลายโครงการไดยึดการพัฒนา Preservation metadata ตามรูปแบบของ OAIS ทั้งนี้ เพื่อใหมั่นใจวาครอบคลุมขอมูลที่จําเปนตอการอนุรักษสารสนเทศดิจิทัลไวทั้งหมด OAIS ไดจําแนกขอมูลที่เปนตอการอนุรักษสารสนเทศดิจิทัล ไว ดังนี้ - Content Information - Representation Information - Preservation Description Information (broken down into Reference, Context, Provenance, and Fixity Information) - Packaging Information. กลุมที่ทําการบุกเบิกงานวิจัยดาน Preservation metadata ในกลุมของหองสมุด ไดแก CEDARS (CURL Exemplars in Digital Archives), NEDLIB (The Network European Deposit Library) , PANDORA
131
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
(Preserving and Accessing Networked Documentary Resources of Australia) ของ The National Library of Australia, OCLC/RLG Working Group on Preservation Metadata. ซึ่งไดพยายามพัฒนา Framework เพื่อนํา Preservation metadata ไปใชจริงในทางปฏิบัติ โดยยึดตาม OAIS reference model โดย ทดลองกับทรัพยากรบางประเภท เชน จดหมายเหตุ ภาพถายที่แปลงใหอยูในรูปดิจิทัล (Digitised images) เปนตน 2. Authenticity and Integrity Authenticity ของทรัพยากรสารสนเทศดิจิทัล จะหมายถึง ระดับความเชื่อมั่นที่ผูใชจะไดรับจาก ทรัพยากรสารสนเทศดิจิทัลวา ทรัพยากรจะยังคงเหมือนเดิมกับที่มีการอางอิงไวหรือไม (เนื้อหาของทรัพยากร ตองเปนอยางที่ควรจะเปน หรือเปนอยางที่แจงไว แสดงถึงความจริงแทของสารสนเทศ) Integrity หรือ บูรณภาพ คือ ความถูกตองสมบูรณของขอมูล ที่จะไมถูกทําใหเปลี่ยนแปลงไมวากรณี ใด ๆ การที่ตองใหความสําคัญดาน Authenticity เนื่องดวยสภาพแวดลอมแบบดิจิทัลมีความเอื้ออํานวยตอ การแกไข การทําซ้ํา ทั้งการทําซ้ําในรูปแบบเดิมและการผลิตออกมาในรูปแบบใหม วิธีการที่ใชในการแปลง การจัดเก็บ และการโอนยาย หรือ การสรางวัสดุสารสนเทศดิจิทัลอาจทําใหสารสนเทศถูกตัดทอน หรือผิดเพี้ยน ไป หรือขอมูลบางสวนสูญหายไป ดังนั้น ในกระบวนการของการ Migration จากระบบหนึ่งหรือ จากรูปแบบหนึ่ง ไปยังอีกระบบหนึ่งหรือรูปแบบหนึ่ง อาจทําใหขอมูลเปลี่ยนไปจากเดิม ซึ่งขอมูลที่สูญหายไปก็เปนขอมูลหนึ่งที่ ตองถูกเก็บรักษาไวเชนกัน การคาดหวังใหเอกสารสามารถทํางานไดจะขึ้นอยูกับซอฟตแวรและความสัมพันธกับ เอกสารอื่น ๆ ซึ่งคุณลักษณะตาง ๆ เหลานี้มีความจําเปนตอการสรางความนาเชื่อถือดานความจริงแทของ เอกสาร หรือ Authenticity นั่นเอง วิธีการที่เหมาะสมในการเก็บรักษาขอมูลเพื่อคงไวซึ่ง Authenticity ขึ้นอยูกับ วัตถุประสงคของการเก็บรักษาสารสนเทศดิจิทัล วา Authenticity มีความสําคัญมากนอยเพียงใด และตองการ รักษาไวในระดับใด วิธีการเหลานี้ อาทิ การะบุ URI การจัดทํา Metadata การระบุวันที่ การใสลายมือชื่อดิจิทัล เปนตน นอกจากนี้ การสราง Authenticity ยังสามารถใชวิธี Encapsulation และ Encryption หรือการ เขารหัสลับ ในกรณีของการใส Water mark อาจใชไดกับซอฟตแวรบางตัวเทานั้น และใชเพื่อปองกันการทําซ้ํา เทานั้น สวนลายมือชื่อดิจิทัลจะใชเพื่อบันทึกความเปนเจาของและบงบอกถึงบาทของเจาของลายเซ็นที่มีตอ เอกสาร 3. ตนทุน (Costs) แมวาคาใชจายในการอนุรักษสารสนเทศดิจิทัลใหสามารถเขาถึงไดในระยะยาวจะประเมินไดยาก อย า งไรก็ ต าม ค า ใช จ า ย หรื อ ต น ทุ น นี้ เ ป น สิ่ ง สํ า คั ญ ประการหนึ่ ง ที่ ต อ งพิ จ ารณา และควรทํ า การศึ ก ษา เปรียบเทียบตนทุนของวิธีการอนุรักษสารสนเทศดิจิทัลแตละวิธี เนื่องจากตนทุนในการดูแลและเก็บรักษา สารสนเทศ ดิจิทัลในระยะแรกจะสูงกวาสารสนเทศที่อยูในรูปกระดาษ (Phillips, WWW, 1999; Research Libraries Group, WWW, 1996) อยางไรก็ตาม จากบทความเรื่อง Digital Conversion of Research Library Materials สตีเฟน แชปอมน และ แอนเน เคนนี (Stephen Chapman and Anne Kenny) รายงานวา จาก การศึกษาเปรียบเทียบเชิงเศรษฐศาสตรระหวางหองสมุดกระดาษกับหองสมุดดิจิทัล พบวา หองสมุดดิจิทัล มีตนทุน-ประสิทธิผล (Cost-effective) สูงกวาหองสมุดกระดาษ จากขอพิสูจน 4 ขอ คือ สถาบันสามารถใช ดิจิทัลคอลเล็คชั่นรวมกัน ดิจิทัลคอลเล็คชั่นสามารถตอบสนองความตองการของผูใชไดมากกวา การเขาถึง 132
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
แบบอิเล็กทรอนิกสทําใหการเขาใชสารสนเทศเพิ่มมากขึ้น และในระยะยาวดิจิทัลคอลเล็คชั่นจะไมเพิ่มตนทุน ทั้งในสวนของการดูแลรักษาและการจัดสงสารสนเทศ (Chapman and Kenny, WWW, 1996) โทนี เฮนเลย (Tony Hendley) ไดเสนอแนะการวิเคราะหตนทุนของสารสนเทศดิจิทัลออกเปน 7 งาน ไดแก การสรางขอมล (Data creation), การคัดเลือกประเมินขอมูล (Data selection and evaluation), การ จัดการขอมูล (Data management), การแสดงทรัพยากร (Resource disclosure), การใชขอมูล (Data use), การอนุรักษขอมูล (Data preservation) และการจัดการสิทธิ (Rights management) (Hendley, www, 1998) คาใชจายในการประเมินสารสนเทศดิจิทัล อาจประกอบดวย ตนทุนในการจัดการเอกสาร การนํา กระบวนการในการเก็บรักษาทรัพยากรสารสนเทศ เชน การ Refreshing ไปปฏิบัติ ทั้งนี้เพื่อใหมั่นใจไดถึง บูรณภาพของเอกสาร การประเมินโครงสรางของขอมูลกับการเปลี่ยนแปลงที่เกิดจากการเปลี่ยนรูปแบบไฟล การบีบอัด และการเขารหัส นอกจากนี้ตองคํานึงถึงตนทุนในการจัดเก็บขอมูล ซึ่งจะครอบคลุมถึงตนทุนในการ ทําสารสนเทศใหพรอมใช คือสามารถคนหาและเขาถึงได (Hendley, WWW, 1998) แมวาการจัดเก็บทรัพยากรประเภทกระดาษและทรัพยากรประเภทอื่นที่ไมใชสื่อดิจิทัล จะมีตนทุนสูง และมีปญหาอยูบาง อยางไรก็ตาม ทรัพยากรกลุมนี้จะไมมีปญหาสําหรับการใชในระยะยาว ในทางตรงขามหาก เปนสารสนเทศดิจิทัล จะตองทําการดูแลรักษาโปรแกรมสําหรับเรียกใชเอกสารดังกลาวไวดวยเพื่อที่จะสามารถ เรียกใชงานไดในอนาคต ดังนั้นจึงจําเปนตองคํานึงตนทุนในการเก็บรักษาโปรแกรมเหลานี้ดวย 4. การคัดเลือก (Selection) เชนเดียวกับสารสนเทศในรูปแบบดั้งเดิมที่จะไมเก็บทุกอยาง แตจะคัดเลือกเก็บรักษาไวบางรายการ เทานั้น สารสนเทศดิจิทัลก็ตองมีกระบวนการในการคัดเลือกเพื่อจัดเก็บเชนเดียวกัน เพียงแตสารสนเทศดิจิทัลจะ มีกรอบระยะเวลาของการตัดสินใจที่สั้นกวา เนื่องจากสื่อบันทึกขอมูลดิจิทัลมีอายุการใชสั้นและตกรุนเร็ว หอสมุดแหงชาติออสเตรเลียไดกําหนดหลักเกณฑในการอนุรักษทรัพยากรสารสนเทศดิจิทัลเพื่อใหสามารถ เขาถึงไดในระยะยาวไว ดังนี้ : “การเขาถึงทรัพยากรสารสนเทศดิจิทัล ควรจะอนุรักษใหมีไวตราบใดที่ทรัพยากรสารสนเทศนั้นยังมี คุณคา หรือมีความสําคัญ ซึ่งอาจพิจารณาจากความสมดุลระหวางตนทุน และประโยชนที่ไดรับ รวมทั้งความ ตองการและความสนใจของผูใชในอนาคต” (National Library of Australia, www, 2003) หนวยงานที่มีนโยบายในการคัดเลือกทรัพยากรไวในคอลเล็คชั่น ไดแก หองสมุด พิพิธภัณฑและหอง แสดงภาพ ซึ่งนโยบายเหลานี้จะเปนจุดเริ่มตนอยางดีในการคัดเลือกทรัพยากรสารสนเทศดิจิทัลเพื่อทําการ อนุรักษ สําหรับหอจดหมายเหตุเปนหนวยงานที่มีการพัฒนาแนวทางในการคัดเลือกและเก็บรักษาทรัพยากร สารสนเทศมานานแลว ซึ่งจะมีรายละเอียดที่คอนขางชัดเจนทั้งในสวนของเกณฑการคัดเลือกและการกําหนด อายุการเก็บรักษาทรัพยากร อยางไรก็ตาม หากจะนํามาใชกับสารสนเทศดิจิทัลควรตองพิจารณาถึงประเด็นตอนี้ ดวย อาทิ ความนาเชื่อถือในเรื่องความจริงแทของขอมูล (Authenticity) ความสามารถในการเขาถึงไดเสมอ (Accessibility) และ บริบทแวดลอม (Context) อยางไรก็ตาม หลักการที่วา การเขาถึงทรัพยากรสารสนเทศ ดิจิทัล ควรจะอนุรักษใหมีไวตราบใดที่ทรัพยากรสารสนเทศนั้นยังมีคุณคา หรือมีความสําคัญนั้น ยังไมไดเปนที่ ยอมรับโดยทั่วไป ตัวอยางเชน ในที่ประชุมการระดมความคิดเกี่ยวกับหนาที่ความรับผิดชอบในการอนุรักษ ทรัพยากรสารสนเทศดิจิทัลในสหราชอาณาจักรและไอแลนด มีขอคิดเห็นวา เมื่อทรัพยากรไดรับการคัดเลือกแลว
133
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
วาจะตองทําการอนุรักษ ก็ควรที่จะไดรับการอนุรักษไวตลอดไป (Haynes, Streatfield, Jowett, and Blake, www,1997) นอกจากนี้ ยัง มี ป จจั ย อื่ น ๆ อาทิ ความเป น ไปได แ ละต น ทุ น ที่ เกี่ ย วขอ งกั บ การอนุ รั ก ษก ารเข า ถึ ง ทรัพยากร ที่ควรนํามาเปนเกณฑในการพิจารณาคัดเลือกทรัพยากรเชนเดียวกัน และสิ่งที่เกี่ยวของอื่น ๆ ไดแก รูปแบบแฟมขอมูลที่ใช การจัดการเอกสารที่ใช สิทธิ์ที่ติดมากับทรัพยากร ซึ่งจะมีผลตอการจัดหาทรัพยากรที่จะ นํามาใชเพื่อการดูแลรักษาการเขาถึงทรัพยากรสารสนเทศดิจิทัล เมื่อคัดเลือกวัสดุสารสนเทศที่ตองเก็บรักษา ไดแลว ประเด็นตอมาที่ตองพิจารณาควบคูกันไปคือ องคประกอบของทรัพยากรสารสนเทศดิจิทัลที่จะตอง เก็บรักษาไว เชน การเชื่อมโยงไปยังเอกสารอื่น การทํางานรวมกับเอกสารอื่น บริบทที่เกี่ยวของหรือสนับสนุน และ 'Look and Feel' ซึ่งอาจสูญหายไประหวางกระบวนการเก็บรักษา ซึ่งในบางกรณีอาจเปนไปไมไดที่จะ เก็บรักษาองคประกอบเหลานี้ไว เกณฑการพิจารณาเพื่ออนุรักษการเขาถึงทรัพยากรเหลานี้อาจตองนํามา พิจารณาเพื่อปรับปรุงแกไขอีกครั้งเมื่อเวลาผานไป การพิจารณาวาสารสนเทศใดที่ควรจะคัดเลือกเขามาเพื่อทําการเก็บรักษา ควรงมีการกําหนดวิธีการใน การแสวงหาทรัพยากรสารสนเทศดิจิทัลที่มีคุณคา การพิจารณาความคุมคาในการเก็บรักษา และใครที่ตองเปน ผูพิจารณา ทรัพยากรสารสนเทศดิจิทัลบางรายการผูผลิตทรัพยากรเองจะเปนผูนํามาเสนอตอสถาบันบริการ สารสนเทศ อย า งไรก็ ต าม สถาบั น บริ ก ารสารสนเทศยั ง คงต อ งพิ จ ารณาถึ ง กิ จ กรรมที่ ส ามารถกระทํ า กั บ สารสนเทศดังกลาวได โดยเฉพาะประเด็นดานกฎหมายที่เกี่ยวของกับเอกสารดิจิทัล 5. ความรวมมือ (Cooperation) ไดแกการทํางานรวมกันระหวางหอจดหมายเหตุกับหองสมุดดิจิทัล ในการแลกเปลี่ยนขอมูลและใช ขอมูลรวมกันได โดยอาศัยสิ่งแวดลอมที่มีอยูคือ อินเทอรเน็ต รูปแบบและกระบวนการทํางานที่ไดมาตรฐานควร ไดรับการพัฒนาอยางจริงจัง ในสังคมดิจิทัลซึ่งการติดตอสื่อสารและทํางานรวมกันสามารถทําไดผานทางเครือขายคอมพิวเตอร บทบาทและความสัมพันธขององคกรที่เกี่ยวของไดเปลี่ยนแปลงไป ผูออกแบบระบบสารสนเทศและผูจัดหา ผูสรางสรรคผลงาน สํานักพิมพ ผูเผยแพร ผูรวบรวม และผูใหบริการเขาถึงสารสนเทศ ตางตองมีบทบาทในการ สรางความเชื่อมั่นวาสารสนเทศดิจิทัลจะสามารถเขาถึง หรือเรียกออกมาใชไดในระยะยาว เนื่องจากกิจกรรมที่ เกิดขึ้นในแตละหนวยจะสงผลถึงหนวยอื่น ๆ ทั้งในปจจุบันและอนาคต ดังนั้น จึงควรมีการกําหนดบทบาทหนาที่ ความรับผิดชอบของแตละฝายอยางชัดเจน เพื่อความสอดคลองในการทํางานรวมกัน ทั้งในสวนของการสราง การใช การจัดการ การเผยแพร และการอนุรักษสารสนเทศดิจิทัล ลักษณะความรวมมือ อาจใชรูปแบบการกระจายความรับผิดชอบใหกับแตละหนวยงานซึ่งอาจแบง ตามเนื้อหาของสารสนเทศที่รับผิดชอบ เนื่องจาก จะมีความเขาใจและเห็นถึงความสําคัญของสารสนเทศที่ จัดเก็บและใหบริการไดชัดเจนกวา จาก Statement of Principles for the Preservation of and Long-Term Access to Australian Digital Objects, ซึ่งจัดทําโดยหอสมุดแหงชาติออสเตรเลีย ไดกลาวถึงลักษะของความ รวมมือไววา “การจัดหา การคัดเลือก การทํารายการ และการกําหนดอายุของสารสนเทศดิจิทัล จะประสบ ความสําเร็จมากที่สุดดวยความรวมมือในลักษณะการกระจายความรับผิดชอบใหกับแตละสถาบัน” (National Library of Australia, www, 2002)
134
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
บทบาทของผูสรางสรรคผลงาน (Role of Creators) จากรายงานการศึกษาของ the (US) Task Force on Archiving of Digital Information เรื่อง Preserving Digital Information: Final Report and Recommendations กลาววา “หากผูสรางสรรคผงาน/ ผูใหบริการ/เจาของทรัพยากรสารสนเทศดิจิทัลยอมรับถึงความรับผิดชอบเบื้องตนในการเก็บรักษาผลงานของ ตนเอง พวกเขาจะเริ่มมองเห็นหลักการของการเปนสวนหนึ่งในการโอนยาย (Migration) ขอมูล รวมทั้ง กระบวนการอื่น ๆ ในการอนุรักษขอมูลในทั้งขั้นตอนของการสรางสรรคผลงาน และการจัดทํา Metadata ที่ สําคัญและจําเปนตอการอนุรักษสารสนเทศซึ่งสถาบันบริการสารสนเทศจะไดนําไปปฏิบัติตอไป ซึ่งหากไมมี ความรวมมือนี้สถาบันบริการสารสนเทศอาจจะไมสามารถอนุรักษวิธีการเขาถึงทรัพยากรสารสนเทศเหลานี้ได แมวาตองการจะทําก็ตาม นอกจากนี้ หนวยงานขนาดใหญ เชน มหาวิทยาลัย ซึ่งเปนองคกรที่ผลิตสารสนเทศ ออกมาเปนจํานวนมาก หากตองการรวบรวมสารสนเทศของหนวยงานควรตองใหความสําคัญกับการกําหนด หนาที่ความรับผิดชอบในการอนุรักษสารสนเทศที่สรางขึ้นใหสามารถเขาถึงไดในระยะยาว (The Commission on Preservation and Access and The Research Libraries Group, WWW, 1996) บทบาทของสํานักพิมพ (Role of Publishers) บทบาทของสํานักพิมพในการอนุรักษสารสนเทศดิจิทัล คือ การเก็บรักษาสารสนเทศของสํานักพิมพให สามารถเขาถึงและเรียกออกมาใชงานไดในอนาคต และนอกจากนี้ในสวนของสํานักพิมพมีสิ่งที่ตองพิจารณา เพิ่มคือ การจัดเตรียมสารสนเทศดิจิทัลของสํานักพิมพใหอยูในรูปแบบที่เหมาะกับการใชงานในหองสมุดดวย เชน เปนรูปแบบ (Version) ที่สามารถผลิตซ้ําได เชน ในลักษณะของการพิมพออกทางเครื่องพิมพ การบันทึกลง สื่อบันทึกขอมูล การจัดสงทางจดหมายอิเล็กทรอนิกส ภายใตการคุมครองดานลิขสิทธิ์ บทบาทภายในองคกร (Roles within Organizations) ทุกแผนกภายในองคกรที่เกี่ยวของกับการอนุรักษสารสนเทศดิจิทัลใหสามารถเขาถึงไดในระยะยาว ตองไดรับการมอบหมายหนาที่ความรับผิดชอบที่ชัดเจน บุคคลเหลานี้ เชน ผูจัดการฝายธุรกิจ เจาหนาฝาย เทคโนโลยีสารสนเทศและการจัดการ และผูผลิตสารสนเทศแตละคน เปนตน
ตัวอยางโครงการที่ทําการศึกษาเกี่ยวกับการอนุรักษสารสนเทศดิจิทัล (Lee, Slattery, Lu, Tang and McCrary, 2002) 1. Australian projects เริ่มทําการศึกษาเกี่ยวกับ Digital preservation ตั้งแตป 1994 โดยใหความสนใจศึกษาการจัดเก็บ วัสดุดิจิทัลหลากหายประเภท อาทิ เอกสารอิเล็กทรอนิกส (Electronic records) สิ่งพิมพออนไลน (Online publications) ขอมูลเสียงที่อยูในรูปดิจิทัล (Digital audio resources) วิทยานิพนธ (Theses) วัสดุแผนที่ (Cartographic materials) โครงการที่สําคัญไดแก - The Victorian Electronic Records Strategy (VERS) ทําการพัฒนามาตรฐานในการจัดการและ เก็บรักษาเอกสารอิเล็กทรอนิกส ซึ่งวิธีการที่ VERS แนะนําคือ การ Encapsulate ตัวเอกสารและบริบทที่ เกี่ยวของไวกับเอกสารโดยใช XML
135
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
-
The Preserving and Accessing Networked Documentary Resources of Australia (PANDORA) ของหอสมุดแหงชาติออสเตรเลีย ทําการศึกษาการจัดเก็บเอกสารเว็บ โดยมี วัตถุประสงคหลัก คือ ตองการเก็บรักษาสิ่งพิมพออนไลนใหสามารถเขาถึงไดในระยะยาว โดย วิธีการที่ใชคือ Migration โดยทดลองกับเอกสาร HTML โดยทําการทดลองเปลี่ยนแปลง Source code ของเอกสาร HTML โดยนําแท็กที่เลิกใชแลวออกไปและนําแท็กใหมเขามาแทนที่ ทั้งนี้เพื่อให เขากันไดกับเว็บบราวเซอรในอนาคต
2. CEDARS เปนโครงการของ The Consortium of University Research Libraries ซึ่งเปนการรวมตัวกันของ หองสมุดมหาวิทยาลัยและหอสมุดแหงชาติในสหราชอาณาจักรและไอแลนด โครงการนี้ใชรูปแบบของ OAIS ซึ่ง เปนรูปแบบของงานจดหมายเหตุ โดยมีการเก็บรักษาขอมูลเปนระบบยอยรวมอยูดวย โดยโครงการลาสุดเปน การศึกษารวมกันระหวาง NEDLIB ในยุโรป CEDARS ในสหราชอาณาจักร และ PANDORA ในออสเตรเลีย CEDARS มีวัตถุประสงคเพื่อหาวิธีการที่เหมาะสมที่สุดในการเก็บรักษาขอมูล ทั้งนี้เพื่อสามารถใหคําแนะนําแก หองสมุดในการเลือกวิธีการปฏิบัติที่เหมาะที่ดีที่สุด นอกจากนี้ยังทําการศึกษาวิเคราะหถึงคาใชจายในการ เก็บรักษาขอมูล วิธีการที่ CEDARS สนใจศึกษาไดแก Migration, Emulation และ Data refreshing ซึ่งจาก การศึกษาเปรียบเทียบระหวางวิธีการ Migration กับ Emulation ในการเก็บรักษา Older digital materials พบวาทั้งสองวิธีเหมาะกับวัสดุดิจิทัลตางประเภทกัน และเชื่อวาไมมีวิธีใดที่จะสามารถแกปญหาทุกอยางได การ เลือกใชวิธีการอนุรักษเพื่อที่จะสามารถเขาถึงขอมูลไดอยางสมบูรณขึ้นอยูกับธรรมชาติของทรัพยากรแตละ ประเภท และวัตถุประสงคในการอนุรักษ นอกจากนี้ CEDARS ยังสนใจศึกษาในประเด็นการสูญเสียของขอมูล (Information loss) ที่เกิดจากการเก็บรักษาดวยวิธีตาง ๆ 3. CAMiLEON เปนโครงการที่ไดรับทุนสนับสนุนจาก Joint Information Systems Committee (JISC) ซึ่งอยูที่ สหราชอาณาจักร และ The National Science Foundation (NSF) ในสหรัฐอเมริกา โดยประเด็นที่สนใจศึกษา ไดแก การนําเทคโนโลยี Emulation ไปปฏิบัติในการเก็บ รักษาขอมูลดิจิ ทัล โดยสนใจในสวนของการศึกษา ศักยภาพของ Emulation ในการกําหนดอายุของฟงกชันการทํางานตาง ๆ และการรักษา Look and feel ของ วัสดุสารสนเทศดิจิทัล มีจุดมุงหมายเพื่อพัฒนาเครื่องมือ (Tools) แนวทาง (Guide line) และตนทุนของวิธีการ Emulation โดยศึกษาเปรียบเทียบกับวิธีการอื่น ๆ โดยทําการทดสอบกับผูใชทรัพยากรสารสนเทศดิจิทัลทั้งใน สิ่งแวดลอมเดิมและสิ่งแวดลอมเสมือนที่สรางขึ้น โดยนําเสนอแนวทางในการใชวิธีการ Emulation และอภิปราย วา Emulation เปนวิธีการที่ใชไดกับทั้งวัสดุสารสนเทศดิจิทัลที่มีลักษณะซับซอน ซึ่งรวมแฟมขอมูลกระทําการ (Executable file) ไวดวย และวัสดุสารสนเทศที่กระบวนการจัดการไมไดอยูในรูปของอิเล็กทรอนิกส 4. NEDLIB ดําเนินการโดยคณะกรรมการถาวรของ the Conference of European National Libraries (CENL) ในป 1998 โดยไดรับทุนสนับสนุนจาก European Commission’s Telematics Application Programme ซึ่ง ประกอบดวย หอสมุดแหงชาติในยุโรป 8 แหง หอจดหมายเหตุแหงชาติ 1 แหง และ สํานักพิมพชั้นนํา โดยผูนํา ของโครงการคือ หอสมุดแหงชาติเนเธอรแลนด มีวัตถุประสงคเพื่อพัฒนาโครงสรางรูปแบบการทํางานงาย ๆ
136
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
และเครื่องมือพื้นฐานในการสรางระบบเพื่อเก็บรักษาสิ่งพิมพอิเล็กทรอนิกส นอกจากนี้ โครงการนี้ยังประยุกตใช OAIS Migration model ดวย วัตถุประสงคหลักของโครงการ NEDLIB คือ เพื่อทําความขาใจถึงขอดีและขอดอย ของวิธีการเก็บรักษาขอมูลในระยะยาวแตละวิธี โดยทําการจําแนกลักษณะของสิ่งพิมพอิเล็กทรอนิกส และวัสดุ สารสนเทศดิ จิ ทั ล กลุ ม อื่ น ๆ การเก็ บ รั ก ษาที่ เ กี่ ย วข อ ง และความต อ งการด า นความจริ ง แท (Authenticity requirement) และเนนการศึกษาในดานตนทุน-ประสิทธิผล (Cost-effectiveness) ขอหามดานกฎหมาย ขอตกลงกับสํานักพิมพ และความตองการในการเขาถึงของผูใชสารสนเทศ เมื่อมีการนํานโยบายการเก็บรักษา ขอมูลมาใช อยางไรก็ตาม โครงการนี้ไดมุงการศึกษาไปที่ประเด็นดานเทคนิคในการเก็บรักษาขอมูลดิจิทัลซึ่งผูที่ ทําการศึกษาในระยะแรกคือ เจฟ โรเธนเบิรก (Jeff Rothenberg) โดยทดลองสราง Prototype ขึ้นมาเพื่อ ทดสอบวิธีการเก็บรักษาขอมูลตามวิธีการ Emulation โดยใช Commercial emulation tools เปนตัวทดสอบ ผลการทดลองพบวา Emulation นาจะทํางานไดตามทฤษฎี โดยสรุปวา Emulators ที่เหมาะสมสามารถใช แพลตฟอรมที่ตกรุนได 5. Kulturarw Heritage เปนโครงการของ Royal Library ในสวีเดน ทําการทดสอบทฤษฎีการรวบรวม (Collecting) การจัดการ จดหมายเหตุ (Archiving) และ การจัดเตรียมความพรอมเพื่อการเขาถึงเอกสารอิเล็กทรอนิกสของสวีเดน โดยใช Crawler หรือ Robot ในการรวบรวมเว็บเพจของสวีเดนแบบอัตโนมัติ แมวาในปจจุบันโครงการยังไมไดมุงเนน มาที่การเก็บรักษาขอมูล แตโครงการนี้กําลังขยายขอบเขตความรวมมือมายังหนวยงานในยุโรปตอนเหนือซึ่งอาจ ทําใหโครงการนี้เริ่มทําการศึกษาถึงวิธีการเก็บรักษาจดหมายเหตุเหลานี้ในระยะยาว 6. Library of Congress ปจจุบัน The Computer Science and Telecommunications Board (CSTB) แหง The National Academies มอบหมายให The Committee on the Information Technology Strategies รวมกับ Library of Congress เพื่อใหคําแนะนําเกี่ยวกับการเก็บรักษาสารสนเทศดิจิทัล ในรายงานของคณะกรรมการไดรวม ขอเสนอแนะเกี่ยวกับการขยายโครงสรางพื้นฐานดานเทคโนโลยี โดยเฉพาะในสวนของ เครือขาย ฐานขอมูล และการรักษาความปลอดภัยของเทคโนโลยีสารสนเทศ โครงการนํารองของหอสมุดรับสภาอเมริกันที่ทํารวมกับ Internet Archive มีวัตถุประสงคเพื่อจัดการจดหมายตุที่เปนเอกสารเว็บโดยทําการเก็บรักษาเว็บไซตดาน การเมืองทุกแขนง โดยใช Digital Library SunSITE Collection และ Preservation Policy ของ มหาวิทยาลัย แคลิฟอรเนียร เบรกลีย ซึ่งมีการรวบรวมขอมูลดิจิทัลหลายระดับ เปนแนวทาง 7. NARA: Persistent Archives and Electronic Records Management โครงการ NARA (National Archives and Records Administration) เปนโครงการที่ริเริ่มโดย San Diego Supercomputer Center โดยไดรับทุนสนับสนุนจาก NARA มีจุดมุงหมายเพื่อพัฒนาการ ดําเนินงานหมายเหตุอยางตอเนื่อง ทั้งนี้เพื่อสนับสนุนการเลือกสรร การจัดเก็บ การคนพบ และการเก็บรักษา ดิจิทัลคอลเล็คชั่น โดยตองการที่จะเก็บรักษาโครงสรางของดิจิทัลคอลเล็คชั่นใหสอดคลองกับตัววัสดุสารสนเทศ ซึ่งเปนสวนหนึ่งของคอลเล็คชั่น เปาหมายที่สําคัญคือ การเก็บรักษาทั้งตัวขอมูลและบริบทแวดลอมที่จะใชใน การอานขอมูล วัตถุประสงคของโครงการ คือ ตองการเก็บรักษาขอมูลดิจิทัลใหอยูไดเปนรอยป โดยการพัฒนา สิ่งแวดลอมที่สนับสนุนการ Migrate คอลเล็คชั่นไปไวยังซอฟตแวรระบบใหม โครงสรางพื้นฐานที่วางไว
137
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
ประกอบดวย ศูนยซุปเปอรคอมพิวเตอร หองสมุดดิจิทัล สิ่งแวดลอมดานคอมพิวเตอรที่มีอยูทั่วไป และนํา XML มาเปนมาตรฐานในการจัดเก็บขอมูล เพื่อใหสามารถแลกเปลี่ยนขอมูลกันได 8. InterPARES โครงการ The International Research on Permanent Authentic Records Electronic Systems (InterPARES) เปนโครงการวิจัยรวมระดับนานาชาติ โดยความรวมมือของนักวิชาการดานจดหมายเหตุ นั ก วิ ช าการด า นวิ ศ วกรรมคอมพิ ว เตอร สถาบั น จดหมายเหตุ แ ห ง ชาติ และตั ว แทนจากภาคอุ ต สาหกรรม เพื่อพัฒนาองคความรูและทฤษฎีที่จําเปนตอการเก็บรักษาขอมูลใหมีอยูอยางถาวรโดยใชระบบอิเล็กทรอนิกส ขอบเขตการวิจัยประกอบดวย การจําแนกองคประกอบของเอกสารอิเล็กทรอนิกสที่จําเปนตองดูแลรักษา พัฒนา เกณฑในการพิจารณาคัดเลือกเอกสารที่ควรตองเก็บรักษา และสรางกฎในการพัฒนานโยบายการเก็บรักษา ขอมูลทั้งในระดับนานาประเทศ ระดับประเทศ และระดับองคกร โดยไดมีการจําแนกขอบเขตการวิจัยออกเปน 4 ดาน คือ ความจริงแท (Authenticity), การประเมินคา (Appraisal), การเก็บรักษา (Preservation), การวางแผน ยุทธศาสตร (Strategies) โดยในสวนของ Authenticity มีวัตถุประสงคเพื่อ จําแนกองคประกอบของเอกสาร อิเล็กทรอนิกสที่ตองมีการเก็บรักษา ในขณะที่เทคโนโลยีมีการเปลี่ยนแปลง ทั้งนี้เพื่อรักษาความมีอยูจริงของ เอกสาร โดยในขั้นที่หนึ่งจะทําการพัฒนาแนวทางในการวิเคราะหและประเมินเอกสารอิเล็กทรอนิกส โครงการนี้ ตั้งอยูที่ School of Library, Archival and Information Studies, University of British Columbia ประเทศ แคนาดา 9. PRISM โครงการ The Preservation, Reliability, Interoperability, Security Metadata (PRISM) เปน โครงการของ Cornell University ประเทศสหรัฐอเมริกา เปนโครงการระยะ 4 ป ไดรับทุนสนับสนุนจาก Digital Library Initiative เพื่อศึกษาและพัฒนานโยบายและเทคนิคที่จําเปนตอการรักษาบูรณภาพของหองสมุดดิจิทัล โดยมุงเนนที่การศึกษาความสามารถที่จะอยูรอดในระยะยาวของสารสนเทศดิจิทัล ความเชื่อถือไดของทรัพยากร สารสนเทศและบริการสารสนเทศ การทํางานรวมกัน การรักษาความปลอดภัย และ Metadata ทิศทางปจจุบัน ของโครงการนี้มุงไปที่การติดตามบูรณภาพของทรัพยากรสารสนเทศประเภท Web-based และผลักดันนโยบาย ในการเก็บรักษาไปยังเจาของเว็บไซตและผูใชสารสนเทศ การติดตามทรัพยากรจะประกอบดวยการ Capture เว็บเพจแบบอัตโนมัติโดยอาศัย Crawler และการทํางานโดยมนุษยในการรวบรวมขอมูลเกี่ยวกับสถานภาพของ องคกรโดยเฉพาะในสวนของทรัพยากรสารสนเทศและคอลเล็คชั่น วัตถุประสงคที่สําคัญคือ การศึกษาในดาน ตนทุน-ประสิทธิผล และ Event-based metadata เพื่อใหผูใชเขาใจนโยบายในการเก็บรักษาและสามารถนําไป ปฏิบัติได 10. Canadian Projects การศึกษาในเรื่อง E-preservation เปนการศึกษาภายใตความรวมมือของ หอสมุดแหงชาติแคนาดา กับ Canadian Initiative on Digital Libraries (CIDL) โดยมีวัตถุประสงคเพื่อ (1) เพื่อใหชาวแคนาดาสามารถ เข า ถึ ง นโยบายได ง า ย (2) เพื่ อ ทํ า การวิ จั ย เกี่ ย วกั บ การสร า ง การใช และการเก็ บ รั ก ษาดิ จิ ทั ล คอลเล็ ค ชั่ น นอกจากนี้ ยังรวมถึงการจัดซื้อวัสดุดิจิทัล รูปแบบของสารสนเทศดิจิทัล และ Metadata
138
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
11. Preservation Project at National Institute of Standard and Technology (NIST) โครงการของ NIST มีดังนี้ - Longevity testing ทําการศึกษาเกี่ยวกับผลของความรอนและความชื้น และแสง ตออายุการ ใชงานของ Optical discs รวมทั้งศึกษาถึงความเสื่อมสภาพของ Optical discsซึ่งผลการศึกษา จะมีประโยชนทั้งตอการผลิต Optical discs ในอนาคต และการจําแนกประเภทของ Optical discs - Testing of Interchangeability and Interoperability of Optical Disc for Use in High-density Storage Systems such as optical disc “Jukeboxes“ เปนการศึกษาความสามารถของ Optical disc กลุมที่จุขอมูลไดสูงโดยทําการศึกษาควบคูกับ Application และทําการศึกษา การนํา XML มาใชในการเก็บรักษาขอมูล โดยทําการศึกษารวมกับ High Density Storage Association (HDSA) โดยศึกษาความเหมาะสมของสื่อบันทึกกับการใชงานในลักษณะตาง ๆ ซึ่ง รวมทั้งการเก็บรักษาขอมูลดวย - Development of the Turbo Coding System การเก็บรักษาขอมูลดวยวิธี Turbo Cod System จะแตกตางจากการเก็บรักษาขอมูลวิธีอื่น ๆ ที่มุงเนนการเก็บรักษาขอมูลใหสามารถอานไดใน ระยะยาว แตเทคโนโลยีใหมมีจุดมุงหมายเพื่อพัฒนาวิธีการในการคนหา และซอมแซมสารสนเทศ ที่สําคัญจากสื่อบันทึกขอมูลที่เสียหาย หรือจากความผิดพลาดอื่น ๆ โปรแกรมนี้ทําการพัฒนา โดยความรวมมือกับ Carnegie-Mellon University ประเทสหรัฐอเมริกา
สรุป ในบทนี้ไดกลาวถึงความสําคัญองการเก็บรักษาขอมูลดิจิทัล ซึ่งเปนเรื่องเรงดวนที่หนวยงานที่เกี่ยวของ ควรเริ่มศึกษาเพื่อจัดเตรียมนโยบาย และวิธีการที่เหมาะสมที่สุดในการเก็บรักษาขอมูลเหลานี้ เพื่อใหมรดก ทางปญญาที่เกิดขึ้นในวันนี้สามารถตกทอดไปถึงลูกหลานในอนาคต วิธีการเก็บรักษาขอมูลที่ไดนําเสนอขางตน ตางมีความเหมาะสมแตกตางกันไป Refreshing หรือการโอนยายขอมูลจากสื่อบันทึกขอมูลไปยังสื่อใหมที่ ทันสมัยกวา จะเหมาะสําหรับการเก็บรักษาขอมูลในระยะสั้น เปนการแกปญหาความเสื่อมสภาพ หรือการตกรุน ของสื่อบันทึกขอมูล สวนวิธีการ Technology preservation เปนวิธีการที่ใชงบประมาณคอนขางมากทั้งในการ ดูแลรักษาฮารดแวรและซอฟตแวรใหพรอมใชในอนาคต ปญหาคือ จะทําอยางไรกับชิ้นสวนที่เลิกผลิตไปแลวใน อนาคตหากฮารดแวรชํารุดเสียหาย นอกจากนี้ วิธีการนี้ยังมีคาใชจายที่คอนขางสูงในเรื่องของการเตรียมพื้นที่ เพื่อจัดเก็บอุปกรณคอมพิวเตอรและอุปกรณตอพวงทั้งหมดใหอยูในสภาพดีพรอมใชงานได สวนวิธีการที่เหมาะ สําหรับจัดเก็บขอมูลในระยะเวลาที่ยาวขึ้นไดแก Migration Emulation และ Encapsulation นั้น Emulation จะเปนวิธีการที่เหมาะสมในกรณีที่ทรัพยากรที่ตองเก็บรักษามีลักษณะซับซอน (Complex resource) และเปน โปรแกรมประยุกต (Application software) เชน เว็บเพจ เกม หรือโปรแกรมกระทําการ (Executable file) และ Emulation จะเปนทางเลือกที่ดีในกรณีที่ยังมีรูปแบบไฟล (File format) ที่เหมาะสมในการเก็บรักษาสารสนเทศ ดิจิทัล และในกรณีที่ Look and Feel เปนสิ่งสําคัญในการเก็บรักษาสารสนเทศดิจิทัล อยางไรก็ตาม Migration และ Encapsulation จะมีความเหมาะสมกวาในกรณีที่มีความรูเรื่องในเรื่องรูปแบบไฟลเพียงพอ หรือมีรูปแบบ ไฟลที่เหมาะสมในการจัดเก็บทรัพยากรสารสนเทศดิจิทัล หรือทรัพยากรจัดเก็บไวในรูปแบบไฟลที่เปนมาตรฐาน หรือมีการใชอย างแพรห ลาย และในกรณีที่ท รัพยากรสารสนเทศไมมีรูปแบบที่ซับ ซอ น และในกรณี ที่ยั ง มี 139
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
การเรียกใช (Actively access) สวนวิธีการ Encapsulate จะเหมาะกับทรัพยากรที่ไมอยูในสถานการณที่ สามารถเรียกขอมูลออกมาใชงานได ซึ่งการพิจารณาวาวิธีการที่เหมาะสมที่สุดในการเก็บรักษาสารสนเทศ ดิจิทัล อาจพิจารณาจาก ประเภทและความซับซอนของสารสนเทศ การใชงานไดของรูปแบบแฟมขอมูล และ การนําสารสนเทศดิจิทัลไปใชไปใช
ทรัพยากรที่มีเนื้อหาซับซอน
ประเภท หรือ ความซับซอน
โปรแกรมประยุกต ทรัพยากรที่มีเนื้อหาไมซับซอน รูปแบบ แฟมขอมูลที่ รจัก
No Emulation
Yes ยังใชงานอยู
No Encapsulation
Yes Migration
แผนภาพแสดงการเลือกวิธีการที่เหมาะสมในการเก็บรักษาทรัพยากรสารสนเทศดิจิทัล (Lee, Slattery, Lu, Tang and McCrary, 2002)
ดังที่กลาวไวในตอนตนวา วัตถุประสงคของการเก็บรักษาสารสนเทศดิจิทัลในระยะยาวก็เพื่อใหมั่นใจ วาจะสามารถเข า ถึงสารสนเทศดิจิทัลที่จัดเก็บไวไดตลอดเวลา ผู ใ ชในอนาคตจะสามารถเขา ถึงทรัพยากร สารสนเทศดิจิทัลที่เก็บไวในหองสมุดดิจิทัลได โดยใชสิ่งแวดลอมดานคอมพิวเตอรของตนเอง หรือโดย Portable readable devices นั่นหมายความวาสารสนเทศดิจิทัลอาจจะตองถูก Migrate เพื่อสามารถเก็บรักษาไวไดใน ระยะยาว แมวาบางกรณีอาจตองใชวิธีการ Emulation ก็ตาม จะเห็นไดวาการจัดเก็บทรัพยากรสารสนเทศดิจิทัล ในระยะยาวจะตองใชหลายวิธีรวมกันเพื่อใหบรรลุวัตถุประสงคของการจัดเก็บสารสนเทศดิจิทัล และตองอาศัย ความรวมมือของทุกสถาบัน เนื่องจากไมมีหนวยงานใดหนวยงานหนึ่งเพียงหนวยงานเดียวจะสามารถเก็บรักษา ทรัพยากรสารสนเทศดิจิทัลไดทั้งหมด และดวยอินเทอรเน็ตทําใหหองสมุดดิจิทัลทั่วโลกสามารถติดตอและใช สารสนเทศรวมกันได นอกจากนี้ ในสวนของรูปแบบมาตรฐานสําหรับการเก็บรักษาสารสนเทศดิจิทัลควรจะไดรับการพัฒนา เชน เดีย วกั น มาตรฐานจะตอ งสามารถทํ า งานรว มกัน และแลกเปลี่ ยนขอ มู ลกั น ได มี เครื่ อ งมื อ ใหผู พั ฒ นา สามารถแกไขปรับปรุงได มาตรฐานจะใชงานไดเสมอและใชงานได นานกวาการแก ไขแบบไมมีมาตรฐาน 140
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
ดังที่กลาวในตอนตนวา การทํา Migration จากรูปแบบไฟลที่ไดมาตรฐานนั้นงายและถูกกวา และถูกตองกวา รูปแบบไฟลที่ไมไดมาตรฐาน ซี่งมาตรฐานนี้ควรจะมีทั้งในสวนของ Emulation และ Encapsulation และควร จะอยูบน Encoding scheme ที่หลากหลายขึ้นอยูกับประเภทของทรัพยากรดิจิทัล ซี่งปจจุบันมีซอฟตแวรเพียง จํานวนนอยที่สามารถสนับสนุนมาตรฐานนี้ได ดังนั้น จึงเริ่มมีการนํา XML มาใชในการเก็บรักษาสารสนเทศ ดิ จิ ทั ล เนื่ อ งจากข อ ดี ห ลายประการของ XML โดยเฉพาะการไม มี ข อ จํ า กั ด ในประเด็ น ของฮาร ด แวร แ ละ ซอฟตแวรที่จะใชในการดูขอมูล การสนับสนุนการทํางานของเว็บและอินเทอรน็ต ซึ่งการมีมาตรฐานกลางเพียง มาตรฐานเดียวเปนสิ่งที่พึงปรารถนาเมื่อมีการนําระบบการเก็บรักษาขอมูลมาปฏิบัติ วิธีการเก็บรักษาสารสนเทศดิจิทัลที่ประสบความสําเร็จมากที่สุดจะตองประกอบดวยการโอนยาย ขอมูลบนพื้นฐานของมาตรฐาน อยางไรก็ตาม การโอนยา ยขอมูลยังคงตองทําการศึกษาและวิจัยเพิ่มเติม เพื่อพิจารณาในสวนของตนทุนที่เกี่ยวของ สรางตนแบบและการปฏิบัติที่ดีที่สุด นอกจากนี้ การใชการทดสอบ เปนฐานเปนสิ่งจําเปนอีกสิ่งหนึ่งสําหรับการระบุวิธีการโอนยายขอมูล ซึ่งผลของการศึกษาจะเปนประโยชนใน การเลือกเครื่องมือที่เหมาะสมในการโอนยายทรัพยากรสารสนเทศดิจิทัลซึ่งมีรูปแบบแตกตางกัน
บรรณานุกรม Besser, Howard. (2001). Digital preservation of moving image material?. [Online]. Available: http://www.gseis.ucla.edu/~howard/Papers/amia-longevity.html. Chapman, Stephen. (2003). What is digital preservation? [Online]. Available: http://www.oclc.org/events/presentations/symposium/chapman.shtm. Chapman, Stephen and Kenney, Anne R. (1996, October). Digital conversion of research library materials. D-Lib Magazine [Online]. Available: http://www.dlib.org/dlib/october96/cornell/ 10chapman.html. The Commission on Preservation and Access and The Research Libraries Group. (1996). Preserving digital information : report of the task force on archiving of digital information. [Online]. Available: ftp://ftp.rlg.org/pub/archtf/final-report.pdf Consultative for Space Data System. (2002). Reference model for an Open Archival Information System (OAIS). [Online]. Available: http://wwwclassic.ccsds.org/documents/pdf. Cornell University Library/Research Department. (2003). Moving theory into practice digital imaging tutorial. [Online]. Available: http://www.library.cornell.edu/preservation/tutorial/preservation/ preservation-01.html. Depot van Nederlandse Elektronische Publicaties. (2001). Long term preservation - research study. [Online]. Available: http://www.kb.nl/kb/ict/dea/ltp/ltpstudy-overview.pdf. Digital Preservation Coalition. (2002). Definitions and concepts. [Online]. Available: http://www.dpconline.org/graphics/intro/definitions.html.
141
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
Granger, Stewart. (2000). Emulation as a digital preservation strategy. D-Lib Magazine 6(10) [Online]. Available: http://www.dlib.org/dlib/october00/granger/10granger.html. Hendley,T. (1998). Comparison of methods & costs of digital preservation. West Yorkshire: British Library Research and Innovation Center. [Online]. Available: http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html Haynes, D., Streatfield, D., Jowett, T. and Blake, M., (1997). Responsibility for digital archiving and long term access to digital data. British Library Research and Innovation Report, 67. London: British Library Research and Innovation Centre. [Online]. Available: http://www.ukoln.ac.uk/services/papers/bl/jisc-npo67/digital-preservation.html. Lawrence, Gregory W.; Kehoe, William R.; Rieger, Oya Y.; Walters, William H. and Kenney, Anne R. (2000). Risk management of digital information: a file format investigation. Washington, D.C: Council on Library and Information Resources. [Online]. Available: http://www.clir.org/pubs/reports/pub93/pub93.pdf Lee, Kyong-Ho; Slattery, Oliver; Lu, Richang; Tang, Xiao and McCrary, Victor. (January–February 2002). The State of the art and practice in digital preservation. Journal of Research of the National Institute of Standards and Technology. 107(1). [Online]. Available: http://nvl.nist.gov/pub/nistpubs/jres/107/1/j71lee.pdf. National Archives of Australia. (1997). Managing electronic record. [Online]. Available: http://www.naa.gov.au/recordkeeping/er/manage_er/contents.html. National Library of Australia. (2002). Statement of principles for the preservation of and long-term access to Australian digital objects. [Online]. Available: http://www.nla.gov.au/preserve/ digital/princ.html. National Library of Australia. Preservation services branch. (2003). Digital preservation strategies. [Online]. Available: http://www.nla.gov.au/padi/topics/18.html. Phillipss, Magaret E. (1999, June). Ensuring long-term access to online publications. The Journal of Electronic Publishing 4(4) [Online]. Available: http://www.press.umich.edu/jep/0404/phillips.html . Research Libraries Group. (1996) Task force on archiving of digital information. [Online]. Available: http://www.rlg.org/ArchTF/tfadi.index.htm Ross, Seamus. (2000). Changing trains at Wigan: digital preservation and the future of scholarship. Technology and Information Institute (HATII), University of Glasgow. [Online]. Available: http://www.bl.uk/services/preservation/occpaper.pdf. Russell, Kelly. (2001). RLG/OCLC report on the attributes of a reliable digital archive for research repositories draft report. Research Libraries Group and OCLC. [Online]. Available: http://www.rlg.org/longterm.
142
อ. นิศาชล จํานงศรี 204214 เทคโนโลยีในงานสารสนเทศ
Rothenberg, Jeff. (1999). Avoiding technological quicksand: finding a viable technical foundation for digital preservation (a report to the council on library and information resources), Washington, DC: Council on Library and Information Resources. [Online]. Available: http://www.clir.org/pubs/reports/rothenberg/pub77.pdf. The State of digital preservation: an international perspective. (2002). Washington, D.C: Council on Library and Information Resources. [Online]. Available: http://www.clir.org/pubs/reports/pub107/pub107.pdf. Technical Advisory Service for Images. (2002). Establishing a digital preservation strategy. [Online]. Available: http://www.tasi.ac.uk/advice/delivering/pdf/digpres2.pdf.
143