3 minute read

Технофайлы

ОБ АВТОРЕ Дэвид Поуг (David Pogue) — обозреватель Yahoo Tech, ведущий научно-популярного телесериала NOVA на телеканале PBS.

Ваше спасение – опыт Библиотеки Конгресса США

Advertisement

Я не первый технарь, кто с тревогой пишет о «тленности данных», которая проявляется в том, что компьютерные файлы начинают устаревать. На протяжении многих лет мы вверяли свои записи, деловую документацию, любимую музыку и произведения искусства таким носителям информации, как вышедшие из употребления перфокарты, магнитные ленты, дискеты и Zip-диски. И если вы думаете, что компакт-диски будут служить вам бесконечно долго, то глубоко ошибаетесь. Сегодня я хочу поговорить кое о чем еще более серьезном, что не даст вам заснуть ночью, аименно —о деградации форматафайла. Это тот случай, когда вам следует беспокоиться не о носителе информации, а о форматах файлов с вашими документами. Эта проблема поразила меня как гром среди ясного неба, когда в начале этого года я попытался открыть свои документы, созданные в старой версии текстового редактора Microsoft Word, и у меня ничего не вышло. Новая версия Word не могла открыть файлы, созданные с помощью этой же программы примерно в 1989 г. Не есть ли это нарушение некоего элементарного закона? Пренебрежение некоей негласной договоренностью? Чтобы почувствовать, как это выглядит, представьте, что одним прекрасным утром вы обнаруживаете, что ваши отвертки не подходят к триллионам винтов и шурупов, скрепляющих бесчисленные конструкции.

Первые десять лет своей профессиональной деятельности, сразу после окончания университета, я работал аранжировщиком и дирижером бродвейских мюзиклов в Нью-Йорке. Многие годы я создавал музыкальные партитуры, пользуясь ранними версиями музыкального программного обеспечения — приложением Professional Composer, программами Deluxe Music Construction Set и HB Engraver. Каждый раз на это уходило много часов труда. И что теперь? Я не могу заглянуть в эти партитуры. Я их никогда не увижу, кроме тех, что успел в свое время распечатать. Исходные программы давно канули в Лету, а с ними под замком навсегда оказались все ноты и аккорды. Так как же будущие поколения смогут получить доступ к нашим сценариям, романам, фотографиям, видеозаписям и другим компьютерным продуктам? А знаете кто тратит уйму времени на решение этого вопроса? Библиотека Конгресса США. Она выделяет многие миллионы долларов на оцифровку 70 млн своих манускриптов, 14 млн фотографий и 800 тыс. раритетных книг. Это делается для того, чтобы сохранить их и сделать доступными для пользователей интернета.

Несколько лет назад мне довелось брать интервью у Хелены Зинкэм (Helena Zinkham), заведующей отделом эстампов и фотографий Библиотеки Конгресса США. Она отметила, что бумага — один из лучших носителей информации для хранения документов, более того, особенно хороша бумага, изготовленная в давние времена. «В XV, XVI и XVII вв. она была гораздо прочнее, поскольку ее изготавливали на основе хлопковых и льняных волокон, — сказала она мне. — Однако в XIXв., с началом массового производства бумаги, в процессе ее создания стали применять различные химикаты». Эти химикаты приводили к более скорому ее износу. Так что Библиотеке Конгресса хорошо известно об устаревании формата файлов, и ее сотрудники озабочены сохранением своей коллекции для будущих поколений. Какие же намерения на этот счет у вас? Каким, по-вашему, будет формат компьютерного файла лет эдак через 200? Итак, в первую очередь, вы выбираете способ открыть формат, насколько это возможно, если он, конечно, специально не закрыт компанией — разработчиком программного обеспечения. Для оцифровки своих фотографий, книг и документов Библиотека Конгресса выбрала формат TIFF(от англ. Tagged Image File Format, формат хранения растровых графических изображений). «Похоже, это дает нам надежду на сохранение наших файлов в рабочем состоянии на многие годы», — говорит Зинкэм. И вот в чем ключ к решению проблемы: оказывается, реконверсия (обратное преобразование) изначально входила в планы библиотеки. Когда здесь в середине 1990-х гг. приступили к осуществлению программы по сканированию изображений и документов, разрешение было очень низким — всего 420–560 пикселей на весь снимок. Сегодня каждое изображение состоит из нескольких тысяч пикселей в длину и ширину. Конечно, это означает, что работа по преобразованию форматов на самом деле не закончится никогда. Уже сейчас в Библиотеке Конгресса повторно сканируют наиболее важные документы и изображения, чтобы воспользоваться достижениями современных технологий, обеспечивающих лучшие разрешение и глубину сканов, — и этот процесс планируется периодически повторять. Такой же стратегии, по-видимому, должны придерживаться и мы с вами. Если бы я открывал те старые документы формата Word1.0 и сохранял их с помощью следующих версий Word, они до сих пор находились бы в рабочем состоянии и были доступны для использования. Но я не заботился о переформатировании, поскольку не видел в этом необходимости. Теперь вы по крайней мере предупреждены и подобная отговорка вас не оправдывает. Перевод: С.Э. Шафрановский Бумага — один из лучших носителей информации для хранения документов. Особенно хороша была бумага, изготовленная в XV, XVI и XVII вв. Она была гораздо прочнее, поскольку ее изготавливали на основе хлопковых и льняных волокон. Однако в XIX в., с началом массового производства бумаги, в процессе ее создания стали применять различные химикаты, что приводило к более скорому ее износу

This article is from: