Анализ содержания документа Word

We use cookies. Read the Privacy and Cookie Policy

Анализ содержания документа Word

И еще одно сравнение форматов ASCII и Word. В предыдущем примере мы отметили, что файл Word более чем в сто раз тяжелее, чем файл ASCII с тем же текстом. И в любом хорошем текстовом редакторе вроде TextWrangler можно понять, почему это так. Открыв файл Word с повесткой совещания, увидим следующее его содержание:

Файл Word содержит кучу информации. И это ключевое различие между документами в Word и в ASCII. Если ASCII содержит только те символы, которые пользователь видит на экране, документы Microsoft Word могут содержать и текст, и все остальное, что Microsoft решит включить в файл, не показывая этого пользователю. Даже если не учитывать все остальные недостатки Word – размер файлов, образ мышления 1980-х годов, дороговизну обновлений, то сам принцип становится проблемой. Не стоит использовать формат, который скрывает в ваших файлах информацию без вашего ведома и согласия. Хотя в некоторых обстоятельствах Word неизбежен, пользователям по крайней мере следует знать, как этот формат устроен.

Чиновникам британского правительства это знание несколько лет назад досталось дорогой ценой. «Опасное досье» – документ Word, содержавший информацию, которая помогла оправдать поддержку правительством войны в Ираке, – был разослан журналистам в начале 2003 года. Один предприимчивый журналист открыл документ в текстовом редакторе (или это сделал его друг-технарь) и увидел неизвестные до того имена некоторых авторов отчета. Это вызвало новую волну переполоха, и в августе 2003 года BBC сообщило: «Правительство Соединенного Королевства практически перестало пользоваться Microsoft Word для документов, которые должны стать достоянием общественности, и обратилось к созданию документов с помощью Adobe Acrobat, который использует формат PDF»[28]. В той же статье сообщается, что файлы Word могут без ведома пользователей содержать «имена авторов документа, их отношения друг с другом, более ранние версии документов… и порой очень конфиденциальную информацию вроде номера счета социального обеспечения… и информацию о внутреннем пути документа в сети, которая может оказаться полезной для взлома данной сети». Если цель – написать небольшой текст, это, согласитесь, слишком серьезные риски.

Данный текст является ознакомительным фрагментом.