Сканеры Xerox могут самостоятельно изменять цифры в сканируемых документах
Недавно было обнаружено, что при определенном сочетании качества изображения и используемых настроек сжатия, сканеры Xerox могут случайным образом изменить цифры на документах при их воспроизведении. Впервые проблема была обнародована ученым David Kriesel, проводящим исследования в рамках программы Ph.D в Университете Бонна. Он разместил результаты нескольких сканирований одного и того же документа на своем сайте. Вскоре в Xerox признали проблему и посоветовали клиентам использовать более высокое значение качества сканирования, чтобы избежать этой проблемы.
Kriesel рассказал, что он впервые заметил проблему, когда использовал Xerox WorkCentre для сканирования в PDF формате некоторых документов по строительству. В документах были здания с выставки, и каждый номер был отмечен небольшим боксом, в котором содержалось название комнаты и ее площадь в квадратных метрах: 14.13m2, 21.11m2 и 17.42m2. На первый взгляд, PDF копии планов казались идентичными оригиналам – кто мог бы ожидать, что при ближайшем рассмотрении выяснится, что копия не соответствует оригиналу. Некоторые области в трех комнатах, в воспроизведенном варианте, оказались не точными копиями оригинала. Kriesel решил расследовать эту проблему. При сканировании в режиме TIFF, при попиксельном воспроизведении, копированные документы были идентичными исходному. Однако, когда было использовано сжатие изображения, начали получаться странные вещи. Xerox WorkCentre 7535 воспроизводил изображение, на котором значения площадей каждой комнаты стали равны 14.13m2 (реальные см. выше). То же самое произошло при одном сканировании и на Xerox WorkCentre 7556. Второе сканирование на этой же машине отобразило два значения в 17.42m2 и одно в 21.11m2, при третьем сканировании два значения отобразились как 14.13m2 и одно в 17.42m2. Kriesel выключил оптическое распознавание символов, однако это не помогло ликвидировать неточности.
В своем блоге он написал, что проблема вызвана определенной корреляцией между размером шрифта сканирования и разрешением, которое используется. Он смог надежно воспроизводить ошибку при сканировании документов в формат PDF на 200 DPI без OCR, с оригиналов, которые содержат шрифт Arial, размером 7 и 8pt. После публикации сообщения он начал получать электронные письма от других пользователей Xerox, которые также смогли воспроизвести проблему и предложили несколько подсказок. Он сузил поиски проблемы сканера до технологии JBIG2-сжатия изображения, которая впоследствии была подтверждена Xerox, как источник проблемы.
Теги: Xerox WorkCentre, Ошибки, Сканирование
Трекбэк с Вашего сайта.