|
3.6 Программное обеспечение
3.6.1 Программное обеспечение при создании методического пособия
При созданни методического пособия были использованы
следующее программное обеспечение: ABBYY FineReader 6.0 Professional,
HomeSite 5, Adobe Photoshop 7.0, ImageReady.
Программа оптического распознавания текста FineReader
была использована для того чтобы быстро перевести нужный для дальнейшей работы текст в электронный вид.
FineReader позволяет ввести содержимое
бумажного документа в текстовый редактор. Введённый текст и графические изображения можно сохранить в
форматах текстового редактора или передать их в электронную таблицу: в форматах PDF
и HTML без изменения оформления документа.
FineReader – омнифонтовая система
оптическограспознавания текстов. Это означает, что она позволяет распознавать тексты, набранные
практически любыми шрифтами, без предварительного обучения. Особенностью программы
FineReader является высокая точность распознавания и малая чувствительность к
дефектам печати, что достигается благодаря применению технологии «целостного целенаправленного
адаптивного распознавания».
Целостность: объект описывается как целое с
помощью значимых элементов и отношений между ними.
Целенаправленность: распознавание строится
как процесс выдвижения и целенаправленной проверки гипотез.
Адаптивность: способность OCR-системы к
самообучению.
В соответствии с этими тремя принципами система сначала
выдвигает гипотезу об объекте распознавания (символе, части символа или нескольких склеенных символах),
а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы
и связывающие их отношения. В каждом структурном элементе выделяются части, значимые для человеческого
восприятия: отрезки, дуги, кольца и точки. Следуя принципу адаптивности, программа самостоятельно
«настраивается», используя положительный опыт, полученный на первых уверенно распознанных символах.
Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения,
делая систему устойчивой к возможным дефектам письма.
Процесс ввода документа в компьютер был осуществлен в два шага:
Первый – это сканирование. В нем сканер играет роль «глаза»
компьютера: «просматривает» изображение и передает его системе. При этом полученное изображение
является не чем иным, как набором черных, белых или цветных точек, картинкой, которую невозможно
отртиедактировать ни в одном текстовом редакторе.
Второй – это распознавание. Обработка изображения OCR-системой.
Обработка изображения системой FineReader
заключается в анализе графического изображения, переданного сканером, и распознавания каждого символа.
Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в
тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм
поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.
В результате работы в окне текстового редактора
FineReader отображается распознанный текст, который был отредактирован и сохранен в
формате HTML.
Программа HomeSite использовалась для
редактирования текста в HTML-формате.
HomeSite – это HTML-редактор для
профессиональных Web-разработок, которые пишутся на HTML и используют различные скриптовые языки для
создания Web-страниц.
|
|
|
|
|
|
|
Создание сайта методического пособия по
"Информационной безопасности" |
Лист |
|
|
|
|
|
15
|
Изм |
Лист |
№ Докум |
Подпись |
Дата |
|
|