Сафоновский колледж информационных технологий. Дипломный проект Александра Штылева



3.6 Программное обеспечение

3.6.1 Программное обеспечение при создании методического пособия

       При созданни методического пособия были использованы следующее программное обеспечение: ABBYY FineReader 6.0 Professional, HomeSite 5, Adobe Photoshop 7.0, ImageReady.
       Программа оптического распознавания текста FineReader была использована для того чтобы быстро перевести нужный для дальнейшей работы текст в электронный вид.
       FineReader позволяет ввести содержимое бумажного документа в текстовый редактор. Введённый текст и графические изображения можно сохранить в форматах текстового редактора или передать их в электронную таблицу: в форматах PDF и HTML без изменения оформления документа.
       FineReader – омнифонтовая система оптическограспознавания текстов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати, что достигается благодаря применению технологии «целостного целенаправленного адаптивного распознавания».
       Целостность: объект описывается как целое с помощью значимых элементов и отношений между ними.
       Целенаправленность: распознавание строится как процесс выдвижения и целенаправленной проверки гипотез.
       Адаптивность: способность OCR-системы к самообучению.
       В соответствии с этими тремя принципами система сначала выдвигает гипотезу об объекте распознавания (символе, части символа или нескольких склеенных символах), а затем подтверждает или опровергает ее, пытаясь последовательно обнаружить все структурные элементы и связывающие их отношения. В каждом структурном элементе выделяются части, значимые для человеческого восприятия: отрезки, дуги, кольца и точки. Следуя принципу адаптивности, программа самостоятельно «настраивается», используя положительный опыт, полученный на первых уверенно распознанных символах. Целенаправленный поиск и учет контекста позволяют распознавать разорванные и искаженные изображения, делая систему устойчивой к возможным дефектам письма.
       Процесс ввода документа в компьютер был осуществлен в два шага:
       Первый – это сканирование. В нем сканер играет роль «глаза» компьютера: «просматривает» изображение и передает его системе. При этом полученное изображение является не чем иным, как набором черных, белых или цветных точек, картинкой, которую невозможно отртиедактировать ни в одном текстовом редакторе.
       Второй – это распознавание. Обработка изображения OCR-системой.
       Обработка изображения системой FineReader заключается в анализе графического изображения, переданного сканером, и распознавания каждого символа. Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.
       В результате работы в окне текстового редактора FineReader отображается распознанный текст, который был отредактирован и сохранен в формате HTML.
       Программа HomeSite использовалась для редактирования текста в HTML-формате.
       HomeSite – это HTML-редактор для профессиональных Web-разработок, которые пишутся на HTML и используют различные скриптовые языки для создания Web-страниц.
         
Создание сайта методического пособия по
"Информационной безопасности"
Лист
         
15
Изм
Лист
№ Докум
Подпись
Дата

Страницы

1заданиерецензияотзыв23456789101112131415161718192021222324252627282930

Hosted by uCoz