PDA

Просмотр полной версии : Как правильно отсканировать документ


После Ливанова буду Я!
12.12.2013, 12:14
По требованиям МОНа документы, связанные с защитой, выкладываемые на сайт орг-ции должны быть "с распознанным верхним слоем". Собственно вопрос возник вот какого рода. С текстом все понятно, он нормально распознается, а как быть с буквами попавшими под печать? Или например с фамилиями написанными от руки? По идеи аутентичность документа должна полностью сохраниться, т.е. я не могу сместить печать левее (правее) или вбить фамилии руками.

Какие общие мысли? Кто бы как поступил?

leodeltolle
12.12.2013, 12:42
Кто бы как поступил?
оставить картинкой

PNN
12.12.2013, 12:55
а не формат PDF должен быть у выкладываемых файлов?

Старший докторенок
12.12.2013, 13:14
оставить картинкой

Да, надо эти части документа распазновать как картинку. получается чуть бледнее, но зато ни печать, ни подпись не искажается.

Добавлено через 1 минуту
а не формат PDF должен быть у выкладываемых файлов?

Когда сканируешь в PDF, то тоже можно распознать часть документа как картинку.

PNN
12.12.2013, 13:34
так зачастую бывает когда нечетко распознается текст, с ошибками, искажется шрифт и т.д. и т.п. - придется что редактировать его чтобы он выглядел в точности как оригинал? Ну и зачем это сделано?
Не проще было бы сканировать все документы в PDF и эти файлы выкладывать, тогда они в точности будут повторять оригинал? Хоть бы кто над этим из разработчиков норм задумался, если они вообще читают этот сайт...

После Ливанова буду Я!
12.12.2013, 13:35
а не формат PDF должен быть у выкладываемых файлов?

PDF, но распознанный

оставить картинкой

Да, надо эти части документа распазновать как картинку.

Т.е. если печать заползает на фамилию руководителя и название организации (что в общем-то естественно), то просто часть фамилии оставляем не распознанной, а часть распознаем? Или вообще шапку (концовку с визами) как большую картинку?

Старший докторенок
12.12.2013, 13:52
PDF, но распознанный





Т.е. если печать заползает на фамилию руководителя и название организации (что в общем-то естественно), то просто часть фамилии оставляем не распознанной, а часть распознаем? Или вообще шапку (концовку с визами) как большую картинку?

Те части документа где только текст, то распознаем как текст, а ту часть которая с печатью, то как картинку, т.е. если печать наползает на текст, то этот обзац с печатью как картинку, шапку (концовку с визами) как большую картинку. У меня по крайне мере программа позволяет при распозновании определить отедельные области распознования: картинку или текст.