Цитата:
Сообщение от Dikoy
(Сообщение 90068)
Очень надо именно их? Дисера под рукой нет сейчас.
|
Нет, в принципе. Нужно странички 4 смешанного текст/сложные формулы/графики
Добавлено через 6 минут 15 секунд
З.ы. сейчас дерну с какого-нибудь к.т.н.овского автореферата.
Добавлено через 23 минуты 57 секунд
ап: как бы мини тест показал, что сложные формулы и рисунки распознать автоматом нельзя, только как картинку. Качество зависит от источника. Текст же, даже в самом низком качестве распознается без проблем.
Добавлено через 44 минуты 51 секунду
ап 2
Цитата:
Сообщение от Dikoy
(Сообщение 89976)
Желающие могут скачать и высказать своё мнение (3,5 Мб): http://slil.ru/29406303
Хватит такого качества, или стоит приподнять?
|
Я снизил качество еще на 25% за счет бикубического даунсамплинга, визуально текст читать можно, но очень сложно. Файн Ридером же текст распознается беспроблемно. А вот о рисунках/формулах можно забыть.
Итого
копипасту с технических текстов, с обилием формул, это усложнит, но гуманитарные тексты сдираются на раз, а потому гуманитариям заморачиваться не стоит: мартышкин труд.
|