Показать сообщение отдельно
Старый 29.06.2010, 18:47   #57
Ink
Киберпанк
 
Регистрация: 24.04.2009
Сообщений: 10,958
По умолчанию

Цитата:
Сообщение от Dikoy Посмотреть сообщение
Очень надо именно их? Дисера под рукой нет сейчас.
Нет, в принципе. Нужно странички 4 смешанного текст/сложные формулы/графики

Добавлено через 6 минут 15 секунд
З.ы. сейчас дерну с какого-нибудь к.т.н.овского автореферата.

Добавлено через 23 минуты 57 секунд
ап: как бы мини тест показал, что сложные формулы и рисунки распознать автоматом нельзя, только как картинку. Качество зависит от источника. Текст же, даже в самом низком качестве распознается без проблем.

Добавлено через 44 минуты 51 секунду
ап 2
Цитата:
Сообщение от Dikoy Посмотреть сообщение
Желающие могут скачать и высказать своё мнение (3,5 Мб): http://slil.ru/29406303
Хватит такого качества, или стоит приподнять?
Я снизил качество еще на 25% за счет бикубического даунсамплинга, визуально текст читать можно, но очень сложно. Файн Ридером же текст распознается беспроблемно. А вот о рисунках/формулах можно забыть.
Итого
копипасту с технических текстов, с обилием формул, это усложнит, но гуманитарные тексты сдираются на раз, а потому гуманитариям заморачиваться не стоит: мартышкин труд.
Ink вне форума   Ответить с цитированием
Реклама