Цитата:
Сообщение от mvlad123
К сожалению, все попытки получить адекватно распознанные сложные формулы ни в FineReader, ни в Infty не увенчались успехом. Была и есть задача оцифровки большого количества книг по физике. Поэтому пришлось сделать сервис, в основе которого нейросеть.
Вот его адрес mtscript.ru/mathrec/service/ru (если ссылка будет удалена, то это на сайте mtscript в разделе MT-Recognition. Есть описание на русском. Скоро будет демо видео на youtube), который как раз распознает и текст на множестве языков и формулы (причем очень корректно). Языки с латинскими символами распознаются как с печатных оригиналов, так и с рукописных. Рукописные формулы также великолепно распознаются. Кириллица - только печатная.
Распознаются ВСЕ математические формулы просто за секунды + весь текст вокруг. Набирать ничего не нужно. Все автоматически и очень качественно. Можете не верить, но нейронные сети уже просто творят чудеса. Сам сейчас распознаю книги по математике и физике за пару часов. Да, потом несколько дней вычитываю и правлю ошибки, а раньше на это уходили месяцы.
Логика следующая. Вы получаете текст + формулы в Tex. Копируйте это все в Word и командой MathType-> Toogle Tex делаете из формул в таком формате $ { x } ^ { 2-z } $ привычную формулу MathType, как будто Вы ее лично набрали. Минута делов, к счастью.
|
Мой опыт
Рапознавала формулы Файным, принудительно задавая выделенной области тип "Рисунок", потом перенабирала Эквейшеном в Ворде.