PDA

Просмотр полной версии : Чем можно распознать математические формулы?


Mikap
20.08.2003, 13:32
Уж больно много нужно печатать этих формул :( FineReader 6 этого делать не умеет, только при недельном забивании в него всех обозначений. Слышал есть софтина GOSR - распознает и сохраняет в TeX, но так ее и не нашел. Может кто-то сталкивался?

revinski
20.08.2003, 22:03
Mikap
не GOSR, а GOCR
вот официальная страница - http://jocr.sourceforge.net/ там дают дистрибутивы, ибо программа - open-source

скачивай и пользуй :)

revinski
27.08.2003, 13:28
Mikap
вот тебе очень толковый ответ, смотри:
http://forum.ru-board.com/topic.cgi?forum=5&topic=9159#

Mikap
27.08.2003, 13:43
К сожалению, на собственном опыте убедился, о простоте ручного ввода формул в диссертацию. Дня потраченного времени хватило за глаза :( На эксперименты с Линукс у меня мужества не хватило, хотя ежедневно и администрирую FreeBSD. Сейчас поселил на компе MathType 5.1, пока хватает.
В принципе, есть возможность и FineReader надрессировать, но это также вопрос времени. Видел неофициальное мнение разработчиков вышеупомянутой программы о том, что дело хлопотное реализовывать распознавание формул и, кроме всего, маловостребованное :) Видимо в широкой массе потребителей, ученые смотрятся совсем уж небольшой горсткой, если проще вместо формул добавить распознавание африканского языка Тумбо-Юмбо :)

dm
16.10.2004, 01:54
Во-первых, GOCR/JOCR (GNU Optical Character Recognition) ни в настоящее время, ни в обозримом будущем распознавать математические формулы не будет. Так мне сказали его разработчики Bruno Barberi Gnecco и Joerg Schulenburg.
Подробнее см. на Ру-Борде http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=9159#1
Во-вторых, по словам одного из разработчиков ABBYY FineReader'а Красноперова Дмитрия в ближайшей - 8-ой версии программы возможность распознавания математических формул не планируется. Не планируется даже, чтобы FR автоматически распознавал, где текст, где математика, и сам сохранял формулы как рисунки (не говоря уже о распознании формул и сохранении их в редактируемом формате - Word+MathType или TeX/LaTeX).
Ссылки и подробности см. на Ру-Борде http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=12860#1
В-третьих, единственным кандидатом на сегодняшний день на роль работающей программы, распознающей математические формулы в редактируемом формате, является японская InftyReader. Скачать этот OCR-пакет, а также WYSIWYG-редактор под LaTeX - InftyEditor и около-ТеХ-овский макропакет, специально адаптированный под нужды Infty, можно с сайтов разработчиков
http://www.inftyproject.org/index-e.html http://www.caisystem.co.jp/infty/e/index.html В программе на сегодняшний день еще много недоработок, но уже сегодня она позволяет распознавать математические тексты с редактируемыми формулами. Результат можно сохранять в форматах LaTeX / HTML+PNG / MathML / InftyXML / воспринимаемый_человеком_Т еХ.
Имеются проблемы в работе программ под русской Windows.
Кириллица не поддерживается. Сам текст распознаётся несколько хуже, чем FineReader'ом 7.
Обсуждение работы текущей версии см. на Ру-Борде
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=12982#1 Комментарии приветствуются: присылайте мне на мыло или в Ру-Бордовский топик или непосредственно разработчикам.

finmen
20.10.2004, 01:15
Товарисчи, а я чайник. У меня чего-то в Ворде нет редактора написания формул Эквейшн. Мне что, следует весь другой Ворд поставить?

dm
20.10.2004, 11:30
Во-первых, возможно, что всё-таки есть.
Зайдите в Сервис -> Настройка на вкладку "Команды" в категорию "Вставка" и перетащите кнопку "Редактор формул" на панель инструментов. Попробуйте кликнуть.

Если всё-таки нет, какой у Вас Word ?
Если 2003, то при установке он просил Вас сам указать еще одну папку (кроме X:\Program Files\Microsoft Office), в которой будет храниться его дистрибутив. Теперь, когда Вы попробуете вызвать Редактор формул, Ворд сам должен сказать, что нужный компонент не установлен, и предложить его установить.

Если нет, то нужен оригинальный компакт, с которого устанавливался Ворд, чтобы доустановить Редактор формул (нужно выбрать выборочную установку). Если этого компакта нет, то нужно, конечно, всё переставлять.

А вообще лучше, конечно, установить MathType - выглядит он как стандартный Вордовский редактор формул, а возможностей больше. Его можно устанавливать, если даже нет самого редактора формул. (Единственное неудобство может быть, если Вы захотите формулы, набранные в MathType, редактировать на другом компьютере, где нет MathType. Редактор формул их открывать не будет. Хотя выглядеть они, конечно, должны также.)

dm
25.10.2004, 23:39
Вышли новые релиз Infty Editor 2.03d(17-10-2004) и бэта-версия Infty Editor 2.04(20-10-2004).

Несмотря на ряд изменений, по-прежнему есть проблемы с некоторыми символами и интеграцией с MiKTeX или LaTeX Install Kit.

dm
14.12.2004, 02:01
Текущие версии:

релиз Infty Editor 2.03e (11 ноября 2004)
бэта Infty Editor 2.04 beta 3 (13 декабря 2004)

Infty Reader 2.4.2z (13 октября 2004)

mvlad123
14.03.2021, 18:25
К сожалению, все попытки получить адекватно распознанные сложные формулы ни в FineReader, ни в Infty не увенчались успехом. Была и есть задача оцифровки большого количества книг по физике. Поэтому пришлось сделать сервис, в основе которого нейросеть.
Вот его адрес mtscript.ru/mathrec/service/ru (если ссылка будет удалена, то это на сайте mtscript в разделе MT-Recognition. Есть описание на русском. Скоро будет демо видео на youtube), который как раз распознает и текст на множестве языков и формулы (причем очень корректно). Языки с латинскими символами распознаются как с печатных оригиналов, так и с рукописных. Рукописные формулы также великолепно распознаются. Кириллица - только печатная.
Распознаются ВСЕ математические формулы просто за секунды + весь текст вокруг. Набирать ничего не нужно. Все автоматически и очень качественно. Можете не верить, но нейронные сети уже просто творят чудеса. Сам сейчас распознаю книги по математике и физике за пару часов. Да, потом несколько дней вычитываю и правлю ошибки, а раньше на это уходили месяцы.
Логика следующая. Вы получаете текст + формулы в Tex. Копируйте это все в Word и командой MathType-> Toogle Tex делаете из формул в таком формате $ { x } ^ { 2-z } $ привычную формулу MathType, как будто Вы ее лично набрали. Минута делов, к счастью.

Anna95
24.07.2021, 15:11
К сожалению, все попытки получить адекватно распознанные сложные формулы ни в FineReader, ни в Infty не увенчались успехом. Была и есть задача оцифровки большого количества книг по физике. Поэтому пришлось сделать сервис, в основе которого нейросеть.
Вот его адрес mtscript.ru/mathrec/service/ru (если ссылка будет удалена, то это на сайте mtscript в разделе MT-Recognition. Есть описание на русском. Скоро будет демо видео на youtube), который как раз распознает и текст на множестве языков и формулы (причем очень корректно). Языки с латинскими символами распознаются как с печатных оригиналов, так и с рукописных. Рукописные формулы также великолепно распознаются. Кириллица - только печатная.
Распознаются ВСЕ математические формулы просто за секунды + весь текст вокруг. Набирать ничего не нужно. Все автоматически и очень качественно. Можете не верить, но нейронные сети уже просто творят чудеса. Сам сейчас распознаю книги по математике и физике за пару часов. Да, потом несколько дней вычитываю и правлю ошибки, а раньше на это уходили месяцы.
Логика следующая. Вы получаете текст + формулы в Tex. Копируйте это все в Word и командой MathType-> Toogle Tex делаете из формул в таком формате $ { x } ^ { 2-z } $ привычную формулу MathType, как будто Вы ее лично набрали. Минута делов, к счастью.


Мой опыт

Рапознавала формулы Файным, принудительно задавая выделенной области тип "Рисунок", потом перенабирала Эквейшеном в Ворде.

nesowertwo
24.04.2024, 13:17
Буду знать, спасибо