Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Software (программное обеспечение) (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=107)
-   -   Чем можно распознать математические формулы? (http://www.aspirantura.spb.ru/forum/showthread.php?t=2634)

Mikap 20.08.2003 13:32

Чем можно распознать математические формулы?
 
Уж больно много нужно печатать этих формул :( FineReader 6 этого делать не умеет, только при недельном забивании в него всех обозначений. Слышал есть софтина GOSR - распознает и сохраняет в TeX, но так ее и не нашел. Может кто-то сталкивался?

revinski 20.08.2003 22:03

Чем можно распознать математические формулы?
 
Mikap
не GOSR, а GOCR
вот официальная страница - http://jocr.sourceforge.net/ там дают дистрибутивы, ибо программа - open-source

скачивай и пользуй :)

revinski 27.08.2003 13:28

Чем можно распознать математические формулы?
 
Mikap
вот тебе очень толковый ответ, смотри:
http://forum.ru-board.com/topic.cgi?forum=5&topic=9159#

Mikap 27.08.2003 13:43

Чем можно распознать математические формулы?
 
К сожалению, на собственном опыте убедился, о простоте ручного ввода формул в диссертацию. Дня потраченного времени хватило за глаза :( На эксперименты с Линукс у меня мужества не хватило, хотя ежедневно и администрирую FreeBSD. Сейчас поселил на компе MathType 5.1, пока хватает.
В принципе, есть возможность и FineReader надрессировать, но это также вопрос времени. Видел неофициальное мнение разработчиков вышеупомянутой программы о том, что дело хлопотное реализовывать распознавание формул и, кроме всего, маловостребованное :) Видимо в широкой массе потребителей, ученые смотрятся совсем уж небольшой горсткой, если проще вместо формул добавить распознавание африканского языка Тумбо-Юмбо :)

dm 16.10.2004 01:54

Чем можно распознать математические формулы?
 
Во-первых, GOCR/JOCR (GNU Optical Character Recognition) ни в настоящее время, ни в обозримом будущем распознавать математические формулы не будет. Так мне сказали его разработчики Bruno Barberi Gnecco и Joerg Schulenburg.
Подробнее см. на Ру-Борде http://forum.ru-board.com/topic.cgi?...1&topic=9159#1
Во-вторых, по словам одного из разработчиков ABBYY FineReader'а Красноперова Дмитрия в ближайшей - 8-ой версии программы возможность распознавания математических формул не планируется. Не планируется даже, чтобы FR автоматически распознавал, где текст, где математика, и сам сохранял формулы как рисунки (не говоря уже о распознании формул и сохранении их в редактируемом формате - Word+MathType или TeX/LaTeX).
Ссылки и подробности см. на Ру-Борде http://forum.ru-board.com/topic.cgi?...&topic=12860#1
В-третьих, единственным кандидатом на сегодняшний день на роль работающей программы, распознающей математические формулы в редактируемом формате, является японская InftyReader. Скачать этот OCR-пакет, а также WYSIWYG-редактор под LaTeX - InftyEditor и около-ТеХ-овский макропакет, специально адаптированный под нужды Infty, можно с сайтов разработчиков
http://www.inftyproject.org/index-e.html http://www.caisystem.co.jp/infty/e/index.html В программе на сегодняшний день еще много недоработок, но уже сегодня она позволяет распознавать математические тексты с редактируемыми формулами. Результат можно сохранять в форматах LaTeX / HTML+PNG / MathML / InftyXML / воспринимаемый_человеком_Т еХ.
Имеются проблемы в работе программ под русской Windows.
Кириллица не поддерживается. Сам текст распознаётся несколько хуже, чем FineReader'ом 7.
Обсуждение работы текущей версии см. на Ру-Борде
http://forum.ru-board.com/topic.cgi?...&topic=12982#1 Комментарии приветствуются: присылайте мне на мыло или в Ру-Бордовский топик или непосредственно разработчикам.

finmen 20.10.2004 01:15

Чем можно распознать математические формулы?
 
Товарисчи, а я чайник. У меня чего-то в Ворде нет редактора написания формул Эквейшн. Мне что, следует весь другой Ворд поставить?

dm 20.10.2004 11:30

Чем можно распознать математические формулы?
 
Во-первых, возможно, что всё-таки есть.
Зайдите в Сервис -> Настройка на вкладку "Команды" в категорию "Вставка" и перетащите кнопку "Редактор формул" на панель инструментов. Попробуйте кликнуть.

Если всё-таки нет, какой у Вас Word ?
Если 2003, то при установке он просил Вас сам указать еще одну папку (кроме X:\Program Files\Microsoft Office), в которой будет храниться его дистрибутив. Теперь, когда Вы попробуете вызвать Редактор формул, Ворд сам должен сказать, что нужный компонент не установлен, и предложить его установить.

Если нет, то нужен оригинальный компакт, с которого устанавливался Ворд, чтобы доустановить Редактор формул (нужно выбрать выборочную установку). Если этого компакта нет, то нужно, конечно, всё переставлять.

А вообще лучше, конечно, установить MathType - выглядит он как стандартный Вордовский редактор формул, а возможностей больше. Его можно устанавливать, если даже нет самого редактора формул. (Единственное неудобство может быть, если Вы захотите формулы, набранные в MathType, редактировать на другом компьютере, где нет MathType. Редактор формул их открывать не будет. Хотя выглядеть они, конечно, должны также.)

dm 25.10.2004 23:39

Чем можно распознать математические формулы?
 
Вышли новые релиз Infty Editor 2.03d(17-10-2004) и бэта-версия Infty Editor 2.04(20-10-2004).

Несмотря на ряд изменений, по-прежнему есть проблемы с некоторыми символами и интеграцией с MiKTeX или LaTeX Install Kit.

dm 14.12.2004 02:01

Чем можно распознать математические формулы?
 
Текущие версии:

релиз Infty Editor 2.03e (11 ноября 2004)
бэта Infty Editor 2.04 beta 3 (13 декабря 2004)

Infty Reader 2.4.2z (13 октября 2004)

mvlad123 14.03.2021 18:25

К сожалению, все попытки получить адекватно распознанные сложные формулы ни в FineReader, ни в Infty не увенчались успехом. Была и есть задача оцифровки большого количества книг по физике. Поэтому пришлось сделать сервис, в основе которого нейросеть.
Вот его адрес mtscript.ru/mathrec/service/ru (если ссылка будет удалена, то это на сайте mtscript в разделе MT-Recognition. Есть описание на русском. Скоро будет демо видео на youtube), который как раз распознает и текст на множестве языков и формулы (причем очень корректно). Языки с латинскими символами распознаются как с печатных оригиналов, так и с рукописных. Рукописные формулы также великолепно распознаются. Кириллица - только печатная.
Распознаются ВСЕ математические формулы просто за секунды + весь текст вокруг. Набирать ничего не нужно. Все автоматически и очень качественно. Можете не верить, но нейронные сети уже просто творят чудеса. Сам сейчас распознаю книги по математике и физике за пару часов. Да, потом несколько дней вычитываю и правлю ошибки, а раньше на это уходили месяцы.
Логика следующая. Вы получаете текст + формулы в Tex. Копируйте это все в Word и командой MathType-> Toogle Tex делаете из формул в таком формате $ { x } ^ { 2-z } $ привычную формулу MathType, как будто Вы ее лично набрали. Минута делов, к счастью.


Текущее время: 21:29. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2024, «Аспирантура. Портал аспирантов»