PDA

Просмотр полной версии : Сравнение двух word файлов


Ink
16.03.2010, 01:12
Есть два текстовых файла ворд, сравниваю их через рецензирование --> сравнить но вот как интерпретировать результаты разобраться не могу. Хотелось бы что-то на подобии антиплагиата. Можно ли как-то настроить ворд чтобы выдавал такие же отчёты?

lxa85
16.03.2010, 07:09
Ink, не совсем ясна задача. Можно еще более развернуто?

Jacky
16.03.2010, 16:08
А что конкретно смущает? Вроде там не очень сложная система, сравниваются два текста, один принимается за исходный, второй за измененный. При этом за исходный, конечно, лучше принимать более раннюю редакцию документа.

И по умолчанию (если не настраивать), в результатах показан текст измененной редакции, в которой по сравнению с исходной:
1. совпадающий текст никак не выделен
2. зачеркнуто то, что есть в исходном, но нет в измененном
3. подчеркнуто то, что есть в измененном, но нет в исходном

Собственно, и всё. Вполне просто, вроде бы.

В антиплагиате, задача прямо противоположная. Здесь мы ищем расхождения в файлах, а там одинаковые куски. Так что по сути дела, если нужно то же самое, что в антиплагиате, достаточно обращать внимание на п.1 то есть куски не зачеркнутого и не подчеркнутого текста.

Вот, вроде бы так.

Ink
16.03.2010, 17:16
А что конкретно смущает?
Обилие окон где куча зачёркнутого и подчеркнутого текста.[/QUOTE]

Вроде там не очень сложная система, сравниваются два текста, один принимается за исходный, второй за измененный. При этом за исходный, конечно, лучше принимать более раннюю редакцию документа.
У меня три документа. Третий создан компиляцией и существенной переработкой первых двух. Причем из первого (на глазок) взята компоновка, а из второго - текст. Но документы на много десятков страниц. Вот у меня и стоят задачи узнать:
1) что заимствовано из первых двух документов в третий (но реально я сравниваю два файла);
2) что ново.

Jacky
16.03.2010, 17:25
Обилие окон где куча зачёркнутого и подчеркнутого текста.
Версия ворда какая? Обращать внимание надо на центральное окно, остальные дополнительные.

что заимствовано
Смотрите не зачеркнутые и не подчеркнутые куски. Это и будут текстуальные совпадения.

Ink
16.03.2010, 17:44
Версия ворда какая? Обращать внимание надо на центральное окно, остальные дополнительные. 2007. Но от количества зачёркиваний/подчёркиваний красным/синим/чёрным цветом у меня уже рябит в глазах


Смотрите не зачеркнутые и не подчеркнутые куски. Это и будут текстуальные совпадения.
Сложно. Я по простому хотел. Но, видимо, придётся так.

Jacky
16.03.2010, 19:43
Можно еще попробовать внешние программы сравнения типа Compare It! (умеет работать с файлами word). Там покопаться в настройках, перенос предложений, игнорирование пробелов и т.д. В принципе, тоже может нормально получиться.

IvanSpbRu
16.03.2010, 21:48
Есть два текстовых файла ворд, сравниваю их через рецензирование --> сравнить но вот как интерпретировать результаты разобраться не могу. Хотелось бы что-то на подобии антиплагиата. Можно ли как-то настроить ворд чтобы выдавал такие же отчёты?

Полезная функция, никак не мог ее в ворде найти. И рецензирование сейчас у себя в списке функций тоже не вижу (ворд 2003). Где его искать, подскажите, пожалуйста?

Jacky
16.03.2010, 22:03
IvanSpbRu, http://www.computerra.ru/gid/rtfm/office/219898/

IvanSpbRu
16.03.2010, 23:13
Jacky, спасибо большое

lxa85
17.03.2010, 18:11
Не знаю как в MS, а собственно давно уже существует diff (http://www.gnu.org/software/diffutils/). (входит в состав DiffUtils)
DiffUtils for Windows (http://gnuwin32.sourceforge.net/packages/diffutils.htm)
On-line сравниватель (http://realcode.ru/diff/)
Через ссылку на википедию можно найти программу
WinMerge (http://winmerge.org) Он расцветит фон, вместо подчеркиваний.

СОбственно благодаря наличию хорошего инструментария для работы с текстом (PlainText) для его наличие более предпочтительно нежели в комплекте с оберткой Word.

Вот только с конверторами Word to Text сложновато. Мне путного бесплатного пока не встретилось. (Сразу пометку сделаю, позволяющую пакетно перевести порядка 150-200 файлов.)

Jacky
18.03.2010, 14:48
Вот только с конверторами Word to Text сложновато. Мне путного бесплатного пока не встретилось. (Сразу пометку сделаю, позволяющую пакетно перевести порядка 150-200 файлов.)
Ну я не думаю, что Ink имеет потребность пакетно преобразовывать 200 файлов для того, чтобы сравнить два документа. К тому же, перевод в txt не всегда удобен.
Но вот упомянутая мной выше программа Compare It работает по тому же принципу, что и WinMerge и аналоги, но понимает формат word напрямую (и docx кстати тоже).

ivan866
22.08.2014, 20:23
fc.exe -- классика
diff.exe -- мощно
texdiff.exe -- красиво


Рейтинг@Mail.ru