![]() |
Библиография
Коллеги, вопрос.
Есть у меня библиографический список по теме на большое количество страниц (сколько не суть важно, главное, что руками не перебрать) в Ворде. В нем однозначно есть повторения. Как или чем эту кучу можно превратить в конфетку? |
Цитата:
|
МЮрий, я бы делал так.
1. Notepad++ отделить названия с помощью регулярных выражений табуляторами Примерно так
## Шаг 1. Выделить все и нажать TAB ## Шаг 2. Отделение авторов. Первая строка, что ищем, вторая на что меняем ## Notepad++ режим регулярные выражения ^\t([\w-]+[\s,]+(\w{1,2}[.]\s*){1,2}([,]\s*([\w-]+[\s,]+(\w{1,2}[.]\s*){1,2})\s*)*) \1\t ## Шаг 3 отделяем названия публикаций ^(.*?)\t(.*?)\s*((/+)|([.]\s+[-]\s?\w+[.])) \1\t\2\t\3\t ## Шаг 4 ищем год публикации и ставим его в конец ([12][90]\d\d)(.*?)$ 2. Выделить все и перетащить в Excel 3. Отсортировать по названию 4. Глянуть глазами А вообще, пользуйтесь библиотечными менеджерами, типа JabRef или Zotero и будет вам Щастье™ |
Hogfather, а как думаете - пункт
Цитата:
Код:
=ЕСЛИ(A1=A2;1;0) |
А если не маяться дурью и сделать в Ворде упорядочивание по алфавиту, то повторяющиеся названия окажутся рядом друг с другом и их сразу будет заметно - поудалять ручками потом, и все.
|
Цитата:
Цитата:
|
Цитата:
|
Цитата:
|
Цитата:
|
kravets, О.Я., приведен как раз рабочий фрагмент парсера, которым я занимался для своих задач. Отловить авторов в начале описания и название самое простое, работает в большинстве случаев. Проблемы начинаются со второй частью разбора, потому как там полная разножопица, решаемая (не на 100%) с помощью тех же регэкспов и элементов нечеткой логики.
|
Текущее время: 01:38. Часовой пояс GMT +3. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»