Портал аспирантов
 

Вернуться   Портал аспирантов > Компьютер для аспирантов > Software (программное обеспечение)

Ответ
 
Опции темы
Старый 27.01.2016, 10:26   #1
МЮрий
Gold Member
 
Аватар для МЮрий
 
Регистрация: 01.04.2009
Адрес: Москва
Сообщений: 1,204
По умолчанию Библиография

Коллеги, вопрос.
Есть у меня библиографический список по теме на большое количество страниц (сколько не суть важно, главное, что руками не перебрать) в Ворде.
В нем однозначно есть повторения.
Как или чем эту кучу можно превратить в конфетку?
---------
Публикация ВАК статей, Scopus: vak-statya.ru; vak-journal.ru
Мои ВАК журналы: www.nauteh.ru
МЮрий вне форума   Ответить с цитированием
Реклама
Старый 27.01.2016, 10:32   #2
kravets
Platinum Member
 
Аватар для kravets
 
Регистрация: 12.03.2010
Адрес: Воронеж
Сообщений: 9,785
По умолчанию

Цитата:
Сообщение от МЮрий Посмотреть сообщение
Коллеги, вопрос.
Есть у меня библиографический список по теме на большое количество страниц (сколько не суть важно, главное, что руками не перебрать) в Ворде.
В нем однозначно есть повторения.
Как или чем эту кучу можно превратить в конфетку?
Сортировка и глазами.
---------
Обычно пуська. Но иногда кое-кому доводится увидеть льва в год тигра...
"Экономика и менеджмент систем управления", "Врач-аспирант" - новый cписок ВАК.
sbook.us - молоденькие американские журналы
kravets на форуме   Ответить с цитированием
Старый 27.01.2016, 10:58   #3
Hogfather
Platinum Member
 
Регистрация: 22.07.2010
Сообщений: 3,023
По умолчанию

МЮрий, я бы делал так.
1. Notepad++ отделить названия с помощью регулярных выражений табуляторами
Примерно так

## Шаг 1. Выделить все и нажать TAB
## Шаг 2. Отделение авторов. Первая строка, что ищем, вторая на что меняем
## Notepad++ режим регулярные выражения
^\t([\w-]+[\s,]+(\w{1,2}[.]\s*){1,2}([,]\s*([\w-]+[\s,]+(\w{1,2}[.]\s*){1,2})\s*)*)
\1\t
## Шаг 3 отделяем названия публикаций
^(.*?)\t(.*?)\s*((/+)|([.]\s+[-]\s?\w+[.]))
\1\t\2\t\3\t
## Шаг 4 ищем год публикации и ставим его в конец
([12][90]\d\d)(.*?)$


2. Выделить все и перетащить в Excel
3. Отсортировать по названию
4. Глянуть глазами

А вообще, пользуйтесь библиотечными менеджерами, типа JabRef или Zotero и будет вам Щастье™
---------
"So Long, and Thanks for all the Fish"
Hogfather вне форума   Ответить с цитированием
Старый 27.01.2016, 11:04   #4
Дмитрий В.
Gold Member
 
Аватар для Дмитрий В.
 
Регистрация: 08.04.2012
Адрес: Воронеж
Сообщений: 2,010
По умолчанию

Hogfather, а как думаете - пункт
Цитата:
Сообщение от Hogfather Посмотреть сообщение
4. Глянуть глазами
не получится ли упростить: в соседнем столбце вставить такую функцию (вариант для случая, если названия у нас находятся в столбце А):
Код:
=ЕСЛИ(A1=A2;1;0)
В случае, если А1 совпадает с А2, то функция вернет единицу. А потом скопировать-вставить результаты как значения и или вручную найти все единицы, или просто отсортировать по столбцу с нулями и единицами.
---------
Грамотей-опричникъ
Сварщик я не настоящий, а сюда просто пописать зашел
Дмитрий В. вне форума   Ответить с цитированием
Старый 27.01.2016, 11:07   #5
Just Another One
Заблокирован
 
Регистрация: 01.10.2010
Сообщений: 3,478
По умолчанию

А если не маяться дурью и сделать в Ворде упорядочивание по алфавиту, то повторяющиеся названия окажутся рядом друг с другом и их сразу будет заметно - поудалять ручками потом, и все.
Just Another One вне форума   Ответить с цитированием
Старый 27.01.2016, 11:17   #6
Hogfather
Platinum Member
 
Регистрация: 22.07.2010
Сообщений: 3,023
По умолчанию

Цитата:
Сообщение от Дмитрий В. Посмотреть сообщение
В случае, если А1 совпадает с А2, то функция вернет единицу. А потом скопировать-вставить результаты как значения и или вручную найти все единицы, или просто отсортировать по столбцу с нулями и единицами.
Дмитрий, так и бьть поясню. Дело в том, что когда у источника более одного автора добрые люди могут по-разному их написать в списке литературы (на первом месте только один, а полный перечень после косой черты, всех перечислить вначале и т.п.), во-вторых, Дмитрий, есть такая вещь как пробелы между словами, в т.ч. неразрывные, а еще бывают опечатки, которые вот так , "в лоб" просто не позволят вам решить эту задачу. Напоминаю, что в задаче предполагается фигова туча источников.

Цитата:
Сообщение от Just Another One Посмотреть сообщение
А если не маяться дурью и сделать в Ворде упорядочивание по алфавиту,
Спасибо за Ваше мнение. Оно офигенно важно для нас.
---------
"So Long, and Thanks for all the Fish"
Hogfather вне форума   Ответить с цитированием
Старый 27.01.2016, 11:21   #7
Just Another One
Заблокирован
 
Регистрация: 01.10.2010
Сообщений: 3,478
По умолчанию

Цитата:
Сообщение от Hogfather Посмотреть сообщение
Спасибо за Ваше мнение. Оно офигенно важно для нас.
И тем не менее, оно единственное оптимальное решение в данном случае. А ваша городьба усложняет все в разы.
Just Another One вне форума   Ответить с цитированием
Старый 27.01.2016, 11:29   #8
Hogfather
Platinum Member
 
Регистрация: 22.07.2010
Сообщений: 3,023
По умолчанию

Цитата:
Сообщение от Just Another One Посмотреть сообщение
оно единственное оптимальное решение в данном случае
Эх. Чувствуется, что не технарь. У нас за слово "оптимальное" можно и канделябром по шее схлопотать, без указания критерия и параметров, тем более, не видя исходные данные.
---------
"So Long, and Thanks for all the Fish"
Hogfather вне форума   Ответить с цитированием
Старый 27.01.2016, 11:32   #9
kravets
Platinum Member
 
Аватар для kravets
 
Регистрация: 12.03.2010
Адрес: Воронеж
Сообщений: 9,785
По умолчанию

Цитата:
Сообщение от Hogfather Посмотреть сообщение
МЮрий, я бы делал так.
1. Notepad++ отделить названия с помощью регулярных выражений табуляторами
Вас бы в РИНЦ... Они так и не имеют посейчас форсированного алгоритма гарантированного разбора библиографической записи. Много разбирается руками. Увы, все не так просто - авторы имеют обыкновение плевать на правила, редколлегии - тоже.
---------
Обычно пуська. Но иногда кое-кому доводится увидеть льва в год тигра...
"Экономика и менеджмент систем управления", "Врач-аспирант" - новый cписок ВАК.
sbook.us - молоденькие американские журналы
kravets на форуме   Ответить с цитированием
Старый 27.01.2016, 11:38   #10
Hogfather
Platinum Member
 
Регистрация: 22.07.2010
Сообщений: 3,023
По умолчанию

kravets, О.Я., приведен как раз рабочий фрагмент парсера, которым я занимался для своих задач. Отловить авторов в начале описания и название самое простое, работает в большинстве случаев. Проблемы начинаются со второй частью разбора, потому как там полная разножопица, решаемая (не на 100%) с помощью тех же регэкспов и элементов нечеткой логики.
---------
"So Long, and Thanks for all the Fish"
Hogfather вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.



Текущее время: 19:31. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2017, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2017, «Аспирантура. Портал аспирантов»
Рейтинг@Mail.ru