![]() |
Hogfather, а если с таким же кодом в ответ на
Код:
plot.wordcloud(subset(dissers,substr(Nspec,1,2)=="10")$diser) Код:
null device Добавлено через 1 минуту Исходный вариант с 08 тоже пробовал, тот же результат. |
ребята, может кто-то такую же картинку для 05.13.18 сделает? В наших науках это тоже "продажная" специальность ;) чё хошь туда засовывают :) поэтому интерсно посмотреть, но самой разбираться с этим лень.
|
Uzanka, я бы сделал, когда станет ясно, ЧЯДНТ.
Добавлено через 1 час 43 минуты Цитата:
Добавлено через 6 минут Uzanka, вот 05.13.18 http://i024.radikal.ru/1312/61/1622a55d0e26.png |
В процессе разбора выяснилось, что забыл указать library(SnowballC)
Добавил в код, также в явном виде указал кодировку. Все работает даже на MacBook. |
Филологические:
http://s005.radikal.ru/i212/1312/cc/7f62ee425587.png |
Исправил ошибку с буквами "ч" и "я"
Так же филология, но обратите внимание на слово "творчество" и "англоязычный". По пакету Text Mining документация почти отсутствует, приходится разбираться в процессе. Надеюсь, Дмитрию пригодится. Это только вершина айсберга, там такие возможности, что на половину докторской моделек наделать можно. http://aspirantura.spb.ru/forum/pict...pictureid=1432 Добавлено через 9 минут Цитата:
Ставите фильтры, отбираете те строки, которые нужны Выделяете в колонке с названиями диссертаций нужный фрагмент Копируете Вставляете в окно чудо-программы ... PROFIT! Добавлено через 10 минут Помимо всего вышеизложенного, лично для меня представляет интерес, в чем отличие кандидатской от докторской. Возьмем царицу наук 08.00.05 Имеем для кандидатский http://aspirantura.spb.ru/forum/pict...pictureid=1433 Для докторских http://aspirantura.spb.ru/forum/pict...pictureid=1434 В принципе, вся немудренная мысль "докторская -- это методология" видна на этой картинке. Предприятие и инновации отходят на второй план, на первом плане теория и методология. Соответственно, отбор и печать выглядят вот так (для кандидатских): Код:
plot.wordcloud(subset(dissers,Nspec=="08.00.05" & TypeOfDisser=="КАНД")$diser) А вот забавный результат: отбор по корню "оптимизац" Облако специальностей http://aspirantura.spb.ru/forum/pict...pictureid=1435 Никогда не думал, что оптимизацией занимается медицина. С инновациями график скучный -- там здоровая 08.00.05. Добавлено через 12 минут Цитата:
24.00.01 Философско-культурологический анализ сущности нанотехнологии 10.02.04 Современный английский подъязык нанотехнологий: структурно-семантическая, когнитивно-фреймовая и лексикографическая модели 10.02.04 Акцентуация терминологических словосочетаний в подъязыке нанотехнологий (на материале английского языка) 08.00.05 Маркетинговая модель коммерциализации нанотехнологических инноваций 08.00.05 ОЦЕНКА ЭФФЕКТИВНОСТИ ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ РЕГИОНА В ОБЛАСТИ НАНОТЕХНОЛОГИЙ (НА ПРИМЕРЕ РЕСПУБЛИКИ ТАТАРСТАН) |
Цитата:
|
Дмитрий В.,
Hogfather, спасибо! прикольные, кстати, результаты получились на картинке по специальностям. Как и думала, 05.13.18 оказалась в числе наиболее частых в числе 14.01.17, 14.01.08 и 05.13.01 даже ее обогнала. "Продажная" деффка (любой диссер, видимо, под нее подогнать без проблем :)) Зы. а где посмотреть паспорта? т.е. где посмотреть что это за специалности, которые соответствуют цифиркам 14 и т.п.? я очень непроходимая в этом вопросе. |
Цитата:
Паспорта специальностей Добавлено через 2 минуты Цитата:
Кстати, хозяйке на заметку, пакет Text mining позволяет брать файлы из каталога (по расширению), делать их разбор и творить разные непотребства. Насколько я увидел, даже pdf читает. Так что, если натравить его на документы можно получить научный профит. Но пока это теоретически, попробую поиграть с АР, посмотрю. |
Цитата:
Зы. Оооооо, это медики так всех уделали :eek: никак не ожидала. |
Текущее время: 11:07. Часовой пояс GMT +3. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»