Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Свободное общение (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=102)
-   -   Комплексы экономистов (http://www.aspirantura.spb.ru/forum/showthread.php?t=12285)

Дмитрий В. 14.12.2013 16:35

Hogfather, а если с таким же кодом в ответ на
Код:

plot.wordcloud(subset(dissers,substr(Nspec,1,2)=="10")$diser)
что в R, что через RStudio получается
Код:

null device
          1

- это я дурак или лыжи не едут?

Добавлено через 1 минуту
Исходный вариант с 08 тоже пробовал, тот же результат.

Uzanka 14.12.2013 16:43

ребята, может кто-то такую же картинку для 05.13.18 сделает? В наших науках это тоже "продажная" специальность ;) чё хошь туда засовывают :) поэтому интерсно посмотреть, но самой разбираться с этим лень.

Дмитрий В. 14.12.2013 18:48

Uzanka, я бы сделал, когда станет ясно, ЧЯДНТ.

Добавлено через 1 час 43 минуты
Цитата:

Сообщение от Дмитрий В. (Сообщение 411313)
это я дурак

:yes: В рабочей папке создается файл с заданным именем - "wordcloud.png", а я и не приметил. Результатами сейчас поделюсь.

Добавлено через 6 минут
Uzanka, вот 05.13.18
http://i024.radikal.ru/1312/61/1622a55d0e26.png

Hogfather 14.12.2013 18:55

В процессе разбора выяснилось, что забыл указать library(SnowballC)
Добавил в код, также в явном виде указал кодировку. Все работает даже на MacBook.

Дмитрий В. 14.12.2013 18:56

Филологические:
http://s005.radikal.ru/i212/1312/cc/7f62ee425587.png

Hogfather 14.12.2013 20:27

Исправил ошибку с буквами "ч" и "я"
Так же филология, но обратите внимание на слово "творчество" и "англоязычный". По пакету Text Mining документация почти отсутствует, приходится разбираться в процессе. Надеюсь, Дмитрию пригодится. Это только вершина айсберга, там такие возможности, что на половину докторской моделек наделать можно.

http://aspirantura.spb.ru/forum/pict...pictureid=1432

Добавлено через 9 минут
Цитата:

Сообщение от Vica3 (Сообщение 411306)
для гуманитарной мну можно на пальцах - чудо-приложение Кравца же предлагает: или вставить в окошко тексту, или прописать урлу. А как ее заставить работать с Экселем или еще каким файлом, живущим на компе?

В экселе открываете, например, мой файл.
Ставите фильтры, отбираете те строки, которые нужны
Выделяете в колонке с названиями диссертаций нужный фрагмент
Копируете
Вставляете в окно чудо-программы
...
PROFIT!

Добавлено через 10 минут
Помимо всего вышеизложенного, лично для меня представляет интерес, в чем отличие кандидатской от докторской. Возьмем царицу наук 08.00.05

Имеем для кандидатский
http://aspirantura.spb.ru/forum/pict...pictureid=1433

Для докторских
http://aspirantura.spb.ru/forum/pict...pictureid=1434

В принципе, вся немудренная мысль "докторская -- это методология" видна на этой картинке. Предприятие и инновации отходят на второй план, на первом плане теория и методология.

Соответственно, отбор и печать выглядят вот так (для кандидатских):
Код:

plot.wordcloud(subset(dissers,Nspec=="08.00.05" & TypeOfDisser=="КАНД")$diser)
Добавлено через 49 минут
А вот забавный результат: отбор по корню "оптимизац"
Облако специальностей

http://aspirantura.spb.ru/forum/pict...pictureid=1435

Никогда не думал, что оптимизацией занимается медицина. С инновациями график скучный -- там здоровая 08.00.05.

Добавлено через 12 минут
Цитата:

Сообщение от Olafson (Сообщение 170434)
Нанотехнологии -- это не термин для научной работы. Он для газет, максимум для популярного чтива.

09.00.08 Проблема изменения природы человека в контексте становления нанотехнологий
24.00.01 Философско-культурологический анализ сущности нанотехнологии
10.02.04 Современный английский подъязык нанотехнологий: структурно-семантическая, когнитивно-фреймовая и лексикографическая модели
10.02.04 Акцентуация терминологических словосочетаний в подъязыке нанотехнологий (на материале английского языка)
08.00.05 Маркетинговая модель коммерциализации нанотехнологических инноваций
08.00.05 ОЦЕНКА ЭФФЕКТИВНОСТИ ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ РЕГИОНА В ОБЛАСТИ НАНОТЕХНОЛОГИЙ (НА ПРИМЕРЕ РЕСПУБЛИКИ ТАТАРСТАН)

Vica3 14.12.2013 21:16

Цитата:

Сообщение от Hogfather (Сообщение 411333)
В экселе открываете, например, мой файл.
Ставите фильтры, отбираете те строки, которые нужны
Выделяете в колонке с названиями диссертаций нужный фрагмент
Копируете
Вставляете в окно чудо-программы
...
PROFIT!

это я догадалась.. а (вот идеётка) - в окне чудо программы шо - ограничений по кол-ву символов немае?

Uzanka 14.12.2013 22:00

Дмитрий В.,
Hogfather,
спасибо!

прикольные, кстати, результаты получились на картинке по специальностям. Как и думала, 05.13.18 оказалась в числе наиболее частых в числе 14.01.17, 14.01.08 и 05.13.01 даже ее обогнала. "Продажная" деффка (любой диссер, видимо, под нее подогнать без проблем :))

Зы. а где посмотреть паспорта? т.е. где посмотреть что это за специалности, которые соответствуют цифиркам 14 и т.п.? я очень непроходимая в этом вопросе.

Hogfather 14.12.2013 22:26

Цитата:

Сообщение от Uzanka (Сообщение 411367)
Зы. а где посмотреть паспорта?

Вверху этой страницы справа видим:

Паспорта специальностей

Добавлено через 2 минуты
Цитата:

Сообщение от Vica3 (Сообщение 411355)
в окне чудо программы шо - ограничений по кол-ву символов немае?

Ну, Вы, барыня, задачи ставите... Пёс его знает, но, думаю, "Войну и мир" не запихнуть.

Кстати, хозяйке на заметку, пакет Text mining позволяет брать файлы из каталога (по расширению), делать их разбор и творить разные непотребства. Насколько я увидел, даже pdf читает. Так что, если натравить его на документы можно получить научный профит. Но пока это теоретически, попробую поиграть с АР, посмотрю.

Uzanka 14.12.2013 22:28

Цитата:

Сообщение от Hogfather (Сообщение 411369)
Вверху этой страницы справа видим:
Паспорта специальностей

спасибо!

Зы. Оооооо, это медики так всех уделали :eek: никак не ожидала.


Текущее время: 11:07. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»