Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Филологические науки (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=136)
-   -   Параметрический анализ (http://www.aspirantura.spb.ru/forum/showthread.php?t=10490)

Дмитрий В. 09.11.2012 22:59

Параметрический анализ
 
Здравствуйте, коллеги, филологи, лингвисты и просто ученые!
Меня зовут Дмитрий и я Grammar nazi По предложению Ilonы расскажу здесь о своей методике исследования. Да и сам потренируюсь в объяснении ее на пальцах старым хрычам из диссовета незнакомым с ней лицам.
Параметрический анализ - сравнительно новая методика, разработанная моим НР, широко известным в узких кругах :cool: Вот ее суть.
Сначала словарь определенного языка преобразуется в электронный вид с помощью такой-то матери сканера и FineReader, если этого словаря нет в электронном виде. А затем полученный текст копируется в Excel (да святится имя его) и обрабатывается особым образом - девочки налево, мальчики направо фразеосочетания и примеры употребления слова - в столбцы слева от леммы (слова в словарной форме), значения - в столбцы справа.
Затем производится подсчет по 4 параметрам - 1) функциональный (длина слов в буквах и звуках), 2) парадигматический (размерность синонимических рядов), 3) синтагматический (количество фразеосочетаний и иллюстративных примеров при слове) и 4) эпидигматический (учет данных о многозначности слов, сиречь полисемии).
В зависимости от конкретных показателей каждое слово наделяется параметрическим весом по каждому из параметров. Затем отбирается ядро по каждому из них (слова с наиболее высокими параметрами), эти 4 множества складываются и мы получаем лексико-семантическое ядро языка. Если слово вошло во все 4 ядра - это малое ядро (обычно от 30-40 до 100-150 слов), в 3 - большое, в два - периферия большого ядра, а единичное вхождение - "отходы производства".
Самое приятное в ней, что так можно проанализировать практически любой двуязычный словарь, если знаем язык, которым даются дефиниции (н-р, X-русский словарь или Y-английский).
Пока что все, буду продолжать по мере поступления вопросов. Все-таки это не теоретическая глава :)

phoenix367 09.11.2012 23:11

Глупый вопрос - а зачем все это надо?

Ilona 09.11.2012 23:13

Цитата:

Сообщение от Дмитрий В. (Сообщение 289301)
Параметрический анализ - сравнительно новая методика, разработанная моим НР, широко известным в узких кругах :cool:

Если он все равно известен, может быть вы раскроете коллегам имя? если этот секрет не для онлайна -- тогда в личку :)

Галчонка 09.11.2012 23:13

Дмитрий В., а что дает практически этот анализ, эти ядра? ну посчитали мы и что с того, это для сравнения словарей? сколько где чего, или для языков?
ПС извините если вопрос глупый, я совсем не гуманитарий, но для общего развития интересно

Ilona 09.11.2012 23:16

Цитата:

Сообщение от Дмитрий В. (Сообщение 289301)
В зависимости от конкретных показателей каждое слово наделяется параметрическим весом по каждому из параметров.

Каждое слово или каждая лемма?

Дмитрий В. 09.11.2012 23:27

Ilona, а подсчет так и так по леммам производится.
Т.е. выглядит лист Excel примерно так:
<> waste one's breath - тратить зря слова - - - - - пустые столбцы - breath - n (часть речи) - 1) дыхание. И когда подсчитываем количество ФС, значений и синонимов, само слово в словарной форме остается.
Ах да, забыл уточнить - в ядре оставляем лишь существительные, прилагательные и глаголы как слова с полноценной семантикой.
Цитата:

Сообщение от phoenix367 (Сообщение 289309)
Глупый вопрос - а зачем все это надо?

Цитата:

Сообщение от Галчонка (Сообщение 289311)
Дмитрий В., а что дает практически этот анализ, эти ядра? ну посчитали мы и что с того, это для сравнения словарей? сколько где чего, или для языков?

Ядро нужно для ядерной бомбы! Это позволяет свести словарь, н-р, В.К. Мюллера к 1,5-2 тысячам наиболее важных для языка слов. А эти слова позволяют создавать разговорники, малые словари и т.п. По малому ядру можно делать некоторые выводы о менталитете и ценностях носителей языка. Также, если у нас есть ядра нескольких языков, то их можно тоже сравнить и прийти к разным интересным выводам.

Ilona 09.11.2012 23:28

Цитата:

Сообщение от Дмитрий В. (Сообщение 289327)
Ах да, забыл уточнить - в ядре оставляем лишь существительные, прилагательные и глаголы как слова с полноценной семантикой.

Только хотела спросить, а что вы тогда делаете с местоимениями :)

Дмитрий В. 09.11.2012 23:30

Цитата:

Сообщение от Ilona (Сообщение 289330)
Только хотела спросить, а что вы тогда делаете с местоимениями

Так у них же своей собственной семантики не наблюдается, так что Скрипач - не нужен :)

Ilona 09.11.2012 23:32

Цитата:

Сообщение от Дмитрий В. (Сообщение 289332)
Так у них же своей собственной семантики не наблюдается, так что Скрипач - не нужен :)

Тем не менее абсурдно было бы утверждать, что местоимения не входят в самое ядровое ядро любого, по крайней мере индоевропейского, языка (в языках других строев я разбираюсь мало). Как вы справляетесь с этим?

Галчонка 09.11.2012 23:34

Дмитрий В., спасибо за ответ


Текущее время: 23:31. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2024, «Аспирантура. Портал аспирантов»