Здравствуйте, коллеги, филологи, лингвисты и просто ученые!
Меня зовут Дмитрий и я Grammar nazi По предложению
Ilonы расскажу здесь о своей методике исследования. Да и сам потренируюсь в объяснении ее на пальцах
старым хрычам из диссовета незнакомым с ней лицам.
Параметрический анализ - сравнительно новая методика, разработанная моим НР, широко известным в узких кругах

Вот ее суть.
Сначала словарь определенного языка преобразуется в электронный вид с помощью
такой-то матери сканера и FineReader, если этого словаря нет в электронном виде. А затем полученный текст копируется в Excel (да святится имя его) и обрабатывается особым образом -
девочки налево, мальчики направо фразеосочетания и примеры употребления слова - в столбцы слева от леммы (слова в словарной форме), значения - в столбцы справа.
Затем производится подсчет по 4 параметрам - 1) функциональный (длина слов в буквах и звуках), 2) парадигматический (размерность синонимических рядов), 3) синтагматический (количество фразеосочетаний и иллюстративных примеров при слове) и 4) эпидигматический (учет данных о многозначности слов, сиречь полисемии).
В зависимости от конкретных показателей каждое слово наделяется параметрическим весом по каждому из параметров. Затем отбирается ядро по каждому из них (слова с наиболее высокими параметрами), эти 4 множества складываются и мы получаем лексико-семантическое ядро языка. Если слово вошло во все 4 ядра - это малое ядро (обычно от 30-40 до 100-150 слов), в 3 - большое, в два - периферия большого ядра, а единичное вхождение - "отходы производства".
Самое приятное в ней, что так можно проанализировать практически любой двуязычный словарь, если знаем язык, которым даются дефиниции (н-р, X-русский словарь или Y-английский).
Пока что все, буду продолжать по мере поступления вопросов. Все-таки это не теоретическая глава