Показать сообщение отдельно
Старый 22.12.2012, 22:56   #6
Hogfather
Platinum Member
 
Аватар для Hogfather
 
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,286
По умолчанию GRETL регрессионный анализ. Метод наименьших квадратов (МНК). Ответы на вопросы.

Получил тут письмо и призадумался.
Цитата:
Уважаемый, Hogfather!
Мне очень нужна Ваша помощь.. Без Вас никак. Из Ваших уроков я поняла, как вывести логарифмическую формулу. Теперь, похоже, у меня должна быть степенная функция от трёх переменных. Возможно, что потом понадобится ещё другая зависимость...
Всё-таки никудышный из меня педагог. Не моё это, явно. Что ж, попробую объяснить еще раз.
Начнем с азов.
1. Пусть у нас есть некие переменные A, B и C и есть зависимая Y,
Вариант номер раз. Самый простой.
Зависимая переменная у нас Y, Независимые: const, A, B, C . Что-то получили, радуемся. Провели тест на нелинейность или Рамсея (прямо в модели, меню "Тесты"), чувствуем, чего-то нехватает.
Код:
Модель 3: МНК, использованы наблюдения 1-28
Зависимая переменная: Y

             Коэффициент   Ст. ошибка   t-статистика   P-значение
  ---------------------------------------------------------------
  const         51.3073     114.623        0.4476      0.6584    
  A           -136.708       30.7476      -4.446       0.0002     ***
  B            138.750       17.9676       7.722       5.87e-08   ***
  C            267.893       15.9484      16.80        9.01e-015  ***

Среднее зав. перемен    746.4821   Ст. откл. зав. перемен  1026.452
Сумма кв. остатков      844716.8   Ст. ошибка модели       187.6074
R-квадрат               0.970306   Испр. R-квадрат         0.966594
F(3, 24)                261.4137   Р-значение (F)          1.87e-18
Лог. правдоподобие     -184.1340   Крит. Акаике            376.2680
Крит. Шварца            381.5968   Крит. Хеннана-Куинна    377.8971

Тест на нелинейность (квадраты) -
  Нулевая гипотеза: зависимость линейна
  Тестовая статистика: LM = 27.9766
  р-значение = P(Хи-квадрат(3) > 27.9766) = 3.67338e-006

Тест на нелинейность (логарифмы) -
  Нулевая гипотеза: зависимость линейна
  Тестовая статистика: LM = 18.6274
  р-значение = P(Хи-квадрат(3) > 18.6274) = 0.000326435
2. Говорим, а не замахнуться ли нам на полином. Да запросто, а что нам даёт полином? А просто расчет дополнительных коэффициентов у членов A2, B2, С2 и, если очень хочется, у AB, BC, AC и ABC. Как мы их можем добавить к нашим данным? Да элементарно!
Меню "Добавить"-"Новую переменную". В появившемся окне пишем
A2=A^2


Нажимаем ОК. Мы таким образом добавили квадрат A и назвали его A2
Аналогично создаем еще 6 переменных.
Для произведения пишем: AB=A*B и т.д. Вот что у нас получится.



Все их ставим в независимые переменные. Получаем.

Код:
Модель 4: МНК, использованы наблюдения 1-28
Зависимая переменная: Y

             Коэффициент    Ст. ошибка   t-статистика  P-значение
  ---------------------------------------------------------------
  const     -4.54555e-09   1.67265e-09   -2.718        0.0146     **
  A          1.00000       9.10744e-010   1.098e+09    1.12e-144  ***
  B          8.82849e-09   2.67155e-09    3.305        0.0042     ***
  C          1.00000       1.18757e-08    8.421e+07    1.02e-125  ***
  A2         8.52545e-012  1.14165e-010   0.07468      0.9413    
  B2         5.00000       9.76096e-010   5.122e+09    4.76e-156  ***
  C2        -4.01230e-08   9.75099e-09   -4.115        0.0007     ***
  AB        -2.80596e-09   7.36439e-010  -3.810        0.0014     ***
  BC         4.50756e-08   1.09837e-08    4.104        0.0007     ***
  AC         3.16735e-09   9.76208e-010   3.245        0.0048     ***
  ABC        5.00000       2.81483e-010   1.776e+010   3.14e-165  ***

Среднее зав. перемен    746.4821   Ст. откл. зав. перемен  1026.452
Сумма кв. остатков      4.53e-18   Ст. ошибка модели       5.16e-10
R-квадрат               1.000000   Испр. R-квадрат         1.000000
Лог. правдоподобие      566.0131   Крит. Акаике           -1110.026
Крит. Шварца           -1095.372   Крит. Хеннана-Куинна   -1105.546

Исключая константу, наибольшее р-значение получено для переменной 5 (A2)
Коню понятно, что A2 нам не нужно. Выкидываем его.

Код:
Модель 5: МНК, использованы наблюдения 1-28
Зависимая переменная: Y

            Коэффициент    Ст. ошибка   t-статистика  P-значение
  --------------------------------------------------------------
  const     -4.38415e-09  1.55420e-09   -2.821        0.0113     **
  A          1.00000      6.75041e-010   1.481e+09    3.12e-155  ***
  B          8.47465e-09  2.27841e-09    3.720        0.0016     ***
  C          1.00000      1.11757e-08    8.948e+07    2.72e-133  ***
  B2         5.00000      9.18925e-010   5.441e+09    2.11e-165  ***
  C2        -3.88601e-08  9.17774e-09   -4.234        0.0005     ***
  AB        -2.70371e-09  6.62518e-010  -4.081        0.0007     ***
  BC         4.36974e-08  1.03449e-08    4.224        0.0005     ***
  AC         3.08468e-09  9.12015e-010   3.382        0.0033     ***
  ABC        5.00000      2.59637e-010   1.926e+010   2.77e-175  ***

Среднее зав. перемен    746.4821   Ст. откл. зав. перемен  1026.452
Сумма кв. остатков      4.26e-18   Ст. ошибка модели       4.86e-10
R-квадрат               1.000000   Испр. R-квадрат         1.000000
Лог. правдоподобие      566.8903   Крит. Акаике           -1113.781
Крит. Шварца           -1100.459   Крит. Хеннана-Куинна   -1109.708
Примерно так.

P.S. Некоторые коэффициенты ничтожно малы. Можно попробовать обойтись без этих строк.
P.P.S. А в GNU R это делается вот так

Последний раз редактировалось Hogfather; 23.12.2012 в 14:07.
---------
DNF is not an option
Hogfather вне форума   Ответить с цитированием
Реклама