2.1. Проверим совместную значимость факторов X1, X3
Построим вспомогательную регрессию, не включающую в себя переменные X1 и X3 .
Y : 1 X2
Рассмотрим вновь полученные оценки и статистики:
Ordinary least squares
(linear regression)
Dependent variable: Y
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 307.17118774 1.442493303 212.94461965 [0.0000]
2 X2 3.4527047396 0.1843287168 18.731236234 [0.0000]
R^2adj. = 42.209727089% DW = 2.0932
R^2 = 42.330374841% S.E. = 27.664737595
Residual sum of squares: 365831.423555069
Maximum loglikelihood: -2273.76453057757
AIC = 9.4865188774 BIC = 9.5126050406
F(1,478) = 350.8592 [0.0000]
Normality: Chi^2(2) = 2.438169 [0.2955]
Heteroskedasticity: Chi^2(1) = 0.459809 [0.4977]
Functional form: Chi^2(1) = 0.104349 [0.7467]
AR(1) in the error: Chi^2(1) = 1.294986 [0.2551]
ARCH(1) in the error: Chi^2(1) = 0.086874 [0.7682]
Сравним регрессии (исходную и вспомогательную) по сумме квадратов остатков.
Для исходной регрессии сумма квадратов остатков равна 301939.369, для вспомогательной 365831.424. Сумма квадратов остатков для исходной регрессии меньше, чем для вспомогательной, соответственно исходная регрессия лучше вспомогательной. Суть самого МНК состоит в том, чтобы найти такие параметры αi, при которых сумма квадратов остатков будет минимальной.
Выдвинем гипотезу:
H0≔α1=α3=0
q – число ограничений на коэффициенты
В данном случае проверяется два ограничения q=2.
Исходная регрессия – регрессия без ограничений.
Вспомогательная регрессия – регрессия с учетом ограничений.
Построим F-статистику для проверки существенности ограничений. Тестирование гипотезы основано на F-статистике, которая вычисляется по формуле:
F=R2-R2’1-R2*n-m-1q
R2′ – коэффициент детерминации для вспомогательной регрессии.
F=0,524-0,4231-0,524*480-42=50.5
Fкр=Fα,q,n-m-1=F0.05,2,480-3-1=3.015
Так как F-статистика больше Fкр, то H0≔α1=α3=0 отвергается на уровне значимости 0,05, то есть факторы Х1 и Х3 совместно значимы.
Можно рассчитать РДУЗ с помощью функции Excel F.РАСП.ПX(50.5;2;476) = 1.3E-20. Значение очень мало, гипотеза отвергается.
2.2. RESET тест Рамсея;
RESET тест Рамсея предназначен для тестирования функциональной формы (спецификации) модели.
Построим вспомогательную регрессию, в которой факторами являются не только переменные X 1 — X 3 , но и квадрат и куб расчетных значений исходного уравнения (Yest).
Ordinary least squares
(linear regression)
Dependent variable: Y
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 274.23565948 212.45643346 1.2907853861 [0.1974]
2 X1 2.3501919045 0.2509936643 9.3635507118 [0.0000]
3 X2 3.394997654 0.1687775945 20.115215316 [0.0000]
4 X3 0.3904361739 0.1109490671 3.5190577434 [0.0005]
5 Yest^2 -5.19662E-04 0.0074833596 -0.0694423332 [0.9447]
6 Yest^3 9.893367E-07 1.708521E-05 0.057906015 [0.9538]
R^2adj. = 51.924492047% DW = 2.0184
R^2 = 52.426324071% S.E. = 25.232548884
Residual sum of squares: 301787.041978681
Maximum loglikelihood: -2227.57628426685
AIC = 9.3107345178 BIC = 9.3716022318
F(5,474) = 104.4699 [0.0000]
Normality: Chi^2(2) = 2.474156 [0.2902]
Heteroskedasticity: Chi^2(1) = 2.387862 [0.1223]
Functional form: Chi^2(1) = 0.075318 [0.7837]
AR(1) in the error: Chi^2(1) = 0.062805 [0.8021]
ARCH(1) in the error: Chi^2(1) = 0.145456 [0.7029]
Проверим совместную значимость добавленных факторов. В этом случае регрессией без ограничений является построенная вспомогательная регрессия, а регрессией с ограничениями будет исходная регрессия. Ограничений в данном случае два:
H0:α4=α5=0
q=2
для проверки совместной значимости добавленных факторов построим F -статистику.
Построим F-статистику для проверки существенности ограничений:
F=R2′- R21-R2’*n-m-1q
R2′ – коэффициент детерминации для вспомогательной регрессии.
F=0,52426-0,524031-0,52426*480-62=0.115
Fкр=Fα,q,n-m-1=F0.05,2,480-5-1=3.015
Так как F-статистика меньше Fкр, то гипотеза H0≔α4=α5=0 принимается на уровне значимости 0,05, то есть факторы Х4 и Х5 совместно незначимы. Таким образом, функциональная форма модели (линейная) является приемлемой.
Рассчитаем РДУЗ с помощью функции Excel F.РАСП.ПX(0,115;2;474) = 0,891. Значение значительно превышает приемлемые уровни допустимой вероятности ошибки первого уровня — 0.1, 0.05, гипотеза принимается.
2.3. Проверка постоянства коэффициентов тестом Чоу I формы.
Создаем вспомогательную переменную ChowBreak, переменная принимает значение 1 для первой половины наблюдений, а для второй половины наблюдений — значение 0.
Оценим вспомогательную регрессию, в которой вместо исходных факторов X 1, X 2, X 3 участвует набор факторов X1*ChowBreak, X2*ChowBreak, X3*ChowBreak, X1*(1- ChowBreak), X2*(1- ChowBreak), X3*(1- ChowBreak).
Ordinary least squares
(linear regression)
Dependent variable: Y
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 254.63835933 5.4042814301 47.117893956 [0.0000]
2 X1*ChowBreak 2.4781506026 0.2803082319 8.8408056595 [0.0000]
3 X2*ChowBreak 3.2411841299 0.2351491615 13.783524078 [0.0000]
4 X3*ChowBreak 0.3957969746 0.156393101 2.5307828297 [0.0117]
5 X1*(1-ChowBreak) 2.2374806517 0.266478503 8.3964771148 [0.0000]
6 X2*(1-ChowBreak) 3.5338660014 0.2402667507 14.708094194 [0.0000]
7 X3*(1-ChowBreak) 0.3787418009 0.1469106896 2.5780411346 [0.0102]
R^2adj. = 52.185846928% DW = 2.0278
R^2 = 52.784771601% S.E. = 25.163869038
Residual sum of squares: 299513.204236663
Maximum loglikelihood: -2225.76113896194
AIC = 9.307338079 BIC = 9.3769011807
F(6,473) = 88.13257 [0.0000]
Normality: Chi^2(2) = 1.60866 [0.4474]
Heteroskedasticity: Chi^2(1) = 3.985729 [0.0459]
Functional form: Chi^2(1) = 0.039421 [0.8426]
AR(1) in the error: Chi^2(1) = 0.132954 [0.7154]
ARCH(1) in the error: Chi^2(1) = 0.209723 [0.6470]
Сравним полученную вспомогательную и исходную регрессии, построим F -статистику для проверки равенства коэффициентов при «разных половинах» исходных факторов во вспомогательной регрессии.
F=RSS-RSS’RSS’*n-2qq=301939.369-299513.204299513.204*480-2*33=1.28
Fкр=Fα,q,n-2q=F0.05,3,480-6=2.624
в данном случае проверяется q=3 ограничения: α1=α4; α2=α5; α3=α6
Исходная регрессия – регрессия с учетом ограничений.
Вспомогательная регрессия – регрессия без ограничений.
Так как F-статистика меньше Fкр, то гипотеза H0: α1=α4; α2=α5; α3=α6 принимается на уровне значимости 0,05, то есть модель для всех наблюдений неизменна, другими словами, коэффициенты модели постоянны.
Рассчитаем РДУЗ с помощью функции Excel F.РАСП.ПX(1.28;3;474) = 0,281. Значение превышает приемлемые уровни допустимой вероятности ошибки первого уровня — 0.1, 0.05, гипотеза принимается.
2.4. Проверка гетероскедастичности (тест Бреуша – Годфри – Пагана);
Введем новую переменную Resid2=Resid1^2 – остатки, возведенные в квадрат.
Создадим вспомогательную регрессию, где в качестве зависимой выступает переменная Resid2 , а факторы — исходный набор факторов, номер наблюдения (N) , квадраты факторов, а также попарно перемноженные факторы.
Ordinary least squares
(linear regression)
Dependent variable: Resid2
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 1052.0367685 409.20762462 2.5709119409 [0.0104]
2 X1 -88.381656337 41.409532326 -2.1343311883 [0.0333]
3 X2 -13.436102116 13.787603644 -0.9745059738 [0.3303]
4 X3 4.1909093272 10.908179252 0.3841987953 [0.7010]
5 N 0.7268726164 0.1417308444 5.1285422003 [0.0000]
6 X1^2 1.882184371 1.0432891718 1.8040869413 [0.0719]
7 X2^2 1.1057856934 0.4692634477 2.3564283533 [0.0188]
8 X3^2 -0.2357901009 0.1974066582 -1.1944384402 [0.2329]
9 X1*X2 0.088968295 0.604909979 0.1470769174 [0.8831]
10 X1*X3 0.1388007007 0.4095211551 0.3389341404 [0.7348]
11 X2*X3 -0.0852538115 0.2870641484 -0.2969852276 [0.7666]
R^2adj. = 7.5656493794% DW = 2.1190
R^2 = 9.4953853005% S.E. = 426.93345875
Residual sum of squares: 85485651.5754815
Maximum loglikelihood: -3582.70801548019
AIC = 14.977950065 BIC = 15.082294717
F(10,469) = 4.920562 [0.0000]
Normality: Chi^2(2) = 1175.547 [0.0000]
Heteroskedasticity: Chi^2(1) = 26.67577 [0.0000]
Functional form: Chi^2(1) = 2.700913 [0.1003]
AR(1) in the error: Chi^2(1) = 1.762428 [0.1843]
ARCH(1) in the error: Chi^2(1) = 0.597901 [0.4394]
Судя по РДУЗ (больше 0,05) все коэффициенты модели, кроме коэффициента при номере наблюдения (N), при X1 и X2^2, незначимы по критерию Стьюдента. Однако все факторы в уравнении значимы в совокупности (РДУЗ для F-статистики меньше 0,05), т.е. в совокупности этот набор переменных можно считать сильными инструментами.
Матрица корреляции:
Correlation matrix
Number of observations: 480
Variable Mean Variance S.D.
1 Resid2 298.8494481 196780.13993 443.59907566
2 X1 19.450018854 21.113543735 4.5949476313
3 X2 3.7833283708 46.927333058 6.8503527688
4 X3 17.981022954 108.52729266 10.417643335
5 N 240.5 19199.916667 138.5637639
6 X1^2 399.41677716 32467.936922 180.18861485
7 X2^2 61.240906619 4392.8488132 66.278569789
8 X3^2 431.84447914 151346.61225 389.03291923
9 X1*X2 73.771003511 19363.448843 139.1526099
10 X1*X3 349.64997986 48692.60961 220.66401974
11 X2*X3 73.481478839 21623.077664 147.04787542
<1> <2> <3> <4> <5> <6> <7>
<1> 1. -0.119166 -0.084005 -0.057604 0.221551 -0.109894 0.004065
[0.0090] [0.0659] [0.2078] [0.0000] [0.0160] [0.9292]
<2> -0.119166 1. 0.005884 -0.001697 0.011294 0.994536 0.021057
[0.0090] [0.8977] [0.9704] [0.8051] [0.0000] [0.6454]
<3> -0.084005 0.005884 1. 0.076416 -0.029774 0.008718 0.770062
[0.0659] [0.8977] [0.0945] [0.5152] [0.8489] [0.0000]
<4> -0.057604 -0.001697 0.076416 1. 0.009116 -0.007843 0.039024
[0.2078] [0.9704] [0.0945] [0.8421] [0.8639] [0.3936]
<5> 0.221551 0.011294 -0.029774 0.009116 1. 0.008293 -0.034612
[0.0000] [0.8051] [0.5152] [0.8421] [0.8562] [0.4493]
<6> -0.109894 0.994536 0.008718 -0.007843 0.008293 1. 0.028885
[0.0160] [0.0000] [0.8489] [0.8639] [0.8562] [0.5278]
<7> 0.004065 0.021057 0.770062 0.039024 -0.034612 0.028885 1.
[0.9292] [0.6454] [0.0000] [0.3936] [0.4493] [0.5278]
<8> -0.06911 -0.016613 0.070839 0.966861 0.007439 -0.021943 0.022341
[0.1306] [0.7166] [0.1212] [0.0000] [0.8709] [0.6316] [0.6254]
<9> -0.100991 0.136126 0.963499 0.085487 -0.04726 0.13834 0.737362
[0.0269] [0.0028] [0.0000] [0.0613] [0.3015] [0.0024] [0.0000]
<10> -0.097882 0.361462 0.084388 0.905961 -0.004666 0.354312 0.045009
[0.0320] [0.0000] [0.0647] [0.0000] [0.9188] [0.0000] [0.3251]
<11> -0.085936 0.031358 0.843929 0.327258 -0.011511 0.03127 0.680317
[0.0599] [0.4931] [0.0000] [0.0000] [0.8014] [0.4943] [0.0000]
<8> <9> <10> <11>
<1> -0.06911 -0.100991 -0.097882 -0.085936
[0.1306] [0.0269] [0.0320] [0.0599]
<2> -0.016613 0.136126 0.361462 0.031358
[0.7166] [0.0028] [0.0000] [0.4931]
<3> 0.070839 0.963499 0.084388 0.843929
[0.1212] [0.0000] [0.0647] [0.0000]
<4> 0.966861 0.085487 0.905961 0.327258
[0.0000] [0.0613] [0.0000] [0.0000]
<5> 0.007439 -0.04726 -0.004666 -0.011511
[0.8709] [0.3015] [0.9188] [0.8014]
<6> -0.021943 0.13834 0.354312 0.03127
[0.6316] [0.0024] [0.0000] [0.4943]
<7> 0.022341 0.737362 0.045009 0.680317
[0.6254] [0.0000] [0.3251] [0.0000]
<8> 1. 0.079789 0.86942 0.31328
[0.0808] [0.0000] [0.0000]
<9> 0.079789 1. 0.142782 0.813716
[0.0808] [0.0017] [0.0000]
<10> 0.86942 0.142782 1. 0.323106
[0.0000] [0.0017] [0.0000]
<11> 0.31328 0.813716 0.323106 1.
Вклад каждого из этих факторов в зависимую переменную несущественен (коэффициент корреляции меньше 0,3).
Совместная значимость всех факторов в этой вспомогательной регрессии проверяется на основе F-статистики (то есть проверка значимости уравнения в целом). Таким образом, все факторы совместно значимы.
Статистика теста Бреуша – Годфри – Пагана рассчитывается как , где -объяснённая сумма квадратов вспомогательной регрессии. Данная статистика асимптотически имеет распределение , где — количество переменных в модели.
Variable Fitted values, 480 obs.
Minimum -30.860680166
Maximum 700.93834709
Mean 298.8494481 [0.0000]
Median 297.34915094 [0.0000]
Variance 18685.032481 (biased estimate)
Variance 18724.0409 (unbiased estimate)
Standard deviation 136.69320569 (biased estimate)
Standard deviation 136.83581731 (unbiased estimate)
Asymmetry 0.1722495 [0.1234]
Excess kurtosis -0.4638322292 [0.0380]
Coefficient of variation 0.4578754225
Sum 143447.73509
Sum of squares about mean 8968815.591
Sum of squares 51838092.053
1-st order autocorrelation 0.5351547412 [0.0000]
Статистика равна 8968815,591/2 = 4484407,8
X20.05;10=18.31
Статистика превышает критическое значение на уровне значимости 0,05. Значит гипотеза о присутствии гетероскедастичности отвергается.
Стандартные статистические выводы, основанные на МНК, в условиях гетероскедастичности неверны. То есть тестирование значимости или совместной значимости факторов с помощью t- и F-статистик может привести к неверным выводам. В нашем же случае ошибка модели гомоскедастична и все выводы, сделанные ранее верны.
Таким образом, исходная модель значима и может использоваться для дальнейшего анализа зависимой переменной Y.
Y=254,602+2,354X1+3,398X2+0,389X3
katyfoxy 5.0
рекламист + фриланс. Работаю за границей, поэтому английский на высшем уровне. Также компетентна в области маркетинга, психологии, имиджелогии, конфликтологии, менеджмента, экономики, филологии, информатики и это далеко не все:)
На странице представлен фрагмент
Уникализируй или напиши новое задание с помощью нейросети
Похожие работы
Определить сопротивление растеканию сложного заземления
Определить сопротивление растеканию сложного заземления, состоящего из вертикальных стержневых заземлителей и горизонтальной полосы. Исходные данные принять по варианту, номер которого совпадает с последней...
3 Заносим числовые данные по задаче в 5 столбец и 6 столбец
3. Заносим числовые данные по задаче в 5 столбец и 6 столбец. Данные столбца 5 – это данные уровня притязаний, а столбца 6 – силы воли Кодируем переменные: для этого переходим с листа «представление...