Номер предприятия 1 2 3 4 5 6 7 8 Товарооборот д
Вариант 4
Номер предприятия 1 2 3 4 5 6 7 8
Товарооборот, д.е 7 10 15 20 30 45 60 120
Уровень затрат в % товарооборота 10 9 7.5 6 6,3 5,8 5,4 5
Задание №1
1) найти оценку парного линейного коэффициента корреляции и проверить его значимость при уровне значимости α=0,05
2) найти оценки a, b и остаточной дисперсии s2 в предположении, что генеральное уравнение регрессии имеет вид у=a+bx; проверить значимость коэффициентов регрессии и значимость уравнения регрессии в целом при уровне значимости α=0,05
РЕШЕНИЕ
Рабочая таблица.
N х Y x2 Xy
y2
1 7 10 49 70 100 7,962 2,038 4,153 20,380
2 10 9 100 90 81 7,857 1,143 1,306 12,700
3 15 7,5 225 112,5 56,25 7,682 -0,182 0,033 2,427
4 20 6 400 120 36 7,507 -1,507 2,271 25,117
5 30 6,3 900 189 39,69 7,157 -0,857 0,734 13,603
6 45 5,8 2025 261 33,64 6,632 -0,832 0,692 14,345
7 60 5,4 3600 324 29,16 6,107 -0,707 0,500 13,093
8 120 5 14400 600 25 4,007 0,993 0,986 19,860
Сумма 307 55 21699 1766,5 400,74 54,911 0,089 10,677 121,524
Ср.знач
38,375 6,875 2712,375 220,813 50,093 6,864 0,011 1,335 15,190
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,727
R-квадрат 0,528
Нормированный R-квадрат 0,449
Стандартная ошибка 1,334
Наблюдения 8
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 11,940 11,940 6,711 0,041
Остаток 6 10,675 1,779
Итого 7 22,615
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 8,207 0,698 11,765 0,000 6,500 9,913
Переменная X 1 -0,035 0,013 -2,591 0,041 -0,067 -0,002
Получено уравнение регрессии:.
С увеличением товарооборота на 1 ден.ед уровень затрат уменьшается на 0,035%
Тесноту линейной связи оценит коэффициент корреляции:
;.
Значение коэффициента корреляции менее 0,3 и положительно, это говорит о слабой и прямой связи между выпуском продукции и расходом материала на 1 единицу продукции.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=8-2=6 составляет Fтабл=5,99.
Fфакт=6,711>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза Н1 , т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить как среднее, так как превышает 8-10%, но менее 20%.
Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение t-критерия для числа степеней свободы df=n-2=8-2=6 и α=0,05 составит tтабл=2,4469
t-статистика
Y-пересечение 11,765
Переменная X 1 -2,591
Фактические значения t-статистики превосходят табличное значение:
Значит параметры a, b и rxy не случайно отличаются от нуля, статистически значимы.
Таким образом, линейная модель подходит для выявления зависимости и дальнейшего использования для прогнозирования.
Задание №2
На основании данных требуется:
1) рассчитать параметры уравнений гиперболической, степенной, показательной и полиномиальной 2-ой степени модели парной регрессии
2) оценить каждую модель через среднюю относительную ошибку аппроксимации и F критерий Фишера
3) выбрать лучшее уравнение регрессии и дать его обоснование (линейную модель тоже учитывать)
РЕШЕНИЕ
1) рассчитать параметры уравнений гиперболической, степенной, показательной и полиномиальной 2-ой степени модели парной регрессии
Гиперболическая модель
у=β0+β1/x+ε;
Представим в виде
Для расчета параметров уравнения строим расчетную таблицу 4.
№ 1/х y 1/х2
y2 у/х
1 0,143 10,000 0,020 100,000 1,429 10,213 -0,213 2,128 0,045 9,766
2 0,100 9,000 0,010 81,000 0,900 8,584 0,416 4,618 0,173 4,516
3 0,067 7,500 0,004 56,250 0,500 7,318 0,182 2,428 0,033 0,391
4 0,050 6,000 0,003 36,000 0,300 6,685 -0,685 11,411 0,469 0,766
5 0,033 6,300 0,001 39,690 0,210 6,051 0,249 3,946 0,062 0,331
6 0,022 5,800 0,000 33,640 0,129 5,629 0,171 2,945 0,029 1,156
7 0,017 5,400 0,000 29,160 0,090 5,418 -0,018 0,336 0,000 2,176
8 0,008 5,000 0,000 25,000 0,042 5,102 -0,102 2,030 0,010 3,516
Итого 0,440 55,000 0,039 400,740 3,599 0,000 0,000 29,841 0,821 22,615
Среднее значение 0,055 6,875 0,005 50,093 0,450 – – 3,730 – 2,827
0000
0,043 1,681 – – – – – – – –
0000
0,002 2,827 – – – – – – – –
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,982
R-квадрат 0,964
Нормированный R-квадрат 0,958
Стандартная ошибка 0,370
Наблюдения 8
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 21,794 21,794 159,174 0,000
Остаток 6 0,821 0,137
Итого 7 22,615
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 4,785 0,211 22,667 0,000 4,268 5,301
Переменная X 1 37,995 3,012 12,616 0,000 30,626 45,365
Получено уравнение регрессии:.
Степенная модель
степенная функция у=axbε
Проведем его линеаризацию путем логарифмирования обеих частей уравнения
Для расчета параметров уравнения строим расчетную таблицу 2.
№ ln(x) ln(y) ln(x)2 ln(y)2 ln(x) • ln(y)
1 1,946 2,303 3,787 5,302 4,481 2,220 0,082 3,576 0,007 9,766
2 2,303 2,197 5,302 4,828 5,059 2,133 0,064 2,922 0,004 4,516
3 2,708 2,015 7,334 4,060 5,456 2,034 -0,019 0,942 0,000 0,391
4 2,996 1,792 8,974 3,210 5,368 1,964 -0,172 9,588 0,030 0,766
5 3,401 1,841 11,568 3,388 6,260 1,864 -0,024 1,296 0,001 0,331
6 3,807 1,758 14,491 3,090 6,692 1,765 -0,007 0,421 0,000 1,156
7 4,094 1,686 16,764 2,844 6,905 1,695 -0,009 0,505 0,000 2,176
8 4,787 1,609 22,920 2,590 7,705 1,525 0,084 5,219 0,007 3,516
Итого 26,042 15,201 91,139 29,312 47,926 15,201 0,000 24,469 0,049 22,615
Среднее значение 3,255 1,900 11,392 3,664 5,991 – – 3,05865332 – –
0000
0,892 0,232 – – – – – – – –
0000
0,796 0,054 – – – – – – – –
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,942
R-квадрат 0,887
Нормированный R-квадрат 0,868
Стандартная ошибка 0,090
Наблюдения 8
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 0,381 0,381 47,060 0,000
Остаток 6 0,049 0,008
Итого 7 0,429
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 2,696 0,120 22,410 0,000 2,402 2,990
Переменная X 1 -0,245 0,036 -6,860 0,000 -0,332 -0,157
Получено уравнение регрессии:.
Выполним его потенцирование, получим
Показательная модель
у=β0β1x*ε
Проведем его линеаризацию путем логарифмирования обеих частей уравнения
Для расчета параметров уравнения строим расчетную таблицу 3.
№ х ln(y) (x)2 ln(y)2 х • ln(y)
1 7,000 2,303 49 5,302 16,118 2,060 0,243 10,536 0,059 9,766
2 10,000 2,197 100 4,828 21,972 2,045 0,153 6,942 0,023 4,516
3 15,000 2,015 225 4,060 30,224 2,019 -0,004 0,214 0,000 0,391
4 20,000 1,792 400 3,210 35,835 1,994 -0,202 11,272 0,041 0,766
5 30,000 1,841 900 3,388 55,216 1,943 -0,102 5,554 0,010 0,331
6 45,000 1,758 2025 3,090 79,104 1,866 -0,108 6,171 0,012 1,156
7 60,000 1,686 3600 2,844 101,184 1,790 -0,103 6,137 0,011 2,176
8 120,000 1,609 14400 2,590 193,133 1,484 0,125 7,786 0,016 3,516
Итого 307,000 15,201 21699 29,312 532,786 0,000 0,000 54,611 0,172 22,615
Среднее значение 38,375 1,900 2712,375 3,664 66,598 – – 6,826 – –
0000
35,210 0,232 – – – – – – – –
0000
1239,734 0,054 – – – – – – – –
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,775
R-квадрат 0,600
Нормированный R-квадрат 0,534
Стандартная ошибка 0,169
Наблюдения 8
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 0,258 0,258 9,008 0,024
Остаток 6 0,172 0,029
Итого 7 0,429
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 2,096 0,088 23,698 0,000 1,879 2,312
Переменная X 1 -0,005 0,002 -3,001 0,024 -0,009 -0,001
Получено уравнение регрессии:
Выполним его потенцирование, получим
Полиномиальная 2-ой степени модель
y=ax2+bx+c+ε
По приведенным исходным данным определим оценки коэффициентов квадратичной регрессии. Применение к ней метода наименьших квадратов приводит к следующей системе линейных алгебраических уравнений a, b, c
ax4+bx3+cx2=x2yax3+bx2+cx=xyax2+bx+cn=y
Решение находим методом Крамера
№ х у ху
х2
у2
х3 х4
х2у
1 7 10 70,0 49,0 100,000 343,0 2401,0 490,0 5,457 4,543 45,431 9,766 20,640
2 10 9 90,0 100,0 81,000 1000,0 10000,0 900,0 5,596 3,404 37,822 4,516 11,587
3 15 7,5 112,5 225,0 56,250 3375,0 50625,0 1687,5 5,831 1,669 22,253 0,391 2,786
4 20 6 120,0 400,0 36,000 8000,0 160000,0 2400,0 6,070 -0,070 1,167 0,766 0,005
5 30 6,3 189,0 900,0 39,690 27000,0 810000,0 5670,0 6,560 -0,260 4,127 0,331 0,068
6 45 5,8 261,0 2025,0 33,640 91125,0 4100625,0 11745,0 7,325 -1,525 26,293 1,156 2,326
7 60 5,4 324,0 3600,0 29,160 216000,0 12960000,0 19440,0 8,126 -2,726 50,481 2,176 7,431
8 120 5 600,0 14400,0 25,000 1728000,0 207360000,0 72000,0 11,690 -6,690 133,800 3,516 44,756
Σ 307,000 55,000 1766,5 21699,0 400,740 2074843,0 225453651,0 114332,5 56,655 -1,655 321,375 22,615 89,598
Метод Крамера
225453651,000 2074843,000 400,740
114332,500 2074843,000 400,740
А= 2074843,000 400,740 307,000
В= 1766,500 400,740 307,000
400,740 307,000 8,000
55,000 307,000 8,000
225453651,000 114332,500 400,740
225453651,000 2074843,000 114332,500
С= 2074843,000 1766,500 307,000
Д= 2074843,000 400,740 1766,500
400,740 55,000 8,000
400,740 307,000 55,000
ΔА= -54455322770869,1
ΔВ= -4488645241,7
ΔС= -2458936489150,8
ΔД= -279793808816788
a=ΔВ/ΔА= 0,00008
b= 0,045
с= 5,138
y=0,00008×2+0,045x+5,138
Рассчитаем теоретические значения у и занесем в таблицу, также определим отклонения
2) оценить каждую модель через среднюю относительную ошибку аппроксимации и F критерий Фишера
Гиперболическая модель
Индекс детерминации: детерминации
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=8-2=6 составляет Fтабл=5,99.
Fфакт=159б154>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза Н1 , т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 3,73%. Качество построенной модели можно оценить хорошее, так как не превышает 8-10%.
Степенная модель
Рассчитаем индекс корреляции и коэффициент детерминации.
Определим коэффициент детерминации
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=8-2=6 составляет Fтабл=5,99.
Fфакт=47,06>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза Н1 , т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить хорошее, так как не превышает 8-10%.
Показательная модель
Определим коэффициент детерминации
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=8-2=6 составляет Fтабл=5,99.
Fфакт=9,008>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза Н1 , т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить хорошее, так как не превышает 8-10%.
Полиномиальная 2-ой степени модель
Тесноту линейной связи оценит коэффициент корреляции:
Определим коэффициент детерминации
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=8-2=6 составляет Fтабл=5,99.
Fфакт=17,81>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза Н1 , т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить как неудовлетворительное, так как превышает 10%.
3) выбрать лучшее уравнение регрессии и дать его обоснование (линейную модель тоже учитывать)
модель Уравнение Коэффициент детерминации Ошибка аппроксимации F критерий Фишера
Линейная 0,528 15,19 6,711
Гиперболическая 0,964 3,73 159,174
Степенная
0,887 3,06 47,06
Показательная 0,6 6.83 9,008
Полиномиальная 2-ой степени y=0,00008×2+0,045x+5,138
0,748 40,17 17,81
Лучшая гиперболическая
Лучшим уравнение является гиперболическая модель , т.к. значение критерия Фишера и коэффициента детерминации самые высокие, ошибка аппроксимации допустимая. Также может быть использована степенная модель.
Вариант №16 n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 x 5 4 5 6 3 6 4 3 7 5 4 7 6 5 6 4 8 4 y 120 130 126 100 110 90 135 150 90 130 139 85 105
Вариант №16
n
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
x
5 4 5 6 3 6 4 3 7 5 4 7 6 5 6 4 8 4
y
120 130 126 100 110 90 135 150 90 130 139 85 105 130 85 120 70 100
Составим расчетную таблицу.
Таблица 1
Вспомогательная таблица для расчета статистических величин
n
x
y
xy
x2 y2 ()2
1 5 120 600 25 14400 113,35 6,65 44,20 5,54
2 4 130 520 16 16900 126,02 3,98 15,84 3,06
3 5 126 630 25 15876 113,35 12,65 159,97 10,04
4 6 100 600 36 10000 100,68 -0,68 0,47 0,68
5 3 110 330 9 12100 138,69 -28,69 822,97 26,08
6 6 90 540 36 8100 100,68 -10,68 114,15 11,87
7 4 135 540 16 18225 126,02 8,98 80,65 6,65
8 3 150 450 9 22500 138,69 11,31 127,97 7,54
9 7 90 630 49 8100 88,02 1,98 3,93 2,20
10 5 130 650 25 16900 113,35 16,65 277,16 12,81
11 4 139 556 16 19321 126,02 12,98 168,49 9,34
12 7 85 595 49 7225 88,02 -3,02 9,10 3,55
13 6 105 630 36 11025 100,68 4,32 18,63 4,11
14 5 130 650 25 16900 113,35 16,65 277,16 12,81
15 6 85 510 36 7225 100,68 -15,68 245,99 18,45
16 4 120 480 16 14400 126,02 -6,02 36,24 5,02
17 8 70 560 64 4900 75,35 -5,35 28,61 7,64
18 4 100 400 16 10000 126,02 -26,02 677,03 26,02
Ито-го
92 2015 9871 504 234097
3108,55 173,41
Ср. знач. 5,11 111,94 548,39 28,0 13005,39
172,70 9,63
1. где
и − средние квадратические отклонения по х и у.
1,374;
21,791;
-0,79.
Коэффициент корреляции rху = -0,79 свидетельствует, что связь между признаками очень тесная и обратная.
Для проверки статистической значимости (существенности) линейного коэффициента парной корреляции рассчитаем t-критерий Стьюдента по формуле:
5,15.
Вычисленное tфакт сравним с табличным (критическим) значением tтабл при принятом уровне значимости = 0,05 и числе степеней свободы = n – 2 = 18 – 2 = 16. Табличное значение по таблице распределения Стьюдента равно 2,12.
Фактическое значение критерия больше табличного, что свидетельствует о значимости линейного коэффициента корреляции.
2. Уравнение парной линейной регрессии имеет вид:
,
где − результирующий показатель;
х – факторный показатель;
a, b − параметры уравнения.
Для определения параметров уравнения a и b составим систему нормальных уравнений. Исходное уравнение последовательно умножим на коэффициенты при неизвестных a и b и затем каждое уравнение просуммируем:
где n – число единиц совокупности.
Подставим полученные данные в систему уравнений:
Разделим каждый член уравнений на коэффициенты при а (в первом уравнении на 18, во втором – 92):
Вычтем из второго уравнения первое и найдем параметр b:
4,646 = -0,368b; b = -12,625.
Подставив значение b в первое уравнение, найдем значение а:
а = 111,94 – 5,11(-12,625) = 176,454.
Уравнение регрессии имеет вид:
.
Коэффициент регрессии b = -12,625 показывает, что при росте факторного признака на 1 ед. результирующий признак снижается на 12,625 ед.
В графическом виде рассчитанное в среде MS Excel уравнение регрессии выглядит следующим образом (рис. 1).
Рис. 1. Регрессионный анализ в MS Excel
Наблюдается незначительное расхождение коэффициентов ввиду округления результатов расчетов.
Рассчитаем средний коэффициент эластичности по формуле:
. Отсюда:
-0,576.
Коэффициент эластичности показывает, что в среднем при росте факторного признака результативный снижается на 0,576%.
Бета-коэффициент выражается формулой:
= -0,796.
β-коэффициент показывает, на какую часть своего среднего квадратического отклоненияизменится признак-результат Y с изменением фактора на величину своего среднего квадратического отклонения. В данном случае это значение равно -0,796%.
3. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем t-критерий Стьюдента и доверительные интервалы каждого из показателей. Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции.
S2ост = 3108,5516 = 194,284.
mb=Sостσx*n = 194,2841,374*18 = 2,391; ma=Sост*x2σx*n =194,284* 5041,374*18 = 12,653.
mr=1-r2n-2 = 1-0,624116 = 0,153.
Фактические значения t-статистик:
tb=bmb = 12,6252,391 = 5,28. ta=ama = 176,45412,653 = 13,946. tr=rmr = 0,790,153 = 5,163.
Табличное значение t-критерия Стьюдента при α = 0,05 и числе степеней свободы n-2 = 16 есть 2,12. Так как то признаем статистическую значимость параметров регрессии и показателя тесноты связи. Рассчитаем доверительные интервалы для параметров регрессии a и b:
a±t*ma и b±t*mb. Получим, что а ∈ 149,63;203,28 и b ∈-17,69;-7,56.
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
4. Оценим значимости уравнения регрессии и показателя тесноты связи с помощью F-критерия Фишера. Для этого сравним его фактическое значение Fфакт с табличным (критическим) значением Fтабл.
Фактическое значение Fфакт рассчитаем по формуле:
.
Табличное значение Fтабл по таблице значений F-критерия Фишера при = 0,05, k1 = m = 1 и k2 = n – m – 1 = 18 − 1− 1 = 16 равно 4,49 (m – число параметров при переменной х).
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и показателя тесноты связи rху, то есть они статистически надежны и сформировались под неслучайным воздействием фактора х.
5. Коэффициент детерминации показывает, что 62,4 % изменений результирующего признака объясняется вариацией факторных признаков.
6. Оценим качество уравнения с помощью средней ошибки аппроксимации по формуле:
, где − ошибка аппроксимации.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения . После этого на основе рассчитанных данных найдем величину средней ошибки аппроксимации (табл. 1).
Итак, в среднем расчетные значения прибыли на одного среднегодового работника отклоняются от фактических на 9,63 %. Качество уравнения регрессии можно оценить как хорошее, так как средняя ошибка аппроксимации не превышает допустимого предела (8−10%).
Построить поле корреляции и сделать предположение о форме и направлении связи
1. Построить поле корреляции и сделать предположение о форме и направлении связи
2. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии (сделать вывод о силе и направлении связи).
3. Найти коэффициент корреляции.
4. Оценить статистическую значимость коэффициентов регрессии и коэффициента корреляции по критерию Стьюдента.
5. Найти коэффициент детерминации, проверить значимость уравнения регрессии с помощью F – критерия Фишера
6. Сделать вывод о качестве модели.
Проанализируем данные зависимости себестоимости единицы изделия Y (тыс.руб) от величины выпуска продукции Х (тыс.шт.) за отчетный период:
Построить поле корреляции и сделать предположение о форме и направлении связи
Рис. 1
По построенному корреляционному полю можно сделать вывод о линейной связи X и Y, с положительным направлением.
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии (сделать вывод о силе и направлении связи).
Составим таблицу:
Таблица 1
Подставляем полученные значения в систему:
Из системы уравнений находим коэффициенты регрессии:
Уравнение парной регрессии:
Экономическая интерпретация: при увеличении величины выпуска продукции на 1 (тыс. шт.) себестоимость единицы изделия увеличится в среднем на 0,07 (тыс. руб).
Связь между X и Y прямая. Вывод о силе связи можно сделать после нахождения коэффициента корреляции.
Найти коэффициент корреляции
Заполним таблицу:
Таблица 2
если 0<г<1, это говорит о том, что связь прямая, с увеличением x увеличивается y, т.к. ±0,7 ≤ r ≤ ±1 – связь тесная.
Оценить статистическую значимость коэффициентов регрессии и коэффициента корреляции по критерию Стьюдента.
Оценим статистическую значимость коэффициента парной корреляции:
, где
Находим значение t-критерия Стьюдента по таблице
Сравниваем полученное значение с табличным:
– статистическая значимость коэффициента парной корреляции подтверждается
Рассчитаем стандартные ошибки коэффициентов регрессии.
Таблица 3
Рассчитаем стандартные ошибки коэффициентов регрессии.
0,148
0,022
Проверим статистическую значимость коэффициентов регрессии на уровне значимости
По таблице распределение Стьюдента находим табличное значение критерия:
Сравниваем полученные значения с табличным:
– статистическая значимость коэффициента регрессии a подтверждается
– статистическая значимость коэффициента регрессии b подтверждается
Найти коэффициент детерминации, проверить значимость уравнения регрессии с помощью F – критерия Фишера
Коэффициент детерминации означает, что 57,1% наблюдений приходятся на фактор x, остальные 42,9% на долю прочих факторов, не учтенных в уравнении регрессии.
Проверим значимость коэффициента детерминации на уровне значимости с помощью F- критерия Фишера.
По таблице значений Фишера-Снедекора находим табличное значение критерия:
Рассчитаем F-критерий Фишера по построенной модели регрессии:
Сравниваем получившееся значение с табличным:
– построенная модель регрессии значима
Построенное уравнение регрессии в целом можно считать качественным, т.к.:
– Коэффициент b статистически значим
– Связь между X и Y тесная
– Подтверждается значимость построенной модели по F-критерию Фишера
1. Построить поле корреляции и сделать предположение о форме и направлении связи
2. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии (сделать вывод о силе и направлении связи).
3. Найти коэффициент корреляции.
4. Оценить статистическую значимость коэффициентов регрессии и коэффициента корреляции по критерию Стьюдента.
5. Найти коэффициент детерминации, проверить значимость уравнения регрессии с помощью F – критерия Фишера
6. Сделать вывод о качестве модели.
Проанализируем данные зависимости урожайности зерновых Y (ц/га) от величины внедрений удобрений на 1 га посева Х (кг)
Построить поле корреляции и сделать предположение о форме и направлении связи
Рис. 1
По построенному корреляционному полю можно сделать вывод о линейной связи X и Y, с положительным направлением.
Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии (сделать вывод о силе и направлении связи).
Составим таблицу:
Таблица 1
Подставляем полученные значения в систему:
Из системы уравнений находим коэффициенты регрессии:
Уравнение парной регрессии:
Экономическая интерпретация: при увеличении величины внесения удобрений на 1 (кг) урожайность зерновых в среднем увеличится на 1,22099 (ц/га).
Связь между X и Y прямая. Вывод о силе связи можно сделать после нахождения коэффициента корреляции.
Найти коэффициент корреляции.
Составим таблицу:
Таблица 2
если 0<г<1, это говорит о том, что связь прямая, с увеличением x увеличивается y, т.к. ±0,5 ≤ r ≤ ±0,7 – связь средняя.
Оценить статистическую значимость коэффициентов регрессии и коэффициента корреляции по критерию Стьюдента.
Оценим статистическую значимость коэффициента парной корреляции:
, где
Находим значение t-критерия Стьюдента по таблице
Сравниваем полученное значение с табличным:
– статистическая значимость коэффициента парной корреляции подтверждается
Таблица 3
Рассчитаем стандартные ошибки коэффициентов регрессии.
7,4696
0,488
Проверим статистическую значимость коэффициентов регрессии на уровне значимости
По таблице распределение Стьюдента находим табличное значение критерия:
Сравниваем полученные значения с табличным:
– статистическая значимость коэффициента регрессии a не подтверждается
– статистическая значимость коэффициента регрессии b подтверждается
Найти коэффициент детерминации, проверить значимость уравнения регрессии с помощью F – критерия Фишера
Коэффициент детерминации означает, что 43,9% наблюдений приходятся на фактор x, остальные 56,1% на долю прочих факторов, не учтенных в уравнении регрессии.
Проверим значимость коэффициента детерминации на уровне значимости с помощью F- критерия Фишера.
По таблице значений Фишера-Снедекора находим табличное значение критерия:
Рассчитаем F-критерий Фишера по построенной модели регрессии:
Сравниваем получившееся значение с табличным:
– построенная модель регрессии значима
Построенное уравнение регрессии в целом можно считать качественным, т.к.:
– Коэффициент b статистически значим
– Связь между X и Y средняя
– Подтверждается значимость построенной модели по F-критерию Фишера
Из партии электроламп отобрано 200 штук для определения срока их работы
Вариант 2
Из партии электроламп отобрано 200 штук для определения срока их работы. Выборочное среднее значение этого параметра оказалось 1100 часов. Найти интервальную оценку этого параметра ламп, если среднее квадратичное отклонение их нормальной работы известно и равно 40 часов.
Взять коэффициент доверия γ=0,9;
Взять коэффициент доверия γ=0,98;
РЕШЕНИЕ
Коэффициент доверия γ=0,9 t=1,65
Предельная ошибка выборки
∆x=tσ2n=1,65402200=4,7 ч.
Определим пределы, в которых ожидается средний срок работы электроламп:
x=x±∆x=1100±4,7 ч.1095,3≤x≤1104,7 ч.
Коэффициент доверия γ=0,98 t=2,34
Предельная ошибка выборки
∆x=tσ2n=2,34402200=6,6 ч.
Определим пределы, в которых ожидается средний срок работы электроламп:
x=x±∆x=1100±6,6ч.1093,4≤x≤1106,6 ч.
Исследовать тип регрессии между случайными переменными x и y.
X 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8
Y 17,385 15,804 14,821 13,978 12,513 11,3 10,233 8,961 7,638 6,481
Если известно, что она отвечает одному из следующих типов:
Линейная функция: y=a+bx;
Нелинейные функции: y= a+b/x (гипербола);
y=a+bx+cx2 ( парабола).
РЕШЕНИЕ
Линейная функция: y=a+bx
Рабочая таблица.
N х Y x2 Xy
y2
1 1 17,385 1 17,385 302,238 17,285 0,100 0,010 0,575
2 1,2 15,804 1,44 18,9648 249,766 16,091 -0,287 0,082 1,815
3 1,4 14,821 1,96 20,7494 219,662 14,897 -0,076 0,006 0,510
4 1,6 13,978 2,56 22,3648 195,384 13,702 0,276 0,076 1,972
5 1,8 12,513 3,24 22,5234 156,575 12,508 0,005 0,000 0,038
6 2 11,3 4 22,6 127,69 11,314 -0,014 0,000 0,124
7 2,2 10,233 4,84 22,5126 104,714 10,120 0,113 0,013 1,106
8 2,4 8,961 5,76 21,5064 80,2995 8,926 0,035 0,001 0,395
9 2,6 7,638 6,76 19,8588 58,339 7,731 -0,093 0,009 1,223
10 2,8 6,481 7,84 18,1468 42,0034 6,537 -0,056 0,003 0,867
Сумма 19 119,114 39,4 206,612 1536,673 119,111 0,003 0,200 8,625
Ср.знач
1,900 11,911 3,940 20,661 153,667 11,911 0,000 0,020 0,863
;
.
Получено уравнение регрессии:.
Тесноту линейной связи оценит коэффициент корреляции:
;.
Значение коэффициента корреляции больше 0,7 и отрицательно, это говорит о сильной и обратной связи.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=4704,143>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить хорошее, так как не превышает 8-10%.
Нелинейные функции: y= a+b/x (гипербола)
Представим в виде
Для расчета параметров уравнения строим расчетную таблицу 4.
№ 1/х y 1/х2
y2 у/х
1 1,000 17,385 1,000 302,238 17,385 18,751 -1,366 7,857 1,866 40,120
2 0,833 15,804 0,694 249,766 13,170 16,010 -0,206 1,305 0,043 32,070
3 0,714 14,821 0,510 219,662 10,586 14,052 0,769 5,186 0,591 23,088
4 0,625 13,978 0,391 195,384 8,736 12,584 1,394 9,972 1,943 15,062
5 0,556 12,513 0,309 156,575 6,952 11,442 1,071 8,558 1,147 8,248
6 0,500 11,300 0,250 127,690 5,650 10,529 0,772 6,827 0,595 2,465
7 0,455 10,233 0,207 104,714 4,651 9,781 0,452 4,417 0,204 7,717
8 0,417 8,961 0,174 80,300 3,734 9,158 -0,197 2,199 0,039 21,132
9 0,385 7,638 0,148 58,339 2,938 8,631 -0,993 13,001 0,986 7,717
10 0,357 6,481 0,128 42,003 2,315 8,179 -1,698 26,203 2,884 21,132
Итого 0,053 119,114 3,810 1536,67 76,117 119,118 -0,004 85,525 10,297 178,752
Среднее значение 0,005 11,911 0,381 153,67 7,612 – – 8,553 – 17,875
0000
0,617 3,433 – – – – – – – –
0000
0,381 11,786 – – – – – – – –
Все расчеты в таблице велись по формулам
.
Тогда
Получено уравнение регрессии:.
индекс корреляции
Связь между показателем у и фактором х можно считать сильной, так как R>0,7,
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=83,56>Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 17,875%. Качество построенной модели можно оценить как неудовлетворительное, так как превышает 8-10%.
y=a+bx+cx2 ( парабола).
По приведенным исходным данным определим оценки коэффициентов квадратичной регрессии. Применение к ней метода наименьших квадратов приводит к следующей системе линейных алгебраических уравнений a, b, c
ax4+bx3+cx2=x2yax3+bx2+cx=xyax2+bx+cn=y
Решение находим методом Крамера
№ х у ху
х2
у2
х3 х4
х2у
1 1 17,385 17,385 1,000 302,238 1,000 1,000 17,385 17,214 0,171 0,984 6,175
2 1,2 15,804 18,965 1,440 249,766 1,728 2,074 22,758 16,068 -0,264 1,670 0,817
3 1,4 14,821 20,749 1,960 219,662 2,744 3,842 29,049 14,910 -0,089 0,600 0,006
4 1,6 13,978 22,365 2,560 195,384 4,096 6,554 35,784 13,740 0,238 1,703 0,850
5 1,8 12,513 22,523 3,240 156,575 5,832 10,498 40,542 12,558 -0,045 0,360 5,698
6 2 11,3 22,600 4,000 127,690 8,000 16,000 45,200 11,364 -0,064 0,566 12,960
7 2,2 10,233 22,513 4,840 104,714 10,648 23,426 49,528 10,158 0,075 0,733 21,781
8 2,4 8,961 21,506 5,760 80,300 13,824 33,178 51,615 8,940 0,021 0,234 35,272
2,6 7,638 19,859 6,760 58,339 17,576 45,698 51,633 7,710 -0,072 0,943 52,737
2,8 6,481 18,147 7,840 42,003 21,952 61,466 50,811 6,468 0,013 0,201 70,880
Σ 19,000 119,11 206,61 39,400 1536,67 87,400 203,73 394,30 119,130 -0,016 7,994 207,175
Метод Крамера
203,733 87,400 39,400
394,305 87,400 39,400
А= 87,400 39,400 19,000
В= 206,612 39,400 19,000
С=
39,400 19,000 10,000
119,114 19,000 10,000
203,733 394,305 39,400
203,733 87,400 394,305
С= 87,400 206,612 19,000
Д= 87,400 39,400 206,612
39,400 119,114 10,000
39,400 19,000 119,114
ΔА= 27,878
ΔВ= -4,190
ΔС= -150,544
634,611
a=ΔВ/ΔА= -0,150
b= -5,400
с= 22,764
y=-0,15×2-5,4x+22,764
Рассчитаем теоретические значения у и занесем в таблицу, также определим отклонения
индекс корреляции
Связь между показателем у и фактором х можно считать сильной, так как R>0,7,
Индекс детерминации: детерминации
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=7992Fтабл=5,99, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 7,994%. Качество построенной модели можно оценить как хорошее, так как не превышает 8-10%.
Наилучшей является линейная модель или параболическая модель.
Построить аддитивную модель временного ряда, описывающего потребление электроэнергии за 4 года:
№
квартала 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
млн Квч
10,9 6,5 8,7 11 6,4 5,6 8 10 6 4,4 7,4 9,3 5,1 4,5 6 8
Анализ провести, используя Excel;
Выделить тренд;
Графически оценить циклическую составляющую и ее период
РЕШЕНИЕ
Анализ провести, используя Excel
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,438
R-квадрат 0,192
Нормированный R-квадрат 0,134
Стандартная ошибка 2,005
Наблюдения 16
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 13,361 13,361 3,324 0,090
Остаток 14 56,276 4,020
Итого 15 69,638
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 9,048 1,051 8,605 0,000 6,792 11,303
t -0,198 0,109 -1,823 0,090 -0,431 0,035
Выделить тренд
Уравнение тренда
у=9,048-0,198t
Графически оценить циклическую составляющую и ее период
Циклическая составляющая
Наблюдение
У Предсказанное У
Циклическая составляющая
1 1 год 10,9 8,85 2,05
2
6,5 8,65 -2,15
3
8,7 8,45 0,25
4
11 8,25 2,75
5 2 год 6,4 8,06 -1,66
6
5,6 7,86 -2,26
7
8 7,66 0,34
8
10 7,46 2,54
9 3 год 6 7,26 -1,26
10
4,4 7,07 -2,67
11
7,4 6,87 0,53
12
9,3 6,67 2,63
13 4 год 5,1 6,47 -1,37
14
4,5 6,27 -1,77
15
6 6,07 -0,07
16
8 5,88 2,12
Σ
117,8 117,8
Проверим выполнимость требований к сезонным составляющим для аддитивной модели: сумма всех сезонных компонент должна быть равна нулю. Условие выполняется.
Все отклонения находятся внутри горизонтальной полосы постоянной ширины, это говорит о независимости дисперсий от значений объясняющей переменной и выполнимости условия гомоскедастичности.
2 1 Проверим совместную значимость факторов X1 X3 Построим вспомогательную регрессию
2.1. Проверим совместную значимость факторов X1, X3
Построим вспомогательную регрессию, не включающую в себя переменные X1 и X3 .
Y : 1 X2
Рассмотрим вновь полученные оценки и статистики:
Ordinary least squares
(linear regression)
Dependent variable: Y
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 307.17118774 1.442493303 212.94461965 [0.0000]
2 X2 3.4527047396 0.1843287168 18.731236234 [0.0000]
R^2adj. = 42.209727089% DW = 2.0932
R^2 = 42.330374841% S.E. = 27.664737595
Residual sum of squares: 365831.423555069
Maximum loglikelihood: -2273.76453057757
AIC = 9.4865188774 BIC = 9.5126050406
F(1,478) = 350.8592 [0.0000]
Normality: Chi^2(2) = 2.438169 [0.2955]
Heteroskedasticity: Chi^2(1) = 0.459809 [0.4977]
Functional form: Chi^2(1) = 0.104349 [0.7467]
AR(1) in the error: Chi^2(1) = 1.294986 [0.2551]
ARCH(1) in the error: Chi^2(1) = 0.086874 [0.7682]
Сравним регрессии (исходную и вспомогательную) по сумме квадратов остатков.
Для исходной регрессии сумма квадратов остатков равна 301939.369, для вспомогательной 365831.424. Сумма квадратов остатков для исходной регрессии меньше, чем для вспомогательной, соответственно исходная регрессия лучше вспомогательной. Суть самого МНК состоит в том, чтобы найти такие параметры αi, при которых сумма квадратов остатков будет минимальной.
Выдвинем гипотезу:
H0≔α1=α3=0
q – число ограничений на коэффициенты
В данном случае проверяется два ограничения q=2.
Исходная регрессия – регрессия без ограничений.
Вспомогательная регрессия – регрессия с учетом ограничений.
Построим F-статистику для проверки существенности ограничений. Тестирование гипотезы основано на F-статистике, которая вычисляется по формуле:
F=R2-R2’1-R2*n-m-1q
R2′ – коэффициент детерминации для вспомогательной регрессии.
F=0,524-0,4231-0,524*480-42=50.5
Fкр=Fα,q,n-m-1=F0.05,2,480-3-1=3.015
Так как F-статистика больше Fкр, то H0≔α1=α3=0 отвергается на уровне значимости 0,05, то есть факторы Х1 и Х3 совместно значимы.
Можно рассчитать РДУЗ с помощью функции Excel F.РАСП.ПX(50.5;2;476) = 1.3E-20. Значение очень мало, гипотеза отвергается.
2.2. RESET тест Рамсея;
RESET тест Рамсея предназначен для тестирования функциональной формы (спецификации) модели.
Построим вспомогательную регрессию, в которой факторами являются не только переменные X 1 — X 3 , но и квадрат и куб расчетных значений исходного уравнения (Yest).
Ordinary least squares
(linear regression)
Dependent variable: Y
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 274.23565948 212.45643346 1.2907853861 [0.1974]
2 X1 2.3501919045 0.2509936643 9.3635507118 [0.0000]
3 X2 3.394997654 0.1687775945 20.115215316 [0.0000]
4 X3 0.3904361739 0.1109490671 3.5190577434 [0.0005]
5 Yest^2 -5.19662E-04 0.0074833596 -0.0694423332 [0.9447]
6 Yest^3 9.893367E-07 1.708521E-05 0.057906015 [0.9538]
R^2adj. = 51.924492047% DW = 2.0184
R^2 = 52.426324071% S.E. = 25.232548884
Residual sum of squares: 301787.041978681
Maximum loglikelihood: -2227.57628426685
AIC = 9.3107345178 BIC = 9.3716022318
F(5,474) = 104.4699 [0.0000]
Normality: Chi^2(2) = 2.474156 [0.2902]
Heteroskedasticity: Chi^2(1) = 2.387862 [0.1223]
Functional form: Chi^2(1) = 0.075318 [0.7837]
AR(1) in the error: Chi^2(1) = 0.062805 [0.8021]
ARCH(1) in the error: Chi^2(1) = 0.145456 [0.7029]
Проверим совместную значимость добавленных факторов. В этом случае регрессией без ограничений является построенная вспомогательная регрессия, а регрессией с ограничениями будет исходная регрессия. Ограничений в данном случае два:
H0:α4=α5=0
q=2
для проверки совместной значимости добавленных факторов построим F -статистику.
Построим F-статистику для проверки существенности ограничений:
F=R2′- R21-R2’*n-m-1q
R2′ – коэффициент детерминации для вспомогательной регрессии.
F=0,52426-0,524031-0,52426*480-62=0.115
Fкр=Fα,q,n-m-1=F0.05,2,480-5-1=3.015
Так как F-статистика меньше Fкр, то гипотеза H0≔α4=α5=0 принимается на уровне значимости 0,05, то есть факторы Х4 и Х5 совместно незначимы. Таким образом, функциональная форма модели (линейная) является приемлемой.
Рассчитаем РДУЗ с помощью функции Excel F.РАСП.ПX(0,115;2;474) = 0,891. Значение значительно превышает приемлемые уровни допустимой вероятности ошибки первого уровня — 0.1, 0.05, гипотеза принимается.
2.3. Проверка постоянства коэффициентов тестом Чоу I формы.
Создаем вспомогательную переменную ChowBreak, переменная принимает значение 1 для первой половины наблюдений, а для второй половины наблюдений — значение 0.
Оценим вспомогательную регрессию, в которой вместо исходных факторов X 1, X 2, X 3 участвует набор факторов X1*ChowBreak, X2*ChowBreak, X3*ChowBreak, X1*(1- ChowBreak), X2*(1- ChowBreak), X3*(1- ChowBreak).
Ordinary least squares
(linear regression)
Dependent variable: Y
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 254.63835933 5.4042814301 47.117893956 [0.0000]
2 X1*ChowBreak 2.4781506026 0.2803082319 8.8408056595 [0.0000]
3 X2*ChowBreak 3.2411841299 0.2351491615 13.783524078 [0.0000]
4 X3*ChowBreak 0.3957969746 0.156393101 2.5307828297 [0.0117]
5 X1*(1-ChowBreak) 2.2374806517 0.266478503 8.3964771148 [0.0000]
6 X2*(1-ChowBreak) 3.5338660014 0.2402667507 14.708094194 [0.0000]
7 X3*(1-ChowBreak) 0.3787418009 0.1469106896 2.5780411346 [0.0102]
R^2adj. = 52.185846928% DW = 2.0278
R^2 = 52.784771601% S.E. = 25.163869038
Residual sum of squares: 299513.204236663
Maximum loglikelihood: -2225.76113896194
AIC = 9.307338079 BIC = 9.3769011807
F(6,473) = 88.13257 [0.0000]
Normality: Chi^2(2) = 1.60866 [0.4474]
Heteroskedasticity: Chi^2(1) = 3.985729 [0.0459]
Functional form: Chi^2(1) = 0.039421 [0.8426]
AR(1) in the error: Chi^2(1) = 0.132954 [0.7154]
ARCH(1) in the error: Chi^2(1) = 0.209723 [0.6470]
Сравним полученную вспомогательную и исходную регрессии, построим F -статистику для проверки равенства коэффициентов при «разных половинах» исходных факторов во вспомогательной регрессии.
F=RSS-RSS’RSS’*n-2qq=301939.369-299513.204299513.204*480-2*33=1.28
Fкр=Fα,q,n-2q=F0.05,3,480-6=2.624
в данном случае проверяется q=3 ограничения: α1=α4; α2=α5; α3=α6
Исходная регрессия – регрессия с учетом ограничений.
Вспомогательная регрессия – регрессия без ограничений.
Так как F-статистика меньше Fкр, то гипотеза H0: α1=α4; α2=α5; α3=α6 принимается на уровне значимости 0,05, то есть модель для всех наблюдений неизменна, другими словами, коэффициенты модели постоянны.
Рассчитаем РДУЗ с помощью функции Excel F.РАСП.ПX(1.28;3;474) = 0,281. Значение превышает приемлемые уровни допустимой вероятности ошибки первого уровня — 0.1, 0.05, гипотеза принимается.
2.4. Проверка гетероскедастичности (тест Бреуша – Годфри – Пагана);
Введем новую переменную Resid2=Resid1^2 – остатки, возведенные в квадрат.
Создадим вспомогательную регрессию, где в качестве зависимой выступает переменная Resid2 , а факторы — исходный набор факторов, номер наблюдения (N) , квадраты факторов, а также попарно перемноженные факторы.
Ordinary least squares
(linear regression)
Dependent variable: Resid2
Number of observations: 480
Variable Coefficient St. Error t-statistic Sign.
1 Constant 1052.0367685 409.20762462 2.5709119409 [0.0104]
2 X1 -88.381656337 41.409532326 -2.1343311883 [0.0333]
3 X2 -13.436102116 13.787603644 -0.9745059738 [0.3303]
4 X3 4.1909093272 10.908179252 0.3841987953 [0.7010]
5 N 0.7268726164 0.1417308444 5.1285422003 [0.0000]
6 X1^2 1.882184371 1.0432891718 1.8040869413 [0.0719]
7 X2^2 1.1057856934 0.4692634477 2.3564283533 [0.0188]
8 X3^2 -0.2357901009 0.1974066582 -1.1944384402 [0.2329]
9 X1*X2 0.088968295 0.604909979 0.1470769174 [0.8831]
10 X1*X3 0.1388007007 0.4095211551 0.3389341404 [0.7348]
11 X2*X3 -0.0852538115 0.2870641484 -0.2969852276 [0.7666]
R^2adj. = 7.5656493794% DW = 2.1190
R^2 = 9.4953853005% S.E. = 426.93345875
Residual sum of squares: 85485651.5754815
Maximum loglikelihood: -3582.70801548019
AIC = 14.977950065 BIC = 15.082294717
F(10,469) = 4.920562 [0.0000]
Normality: Chi^2(2) = 1175.547 [0.0000]
Heteroskedasticity: Chi^2(1) = 26.67577 [0.0000]
Functional form: Chi^2(1) = 2.700913 [0.1003]
AR(1) in the error: Chi^2(1) = 1.762428 [0.1843]
ARCH(1) in the error: Chi^2(1) = 0.597901 [0.4394]
Судя по РДУЗ (больше 0,05) все коэффициенты модели, кроме коэффициента при номере наблюдения (N), при X1 и X2^2, незначимы по критерию Стьюдента. Однако все факторы в уравнении значимы в совокупности (РДУЗ для F-статистики меньше 0,05), т.е. в совокупности этот набор переменных можно считать сильными инструментами.
Матрица корреляции:
Correlation matrix
Number of observations: 480
Variable Mean Variance S.D.
1 Resid2 298.8494481 196780.13993 443.59907566
2 X1 19.450018854 21.113543735 4.5949476313
3 X2 3.7833283708 46.927333058 6.8503527688
4 X3 17.981022954 108.52729266 10.417643335
5 N 240.5 19199.916667 138.5637639
6 X1^2 399.41677716 32467.936922 180.18861485
7 X2^2 61.240906619 4392.8488132 66.278569789
8 X3^2 431.84447914 151346.61225 389.03291923
9 X1*X2 73.771003511 19363.448843 139.1526099
10 X1*X3 349.64997986 48692.60961 220.66401974
11 X2*X3 73.481478839 21623.077664 147.04787542
<1> <2> <3> <4> <5> <6> <7>
<1> 1. -0.119166 -0.084005 -0.057604 0.221551 -0.109894 0.004065
[0.0090] [0.0659] [0.2078] [0.0000] [0.0160] [0.9292]
<2> -0.119166 1. 0.005884 -0.001697 0.011294 0.994536 0.021057
[0.0090] [0.8977] [0.9704] [0.8051] [0.0000] [0.6454]
<3> -0.084005 0.005884 1. 0.076416 -0.029774 0.008718 0.770062
[0.0659] [0.8977] [0.0945] [0.5152] [0.8489] [0.0000]
<4> -0.057604 -0.001697 0.076416 1. 0.009116 -0.007843 0.039024
[0.2078] [0.9704] [0.0945] [0.8421] [0.8639] [0.3936]
<5> 0.221551 0.011294 -0.029774 0.009116 1. 0.008293 -0.034612
[0.0000] [0.8051] [0.5152] [0.8421] [0.8562] [0.4493]
<6> -0.109894 0.994536 0.008718 -0.007843 0.008293 1. 0.028885
[0.0160] [0.0000] [0.8489] [0.8639] [0.8562] [0.5278]
<7> 0.004065 0.021057 0.770062 0.039024 -0.034612 0.028885 1.
[0.9292] [0.6454] [0.0000] [0.3936] [0.4493] [0.5278]
<8> -0.06911 -0.016613 0.070839 0.966861 0.007439 -0.021943 0.022341
[0.1306] [0.7166] [0.1212] [0.0000] [0.8709] [0.6316] [0.6254]
<9> -0.100991 0.136126 0.963499 0.085487 -0.04726 0.13834 0.737362
[0.0269] [0.0028] [0.0000] [0.0613] [0.3015] [0.0024] [0.0000]
<10> -0.097882 0.361462 0.084388 0.905961 -0.004666 0.354312 0.045009
[0.0320] [0.0000] [0.0647] [0.0000] [0.9188] [0.0000] [0.3251]
<11> -0.085936 0.031358 0.843929 0.327258 -0.011511 0.03127 0.680317
[0.0599] [0.4931] [0.0000] [0.0000] [0.8014] [0.4943] [0.0000]
<8> <9> <10> <11>
<1> -0.06911 -0.100991 -0.097882 -0.085936
[0.1306] [0.0269] [0.0320] [0.0599]
<2> -0.016613 0.136126 0.361462 0.031358
[0.7166] [0.0028] [0.0000] [0.4931]
<3> 0.070839 0.963499 0.084388 0.843929
[0.1212] [0.0000] [0.0647] [0.0000]
<4> 0.966861 0.085487 0.905961 0.327258
[0.0000] [0.0613] [0.0000] [0.0000]
<5> 0.007439 -0.04726 -0.004666 -0.011511
[0.8709] [0.3015] [0.9188] [0.8014]
<6> -0.021943 0.13834 0.354312 0.03127
[0.6316] [0.0024] [0.0000] [0.4943]
<7> 0.022341 0.737362 0.045009 0.680317
[0.6254] [0.0000] [0.3251] [0.0000]
<8> 1. 0.079789 0.86942 0.31328
[0.0808] [0.0000] [0.0000]
<9> 0.079789 1. 0.142782 0.813716
[0.0808] [0.0017] [0.0000]
<10> 0.86942 0.142782 1. 0.323106
[0.0000] [0.0017] [0.0000]
<11> 0.31328 0.813716 0.323106 1.
Вклад каждого из этих факторов в зависимую переменную несущественен (коэффициент корреляции меньше 0,3).
Совместная значимость всех факторов в этой вспомогательной регрессии проверяется на основе F-статистики (то есть проверка значимости уравнения в целом). Таким образом, все факторы совместно значимы.
Статистика теста Бреуша – Годфри – Пагана рассчитывается как , где -объяснённая сумма квадратов вспомогательной регрессии. Данная статистика асимптотически имеет распределение , где — количество переменных в модели.
Variable Fitted values, 480 obs.
Minimum -30.860680166
Maximum 700.93834709
Mean 298.8494481 [0.0000]
Median 297.34915094 [0.0000]
Variance 18685.032481 (biased estimate)
Variance 18724.0409 (unbiased estimate)
Standard deviation 136.69320569 (biased estimate)
Standard deviation 136.83581731 (unbiased estimate)
Asymmetry 0.1722495 [0.1234]
Excess kurtosis -0.4638322292 [0.0380]
Coefficient of variation 0.4578754225
Sum 143447.73509
Sum of squares about mean 8968815.591
Sum of squares 51838092.053
1-st order autocorrelation 0.5351547412 [0.0000]
Статистика равна 8968815,591/2 = 4484407,8
X20.05;10=18.31
Статистика превышает критическое значение на уровне значимости 0,05. Значит гипотеза о присутствии гетероскедастичности отвергается.
Стандартные статистические выводы, основанные на МНК, в условиях гетероскедастичности неверны. То есть тестирование значимости или совместной значимости факторов с помощью t- и F-статистик может привести к неверным выводам. В нашем же случае ошибка модели гомоскедастична и все выводы, сделанные ранее верны.
Таким образом, исходная модель значима и может использоваться для дальнейшего анализа зависимой переменной Y.
Y=254,602+2,354X1+3,398X2+0,389X3
Из партии электроламп отобрано 400 штук для определения срока их работы
Вариант 1
Из партии электроламп отобрано 400 штук для определения срока их работы. Выборочное среднее значение этого параметра оказалось 1280 часов. Найти интервальную оценку этого параметра ламп, если среднее квадратичное отклонение их нормальной работы известно и равно 25 часов.
Взять коэффициент доверия γ=0,9;
Взять коэффициент доверия γ=0,98;
РЕШЕНИЕ
Коэффициент доверия γ=0,9 t=1,65
Предельная ошибка выборки
∆x=tσ2n=1,65252400=1,65*3510=2,06 ч.
Определим пределы, в которых ожидается средний срок работы электроламп:
x=x±∆x=1280±2,06 ч.1277,94≤x≤1282,06 ч.
Коэффициент доверия γ=0,98 t=2,34
Предельная ошибка выборки
∆x=tσ2n=2,34252400=2,93 ч.
Определим пределы, в которых ожидается средний срок работы электроламп:
x=x±∆x=1280±2,93ч.1277,07≤x≤1282,93 ч.
2) Исследовать тип регрессии между случайными переменными x и y.
X 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8
Y 1 1,456 1,84118 2,175 2,469 2,733 2,971 3,189 3,389 3,574
Если известно, что она отвечает одному из следующих типов:
Линейная функция: y=a+bx;
Нелинейные функции: y= a+b/x (гипербола);
y=a+bx+cx2 ( парабола).
РЕШЕНИЕ
Линейная функция: y=b0+b1x
Рабочая таблица.
N х Y x2 Xy
y2
1 1 1 1 1 1 1,223 -0,223 0,050 22,300
2 1,2 1,456 1,44 1,7472 2,11994 1,502 -0,046 0,002 3,187
3 1,4 1,84118 1,96 2,57765 3,38994 1,782 0,059 0,004 3,225
4 1,6 2,175 2,56 3,48 4,73063 2,061 0,114 0,013 5,232
5 1,8 2,469 3,24 4,4442 6,09596 2,341 0,128 0,016 5,200
6 2 2,733 4 5,466 7,46929 2,620 0,113 0,013 4,135
7 2,2 2,971 4,84 6,5362 8,82684 2,899 0,072 0,005 2,410
8 2,4 3,189 5,76 7,6536 10,1697 3,179 0,010 0,000 0,320
9 2,6 3,389 6,76 8,8114 11,4853 3,458 -0,069 0,005 2,042
10 2,8 3,574 7,84 10,0072 12,7735 3,738 -0,164 0,027 4,578
Сумма 19 24,797 39,4 51,723 68,0611 26,369 -0,006 0,134 52,628
Ср.знач
1,900 2,480 3,940 5,172 6,806 2,637 -0,001 0,013 5,263
.
Получено уравнение регрессии:.
Тесноту линейной связи оценит коэффициент корреляции:
Значение коэффициента корреляции больше 0,7 и отрицательно, это говорит о сильной и прямой связи.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=383,15>Fтабл=5,32, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить хорошее, так как не превышает 8-10%.
Нелинейные функции: y= a+b/x (гипербола)
Представим в виде
Для расчета параметров уравнения строим расчетную таблицу 4.
№ 1/х y 1/х2
y2 у/х
1 1,000 1,000 1,000 1,000 1,000 0,807 0,193 19,262 0,037 4,410
2 0,833 1,456 0,694 2,120 1,213 1,478 -0,022 1,482 0,000 2,703
3 0,714 1,841 0,510 3,390 1,315 1,956 -0,115 6,251 0,013 1,585
4 0,625 2,175 0,391 4,731 1,359 2,315 -0,140 6,451 0,020 0,856
5 0,556 2,469 0,309 6,096 1,372 2,595 -0,126 5,085 0,016 0,398
6 0,500 2,733 0,250 7,469 1,367 2,818 -0,085 3,108 0,007 0,135
7 0,455 2,971 0,207 8,827 1,350 3,001 -0,030 1,001 0,001 0,084
8 0,417 3,189 0,174 10,170 1,329 3,153 0,036 1,127 0,001 0,225
9 0,385 3,389 0,148 11,485 1,303 3,282 0,107 3,159 0,011 0,084
10 0,357 3,574 0,128 12,773 1,276 3,392 0,182 5,081 0,033 0,225
Итого 0,053 24,797 3,810 68,061 12,885 24,797 0,000 52,008 0,140 10,702
Среднее значение 0,005 2,480 0,381 6,806 1,289 – – 5,201 – 1,070
σ
0,617 0,811 – – – – – – – –
σ2
0,381 0,657 – – – – – – – –
Все расчеты в таблице велись по формулам
.
Тогда
Получено уравнение регрессии:.
индекс корреляции
Связь между показателем у и фактором х можно считать сильной, так как R>0,7,
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=367,22>Fтабл=5,32, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 5,201%. Качество построенной модели можно оценить как хорошее, так как не превышает 8-10%.
y=a+bx+cx2 ( парабола).
По приведенным исходным данным определим оценки коэффициентов квадратичной регрессии. Применение к ней метода наименьших квадратов приводит к следующей системе линейных алгебраических уравнений a, b, c
ax4+bx3+cx2=x2yax3+bx2+cx=xyax2+bx+cn=y
Решение находим методом Крамера
№ х у ху
х2
у2
х3 х4
х2у
1 1 1 1,000 1,000 1,000 1,000 1,000 1,000 1,035 -0,035 3,500 4,410
2 1,2 1,456 1,747 1,440 2,120 1,728 2,074 2,097 1,440 0,016 1,104 2,703
3 1,4 1,84118 2,578 1,960 3,390 2,744 3,842 3,609 1,813 0,028 1,504 1,585
4 1,6 2,175 3,480 2,560 4,731 4,096 6,554 5,568 2,156 0,019 0,888 0,856
5 1,8 2,469 4,444 3,240 6,096 5,832 10,498 8,000 2,467 0,002 0,100 0,398
6 2 2,733 5,466 4,000 7,469 8,000 16,000 10,932 2,746 -0,013 0,476 0,135
7 2,2 2,971 6,536 4,840 8,827 10,648 23,426 14,380 2,994 -0,023 0,778 0,017
8 2,4 3,189 7,654 5,760 10,170 13,824 33,178 18,369 3,211 -0,022 0,686 0,008
2,6 3,389 8,811 6,760 11,485 17,576 45,698 22,910 3,396 -0,007 0,215 0,084
2,8 3,574 10,007 7,840 12,773 21,952 61,466 28,020 3,550 0,024 0,663 0,225
Σ 19,000 24,797 51,723 39,400 68,061 87,400 203,73 114,88 24,808 -0,011 9,915 10,419
Метод Крамера
203,733 87,400 39,400
114,883 87,400 39,400
А= 87,400 39,400 19,000
В= 51,723 39,400 19,000
39,400 19,000 10,000
24,797 19,000 10,000
203,733 114,883 39,400
203,733 87,400 114,883
С= 87,400 51,723 19,000
Д= 87,400 39,400 51,723
39,400 24,797 10,000
39,400 19,000 24,797
ΔА= 27,878
ΔВ= -10,935
ΔС= 80,490
ΔД= -40,71
a=ΔВ/ΔА= -0,392
b= 2,887
с= -1,460
y=-0,392+2,887x-1,46
Рассчитаем теоретические значения у и занесем в таблицу, также определим отклонения
Индекс корреляции
Связь между показателем у и фактором х можно считать сильной, так как R>0,7,
Индекс детерминации: детерминации
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=19982>Fтабл=5,32, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 1,239%. Качество построенной модели можно оценить как хорошее, так как не превышает 8-10%.
Наилучшей является параболическая модель.
Построить аддитивную модель временного ряда, описывающего потребление электроэнергии за 4 года:
№
квартала 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
млн Квч
8 6 4,5 5,1 9,3 7,4 4,4 6 10 8 5,6 6,4 11 8,7 6,5 10,9
Анализ провести, используя Excel;
Выделить тренд;
Графически оценить циклическую составляющую и ее период
РЕШЕНИЕ
Анализ провести, используя Excel
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,44
R-квадрат 0,19
Нормированный R-квадрат 0,13
Стандартная ошибка 2,00
Наблюдения 16
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 13,36 13,36 3,32 0,09
Остаток 14 56,28 4,02
Итого 15 69,64
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 5,68 1,05 5,40 0,00 3,42 7,93
t 0,20 0,11 1,82 0,09 -0,03 0,43
Выделить тренд
Уравнение тренда
у=5,68+0,2t
Графически оценить циклическую составляющую и ее период
Циклическая составляющая
Наблюдение
У Предсказанное У
Циклическая составляющая
1 1 год 8 5,88 2,12
2
6 6,07 -0,07
3
4,5 6,27 -1,77
4
5,1 6,47 -1,37
5 2 год 9,3 6,67 2,63
6
7,4 6,87 0,53
7
4,4 7,07 -2,67
8
6 7,26 -1,26
9 3 год 10 7,46 2,54
10
8 7,66 0,34
11
5,6 7,86 -2,26
12
6,4 8,06 -1,66
13 4 год 11 8,25 2,75
14
8,7 8,45 0,25
15
6,5 8,65 -2,15
16
10,9 8,85 2,05
Σ
117,8 117,8 0
Проверим выполнимость требований к сезонным составляющим для аддитивной модели: сумма всех сезонных компонент должна быть равна нулю. Условие выполняется.
Все отклонения находятся внутри горизонтальной полосы постоянной ширины, это говорит о независимости дисперсий от значений объясняющей переменной и выполнимости условия гомоскедастичности.
Вариант 3 По регионам Центрального федерального (без г Москвы) и Уральского округов известны данные за 2013 г
Вариант 3. По регионам Центрального федерального (без г. Москвы) и Уральского округов известны данные за 2013 г.
Район Средний размер назначенных ежемесячных пенсий,
руб., у Прожиточный минимум в среднем на одного пенсионера в месяц, руб., х
Белгородская область 9635 5103
Брянская область 9315 5458
Владимирская область 9874 5855
Воронежская область 9285 5048
Ивановская область 9592 5868
Калужская область 10000 5592
Костромская область 9473 5776
Курская область 9048 4954
Липецкая область 9404 5202
Московская область 10816 6068
Орловская область 9639 5379
Рязанская область 9478 5598
Смоленская область 9470 6325
Тамбовская область 8936 4090
Тверская область 9757 5901
Тульская область 9804 5811
Ярославская область 10107 5379
Курганская область 9214 5414
Свердловская область 10354 5939
Тюменская область 9998 5945
Челябинская область 9879 5742
Решение.
Построим поле корреляции.
Линейное уравнение регрессии имеет вид .
Для оценки параметров используют МНК.
Система нормальных уравнений
Для наших данных система уравнений имеет вид
Линейное уравнение регрессии имеет вид .
№
1 5103 9635 26040609 92833225 49167405
2 5458 9315 29789764 86769225 50841270
3 5855 9874 34281025 97495876 57812270
4 5048 9285 25482304 86211225 46870680
5 5868 9592 34433424 92006464 56285856
6 5592 10000 31270464 100000000 55920000
7 5776 9473 33362176 89737729 54716048
8 4954 9048 24542116 81866304 44823792
9 5202 9404 27060804 88435216 48919608
10 6068 10816 36820624 116985856 65631488
11 5379 9639 28933641 92910321 51848181
12 5598 9478 31337604 89832484 53057844
13 6325 9470 40005625 89680900 59897750
14 4090 8936 16728100 79852096 36548240
15 5901 9757 34821801 95199049 57576057
16 5811 9804 33767721 96118416 56971044
17 5379 10107 28933641 102151449 54365553
18 5414 9214 29311396 84897796 49884596
19 5939 10354 35271721 107205316 61492406
20 5945 9998 35343025 99960004 59438110
21 5742 9879 32970564 97594641 56725218
Сумма 116447 203078 650508149 1967743592 1128793416
Среднее 5545,10 9670,38 30976578,52 93702075,81 53752067,43
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле: , т.е. связь прямая и тесная.
Для оценки качества параметров регрессии построим расчетную таблицу.
№
1 5103 9635 9421,02 1251,81 45788,78 0,0222
2 5458 9315 9621,25 126295,62 93792,02 0,0329
3 5855 9874 9845,18 41460,72 830,42 0,00292
4 5048 9285 9389,99 148518,48 11023,76 0,0113
5 5868 9592 9852,52 6143,57 67868,37 0,0272
6 5592 10000 9696,84 108648,72 91907,43 0,0303
7 5776 9473 9800,62 38959,24 107336,78 0,0346
8 4954 9048 9336,97 387358,05 83505,58 0,0319
9 5202 9404 9476,86 70958,81 5308,27 0,00775
10 6068 10816 9965,33 1312443 723646,75 0,0786
11 5379 9639 9576,69 984,76 3881,93 0,00646
12 5598 9478 9700,22 37010,43 49382,58 0,0234
13 6325 9470 10110,29 40152,53 409967,08 0,0676
14 4090 8936 8849,63 539315,38 7459,16 0,00966
15 5901 9757 9871,13 7502,86 13025,49 0,0117
16 5811 9804 9820,36 17854,05 267,8 0,00167
17 5379 10107 9576,69 190636,19 281223,57 0,0525
18 5414 9214 9596,44 208283,57 146257,75 0,0415
19 5939 10354 9892,56 467335 212923,94 0,0446
20 5945 9998 9895,95 107334,24 10414,72 0,0102
21 5742 9879 9781,45 43521,91 9516,94 0,00987
Сумма 116447 203078 203078 3901968,95 2375329,13 0,56
Средняя ошибка аппроксимации
В среднем, расчетные значения отклоняются от фактических на 2,66%. Поскольку ошибка меньше 7%, то данное уравнение хорошо описывает исходные данные.
Коэффициент детерминации , т.е. в 39,1% случаях изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 60,9% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Несмещенной оценкой дисперсии возмущений является величина:
EQ S2 = f(∑(yi – yx)2;n – m – 1)
EQ S2 = f(2375329.13;19) = 125017.323 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
EQ S = r(S2) = r(125017.323) = 353.58 – стандартная ошибка оценки (стандартная ошибка регрессии).
Sa – стандартное отклонение случайной величины a.
EQ Sa = S f(r( ∑x2);n S(x))
EQ Sa = 353.58 f( r(650508149);21 • 478.014) = 898.36
Sb – стандартное отклонение случайной величины b.
EQ Sb = f(S;r(n) S(x))
EQ Sb = f( 353.58; r(21) • 478.014) = 0.16
t-статистика. Критерий Стьюдента.
tкрит (n-m-1;α/2) = (19;0.025) = 2.093
EQ tb = f(b;Sb)
EQ tb = f(0.56;0.16) = 3.49
Поскольку 3,49 > 2,093, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
EQ ta = f(a;Sa)
EQ ta = f(6542.67;898.36) = 7.28
Поскольку 7,28 > 2,093, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Проверим значимость всего уравнения в целом по критерию Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=19, Fтабл = 4,38
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Прогнозное значение руб.
Вычислим ошибку прогноза руб.
Интервальный прогноз руб.
Степенное уравнение регрессии имеет вид .
После логарифмирования получим: .
№
1 8,54 9,17 72,89 84,15 78,32 0,0004
2 8,6 9,14 74,04 83,53 78,64 0,0008
3 8,68 9,2 75,26 84,6 79,79 0,0001
4 8,53 9,14 72,71 83,47 77,9 0,0001
5 8,68 9,17 75,29 84,06 79,56 0,0005
6 8,63 9,21 74,46 84,83 79,48 0,0011
7 8,66 9,16 75,02 83,84 79,31 0,0007
8 8,51 9,11 72,39 83 77,51 0,0010
9 8,56 9,15 73,22 83,7 78,29 0,0000
10 8,71 9,29 75,88 86,28 80,91 0,0078
11 8,59 9,17 73,79 84,15 78,8 0,0000
12 8,63 9,16 74,48 83,85 79,02 0,0003
13 8,75 9,16 76,6 83,83 80,13 0,0029
14 8,32 9,1 69,16 82,77 75,66 0,0003
15 8,68 9,19 75,39 84,38 79,76 0,0000
16 8,67 9,19 75,13 84,47 79,66 0,0000
17 8,59 9,22 73,79 85,03 79,21 0,0030
18 8,6 9,13 73,9 83,33 78,48 0,0015
19 8,69 9,25 75,5 85,47 80,33 0,0029
20 8,69 9,21 75,52 84,83 80,04 0,0002
21 8,66 9,2 74,92 84,61 79,62 0,0002
Сумма 180,95 192,69 1559,35 1768,16 1660,42 0,0237
Для наших данных система нормальных уравнений имеет вид
Уравнение регрессии (эмпирическое уравнение регрессии): .
Для оценки качества параметров регрессии построим расчетную таблицу.
№
1 5103 9635 9431,39 1251,81 41456,33 0,0211
2 5458 9315 9626,35 126295,62 96941,71 0,0334
3 5855 9874 9834,2 41460,72 1584,12 0,00403
4 5048 9285 9400,35 148518,48 13305,45 0,0124
5 5868 9592 9840,84 6143,57 61919,77 0,0259
6 5592 10000 9697,65 108648,72 91414,92 0,0302
7 5776 9473 9793,64 38959,24 102809,42 0,0338
8 4954 9048 9346,75 387358,05 89248,84 0,033
9 5202 9404 9486,69 70958,81 6837,07 0,00879
10 6068 10816 9941,69 1312443 764414,24 0,0808
11 5379 9639 9583,75 984,76 3052,64 0,00573
12 5598 9478 9700,82 37010,43 49646,73 0,0235
13 6325 9470 10067,95 40152,53 357545,05 0,0631
14 4090 8936 8817,35 539315,38 14077,49 0,0133
15 5901 9757 9857,64 7502,86 10128,61 0,0103
16 5811 9804 9811,66 17854,05 58,61 0,000781
17 5379 10107 9583,75 190636,19 273791,31 0,0518
18 5414 9214 9602,68 208283,57 151070,91 0,0422
19 5939 10354 9876,91 467335 227614,39 0,0461
20 5945 9998 9879,95 107334,24 13936,95 0,0118
21 5742 9879 9776,06 43521,91 10595,82 0,0104
Сумма 116447 203078 202958,06 3901968,95 2381450,36 0,56
Средняя ошибка апросимации
В среднем, расчетные значения отклоняются от фактических на 2,68%. Поскольку ошибка меньше 7%, то данное уравнение хорошо описывает исходные данные.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии
Коэффициент детерминации , т.е. в 39,0% случаях изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 61,0% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Несмещенной оценкой дисперсии возмущений является величина:
EQ S2 = f(∑(yi – yx)2;n – m – 1)
EQ S2 = f(2381450.36;19) = 125339.492
S2 = 125339.492 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
EQ S = r(S2) = r(125339.492) = 354.03
S = 354.03 – стандартная ошибка оценки (стандартная ошибка регрессии).
Sa – стандартное отклонение случайной величины a.
Sb – стандартное отклонение случайной величины b.
t-статистика. Критерий Стьюдента.
tкрит (n-m-1;α/2) = (19;0.025) = 2.093
EQ tb = f(b;Sb)
Поскольку 3,61 > 2,093, то статистическая значимость коэффициента регрессии b подтверждается.
EQ ta = f(a;Sa)
Поскольку 9,16 > 2,093, то статистическая значимость коэффициента регрессии a подтверждается.
Проверим значимость всего уравнения в целом по критерию Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=19, Fтабл = 4,38
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (Найденная оценка уравнения регрессии статистически надежна).
Прогнозное значение руб.
Вычислим ошибку прогноза руб.
Интервальный прогноз руб.
Показательное уравнение регрессии имеет вид .
После логарифмирования получим: .
№
1 5103 9,17 26040609 84,15 46810,62 0,0003
2 5458 9,14 29789764 83,53 49882,74 0,0011
3 5855 9,2 34281025 84,6 53852,3 0,0000
4 5048 9,14 25482304 83,47 46119,31 0,0001
5 5868 9,17 34433424 84,06 53801,84 0,0007
6 5592 9,21 31270464 84,83 51504,22 0,0008
7 5776 9,16 33362176 83,84 52886,22 0,0010
8 4954 9,11 24542116 83 45132,42 0,0011
9 5202 9,15 27060804 83,7 47592,53 0,0001
10 6068 9,29 36820624 86,28 56364,33 0,0066
11 5379 9,17 28933641 84,15 49344,65 0,0000
12 5598 9,16 31337604 83,85 51259,37 0,0005
13 6325 9,16 40005625 83,83 57910,97 0,0041
14 4090 9,1 16728100 82,77 37210,18 0,0001
15 5901 9,19 34821801 84,38 54205,05 0,0001
16 5811 9,19 33767721 84,47 53406,26 0,0000
17 5379 9,22 28933641 85,03 49599,67 0,0027
18 5414 9,13 29311396 83,33 49421,59 0,0016
19 5939 9,25 35271721 85,47 54906,82 0,0024
20 5945 9,21 35343025 84,83 54754,28 0,0001
21 5742 9,2 32970564 84,61 52815,87 0,0001
Сумма 116447 192,69 650508149 1768,16 1068781,25 0,0234
Для наших данных система нормальных уравнений имеет вид
Уравнение регрессии (эмпирическое уравнение регрессии):
Для оценки качества параметров регрессии построим расчетную таблицу.
№
1 5103 9635 9413,62 1251,81 49010,09 0,023
2 5458 9315 9611,71 126295,62 88033,94 0,0319
3 5855 9874 9838,17 41460,72 1283,83 0,00363
4 5048 9285 9383,3 148518,48 9662,02 0,0106
5 5868 9592 9845,67 6143,57 64350,85 0,0264
6 5592 10000 9687,56 108648,72 97621,82 0,0312
7 5776 9473 9792,68 38959,24 102197,51 0,0337
8 4954 9048 9331,7 387358,05 80484,6 0,0314
9 5202 9404 9468,44 70958,81 4153,15 0,00685
10 6068 10816 9961,86 1312443 729547,65 0,079
11 5379 9639 9567,27 984,76 5145,74 0,00744
12 5598 9478 9690,97 37010,43 45354,23 0,0225
13 6325 9470 10113,18 40152,53 413684,9 0,0679
14 4090 8936 8870,53 539315,38 4286,07 0,00733
15 5901 9757 9864,75 7502,86 11610,54 0,011
16 5811 9804 9812,81 17854,05 77,61 0,000899
17 5379 10107 9567,27 190636,19 291312,58 0,0534
18 5414 9214 9586,93 208283,57 139075,99 0,0405
19 5939 10354 9886,77 467335 218307,56 0,0451
20 5945 9998 9890,25 107334,24 11610,83 0,0108
21 5742 9879 9773,17 43521,91 11199,56 0,0107
Сумма 116447 203078 202958,6 3901968,95 2378011,07 0,56
Средняя ошибка апросимации
В среднем, расчетные значения отклоняются от фактических на 2,64%. Поскольку ошибка меньше 7%, то данное уравнение хорошо описывает исходные данные.
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии
Коэффициент детерминации , т.е. в 39,1% случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – средняя. Остальные 60,9% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Несмещенной оценкой дисперсии возмущений является величина:
EQ S2 = f(∑(yi – yx)2;n – m – 1)
EQ S2 = f(2378011.07;19) = 125158.477 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
EQ S = r(S2) = r(125158.477) = 353.78 – стандартная ошибка оценки (стандартная ошибка регрессии).
Sa – стандартное отклонение случайной величины a.
Sb – стандартное отклонение случайной величины b.
t-статистика. Критерий Стьюдента.
tкрит (n-m-1;α/2) = (19;0.025) = 2.093
EQ tb = f(b;Sb)
Поскольку 2,95 > 2,093, то статистическая значимость коэффициента регрессии b подтверждается.
EQ ta = f(a;Sa)
Поскольку 99,4 > 2,093, то статистическая значимость коэффициента регрессии a подтверждается.
Проверим значимость всего уравнения в целом по критерию Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=19, Fтабл = 4,38
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Прогнозное значение руб.
Вычислим ошибку прогноза руб.
Интервальный прогноз руб.
функция Аналитическое выражение R2 Теснота связи F-критерий t-статистика Yпрогнозн, доверительный интервал
Линейная 0,391 заметная 2,66 12,21 3,49 9983,15
Степенная 0,390 заметная 2,68 12,13 3,61 9957,42
Показательная 0,391 заметная 2,64 12,18 2,95 9980,35
По полученным характеристикам выбираем лучшее уравнение – линейная функция.
iномер yiцена тыс у е xi1возраст лет xi2мощностьдвигателя л
iномер yiцена,тыс.у.е. xi1возраст,лет xi2мощностьдвигателя,л.с.
1 12,0 3,5 140
2 10,9 5,0 160
3 6,8 5,5 100
4 7,6 8,0 170
5 9,7 5,0 100
6 9,2 6,0 150
7 4,1 7,0 90
8 7,3 6,0 110
9 12,8 5,0 170
10 11,3 3,5 110
11 5,9 8,0 120
12 12,7 4,5 170
13 12,2 3,5 140
14 6,4 8,0 140
15 10,5 3,5 90
16 9,1 4,0 80
Задания на экспериментальное эконометрическое исследование зависимостей
Построить на графике поля рассеяния между ценой y и возрастом автомобиля x1 – , между ценой y и мощностью двигателя x2 .
Найти функцию регрессии и построить её график.
Найти функцию регрессии и построить её график.
Проанализировать тесноту линейной связи между ценой и возрастом автомобиля, а также между ценой и мощностью двигателя. Для этого рассчитать коэффициенты парной корреляции ии проверить их значимость на уровне α = 0,1.
Проверить качество оценивания моделей на основе коэффициента детерминации – найти значения и проверить их значимость по -тесту при уровне значимости α = 0,05 и α = 0,10.
На продажу поступила очередная партия однотипных автомобилей. Их возраст x17 1 = 3 года. Мощность двигателя x17 2 = 165 л.с. Рассчитать точечный и интервальный прогноз среднего значения цены с доверительной вероятностью .
Сравнить интервалы при
Сделать экономическое резюме.
Табл. 2
1 12,0 3,5 12,25 42,01 12,0 140 19600 1680 144,00
2 10,9 5,0 25,00 54,26 10,9 160 25600 1736 118,81
3 6,8 5,5 30,25 37,32 6,8 100 10000 679 46,24
4 7,6 8,0 64,00 61,07 7,6 170 28900 1298 57,76
5 9,7 5,0 25,00 48,58 9,7 100 10000 972 94,09
6 9,2 6,0 36,00 55,35 9,2 150 22500 1384 84,64
7 4,1 7,0 49,00 28,52 4,1 90 8100 367 16,81
8 7,3 6,0 36,00 43,81 7,3 110 12100 803 53,29
9 12,8 5,0 25,00 64,13 12,8 170 28900 2180 163,84
10 11,3 3,5 12,25 39,53 11,3 110 12100 1242 127,69
11 5,9 8,0 64,00 47,56 5,9 120 14400 713 34,81
12 12,7 4,5 20,25 57,06 12,7 170 28900 2155 161,29
13 12,2 3,5 12,25 42,78 12,2 140 19600 1711 148,84
14 6,4 8,0 64,00 51,31 6,4 140 19600 898 40,96
15 10,5 3,5 12,25 36,79 10,5 90 8100 946 110,25
16 9,1 4,0 16,00 36,26 9,1 80 6400 725 82,81
148,5 86,0 503,5 746,3 148,5 2040 274800 19490
1486,13
Табл. 3
1 3,5 3,52 12,0 11,7 0,1 140 156,25 12,0 9,755 5,040
2 5,0 0,14 10,9 9,8 1,2 160 1056,25 10,9 10,515 0,148
3 5,5 0,02 6,8 9,1 5,5 100 756,25 6,8 8,235 2,059
4 8,0 6,89 7,6 6,0 2,8 170 1806,25 7,6 10,895 10,857
5 5,0 0,14 9,7 9,8 0,0 100 756,25 9,7 8,235 2,146
6 6,0 0,39 9,2 8,5 0,5 150 506,25 9,2 10,135 0,874
7 7,0 2,64 4,1 7,2 10,0 90 1406,25 4,1 7,855 14,100
8 6,0 0,39 7,3 8,5 1,4 110 306,25 7,3 8,615 1,729
9 5,0 0,14 12,8 9,8 9,4 170 1806,25 12,8 10,895 3,629
10 3,5 3,52 11,3 11,7 0,1 110 306,25 11,3 8,615 7,209
11 8,0 6,89 5,9 6,0 0,0 120 56,25 5,9 8,995 9,579
12 4,5 0,77 12,7 10,4 5,2 170 1806,25 12,7 10,895 3,258
57913 3,5 3,52 12,2 11,7 0,3 140 156,25 12,2 9,755 5,978
14 8,0 6,89 6,4 6,0 0,2 140 156,25 6,4 9,755 11,256
15 3,5 3,52 10,5 11,7 1,3 90 1406,25 10,5 7,855 6,996
16 4,0 1,89 9,1 11,0 3,8 80 2256,25 9,1 7,475 2,641
86,0 41,3
148,5 41,9
14700
87,499
Исходные данные и результаты эконометрических исследований по задаче № 2 приведены на представленном ниже рисунке: в верхней части – зависимость цены от возраста автомобиля, в нижней части – зависимость цены от мощности двигателя автомобиля. В табл. 2 и 3 приведены результаты промежуточных расчётов.
Индивидуальные исходные данные по Задаче № 2
Вариант 1
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 8,3 6,0 88
2 17,9 3,0 160
3 11,2 5,0 105
4 17,2 4,0 165
5 9,4 5,5 88
6 15,9 4,0 145
7 6,8 7,0 95
8 10,8 6,0 124
9 15,6 5,0 165
10 13,8 3,5 112
11 15,3 3,0 120
12 14,4 4,5 145
13 15,6 3,5 140
14 10,6 7,0 145
15 11,2 5,5 120
16 13,4 4,5 132
Вариант 2
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 10,5 4,0 90
2 17,0 3,5 170
3 10,2 5,0 105
4 16,5 4,0 165
5 8,4 5,5 88
6 15,1 4,0 145
7 5,7 7,0 95
8 11,9 5,0 130
9 14,9 5,0 165
10 12,7 3,5 112
11 14,2 3,0 120
12 13,5 4,5 145
13 14,6 3,5 140
14 9,8 7,0 145
15 10,3 5,5 120
16 11,5 5,0 130
Вариант 3
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 8,9 6,0 94
2 17,3 4,0 170
3 10,6 5,5 105
4 18,4 4,0 180
5 9,5 5,5 88
6 16,0 4,0 145
7 7,1 7,0 95
8 11,0 6,0 124
9 15,7 5,0 165
10 14,1 3,5 112
11 15,5 3,0 120
12 14,7 4,5 145
13 15,9 3,5 140
14 10,8 7,0 145
15 11,5 5,5 120
16 12,8 5,0 130
Вариант 4
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 14,4 4,0 154
2 16,9 2,0 155
3 13,0 5,0 149
4 9,6 7,0 128
5 9,8 7,0 134
6 9,6 7,0 127
7 16,8 2,0 157
8 14,8 4,0 160
9 9,8 7,0 134
10 16,9 2,0 154
11 16,0 3,0 161
12 17,4 2,0 167
13 17,2 2,0 163
14 17,4 2,0 163
15 15,7 3,0 155
16 17,1 2,0 162
Вариант 5
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 9,6 5,0 121
2 10,9 4,0 128
3 9,5 5,0 127
4 13,3 3,0 149
5 11,4 4,0 132
6 13,8 3,0 157
7 11,7 4,0 134
8 8,7 6,0 126
9 11,4 4,0 139
10 11,7 4,0 142
11 8,9 6,0 136
12 8,2 6,0 122
13 9,7 5,0 129
14 9,4 5,0 114
15 10,0 5,0 126
16 9,7 5,0 123
Вариант 6
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 18,8 3,0 145
2 17,6 2,0 130
3 14,7 4,0 115
4 11,8 6,0 122
5 13,5 6,0 127
6 13,9 6,0 140
7 22,4 2,0 176
8 18,2 4,0 161
9 11,1 6,0 110
10 21,1 2,0 157
11 20,0 3,0 164
12 19,8 2,0 146
13 19,9 2,0 140
14 20,5 2,0 150
15 19,0 3,0 160
16 20,2 2,0 154
Вариант 7
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 12,5 4,0 117
2 12,0 3,0 102
3 8,9 5,0 87
4 7,3 6,0 102
5 8,9 6,0 107
6 8,9 6,0 120
7 15,4 3,0 148
8 13,2 4,0 141
9 13,3 3,0 114
10 14,7 3,0 129
11 15,2 3,0 144
12 13,7 3,0 118
13 14,0 3,0 112
14 14,3 3,0 122
15 5,9 7,0 108
16 5,5 7,0 94
Вариант 8
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 12,5 4,0 84
2 12,8 3,0 89
3 11,2 5,0 94
4 7,6 7,0 95
5 7,6 7,0 74
6 9,5 7,0 116
7 14,8 3,0 103
8 12,0 5,0 110
9 15,0 3,0 114
10 16,3 3,0 124
11 15,6 4,0 142
12 15,1 3,0 112
13 15,6 3,0 110
14 13,2 3,0 73
15 6,7 7,0 80
16 6,4 7,0 71
Вариант 9
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 11,3 4,0 115
2 9,5 3,0 83
3 6,9 5,0 73
4 4,8 7,0 98
5 6,6 7,0 106
6 7,3 7,0 128
7 15,2 3,0 159
8 11,3 5,0 149
9 11,4 3,0 103
10 13,5 3,0 127
11 12,8 4,0 146
12 12,0 3,0 109
13 12,0 3,0 99
14 12,8 3,0 116
15 6,3 7,0 122
16 5,0 7,0 98
Вариант 10
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 6,8 6,0 93
2 7,2 4,0 67
3 4,3 6,0 57
4 10,0 4,0 106
5 9,7 5,0 108
6 12,4 4,0 136
7 12,9 4,0 143
8 6,6 7,0 127
9 11,2 3,0 93
10 11,2 4,0 111
11 8,3 6,0 124
12 5,6 6,0 81
13 5,6 6,0 71
14 6,4 6,0 88
15 5,3 7,0 112
16 4,0 7,0 88
Вариант 11
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 9,2 4,0 105
2 9,7 3,0 73
3 5,8 5,0 63
4 3,4 7,0 88
5 4,0 7,0 96
6 4,6 7,0 118
7 12,5 3,0 149
8 8,8 5,0 139
9 10,2 3,0 93
10 11,6 3,0 117
11 10,6 4,0 136
12 10,8 3,0 99
13 10,6 3,0 89
14 10,8 3,0 106
15 4,2 7,0 112
16 3,4 7,0 88
Вариант 12
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 12,4 5,0 132
2 15,0 3,0 116
3 15,1 3,0 120
4 10,3 5,0 96
5 9,7 6,0 112
6 6,7 7,0 93
7 7,4 7,0 108
8 6,7 7,0 95
9 15,0 3,0 121
10 11,0 5,0 105
11 5,8 7,0 75
12 12,0 4,0 95
13 13,9 3,0 94
14 10,2 5,0 97
15 6,5 7,0 93
16 7,0 7,0 99
Вариант 13
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 15,7 4,0 131
2 10,7 5,0 99
3 7,4 7,0 95
4 13,8 4,0 95
5 17,7 3,0 121
6 12,5 5,0 100
7 6,9 7,0 107
8 11,5 5,0 102
9 16,9 3,0 112
10 15,3 3,0 108
11 14,1 3,0 90
12 9,2 5,0 84
13 6,3 6,0 73
14 5,8 7,0 84
15 6,6 7,0 92
16 6,3 7,0 98
Вариант 14
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 18,6 4,0 160
2 17,3 3,0 140
3 14,4 5,0 128
4 9,7 7,0 100
5 11,8 7,0 122
6 10,8 7,0 109
7 18,4 3,0 156
8 14,1 5,0 127
9 19,3 3,0 145
10 17,5 3,0 141
11 13,9 4,0 115
12 15,6 3,0 125
13 14,8 3,0 118
14 16,8 3,0 133
15 9,3 7,0 109
16 9,1 7,0 115
Вариант 15
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 21,9 4,0 115
2 17,8 3,0 83
3 20,4 5,0 112
4 8,9 7,0 48
5 13,0 7,0 76
6 8,5 7,0 44
7 18,3 3,0 90
8 23,6 5,0 135
9 21,9 3,0 101
10 17,1 3,0 78
11 23,4 4,0 127
12 25,0 3,0 133
13 22,7 3,0 118
14 23,1 3,0 117
15 12,7 7,0 82
16 12,7 7,0 87
Вариант 16
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 10,0 4,0 107
2 9,5 3,0 77
3 7,8 5,0 102
4 0,8 7,0 34
5 2,6 7,0 62
6 0,8 7,0 30
7 10,5 3,0 84
8 9,8 5,0 125
9 10,8 3,0 95
10 9,6 3,0 72
11 11,0 4,0 119
12 12,7 3,0 127
13 11,7 3,0 112
14 11,8 3,0 111
15 3,1 7,0 68
16 3,2 7,0 73
Вариант 17
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 12,7 3,0 125
2 11,3 3,0 102
3 7,6 5,0 87
4 7,1 6,0 102
5 11,2 4,0 123
6 6,3 7,0 112
7 12,3 4,0 140
8 8,6 6,0 125
9 12,1 3,0 114
10 7,3 6,0 105
11 6,3 7,0 112
12 8,5 5,0 102
13 8,1 5,0 96
14 12,6 3,0 122
15 6,1 7,0 108
16 5,2 7,0 94
Вариант 18
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 12,3 5,0 129
2 11,0 4,0 99
3 8,2 7,0 116
4 4,3 7,0 64
5 8,7 6,0 100
6 12,4 3,0 92
7 8,1 6,0 90
8 18,8 3,0 171
9 14,7 3,0 125
10 6,9 6,0 78
11 9,4 7,0 125
12 15,2 4,0 149
13 5,8 8,0 102
14 9,9 6,0 117
15 5,2 8,0 90
16 9,5 6,0 111
Вариант 19
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 12,6 5,0 139
2 5,1 7,0 89
3 10,5 6,0 136
4 6,6 6,0 84
5 4,8 8,0 100
6 4,5 7,0 74
7 12,5 4,0 114
8 17,1 4,0 171
9 13,0 4,0 125
10 9,2 5,0 96
11 13,8 5,0 151
12 13,5 5,0 151
13 14,3 4,0 142
14 10,2 6,0 129
15 9,5 6,0 118
16 11,8 5,0 129
Вариант 20
Номер автомобиляi Цена(тыс.у.е.)yi Возраст(лет)xi1 Мощностьдвигателя(л.с.)xi2
1 14,8 5,0 129
2 5,3 8,0 73
3 11,4 7,0 120
4 5,1 8,0 62
5 9,5 7,0 96
6 6,8 7,0 64
7 7,6 7,0 86
8 15,2 6,0 149
9 15,4 4,0 115
10 10,7 5,0 86
11 17,7 4,0 147
12 13,5 6,0 135
13 16,0 4,0 132
14 10,4 7,0 113
15 9,4 7,0 102
16 11,4 6,0 113
Вольтметром точность которого характеризуется средним квадратичным отклонением 0
Вариант 1
Вольтметром, точность которого характеризуется средним квадратичным отклонением 0,2В, проведено 10 измерений напряжения аккумулятора. Найти интервальную оценку истинного значения напряжения, если его среднее значение оказалось 12,8 В.
Взять коэффициент доверия γ=0,95;
Взять коэффициент доверия γ=0,98;
РЕШЕНИЕ
Коэффициент доверия γ=0,95 t=1,96
Предельная ошибка выборки
∆x=tσ2n=1,960,2210=0,12 В
Определим пределы, в которых ожидается средний срок работы электроламп:
x=x±∆x=12,8±0,12 В12,68≤x≤12,92 В
Коэффициент доверия γ=0,98 t=2,34
Предельная ошибка выборки
∆x=tσ2n=2,340,2210=0,15 В
Определим пределы, в которых ожидается средний срок работы электроламп:
x=x±∆x=12,8±0,15 В.12,65≤x≤12,95 В
Исследовать тип регрессии между случайными переменными x и y.
X 1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8
Y 6,265 7,607 9,096 9,932 11,280 12,318 13,707 15,102 16,004 17,209
Если известно, что она отвечает одному из следующих типов:
Линейная функция: y=a+bx;
Нелинейные функции: y= a+b/x (гипербола);
y=a+bx+cx2 ( парабола).
РЕШЕНИЕ
Линейная функция: y=b0+b1x
Рабочая таблица.
N х Y x2 Xy
y2
1 1 6,265 1 6,265 39,2502 6,407 -0,142 0,020 2,259
2 1,2 7,607 1,44 9,1284 57,8664 7,617 -0,010 0,000 0,126
3 1,4 9,096 1,96 12,7344 82,7372 8,827 0,269 0,073 2,960
4 1,6 9,932 2,56 15,8912 98,6446 10,037 -0,105 0,011 1,056
5 1,8 11,28 3,24 20,304 127,238 11,247 0,033 0,001 0,293
6 2 12,318 4 24,636 151,733 12,457 -0,139 0,019 1,129
7 2,2 13,707 4,84 30,1554 187,882 13,667 0,040 0,002 0,291
8 2,4 15,102 5,76 36,2448 228,07 14,877 0,225 0,051 1,488
9 2,6 16,004 6,76 41,6104 256,128 16,087 -0,083 0,007 0,521
10 2,8 17,209 7,84 48,1852 296,15 17,297 -0,088 0,008 0,514
Сумма 19 118,52 39,4 245,1548 1525,7 118,520 0,000 0,191 10,637
Ср.знач
1,900 11,852 3,940 24,515 152,570 11,852 0,000 0,019 1,064
.
Получено уравнение регрессии:.
Тесноту линейной связи оценит коэффициент корреляции:
Значение коэффициента корреляции больше 0,7 и отрицательно, это говорит о сильной и прямой связи.
Оценку значимости уравнения регрессии в целом проведем с помощью -критерия Фишера. Фактическое значение -критерия:
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=5062,3>Fтабл=5,32, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Качество модели определяет средняя ошибка аппроксимации:
Качество построенной модели можно оценить хорошее, так как не превышает 8-10%.
Нелинейные функции: y= a+b/x (гипербола)
Представим в виде
Для расчета параметров уравнения строим расчетную таблицу 4.
№ 1/х y 1/х2
y2 у/х
1 1,000 6,265 1,000 39,250 6,265 4,880 1,385 22,107 1,918 72,846
2 0,833 7,607 0,694 57,866 6,339 7,675 -0,068 0,894 0,005 51,739
3 0,714 9,096 0,510 82,737 6,497 9,671 -0,575 6,326 0,331 32,536
4 0,625 9,932 0,391 98,645 6,208 11,169 -1,237 12,452 1,530 23,697
5 0,556 11,280 0,309 127,238 6,267 12,333 -1,053 9,338 1,110 12,390
6 0,500 12,318 0,250 151,733 6,159 13,265 -0,947 7,688 0,897 6,160
7 0,455 13,707 0,207 187,882 6,230 14,027 -0,320 2,337 0,103 1,450
8 0,417 15,102 0,174 228,070 6,293 14,663 0,440 2,910 0,193 5,803
9 0,385 16,004 0,148 256,128 6,155 15,200 0,804 5,024 0,646 1,450
10 0,357 17,209 0,128 296,150 6,146 15,661 1,548 8,997 2,397 5,803
Итого 0,053 118,520 3,810 1525,70 62,559 118,544 -0,024 78,073 9,129 213,875
Среднее значение 0,005 11,852 0,381 152,570 6,256 – – 7,807 – 21,388
σ
0,617 3,479 – – – – – – – –
σ2
0,381 12,100 – – – – – – – –
Все расчеты в таблице велись по формулам
.
Тогда
Получено уравнение регрессии:.
индекс корреляции
Связь между показателем у и фактором х можно считать сильной, так как R>0,7,
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=98,04>Fтабл=5,32, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 7,807%. Качество построенной модели можно оценить как хорошее, так как не превышает 8-10%.
y=a+bx+cx2 ( парабола).
По приведенным исходным данным определим оценки коэффициентов квадратичной регрессии. Применение к ней метода наименьших квадратов приводит к следующей системе линейных алгебраических уравнений a, b, c
ax4+bx3+cx2=x2yax3+bx2+cx=xyax2+bx+cn=y
Решение находим методом Крамера
№ х у ху
х2
у2
х3 х4
х2у
1 1 6,265 6,265 1,000 39,250 1,000 1,000 6,265 6,342 -0,077 1,229 72,846
2 1,2 7,607 9,128 1,440 57,866 1,728 2,074 10,954 7,596 0,011 0,143 51,739
3 1,4 9,096 12,734 1,960 82,737 2,744 3,842 17,828 8,839 0,257 2,821 32,536
4 1,6 9,932 15,891 2,560 98,645 4,096 6,554 25,426 10,072 -0,140 1,408 23,697
5 1,8 11,28 20,304 3,240 127,238 5,832 10,498 36,547 11,293 -0,013 0,118 12,390
6 2 12,318 24,636 4,000 151,733 8,000 16,000 49,272 12,504 -0,186 1,510 6,160
7 2,2 13,707 30,155 4,840 187,882 10,648 23,426 66,342 13,704 0,003 0,024 1,195
8 2,4 15,102 36,245 5,760 228,070 13,824 33,178 86,988 14,893 0,209 1,386 0,091
2,6 16,004 41,610 6,760 256,128 17,576 45,698 108,18 16,071 -0,067 0,416 1,450
2,8 17,209 48,185 7,840 296,150 21,952 61,466 134,92 17,238 -0,029 0,167 5,803
Σ 19,000 118,52 245,15 39,40 1525,70 87,400 203,73 542,73 118,552 -0,032 9,222 207,908
Метод Крамера
203,733 87,400 39,400
542,727 87,400 39,400
А= 87,400 39,400 19,000
В= 245,155 39,400 19,000
39,400 19,000 10,000
118,520 19,000 10,000
203,733 542,727 39,400
203,733 87,400 542,727
С= 87,400 245,155 19,000
Д= 87,400 39,400 245,155
39,400 118,520 10,000
39,400 19,000 118,520
ΔА= 27,878
ΔВ= -3,804
ΔС= 183,136
ΔД= -2,554
a=ΔВ/ΔА= -0,136
b= 6,569
с= -0,092
y=-0,136×2+6,569x-0,092
Рассчитаем теоретические значения у и занесем в таблицу, также определим отклонения
индекс корреляции
Связь между показателем у и фактором х можно считать сильной, так как R>0,7,
Индекс детерминации: детерминации
Рассчитаем F-критерий Фишера:
для α=0,05; k1=m=1, k2=n-m-1=8.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=10-2=8 составляет Fтабл=5,32.
Fфакт=413,05>Fтабл=5,32, наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии не принимается на уровне 0,05, т.е. признается статистическая значимость уравнения регрессии.
Средняя относительная ошибка:
В среднем расчетные значения для гиперболической модели отличаются от фактических значений у на 1,153%. Качество построенной модели можно оценить как хорошее, так как не превышает 8-10%.
Наилучшей является линейная модель или параболическая модель.
Построить аддитивную модель временного ряда, описывающего потребление электроэнергии за 4 года:
№
квартала 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
млн Квч
8 6 4,5 5,1 9,3 7,4 4,4 6 10 8 5,6 6,4 11 8,7 6,5 10,9
Анализ провести, используя Excel;
Выделить тренд;
Графически оценить циклическую составляющую и ее период
РЕШЕНИЕ
Анализ провести, используя Excel
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,44
R-квадрат 0,19
Нормированный R-квадрат 0,13
Стандартная ошибка 2,00
Наблюдения 16
Дисперсионный анализ
df
SS MS F Значимость F
Регрессия 1 13,36 13,36 3,32 0,09
Остаток 14 56,28 4,02
Итого 15 69,64
Коэффи
циенты
Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 5,68 1,05 5,40 0,00 3,42 7,93
t 0,20 0,11 1,82 0,09 -0,03 0,43
Выделить тренд
Уравнение тренда
у=5,68+0,2t
Графически оценить циклическую составляющую и ее период
Циклическая составляющая
Наблюдение
У Предсказанное У
Циклическая составляющая
1 1 год 8 5,88 2,12
2
6 6,07 -0,07
3
4,5 6,27 -1,77
4
5,1 6,47 -1,37
5 2 год 9,3 6,67 2,63
6
7,4 6,87 0,53
7
4,4 7,07 -2,67
8
6 7,26 -1,26
9 3 год 10 7,46 2,54
10
8 7,66 0,34
11
5,6 7,86 -2,26
12
6,4 8,06 -1,66
13 4 год 11 8,25 2,75
14
8,7 8,45 0,25
15
6,5 8,65 -2,15
16
10,9 8,85 2,05
Σ
117,8 117,8 0
Проверим выполнимость требований к сезонным составляющим для аддитивной модели: сумма всех сезонных компонент должна быть равна нулю. Условие выполняется.
Все отклонения находятся внутри горизонтальной полосы постоянной ширины, это говорит о независимости дисперсий от значений объясняющей переменной и выполнимости условия гомоскедастичности.