Экономико-математические методы

Recommend Stories

Empty story

Idea Transcript


Министерство образования и науки Российской Федерации Сибирский федеральный университет

ЭКОНОМИКО-МАТЕМАТИЧЕСКИЕ МЕТОДЫ Учебно-методическое пособие для самостоятельной работы Электронное издание

Красноярск СФУ 2012 1  

УДК 669.2:51(07) ББК 65.305.23 с 51 Э40 Составитель: С.И. Цецаркина Э40 Экономико-математические методы: учеб.-метод. пособие для самостоятельной работы [Электронный ресурс] / сост. С.И. Цецаркина. – Электрон. дан. – Красноярск: Сиб.федер. ун-т , 2012. – 1 диск. – Систем. требования: PC не ниже класса Pentium I; 128 Mb RAM; Windows 98/XP/7; Microsoft Word 97‐2003/2007.  – Загл. с экрана.  В учебно-методическом пособии представлены теоретические положения, примеры и задания для самостоятельного выполнения по проверке статистических гипотез, дисперсионному, корреляционному и регрессионному анализу и матричному моделированию применительно к цветной металлургии. Предназначено для студентов специальности 080502.65.10.00 «Экономика и управление на предприятии (металлургии)», специализации: 080502.65.10.07 «Управление затратами».

УДК 669.2:51(07) ББК 65.305.23 с 51 ©Сибирский федеральный университет, 2012 Учебное издание Подготовлено к публикации редакционно-издательским отделом БИК СФУ Подписано в свет 22.03.2012 г. Заказ 6392. Уч.-изд. л. 2,09, 396 Кб. Тиражируется на машиночитаемых носителях. Редакционно-издательский отдел Библиотечно-издательского комплекса Сибирского федерального университета 660041, г. Красноярск, пр. Свободный, 79 Тел/факс (391)206-21-49. E-mail [email protected] http://rio.sfu-kras.ru

2  

1. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 1.1. Проверка гипотезы о предполагаемом распределении генеральной совокупности Гипотеза о виде неизвестного распределения или о параметрах известного называется статистической. Проверка гипотез осуществляется с помощью статистических критериев. Статистическим критерием называют случайную величину, которая служит для проверки нулевой гипотезы. Нулевой (основной) называют выдвинутую гипотезу, а конкурирующей (альтернативной) - гипотезу, противоположную основной. В итоге статистической проверки в двух случаях может быть принято неправильное решение, т.е. допущены ошибки двух родов: ⎯ ошибка 1-го рода – будет отвергнута правильная гипотеза, т.е. отклонена испытуемая гипотеза, если она верна; ⎯ ошибка 2-го рода – будет принята неверная гипотеза, т.е. испытуемая, если верна альтернативная. Вероятность допустить ошибку 1-го рода называется уровнем значимости (α). Область, отвечающая вероятности α, называется критической, а дополняющая её область, вероятность попадания в которую равна (1-α), называется допустимой. Критической областью называется совокупность значений критерия, при котором нулевая гипотеза отвергается. Областью принятия гипотезы называют совокупность значений критерия, при котором нет оснований отвергнуть нулевую гипотезу. Как правило, уровень значимости принимают равным: 0,01; 0,02; 0,05; 0,10 и т.д. Если α=0,05, то в 5 случаях из 100 можно отвергнуть правильную гипотезу. Точка, которая отделяет критическую область от области принятия гипотезы, называется критической. Критические области могут быть правосторонними (К>Ккр.), левосторонними (ККкр). Для нахождения критической точки принимают определённый уровень значимости α (достаточно малые значения вероятности) и находят критическую точку, исходя из требования, чтобы при условии принятия нулевой гипотезы вероятность попадания критерия в критическую область была равна α: Р (К>Ккрит.)=α . Вероятность ошибки 2-го рода (вероятность принятия испытуемой гипотезы, если верна альтернативная), обозначается β, а величина (1-β) называется мощностью критерия. Мощность критерия – это вероятность отклонения испытуемой гипотезы, если верна альтернативная. Выбирая уровень значимости (α), следует учитывать мощность критерия (1-β). Критерий должен быть построен таким образом, чтобы вероятность отклонить испытуемую гипотезу, когда она верна (α), была минимальной, а когда верна альтернативная гипотеза (1β) – максимальной, т.е. вероятности ошибок 1-го и 2-го рода должны быть ми3  

нимальными. Вероятности этих ошибок взаимосвязаны: с уменьшением вероятности ошибки 1-го рода мощность критерия уменьшается, он хуже улавливает различия между гипотезами. Вероятность ошибки 2-го рода (β) при этом увеличивается. Если гипотезу отклоняют при 1% уровне значимости, то из этого автоматически следует, что её отклоняют и при уровне значимости в 5%. Если гипотезу не отвергают при уровне значимости в 5%, то из этого следует, что её не отвергнут и при 1%-ном уровне значимости. Только в одном случае надо представить оба результата: если гипотезу отвергают на 5%-ном, но не на 1%-ном уровне значимости. В работах по контролю качества величина α называется риском производителя ( отвергая правильную гипотезу, он бракует годную продукцию), а величина β – риском потребителя (допуская ложную гипотезу, он использует непригодную продукцию). Выбор α и β производится по взаимной договоренности между производителем и потребителем и зависит от техникo - экономической тяжести последствий от ошибок 1-го и 2-го рода. График дифференциальной функции нормального распределения называют нормальной кривой (кривой Гаусса). Для ее построения по опытным данным необходимо найти теоретические частоты. Эмпирическими (опытными) (ni) называют фактически наблюдаемые частоты. Теоретическими (выравнивающими) частотами (ni΄) называют частоты, найденные теоретически. Они определяются : n'i= n*Рi , где n- число испытаний, Pi- вероятность наблюдаемого значения Xi, вычисленная при допущении, что случайная величина X имеет предполагаемое распределение. Для непрерывного распределения Pi- вероятность попадания случайной величины X в i- тый частичный интервал, вычисленная при допущении , что величина X имеет предполагаемое распределение. Обычно эмпирические и теоретические частоты различаются. Для проверки гипотезы о предполагаемом распределении генеральной совокупности необходимо сравнить эмпирические и теоретические частоты. Расхождение этих частот может быть случайным и объясняться малым числом наблюдений, способом их группировки и другими причинами. Но возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены, исходя из неверной гипотезы о предполагаемом распределении генеральной совокупности. Критерий Пирсона (χ2) отвечает на этот вопрос. В качестве критерия проверки нулевой гипотезы о предполагаемом распределении принимают случайную величину (ni − ni′ ) 2 χ = ∑ n′ . i =1 i 2

n

(*)

(1.1)

Чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.

4  

При n→ ∞ закон распределения случайной величины (*) стремится к закону распределения χ2 с к степенями свободы к= s-r-1, где s- число групп (частичных интервалов) выборки; r - число параметров предполагаемого распределения, которые оценены по данным выборки. При нормальном распределении r =2 (оценивают α и σ) и к = s-r-1 = s-2-1 = s-3. После выбора критерия согласия находят правостороннюю критическую область, исходя из того , чтобы вероятность попадания критерия в эту область, в предположении справедливости нулевой гипотезы, была равна принятому уровню значимости α: Р [χ2>χ2 кр.(α,к)] = α. Критическая область удовлетворяет неравенству : χ2>χ2 кр(α,к), а область принятия гипотезы - χ2χ2 кр.(α,к), то нулевую гипотезу отвергают. Объем выборки (при проверке по критерию χ2 ) должен быть достаточно велик: (n ≥ 50). ПРИМЕР При проверке на нормальность распределения были проанализированы данные по производству алюминия на 1 рабочего. Выделено было 5 групп, фактическое (расчетное) значение χ2 составило 16,8. С вероятностью 95% определить, признаёт ли критерий Пирсона отклонения от нормальной кривой существенными или нет. Решение Для ответа на этот вопрос надо найти критическое значение критерия Пирсо2 на (χ ). Число степеней свободы равно: 5-2-1=2. Уровень значимости – 0,05: (1-0,95=0,05 по условию). Критическое значение критерия Пирсона при α=0,05 и f=2 равно 5,99. Расчетное значение (16,8) выше критического, поэтому оно находится в критической области, в которой нулевая гипотеза (о том, что фактическое распределение подчиняется нормальному закону) отвергается. Следовательно, с вероятностью 95% можно считать, что критерий Пирсона признаёт отклонения от нормального распределения существенными.

5  

1.2. Проверка гипотезы о равенстве генеральных дисперсий На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, методов измерений и т. д. Очевидно, предпочтительнее тот прибор, инструмент, метод измерений, который обеспечит наименьшую дисперсию. Кроме того, сравнение дисперсий широко применяется в эконометрике: в дисперсионном анализе, при проверке значимости коэффициентов корреляции, корреляционного отношения и адекватности уравнения регрессии и т.д. Пусть генеральные совокупности X и Y распределены нормально. По независимым выборкам объемов n1 и n2 , извлеченным из этих совокупностей, найдены выборочные дисперсии s2х и s2y. Требуется по этим дисперсиям при заданном уровне значимости α проверить нулевую гипотезу о равенстве генеральных дисперсий рассмотренных совокупностей: Ho: D(X)=D(Y). Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие выборочных дисперсий объясняется случайными причинами. Так, если различие выборочных дисперсий результатов измерений, выполненных двумя приборами, оказалось незначимым, то приборы имеют одинаковую точность. Если же нулевая гипотеза будет отвергнута, т.е. генеральные дисперсии неодинаковы, то различие дисперсий существенно и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Так, если различие выборочных дисперсий результатов измерений, произведенных двумя приборами, оказалось существенным, то точность приборов различна. В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий используется случайная величина F, равная отношению большей дисперсии к меньшей: F=s2б/s2м, (1.2) где s2б – большая из выборочных дисперсий; s2м – меньшая из них. Величина F при условии справедливости нулевой гипотезы имеет распределение Фишера со степенями свободы f1= n1 – 1 и f2 = n2 – 1 , где n1 – объем выборки, по которой вычислена большая дисперсия, а n2 – объем выборки, по которой вычислена меньшая дисперсия. Распределение Фишера зависит от числа степеней свободы и не зависит от других параметров. (Минимальное число значений, необходимых для вычисления статистики, называется числом степеней свободы данной статистики). Критическая область строится в зависимости от вида конкурирующей гипотезы. Первый случай Нулевая гипотеза : Ho: D(X) = D(Y). Конкурирующая гипотеза 6  

H1: D(X) > D(Y). В этом случае строят правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область, при справедливости нулевой гипотезы, была равна принятому уровню значимости: Р[F>Fкр.(α, f1,f2)] = α. Критическую точку Fкр(α,f1,f2) находят по таблице критических точек распределения Фишера. Тогда правосторонняя критическая область определяется неравенством F>Fкр, а область принятая нулевой гипотезы – неравенством FFкр., то нулевую гипотезу отвергают. Если F набл.< Fкр., то нет оснований отвергнуть нулевую гипотезу. ПРИМЕР По двум независимым выборкам объемов n1=12 , n2=15, извлеченным из нормальных генеральных совокупностей X и Y, найдены выборочные дисперсии s2X= 11,41 и s2y = 6,52.При уровне значимости α=0,05 проверить нулевую гипотезу Ho: D(X) = D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе H1: D(X) > D(Y). Решение Fнабл.=s2б./s2м.=11,41/6,52=1,75. Так как конкурирующая гипотеза H1: D(X) > D(Y), то критическая область – правосторонняя. По таблице критических точек распределения Фишера) по уровню значимости α = 0,05 и степенях свободы f1= 12-1 = 11 и f2 = 151=14 находим критическое (табличное) значения критерия Fкр(0,05; 11;14) = 2,57. Так как Fнабл < Fкр., то нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий. Второй случай Нулевая гипотеза имеет вид: Но: D(X) = D(Y). Конкурирующая гипотеза Н1: D(X) ≠ D(Y). В этом случае строят двустороннюю критическую область так, чтобы вероятность попадания критерия в эту область при справедливости нулевой гипотезы была равна принятому уровню значимости (α). Оказывается, что наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда вероятность попадания критерия в каждый из двух интервалов критической области равна α/2. Поэтому достаточно найти правую критическую точку при уровне значимости вдвое меньше заданного, т.е. Fкр(α/2,f1, f2). Если

7  

Fнабл>Fкр, то нулевую гипотезу отвергают, если FнаблFкр., то нулевую гипотезу о равенстве генеральных дисперсий отвергают, выборочные дисперсии с вероятностью 95% различаются существенно. 1.3. Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема. Критерий Кохрена Пусть генеральные совокупности Х1, Х2, …, Хl распределены нормально. Из них извлечены l выборок одинакового объема n и по ним найдены выборочные дисперсии s21, s22, …, s2l, все с одинаковым числом степеней свободы f=n-1. Требуется при заданном уровне значимости α проверить нулевую гипотезу о равенстве генеральных дисперсий Н0: D(Χ1)= D (Χ2)=…= D (Χl). В качестве критерия проверки нулевой гипотезы принят критерий Кохрена – отношение максимальной дисперсии к сумме всех дисперсий G=s2max/(s21+s22+…+s2l).

(1.3)

Распределение этой случайной величины зависит от числа степеней свободы f=n-1 и количества выборок l. Критическую область строят правостороннюю, исходя из требования, чтобы вероятность попадания критерия в эту область при справедливости нулевой гипотезы была равна принятому уровню значимости α: Р[G>Gкр(α, f, l)]=α Критическую точку Gкр. (α,к,l) находят по таблице критических точек Кохрена и тогда правосторонняя критическая область определяется неравенст8  

вом G>Gкр, а область принятия гипотезы Gtкр при α=0,05 и α=0,01, то между содержанием Са F2 в руде и в концентрате существует линейная корреляционная зависимость с вероятностью 99% (при вероятности ошибки первого рода, отклоняющей нулевую гипотезу, когда она верна, равной 1%). 1.5. Сравнение средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки) Пусть генеральные совокупности X и Y распределены нормально, причем их дисперсии неизвестны. (Например, по выборкам малого объема нельзя получить хорошие оценки генеральных дисперсий). Но если предположить, что неизвестные генеральные дисперсии равны между собой, то можно построить критерий Стьюдента сравнения средних. Если нет оснований считать дисперсии одинаковыми, то прежде чем сравнивать средние, надо, пользуясь критерием Фишера, предварительно проверить гипотезу о равенстве генеральных дисперсий.

10  

В предположении, что генеральные дисперсии одинаковы, требуется проверить нулевую гипотезу Но : М (X) = М (Y), то есть установить, существенно или нет различаются выборочные средние x и y , найденные по независимым малым выборкам, объемов n и m. В качестве критерия проверки нулевой гипотезы принимают случайную величину Т, Т=

(x − y )

(ns

2 x

+ ms y2

nm(m + n − 2 ) . n+m

)

(1.5)

Величина Т при справедливости нулевой гипотезы имеет t – распределение Стьюдента с f = n+m-2 степенями свободы. Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть нулевая гипотеза Но: М(X) = М(Y). Конкурирующая гипотеза Н1:М(X) ≠ М(Y). В этом случае строят двустороннюю критическую область так, чтобы вероятность попадания критерия в эту область при справедливости нулевой гипотезы была равна принятому уровню значимости (α). Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда «левая» и «правая» критические точки выбраны так, что вероятность попадания критерия в каждый из двух интервалов двусторонней критической области равна

α

2

: Р( Тtправ.кр.)= . 2

Величина Т имеет распределение Стьюдента, а оно симметрично относительно нуля, поэтому и критические точки симметричны относительно нуля. Правую критическую точку обозначим tдв.кр.(α,f), левую - -tдв.кр.(α,f). Двусторонняя критическая область определяется : Т tдв.кр.(α, f). Область принятия нулевой гипотезы : (-tдв.кр.(α, f), tдв.кр.(α, f)). Чтобы при заданном уровне значимости проверить нулевую гипотезу: Но: М(X)=М(Y) о равенстве математических ожиданий двух нормальных генеральных совокупностей с неизвестными, но одинаковыми дисперсиями ( в случае независимых малых выборок) при конкурирующей гипотезе Н1:М(X) ≠ М(Y), надо вычислить наблюдаемое значение критерия Тнабл. по формуле (1.5) и по таблице критических точек распределения Стьюдента по заданному уровню значимости α и числу степеней свободы f = n+m-2 найти критическую точку tдв.кр.(α, f). Если |Tнабл.| < tдв.кр.(α, f), то нет оснований отвергнуть нулевую гипотезу. Если |Tнабл.| > tдв.кр.(α, f), то нулевую гипотезу отвергают. ПРИМЕР По двум независимым выборкам объемов n=5 и m=6, извлеченным из нормальных генеральных совокупностей X и Y, найдены выборочные средние 11  

= 0,25 и s2y =0,108. При уровне значимости α=0,05 проверить нулевую гипотезу Η0: Μ(Χ)=Μ(Υ) при конкурирующей гипотезе H1: Μ(Χ)≠Μ(Υ). x =3,3 и y =2,48 и выборочные дисперсии s

2

x

Решение Так как выборочные дисперсии различны, проверим гипотезу о равенстве генеральных дисперсий по критерию Фишера. Fнабл.=0,25/0,108=2,31. Дисперсия s2x>s2y, поэтому в качестве конкурирующей гипотезы примем H1: D(X) >D(Y). В этом случае критическая область – правосторонняя. Числа степеней свободы f1=5-1=4, f2=6-1=5. По таблице критических точек распределения Фишера находим Fкр.(0,05;4;5)=5,19. Поскольку Fнабл. tдв.кр., поэтому нулевую гипотезу о равенстве генеральных средних отвергаем. 1.6. Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки). Критерий для средней разности Пусть генеральные совокупности X и Y распределены нормально, причем их дисперсии неизвестны. Требуется, при уровне значимости α, проверить нулевую гипотезу Но: М(X) = М(Y) о равенстве генеральных средних нормальных совокупностей с неизвестными дисперсиями при конкурирующей гипотезе Н1:М(X) ≠ М(Y) по двум зависимым выборкам одинакового объема. Это бывает необходимо, когда значения признака регистрируется дважды в различных условиях, например, удой коров и привесы молодняка при разных рационах, производительность труда рабочих в разных условиях труда. Введем в рассмотрение случайные величины Di=Xi-Yi и n

D=

∑ Di i =1

n

n

=

n

=

i =1

n

12  

n

∑ ( X i − Y i ) ∑ X i ∑ Yi i =1

n



i =1

n

= X −Y .

Если нулевая гипотеза справедлива, то есть М(X) = М(Y), то М(X)М(Y)=0 или X-Y=0, или D = 0 . Нулевую гипотезу можно записать Но: М(D)=0. Тогда конкурирующая гипотеза Н1: М(D)≠0. n

Наблюдаемые неслучайные разности xi-yi обозначим di, а

∑d i =1

n

i

= d ( в от-

личие от случайных разностей Di= Xi-Yi и случайной величины D ). Для того, чтобы при заданном уровне значимости (α) проверить нулевую гипотезу Но: М(X) = М(Y) о равенстве двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (в случае зависимых выборок одинакового объема) при конкурирующей гипотезе Н1: М(X)≠М(Y), надо вычислить значения критерия: Тнабл.=

d n sd

(1.6)

и по таблице критических точек распределения Стьюдента по заданному уровню значимости (α) и числу степеней свободы f=n-1, найти критическую точку tдв.кр(α, f). Если |Тнабл.| < tдв.кр(α, f), то нет оснований отвергнуть нулевую гипотезу о равенстве математических ожиданий двух нормально распределенных генеральных совокупностей. Если |Тнабл.| > tдв.кр(α, f), нулевую гипотезу отвергают. ПРИМЕР Двумя приборами измерены три детали и получены следующие результаты (мк): х1= 7, х2= 8, х3=10, у1= 8, у2= 7, у3 = 8. Установить с вероятностью 95%, можно ли пользоваться этими приборами для измерений с одинаковой точностью. Решение n

Рассчитаем величину

∑d i =1

n

i

= d = ((7-8)+(8-7)+(10-8))/3= 0,667, а затем

расчетное значение критерия по формуле (1.6): Тнабл.=

d n sd

= 0,667х1,74 /1,525=0,75.

По таблице распределения Стьюдента находим tдв.кр. (0,05;2) =4,3. Поскольку расчетное значение критерия ниже критического, нет оснований отвергнуть нулевую гипотезу, потому генеральные средние с вероятностью 95% можно считать равными, а приборы – имеющими одинаковую степень точности.

13  

Задания для самостоятельного выполнения 1.1. При анализе распределения предприятий по производительности труда было выделено 9 групп. В результате проверки на нормальность распределения расчетное значение критерия Пирсона составило 6,9. С вероятностью 95% установить, согласуется ли распределение с нормальным. Определить то же самое с вероятностью 99%. 1.2. Проверялось соответствие эмпирического распределения нормальному закону. Совокупность объектов, состоящая из 260 единиц, была распределена на 13 групп. Определить число степеней свободы для критерия Пирсона. 1.3. При проверке гипотезы о нормальном распределении генеральной совокупности по уровню качества продукции из 84 объектов выделено 12 групп в отчетном и 16 групп в прошлом году. Фактическое значение критерия Пирсона составило 19,5 в отчетном и 23,6 в прошлом году. С вероятностью 95% и 99% определить, признаёт ли критерий отклонения от нормальной кривой существенными или существенность отклонений не доказана для отчетного и прошлого года. 1.4. По данным трех цехов электролиза никеля по выборкам 20 наблюдений каждая, извлеченным из нормальных генеральных совокупностей, найдены выборочные дисперсии себестоимости 1т катодного никеля: 16,8; 17,2; 23,7. Установить, можно ли считать генеральные дисперсии себестоимости катодного никеля равными с вероятностью 95%. Если да, то оценить генеральную дисперсию. 1.5. По 10 алюминиевым заводам по выборкам одинакового объема n=12, извлеченным из нормальных генеральных совокупностей, найдены выборочные дисперсии производительности труда 1 рабочего по выпуску алюминия-сырца: 17; 18; 15; 1 6; 23; 22; 19; 21; 15; 24. С вероятностью 95% определить, можно ли считать равными генеральные дисперсии производительности труда на этих заводах. При положительном ответе оценить генеральную дисперсию. 1.6. По данным двух цинковых заводов по выборкам объёмом n1= 16 и n2 =12, извлеченным из нормальных генеральных совокупностей, найдены выборочные дисперсии по уровню брака чушкового цинка, равные 176 и 159 соответственно. Установить, можно ли считать равными генеральные дисперсии уровня брака чушкового цинка с вероятностью 99%. 1.7. По двум прокатным цехам по выборкам объёмом n1=27 и n2=25, извлеченным из нормальных генеральных совокупностей, найдены выборочные дисперсии выпуска проката на 1 работающего, равные 244 и 190 соответственно. Определить, можно ли считать равными генеральные дисперсии выпуска проката на 1 работника с вероятностью 95% и 99%. 1.8. Выборочные дисперсии процента брака отливок по двум литейным цехам составили 3,5 и 7,0 по выборкам объемом n1=20 и n2=36 соответственно, извлеченным из нормальных генеральных совокупностей. При уровне значимо-

14  

сти 0,05 и 0,01 определить, существенно ли различаются дисперсии процента брака отливок. 1.9. По двум независимым выборкам объемом 5 и 8, извлеченным из нормальных генеральных совокупностей, определены размеры средней заработной платы 1 рабочего в двух цехах, равные 34080 и 36125 ед. Выборочные дисперсии составили 4560 и 2648 соответственно. С вероятностью 95% установите, можно ли считать, что размеры средней зарплаты в плавильном и рафинировочном цехе равны. (Не забудьте предварительно проверить гипотезу о равенстве генеральных дисперсий). 1.10. Двумя приборами измерены 4 детали и получены следующие результаты (мк): х1= 3, х2= 4, х3=5, х4= 6, у1= 2, у2= 6, у3= 3, у4= 5. С вероятностью 95% и 99% установите, можно ли пользоваться приборами для измерений одинаковой точности. 1.11. Для условий предыдущей задачи выполнить то же задание, если результаты измерений следующие: х1=14, х2=15, х3=16, х1=18; у1=13, у2=14, у3=16, у4=15. 1.12. По данным двух глиноземных заводов по выборкам объемом 8 и 10, извлеченным из нормальных генеральных совокупностей, определены выборочные средние себестоимости 1т глинозема: 7685 и 8452 усл.ед. Выборочные дисперсии равны 167890 и 245678 соответственно. С вероятностью 95% и 99% определите, можно ли считать равными средние себестоимости глинозема на этих заводах. 2. ДИСПЕРСИОННЫЙ АНАЛИЗ Задачей дисперсионного анализа является изучение влияния фактора (или комбинации факторов) на результативный признак. Дисперсионный анализ был разработан английским статистиком Р. Фишером. Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора и «остаточной дисперсии», обусловленной случайными причинами. Если различие между дисперсиями значимо, то фактор оказывает существенное влияние на признак, в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) будут различаться также значимо. Если уже установлено, что фактор существенно влияет на результативный признак, а требуется выяснить, какой из уровней оказывает наибольшее влияние, то дополнительно производят попарные сравнения средних. В зависимости от количества факторов, действующих на результативный признак, дисперсионный анализ подразделяется на однофакторный и многофакторный. В общем, виде задачу однофакторного дисперсионного анализа можно сформулировать следующим образом.

15  

Имеется единичный фактор А, который принимает p различных уровней. Предположим, что на каждом уровне сделано n наблюдений, так что общее число наблюдений N=n p. Пусть результаты наблюдений представлены в виде {хij; i=1,2…, p; j=1,2…,n}. Требуется определить влияние фактора. А на результативный признак x , достоверность и степень этого влияния. Обозначим через x среднюю всей совокупности наблюдений, через xi среднюю на i-м уровне. Тогда: p

n

∑∑ x i =1 j =1

x =

ij

N

,

(2.1)

.

(2.2)

а n

xi =

∑x j =1

ij

n

Обозначим через ω1 – сумму квадратов отклонений между уровнями ω2 сумму квадратов отклонений внутри уровня, ω -общую сумму квадратов отклонений: ω = ω1+ ω2 , причем p

∑ (x

ω1=n

2

− x) ,

i

(2.3)

i

p

n

∑∑ ( x

ω2 =

i

ij

− xi ) 2 ,

(2.4)

j

ω= ∑∑ (xij − x )2 . p

n

i

j

(2.5)

Все эти формулы – следствие следующих преобразований: xij − x = (xi − x ) + (xij − xi )

Возведем обе части уравнения в квадрат, и, суммируя по i и j, получим p

n

∑∑ ( x i

j

− x ) + ∑∑ (xij − xi ) = ∑∑ (xij − x ) 2

i

p

n

i

j

2

p

n

i

j

2

Член с перекрестным произведением исчезает, так как сумма отклонений любой группы наблюдений от их среднего значения равна нулю.

∑∑ (x p i

n j

− x ) = n∑ ( xi − x ) + ∑∑ (xij − xi ) , 2

ij

p

2

i

ω = ω1+ ω2

16  

p

n

i

j

2

Для вычислений ω , ω1, ω2 лучше переписать в следующем виде: 2

ω = ∑ xij 2 ij

⎞ ⎛ ⎜ ∑ xij ⎟ ⎟ ⎜ ij ⎠ , ⎝ − N 2

(2.6) 2

⎛ ⎞ ⎛ ⎞ ∑i ⎜⎜ ∑j xij ⎟⎟ ⎜⎜ ∑ij xij ⎟⎟ ⎠ −⎝ ⎠ , ω1= ⎝ n N

(2.7)

2

⎛ ⎞ ∑i ⎜⎜ ∑j xij ⎟⎟ ⎠ ω2= ∑ xij2 − ⎝ n ij .

(2.8)

Эти формулы являются следствием подстановки в (2.3),(2.4),(2.5) формул (2.1) и (2.2), возведения в квадрат, суммирования и приведения подобных. Число степеней свободы вариации представляет собой число независимых отклонений индивидуальных значений признака от его среднего значения. Так, если есть N наблюдений и определена средняя совокупности, то число независимых отклонений от средней будет N-1; последнее отклонение выражается через все предыдущие. Таким образом, ω имеет (N-1) степень свободы, а ω1 - (р-1) степеней свободы, так как ω1 вычисляют исходя из отклонений р групповых средних (средних для независимых классов) от общего среднего. Аналогично ω и ω1, ω2 имеет N-p степень свободы, так как ω2 вычисляют по отклонению N наблюдений от р групповых средних, т.е. N-p независимых параметров N-p=np-p=р(n-1). Суммы квадратов ω , ω1, ω2 , деленные на соответствующие степени свободы, дают три несмещенные оценки дисперсии: общую s2=ω/N-p ; (2.9) факторную или межгрупповую s21=ω1/p-1; (2.10) случайную или внутригрупповую s22=ω2/N-p. (2.11) Для сравнения дисперсий применяют критерий F Фишера (Fнабл..=s21/s22), называемый дисперсионным отношением. Распределение дисперсионного отношения зависит только от числа степеней свободы f1=p-1 и f2=N-p. По таблице критических точек распределения Фишера по заданному уровню значения α и степеням свободы f1=p-1 и f2=N-p находят Fкрит.(α, f1, f2). Если Fнабл.>Fкрит. (α,f1,f2),то влияние фактора существенно, если Fнабл< Fкр(α,f1,f2), то влияние фактора несущественно. Степень влияния фактора на результативный признак определяется из отношения η1=ω1/ω, а влияние прочих (неучтенных) факторов из равенства η2=1-η1. 17  

Если уже установлено, что фактор существенно влияет на результирующий признак, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно производят попарное сравнение средних по критерию Стьюдента (1.5). ПРИМЕР Требуется провести дисперсионный анализ влияния размеров предприятий на производительность труда. Исходные данные приведены в табл. 2.1. Таблица 2.1 Уровни Производительность труда, предприятий усл.ед./чел. Мелкие 28 32 33 37 Средние 53 51 53 65 Крупные 84 81 93 91 Крупнейшие 134 106 100 127 Решение Необходимо рассчитать факторную (межгрупповую) и случайную (внутригрупповую) дисперсии и найти их отношение. Количество уровней р=4, число наблюдений на каждом уровне n=4, тогда общее число наблюдений N=pq=16. Для вычисления ω1 (числителя факторной дисперсии) рассчитываем: Σхij по каждому уровню, возводим эти суммы в квадрат, суммируем и делим на число наблюдений на каждом уровне, затем вычитаем частное от деления квадрата суммы всех наблюдений на общее число наблюдений, т.е. выполняем расчеты по формуле (2.7): 2

⎛ ⎞ ⎛ ⎞ ∑i ⎜⎜ ∑j xij ⎟⎟ ⎜⎜ ∑ij xij ⎟⎟ ⎝ ⎠ −⎝ ⎠ n N ω1=

2

= (16900+49284+121801+218089)/4 –

– 1364224/16 = 406074/4 – 85264 = 16254,5. Для вычисления ω2 (числителя внутригрупповой дисперсии) рассчитываем: сумму квадратов наблюдений и вычитаем уменьшаемое из выражения для ω1 , т.е. выполняем расчеты по формуле (2.8): ⎞ ⎛ ∑i ⎜⎜ ∑j xij ⎟⎟ ∑ij xij2 − ⎝ n ⎠ ω2=

2

=102578 – 101518,5=1059,5.

Число степеней свободы для факторной дисперсии равно: р-1=4-1=3, а для случайной (внутригрупповой) – (N-p)=16-4=12. Тогда факторная дисперсия (2.10): 16254,5/3=5418,2, а внутригрупповая (2.11) - 1059,5/12=88,3. Находим

18  

расчетное значение критерия Фишера как отношение факторной дисперсии к случайной: Fнабл..= s21/s22= 5418,2/88,3=61,4. Критическое значение Fкрит.(α, f1, f2)= Fкрит.(0,05; f1=3, f2=12)=3,59 и Fкрит.(0,01, f1=3, f2=12)=6,43. Fкрит.(0,00005, f1=3, f2=12)= 43,39. Так как расчетное значение критерия превышает критическое, то уровень концентрации производства с вероятностью 99,9995% оказывает влияние на производительность труда. При 0,005%-ном уровне значимости влияние концентрации производства на производительность труда составляет почти 94%: η1=ω1/ω=(16254,5/17314,0)100. (ω1+ ω2= ω=16254,5+1059,5=17314). Задания для самостоятельного выполнения 2.1. Для выявления достоверности влияния квалификации рабочих на объем брака было проведено по 6 наблюдений на каждом из четырех уровней квалификации. Результаты представлены в табл. 2.2. Определить, достоверно ли влияние уровня квалификации на объем брака и если достоверно, то степень этого влияния. Таблица 2.2 Уровни Объем брака, тыс.р. 1 14,67 14,03 13,20 12,00 11,96 11,35 2 20,36 18,54 15,55 13,89 13,81 8,12 3 24,91 23,89 22,71 21,95 19,51 18,12 4 23,99 23,70 21,34 21,14 21,03 20,98 2.2. Для выяснения достоверности влияния природно-геологических факторов и в частности длины блока на производительность труда забойщиков был проведён однофакторный дисперсионный анализ, результаты которого представлены в табл. 2.3. Установите с вероятностью 99% достоверность и степень этого влияния. Таблица 2.3 Длина блока, м 20-25 26-30 31-35 36-40

4,57 4,96 5,17 3,83

Производительность труда забойщиков, м3/чел-см 5,06 4,72 4,15 5,06 4,78 4,07 3,90 3,63

4,35 4,50 4,51 3,72

2.3 Для выяснения вопроса о влиянии качества сырья на объём брака в литейном цехе было проведено по 8 наблюдений на каждом из трех уровней. Результаты даны в табл. 2. 4. Установите, с вероятностью 95%, достоверно ли влияние качества сырья на объём брака в литейном цехе и определите степень этого влияния. Сделайте выводы и рекомендации для руководства цеха.

19  

Таблица 2.4 Уровни 1 2 3

24,9 23,2 21,1

23,9 22,0 21,0

Объём брака, тыс.руб 22,7 22,1 19,5 18,9 12,1 20,4 19,5 18,7 20,4 18,5 14,9 13,9

14,7 11,3 13,8

14,6 17,3 8,1

2.4. Провести однофакторный дисперсионный анализ влияния качества сырья на себестоимость переработки 1т руды по данным, представленным в табл.2.5. Установите достоверность и степень этого влияния с вероятностью 95%. Таблица 2.5 Уровни 1 2 3 4

40 37 34 25

Себестоимость переработки 1 тонны руды 38 39 38 41 38 37 33 30 28 20 25 29

40 36 31 32

2.5. Три марки бензина испытывали на дальность пробега автомобиля. Бензин каждой марки случайным образом был назначен каждому автомобилю. С помощью дисперсионного анализа по данным табл.2.6. необходимо сделать заключение, о том, различаются ли в среднем характеристики марок бензина, с какой вероятностью и степень влияния марки бензина на пробег автомобиля. Таблица 2.6 Пробег автомобилей разных типов на различных марках бензина, км Марка бензина Тип автомобиля А 16 14 19 21 В 15 15 18 20 С 16 15 19 20 3. ПАРНАЯ КОРРЕЛЯЦИЯ И РЕГРЕССИЯ Корреляционная зависимость – это функциональная зависимость между значениями одной переменной и условным математическим ожиданием другой. Корреляционная зависимость может быть представлена в виде Мх(Y)=f(х) или Мy(Х)=ϕ(х). Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка ее тесноты.

20  

Парный (однофакторный) корреляционный анализ заключается в определении и исследовании линейного коэффициента корреляции, который используется как мера линейной корреляционной зависимости двух случайных величин. Подобно дисперсии и ковариации, коэффициент корреляции имеет две формы – теоретическую (для генеральной совокупности) и выборочную. Теоретический коэффициент корреляции обозначается греческой буквой ρ («ро» )., выборочный – латинской r. При расчете выборочного коэффициента корреляции теоретические дисперсии и ковариации заменяются их несмещенными оценками. Существуют различные модификации формул для расчета коэффициента корреляции: r=

[

sx sy n

r=

∑ (x i =1

n

∑ (x i =1

i

− x)

n

∑ (y i =1

n



i =1

x i yi −

i

,

− y)

n

(3.2)

2

n

∑ ∑ yi

i =1

xi

i =1

2 2 ⎡ n ⎛ n ⎞ ⎤⎥ ⎛ n ⎞ ⎤⎥ ⎡⎢ n ⎢ 2 2 ⎜ ⎟ ⎜ ⎟ ⎢n x i − ⎜ x i ⎟ ⎥ ⎢n yi − ⎜ yi ⎟ ⎥ ⎝ i =1 ⎠ ⎥⎦ ⎝ i =1 ⎠ ⎥⎦ ⎢⎣ i =1 ⎢⎣ i =1



r=

2

(3.1)

sx s y

− x )( y i − y )

i

n r=

] = cov(x, y ) ,

M ( x − m x )( y − m y )





,

(3.3)



xy − x ⋅ y , sx s y n

r = 1−

∑ (y

(3.4)

i

− yˆ i )

∑ (y

− y)

i =1 n

i =1

i

2

,

(3.5)

2

где cov (х,y) – взаимный корреляционный момент, ковариация двух случайных n

величин x и y; хy - среднее произведение х и y ( хy =

∑x y i

i =1

n

i

); yˆ i - расчетное зна-

чение y, т.е. вычисленное по уравнению регрессии. Свойства коэффициента корреляции 1) -1 ≤ r ≤ 1 – коэффициент корреляции изменяется от -1 до +1; 2) если r =1, то существует функциональная зависимость;

21  

3) если r=0, то отсутствует линейная корреляция (по крайней мере, в выборке); 4) чем ближе r к 1, тем связь сильнее, а чем ближе r к 0, тем связь слабее; 5) ry = rx (математически эти коэффициенты равны, хотя зависимость х от y может не иметь смысла). Косвенным признаком, свидетельствующим о линейности связи, является большая величина (> 0,6) коэффициента корреляции. Коэффициент корреляции может быть отличен от нуля в 4-х случаях: ⎯ когда Y причинно зависит от Х; ⎯ когда Х причинно зависит от Y; ⎯ когда величины Х и Y непосредственно не влияют друг на друга, но совместно зависят от одного или нескольких общих факторов, причинно влияющих и на Х и на Y; ⎯ если имеет место простое совпадение согласованности изменений Х и Y, характеризующих совершенно несвязанные явления. При экономическом анализе представляют интерес первый и второй случаи (иногда третий). Корреляция несвязанных логически случайных величин называется ложной. Определить, какой же случай наблюдается в каждом конкретном примере, задача нелегкая, но ее решение необходимо и осуществляется только путем глубокого содержательного (качественного) анализа. Таким образом, при существовании причинной, хотя бы и приближенно, линейной корреляционной зависимости одной случайной величины от другой коэффициент корреляции между ними будет отличен от нуля, но из неравенства его нулю не следует причинной зависимости между рассматриваемыми величинами. Проверка существенности коэффициента корреляции осуществляется по критерию Стьюдента. Задачей регрессионного анализа является установление формы зависимости между переменными и оценка уравнения регрессии. В случае линейной парной регрессии уравнение имеет вид yˆ i =а+bxi+ei, где i=1,2,…n – номер наблюдения; еi – случайная переменная, характеризующая отклонение от функции регрессии, ее называют возмущением или остатком (еi=0 при функциональной зависимости y от х). Система нормальных уравнений для нахождения параметров уравнения линейной регрессии по методу наименьших квадратов имеет вид: x

y

n n ⎧ y an b xi = + ∑ ⎪⎪ ∑ i i =1 i =1 . ⎨n n n ⎪∑ xi y i = a ∑ xi + b∑ xi 2 ⎪⎩ i =1 i =1 i =1

(3.6)

Коэффициент b может быть рассчитан через коэффициент корреляции

22  

b=r

sy sx

,

(3.7)

а коэффициент a - по формуле: a = y − bx .

(3.8)

Другие выражения для коэффициента b: b=

cov( xy ) , s x2

(3.9)

∑ (x − x )( y − y ) b= ∑ (x − x ) i

i

i

2

,

(3.10)

i

i

b=

xy − x ⋅ y x 2 − (x )

(3.11)

2

Коэффициент b показывает, на сколько единиц изменится y при изменении х на одну единицу. Постоянная величина (a) определяет значение y (в единицах y), если х=0. Это может иметь или не иметь явного смысла в зависимости от ситуации. При интерпретации уравнения регрессии важно помнить о трех моментах. Во – первых, величина a является лишь оценкой α (в генеральной совокупности), а b – оценкой β (из той же генеральной совокупности), т.е. выборочное уравнение yˆ =a+bx является оценкой генерального yˆ = α +βх. Во – вторых, уравнение регрессии отражает только общую тенденцию для выборки. При этом каждое отдельное наблюдение подвержено воздействию случайностей. В – третьих, верность интерпретации зависит от правильности спецификации уравнения. После построения уравнения регрессии можно разбить значение yi в каждом наблюдении на две составляющие yˆ i и еi yi= yˆ i+ еi Величина yˆ i – расчетное значение y в наблюдении i – это то значение, которое имел бы y при условии, что уравнение регрессии было правильным, и отсутствовал случайный фактор, т.е это величина y, рассчитанная (спрогнозированная) по значению х в данном наблюдении. Тогда остаток еi есть расхождение между фактическим и расчетным значениями величины У. Дисперсия У может быть разложена на сумму дисперсий: s y2 = s y2ˆ + s e2 , (3.12) где s y2ˆ - дисперсия, которая «объясняется» уравнением регрессии; s e2 - «необъясненная» дисперсия (случайная, остаточная).

23  

r2 =

s y2ˆ s y2

= 1−

s e2 , s y2

(3.13)

где r 2 - коэффициент детерминации, т.е часть дисперсии y, объясненная уравнением регрессии. Максимальное значение r 2 равно 1. В этом случае линия регрессии точно соответствует всем наблюдениям yi= yˆ i, и все остатки равны нулю (еi=0). Это происходит в функциональных зависимостях. Коэффициент детерминации показывает, какую часть изменения y можно объяснить изменением х. Принцип минимизации суммы квадратов остатков эквивалентен минимизации дисперсии остатков. Гипотеза об отсутствии связи между y и х может быть проверена путем вычисления F- статистики: s y2ˆ Q1 1 = F= , Q2 n − 2 s e2

(3.14)

где s y2ˆ - «объясненная» регрессией (т.е влиянием х) дисперсия у; s e2 - «необъясненная», остаточная, случайная дисперсия. Остаточная дисперсия (s e2 ) характеризует рассеяние данных наблюдений вокруг подобранного уравнения регрессии. Если Fрасч., вычисленное по (3.14), больше Fкрит., определенного по таблице F распределения при степенях свободы f1=1, f2=n-2, то уравнение регрессии адекватно описывает зависимость, т.к s y2ˆ > s e2 . Как известно, если ряд наблюдений переменной y состоит из непересекающихся групп, то общая дисперсия равна сумме межгрупповой и внутригрупповой (остаточной) дисперсии: D= Dмежгр.+ Dвнгр.. Если у и х связаны функциональной зависимостью, то

D межгр Dобщ

= 1 . В этом

случае в каждой группе содержатся равные между собой у, поэтому групповая дисперсия каждой группы равна нулю. Следовательно, и среднее арифметическое групповых дисперсий, взвешенное по объемам групп, т.е Dвнутр = 0 и Dобщ = Dмежгр, а

D межгр Dобщ

= 1.

Если х и у связаны корреляционной зависимостью, то групповая дисперсия каждой группы отлична от нуля, Dвнутр ≠ 0 . Тогда Dмежгр < Dобщ, т.к. Dобщ = D межгр + Dвнутр и

D межгр Dобщ

< 1.

Чем меньше внутригрупповая дисперсия, тем межгрупповая ближе к общей дисперсии, т.е. их отношение ближе к 1. Отношение межгруппового среднеквадратического к общему среднеквадратическому отклонению принято в качестве меры тесноты связи любой

24  

корреляционной зависимости, как линейной, так и нелинейной. Это отношение называется корреляционным отношением или индексом корреляции: ηy = x

s межгр s общ

=

,

2 s общ

∑ n (y x

s yx = s межгр =

s общ = s y =

2 s межгр

i

xi

(3.15) −y

)

n

∑ n (y y

i

− y)

2

,

2

,

i

n

(3.16)

(3.17)

где n – объем выборки; nx – частота значения х признака Х; ny – частота значения у признака У; y - общая средняя признака У; y x - условная средняя признака У. Индекс корреляции может быть рассчитан и по формуле:

ηy = x

∑ ( y − yˆ ) 1− ∑ (y − y) i

2

i

i

2

,

(3.18)

i

i

где ŷi –расчетное значение i-го наблюдения (по уравнению регрессии). Проверка значимости корреляционного отношения осуществляется по F – критерию: F=

η 2 (n − 2 ) . 1−η 2

(3.19)

Критическое значение находят по таблице критических точек распределения Фишера при заданном уровне значимости α и числах степеней свободы f1= 1 и f2 = n-2. Если Fнабл, вычисленные по (3.19) больше Fкрит(α, f1, f2), то индекс корреляции существенно отличается от нуля. Индекс корреляции обладает следующими свойствами: 1) 0 ≤ η ≤ 1; 2) если η = 0, то у не связан с х корреляционной зависимостью; 3) если η = 1, то у связан с х функциональной зависимостью; 4) η ≤ r 5) если η = r , то имеет место линейная корреляционная зависимость; 6) корреляционное отношение между у и х не равно корреляционному отношению между х и у: η y x ≠ η x y .

25  

Достоинством индекса корреляции является то, что он служит мерой тесноты связи любой корреляционной зависимости, в т.ч и линейной, в отличие от коэффициента корреляции, который оценивает только линейную корреляционную связь. Недостатком индекса корреляции является то, что он не говорит, о какой форме связи идет речь, и он не имеет знака, поэтому неизвестно направление линии регрессии. Многие экономические процессы наилучшим образом описываются нелинейными соотношениями, например, нелинейными функциями спроса, производственными функциями. ПРИМЕР 1 Найти индекс корреляции по данным корреляционной табл. 3.1. у\х 15 25 nx

10 4 6 10 21

ух

20 28 28 15

Решение y=

∑n

y

yi

i

n

=

30 6 6 12 20

38 ⋅ 15 + 12 ⋅ 25 = 17,4 50

38(15 − 17,4 ) + 12(25 − 17,4 ) = 4,27 50 2

Sy =

S yx =

∑ n (y x

x

n

− y)

2

2

10(21 − 17,4) + 28(15 − 17,4) + 12(20 − 17,4) = 2,73 50 Sy 2,73 η= x = = 0,64 . Sy 4,27 2

=

Таблица 3.1 ny 38 12 n = 50

2

2

ПРИМЕР 2 Проверить на значимость индекс корреляции, рассчитанный в предыдущем примере. Решение Найдем Fнабл по (3.19) Fнабл =

0,64 2 (50 − 2) 19,68 = = 33,3 0,59 1 − 0,64 2

26  

Fкр (0,05;1;48) = 4,05

Fнабл > Fкр, поэтому индекс корреляции существенно отличен от нуля. ПРИМЕР 3 Найти выборочное уравнение регрессии между производительностью обжиговой печи и содержанием меди в шихте, если при исследовании этой зависимости были получены такие данные: у=10,04т/м2сут; х=14,4%; 2 2 х =209,3; у =100,97; Σху/n=145,06. Рассчитать коэффициенты парной корреляции, детерминации, эластичности сделать выводы. Решение 1. Рассчитаем дисперсии и среднеквадратические отклонения: s2у= у2 – ( у)2 =100,97 – 10,042 = 0,17; sу =0,412; s2х= х2 – ( х)2= 209,3 – 14,42= 209,3 – 207,4=1,9; sх = 1,37; 2. Вычислим коэффициент парной корреляции между содержанием меди в шихте и производительностью обжиговой печи. Исходя из имеющихся данных, воспользуемся формулой (3.4 ): r=

xy − x ⋅ y = (145,06 – 14,4х10,04)/1,37х0,412= 0,82. sx s y

Коэффициент детерминации равен: r2= 0,822= 0,6724. Это означает, что производительность обжиговой печи на 67,24% определяется содержанием меди в шихте, а на 32,76% - неучтёнными факторами. 3. Рассчитаем параметры уравнения регрессии по формулам (3.7, 3.8): B = rsу /sх= 0,82х 0,412/1,37= 0,25; а= 10,04 – 0,25х14,4=6,44. Тогда уравнение регрессии будет иметь вид: у=6,44+0,25х. Коэффициент эластичности равен: Э=b x /y =0,25х14,4/10,04=0,36. Он показывает, что с изменением содержания меди на 1% от своего среднего значения ( т.е. на 1,44%) производительность обжиговой печи изменится на 0,36% от своей средней величины. Задания для самостоятельного выполнения 3.1. Вычислить корреляционное отношение (индекс корреляции) между объёмом переработки руды и себестоимостью переработки 1 т руды по данным табл. 3.2. Общая дисперсия себестоимости переработки руды равна 8. Проверить индекс корреляции на существенность. Таблица 3.2 Объём переработки, Число наблюдений Себестоимость руды, тыс.т. переработки 1т, ед. 100-300 40 150 300-500 60 100 27  

3.2. Рассчитать индекс корреляции, характеризующий зависимость между мощностью горно-обогатительных комбинатов и капитальными вложениями производственного назначения, по данным табл. 3.3. Общая дисперсия капитальных вложений равна 2560. Проверить индекс корреляции на значимость и сделать выводы. Таблица 3.3 Мощность ГОКов, Число предприятий Капитальные вложения, млн.т млн. ед. 1-5 15 42 5-10 5 125 3.3. Вычислить индекс корреляции, который характеризует зависимость между объёмом производства и себестоимостью 1 т продукции по данным табл. 3.4. Общая дисперсия себестоимости равна 17000. Проверить индекс корреляции на значимость и сделать выводы. Таблица 3.4 Объём производства, Число предприятий Себестоимость 1т, ед. тыс. т 40-50 30-40 20-30

1 2 3

500 600-700 700-800

3.4. Получить выборочное уравнение регрессии производительности труда на руднике в зависимости от содержания цинка в руде, если среднее содержание цинка в руде составляет 5,05%, средняя производительность труда 1554,1 т/чел., sх=0,417, sу=246, rух=0,469. 3.5. Рассчитать уравнение регрессии между расходом свинца на душу населения, (кг) и национальным доходом страны, (долл.) по данным 19 стран мира, если известны следующие статистические оценки: Σх=64,7; Σх2=265,4; Σу=30281; sу=686; rух=0,6985. 3.6. Вычислить уравнение регрессии между выпуском кремния (т) в цехе и расходами на содержание и эксплуатацию оборудования (тыс.руб.), используя следующие статистические результаты первичной обработки данных, полученные по квартальным данным за четыре года: Σх=103793; Σу=2155,7; Σ(х х)2= 2173025; Σ(у - у)2=1271,2; Σ(х - х)(у - у)=43155,4. Проверить коэффициент корреляции на существенность. 3.7. По данным, приведенным в табл. 3.5, рассчитать и провести анализ уравнения регрессии, описывающего динамику производства глинозёма в цехе.

28  

Таблица 3.5 Годы Глинозём, тыс.т

1 471

2 519

3 601

4 609

5 596

6 587

7 601

8 600

9 587

10 621

11 663

12 704

4. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И РЕГРЕССИЯ Исследуемая корреляционная зависимость между результативным признаком и несколькими факториальными называется множественной корреляцией, а уравнения этих связей – уравнениями множественной регрессии или многофакторными моделями. Многофакторные модели могут быть линейными и нелинейными. Теоретическое уравнение линейной регрессии имеет вид: y = αo + α1x1 + α2x2 + … + αkxk + u

(4.1)

Уравнение регрессии с оцененными параметрами (выборочное) выглядит так: y = аo + а1x1 + а2x2 + … + аkxk + е

(4.2)

Возможны два способа нахождения параметров уравнения регрессии: с помощью системы нормальных уравнений и коэффициентов парной корреляции. Для первого способа требуется ввести фиктивную переменную хou = 1. Тогда данные наблюдений будут представлены в виде матрицы [х] размерности n(k + 1) и вектора [у] размерностью nх1. Сущность МНК в том, что сумма квадратов разностей между наблюдаемыми и расчетными значениями результативного признака (y) должна быть сведена к минимуму: S = ∑ (yu – ŷu)2 → min . u=1

Подставим сюда выражение для линейной модели множественной регрессии (4.2) и получим: n

S = ∑ (yu – ао – а1x1u – а2x2u– … – аkxku)2 → min . u=1

Необходимые условия для минимума функции S: ∂S/∂ао = 0, ∂S/ ∂а1 = 0, ∂S/∂а2 = 0, … , ∂S/∂ак = 0. В результате дифференцирования получим систему нормальных уравнений. В этой системе можно выделить информационную матрицу [М], составленную из сумм произведений наблюдаемых значений факторов x:

29  

(М = XТХ). Матрицу М получают из исходной матрицы Х, если ее умножить слева на транспонированную эту же матрицу. Кроме этого, в системе можно выделить два вектора: вектор-столбец неизвестных коэффициентов А и вектор столбец, составленный из сумм произведений результативного признака (y) на факторы хi : (YM = XTY). Тогда в векторно-матричной форме система нормальных уравнений запишется: М А = YM, или XT X А = XTY=YМ Чтобы решить это уравнение, надо умножить обе части на М-1. Тогда А = М-1XT Y или А = (XT X)-1 XT Y.

(4.3)

Матрица М-1=D является ковариационной. Ковариационными являются матрицы, элементы которых представляют собой дисперсии и ковариации ряда случайных величин. По элементам матрицы D вычисляют коэффициенты аi модели множественной линейной регрессии. Таким образом, для нахождения параметров уравнения множественной линейной регрессии необходимо вычислить ковариационную матрицу D = М-1 и тогда А = DXTY. Другим способом нахождения параметров уравнения множественной регрессии является использование коэффициентов парной корреляции. Для этого уравнение регрессии сначала представляют в стандартизованном масштабе, в котором оно имеет вид: ty =β1tx1 + β2tx2 + …. + βкtxк . (4.4) Коэффициенты βi находят по МНК решением системы уравнений: ryx1 = β1 + β2rx1x2 + …. + βkrx1xk ryx2 = β1 rx1x2 + β2 + …. + βkrx2xk (4.5) ………………………………... ryxk = β1 rx1xk + β2 rx2xk + …. + βk Коэффициенты βi показывают, на какую часть своего среднеквадратического отклонения изменится у при изменении хi на свое среднеквадратическое отклонение. При условии независимости факторов друг от друга коэффициенты bi , показывают, на сколько единиц изменится у при изменении хi на одну единицу. Переход к уравнению в натуральном масштабе осуществляется по формулам: ai = βi sy / sxi , i=0,1,2,..,k (4.6) n

ао = y – ∑ ai xi

(4.7)

u=1

В многомерном корреляционном анализе решают две типовые задачи:

30  

⎯ определение тесноты связи одной из переменных с совокупностью остальных переменных, включенных в анализ; ⎯ определение тесноты связи между переменными при фиксировании или исключении влияния остальных переменных. Эти задачи решаются с помощью коэффициентов множественной и частной корреляции. Теснота связи одной переменной с совокупностью других переменных, измеряется с помощью коэффициента множественной корреляции. Выборочный коэффициент множественной корреляции (R), являющийся оценкой генерального, может быть вычислен по формулам (4.8),(4.9): R = √ 1 - ⎥ q⎥ / ⎥ q11⎥

,

(4.8)

где | q⎥ - определитель матрицы q; ⎥ q11⎥ - определитель той же матрицы с вычеркнутыми первой строкой и первым столбцом, т.е. определитель матрицы, парных коэффициентов между факторами; R = √ β1 rух1 + β2 rух2 + …. + βк rухк ,

(4.9)

βi – коэффициент регрессии в стандартном уравнении. Коэффициент множественной корреляции, заключен в пределах 0 ≤ R≤ 1. Чем ближе R к 1, тем связь сильнее, чем ближе R к 0, тем связь слабее. Величина R2, называемая выборочным множественным коэффициентом детерминации, показывает, какую долю вариации исследуемой переменной объясняет вариация остальных переменных. Коэффициент множественной корреляции существенно отличается от нуля, если значение статистики: F = (R2(n-k-1)) / ((1-R2)k) > Fkp(α, f1, f2), (4.10) где Fkp(α, f1, f2) – критическое значение F- критерия на уровне значимости α при числе степеней свободы f1 = k и f2 = n – k –1. Статистическую зависимость коэффициентов регрессии (аi и аj) определяет ковариация: Cov (аi и аj) =cij. (cij – внедиагональный элемент ковариационной матрицы). Количественной мерой этой зависимости служит коэффициент корреляции: где

rai a j =

cij cii c jj

.

(4.11)

Если cij = 0, то и ra a = 0, т.е. если внедиагональные элементы ковариационной матрицы равны нулю, то коэффициенты аi и аj не коррелированны, и можно корректно установить доверительные границы коэффициентов регрессии. i

j

31  

Если αi – коэффициент множественной регрессии в генеральной совокупности, то (4.12) аi – s a *tкр ≤ αi ≤ аi + s a *tкр. i

i

На практике часто бывает необходимо сравнение влияния на зависимую переменную различных объясняющих переменных, когда те выражаются разными единицами измерения. В этом случае используют стандартизированные коэффициенты регрессии (βi) и коэффициенты эластичности (Эi). Стандартизированный коэффициент регрессии βi показывает, на сколько величин sу изменится в среднем зависимая переменная (у) при увеличении только i-ой объясняющей переменной на s x , а коэффициент эластичности Эi – на сколько процентов (от средней) изменится в среднем у при увеличении тольi

ко хi на 1%. (Коэффициент эластичности Эi =

a i xi ). y

Оценка значимости уравнения регрессии проверяется по F-критерию. Уравнение считается значимым, если: Fрасч = (QR * ( n–k –1) / Qe * k) > Fkp( α, f = n–k –1 ), или

Fрасч = s y2 /se2 > Fkp( α, f = n–k –1 ),

(4.13) (4.14)

где Fkp( α, f) определяется по таблице F-распределения. ПРИМЕР В табл. 4.1 приведены статистические оценки, полученные при обработке месячных технических отчетов за два года, а в табл. 4.2 – матрица коэффициентов парной корреляции. Таблица 4.1 Показатели Среднее ариф- Среднеквадратическое Коэффициент метическое отклонение вариации значение Производительность 3,57 0,26 7,28 конвертора, т/ч Содержание меди в 23,90 4,40 18,40 штейне, % Извлечение меди, % 89,00 0,75 0,84

32  

Таблица 4.2 Матрица коэффициентов парной корреляции Показатели У Х1 Производительность 1 0,78 конвертора, т/ч Содержание меди в 0,78 1 штейне, % Извлечение меди, % 0,70 0,39

Х2 0,70 0,39 1

Требуется: 1) построить уравнение регрессии в стандартизованном и натуральном масштабе; 2) провести корреляционный анализ полученного уравнения. Решение 1. Линейное уравнение множественной регрессии от двух факторов имеет вид у=a0+a1x1+a2x2. Чтобы найти его параметры, сначала надо построить уравнение регрессии в стандартизованном масштабе: ty =β1tx1 + β2tx2 . Расчет β- коэффициентов производим по формуле 4.5 решением системы уравнений: rух1= β1+ β2rх1х2 rух2= β1rх1х2+β2.

0,78= β1+0,39 β2 0,70=0,39 β1+ β2

Решая эту систему, получим β1=0,59 и β2=0,49. Тогда уравнение регрессии в стандартизованном масштабе будет иметь вид: tу=0,59tх1+0,49tх2 . Перевод уравнения в натуральный масштаб осуществим по формуле (4.6, 4.7). Тогда a1 =0,59х0,26/4,40=0,035; а2=0,49х0,26/0,75=0,170; а0=3,75-0,035 х 23,9 – 0,17 х 89,0= -6,21. Уравнение множественной регрессии в натуральном масштабе: у= - 6,21 + 0,035х1+0,170х2. 2. Коэффициент множественной корреляции рассчитаем по формуле (4.9), а коэффициент детерминации R2=0,59 х 0,78+0,49 х 0,70=0,66. Доля совокупного влияния двух факторов на производительность конвертора равна 66%, а доля неучтённых факторов – 34%. Коэффициент множественной корреляции R=0,81, связь достаточно сильная. Существенность (достоверность) коэффициента проверим по критерию Фишера по формуле (4.10) : Fр= 0,66(24-2-1)/(1-0,66)2=20,4. Критическое значение критерия Фишера при α=0,05 и α=0,01 равно: Fкр.(0,05; 2;21)= 3,47; Fкр.(0,01; 2;21)=5,79. Расчетное (наблюдаемое) значение критерия выше критического, поэтому коэффициент множественной корреляции с вероятностью 99% отличен от нуля. 33  

Задания для самостоятельного выполнения 4.1. Коэффициенты парной корреляции между себестоимостью кобальта, объёмом переработки сырья и содержанием кобальта в сырье равны: rух1 =0,77, rух2=0,45, rх1х2=0,29. Найти коэффициент множественной корреляции. 4.2. Уравнение регрессии в стандартизованном масштабе между себестоимостью 1т руды, объёмом добычи горной массы и объёмом горноподготовительных работ имеет вид: tу= - 0,89tх1 + 0,19tх2. Коэффициенты парной корреляции равны: rух1 = - 0,77, rух2=0,37. Найти коэффициент множественной детерминации. 4.3. При расчете уравнения множественной регрессии от двух факторов по совокупности 50 наблюдений вычислена сумма квадратов отклонений эмпирических значений от теоретических, равная 1760 и общая сумма квадратов отклонений, равная 14080. Найти коэффициент множественной корреляции и проверить его на значимость. 4.4. При анализе уравнения множественной регрессии от двух факторов, полученного по месячным данным за три года, были определены: сумма квадратов отклонений эмпирических значений от теоретических, равная 2079, и общая сумма квадратов отклонений результативного признака, равная 4410. При уровне значимости 0,05 и 0,01 определите, адекватно ли уравнение регрессии. 4.5. Парные коэффициенты корреляции между производительностью труда рабочего, уровнем механизации, уровнем квалификации и возрастом рабочего, вычисленные по 40 наблюдениям, равны: rух1=0,75, rух2=0,45, rух3=0,55, rх1х2=0,1, rх1х3=0,2, rх2х3 =0,1. Найти коэффициент множественной корреляции и проверить его на достоверность с вероятностью 95%. 4.6. Уравнение множественной регрессии в стандартизованном масштабе зависимости выпуска концентрата от содержания металла в руде и стоимости основных фондов, вычисленное по месячным данным за два года, имеет вид: : tу= 0,635tх1 + 0,625tх2. Σх1=121,36; Σх2= 256730; Σу=92234; sу=541,4. Сумма квадратов отклонений от своей средней по первому фактору равна 4,144, а по второму – 92721,92. Построить уравнение множественной регрессии в натуральном масштабе, рассчитать коэффициент множественной корреляции. Какова доля совокупного влияния факторов на выпуск концентрата? 4.7. Было проведено исследование производительности отражательной печи (т/м2сут) от содержания меди (%) и серы (%) в шихте. Результаты первичной обработки данных представлены в табл. 4.3. Таблица 4.3 Фактор Среднее Среднее Коэффициент арифметическое квадратическое корреляции У 10,04 0,399 rух1=0,899 Х1 14,40 1,422 rух2=-0,499 Х2 21,80 1,575 rх1х2=-0,376 34  

1) построить линейные уравнения парной регрессии и оценить их значимость по критерию Фишера; 2) найти уравнение множественной регрессии в стандартизованном и натуральном масштабе; 3) рассчитать множественный коэффициент корреляции и проверить его на значимость; 4) определить долю совокупного влияния факторов на исследуемый результативный признак; 5) рассчитать коэффициенты эластичности. 5. МЕЖОТРАСЛЕВОЙ БАЛАНС И МАТРИЧНЫЕ МОДЕЛИ Матричные экономико–математические модели предназначены для анализа и планирования производства и распределения продукции на различных уровнях - от предприятия до экономики страны в целом. Матричное отображение позволяет использовать в экономических расчетах многие достижения матричной алгебры. К матричным моделям относятся межотраслевой, межпродуктовый, межрайонный, межрегиональный, внутриотраслевой балансы производства и распределения продукции, матричные модели предприятий. Эти модели объединяют не только общий принцип построения и единство системы расчетов, но и аналогичность ряда экономических характеристик (в том числе коэффициентов прямых и полных затрат). Модель межотраслевого баланса (МОБ) отражает взаимосвязи по производству, распределению, потреблению и накоплению общественного продукта в разрезе отраслей народного хозяйства и в единстве материальновещественного и стоимостного аспектов воспроизводства. Метод межотраслевого анализа (interindustry analysis), который еще называют анализом затраты-выпуск (input output analysis или I/O analysis), разработанный американским экономистом В.В.Леонтьевым, родившимся в России, позволяет дать последовательный и численно определенный ответ на вопросы, связанные с межотраслевыми взаимодействиями и их влиянием на основные макроэкономические показатели. Схема МОБ представляет собой таблицу, состоящую из четырех квадрантов. Строки таблицы показывают распределение выпуска продукции каждого вида (output). Столбцы таблицы отражают структуру затрат (input) и чистой продукции каждой отрасли. 1-ый квадрант содержит межотраслевые потоки средств производства, производственное потребление. Во II-ом квадранте баланса показан конечный спрос - часть спроса, представляющая закупки конечных продуктов – потребительских или инвестиционных. По строкам МОБ (І-ый и ІІ-ой квадранты) отражено распределение продукции каждой отрасли на промежуточное (внутриотраслевое) потребление и в конечное использование. Введём условные обозначения: 35  

xij - стоимость продукции i-ой отрасли, потребленной в качестве матери-

альных затрат в j-ой; yi - конечная продукция i-ой отрасли; yi j - поставка продукции из i-ой отрасли для формирования j-ого элемента конечного продукта; x i - валовая продукция i-ой отрасли; vj- объем добавленной стоимости j-ой отрасли; vij- объем i-го элемента добавленной стоимости в j-ой отрасли. Для отраслей-производителей вся валовая продукция i-ой отрасли x i распределяется на текущее промежуточное потребление

n

∑x j =1

n

пользование

∑y j =1

ij

ij

и конечное ис-

= yi . Для любой производящей отрасли имеет место равен-

ство (уравнение для строк баланса) : n



j =1

x ij + y i = x i , i= 1, n

(5.1)

В III-ем квадранте показана добавленная стоимость (вновь созданная), включающая факторные затраты отрасли: доход работающих по найму (заработная плата), предпринимательский доход (прибыль), а также амортизационные отчисления, косвенные налоги и субсидии (со знаком минус). IV-ый квадрант отражает конечное распределение и использование национального дохода. Для потребляющих отраслей валовые затраты j-ой отрасли x j складываn

ются из промежуточных затрат



x ij

i=1

и добавленной стоимости

n

∑v i =1

ij

= vj .

Для этих отраслей имеет место равенство (уравнение для столбцов баланса) : n

∑x i =1

ij

+ vj = xj ,

j= 1, n

(5.2)

Величины итоговых показателей II и III квадрантов равны, суммарный конечный продукт совпадает с вновь созданной стоимостью: n

n

∑ y = ∑v i

i =1

j =1

j

.

Технологические связи между отраслями измеряются с помощью коэффициентов прямых материальных затрат i-ой отрасли для производства единицы продукции j-ой:

а ij =

x ij x

.

j

Матрица А = {a ij } - это матрица коэффициентов прямых затрат. Тогда уравнение (5.1) запишется в виде:

36  

n

∑a j =1

ij

⋅ x j + y i = xi ,

i= 1, n

(5.3)

Это уравнение называется основным уравнением межотраслевого баланса или уравнением равновесного выпуска. В матричной форме: AX + Y = X , (5.4) Решив его относительно Х, имеем: ( E − A) X = Y , (5.5) −1 X = ( E − A) ⋅ Y . (5.6) Матрица В = ( E − A) −1 - это матрица коэффициентов полных затрат или обратная матрица Леонтьева или матричный мультипликатор, или мультипликатор Леонтьева. Экономический смысл коэффициентов полных затрат матрицы В = {b ij } заключается в следующем: коэффициент bij определяет потребность в валовом выпуске продукции отрасли i для производства единицы конечной продукции отрасли j. Он является мультипликатором, показывающим эффект распространения спроса, первоначальным источником которого является спрос на конечную продукцию. −1 2 k Матрица ( E − A) −1 разлагается в ряд (E − A) = E + A + A + ...+ A + ..., откуда X = (E − A) −1 ⋅Y = (E + A + A2 + A3 + ...+ AK + ...)⋅Y = Y + AY + A2Y + A3Y +...+ Ak Y +..., (5.7) причем AY есть результат первичного эффекта распространения спроса, A 2 Y вторичного и т.д. Отсюда же следует, что решение AX + Y = Х можно получить итерационно: X ( k +1) = AX k + Y (5.8) 0 Подставив в (5.8) в качестве исходного значения X = Y , можно рассчитать эффект мультипликации, порождаемый конечным спросом. Для расчета коэффициентов полных затрат используют методы: ⎯ решение системы уравнений межотраслевого баланса ⎯ обращение матрицы ( E − A) ⎯ итерационный. Возможны три варианта расчета по модели МОБ: 1. В модели заданы валовые уровни производства всех отраслей ( xi - они же x j ), находят уровни конечной продукции: ( E − A) X = Y ; 2. Заданы прогнозные уровни конечной продукции (спроса), определяют −1 величины валовой продукции: ( E − A) ⋅ Y = Х ;

3. По отдельным отраслям задают уровни валовой, а по другим – конечной продукции так ,чтобы в сумме это число отраслей было равно n. Остальные n переменных определяют решением системы.

37  

Для расчета показателей МОБ применяют следующие методы расчета: ⎯ решение системы уравнений баланса, ⎯ обращение матрицы затрат и решение матричного уравнения, ⎯ итерационное решение. Определенная сложность и громоздкость вычислений при расчете объемов продукции и коэффициентов полных затрат в матричных моделях обусловлена необходимостью учета не только прямых, но и обратных производственных связей. Сочетание и переплетение прямых и обратных связей характерно для всего общественного производства. Но в некоторых частных моделях, разрабатываемых для ограниченной группы продуктов, для одной или нескольких взаимосвязанных отраслей, для отдельных предприятий, затраты обратной связи могут быть незначительными или отсутствовать. В этом случае матрица коэффициентов затрат имеет треугольную форму. Треугольная матрица коэффициентов соответствует такой производственной системе, в которой любой продукт может затрачиваться в своем собственном производстве и в производстве любого следующего за ним продукта, но никакой последующий продукт в производстве предыдущих продуктов не участвует. Расчеты объемов продукции и коэффициентов полных затрат на треугольных матрицах намного упрощаются. Поэтому пытаются путем соответствующего изменения порядка чередования продуктов (отраслей) привести матрицу, если это возможно, приближенно к треугольному виду. При расчете на треугольных матрицах процесс вычисления объемов выпуска продукции осуществляется от конца к началу. Рассмотрим пример. Пусть матрица прямых затрат имеет вид: ⎡0,30 0,25 0,20⎤ ⎡20⎤ ⎢ ⎥ А= 0 0,20 0,05 , а вектор конечного выпуска (спроса) Y = ⎢⎢30 ⎥⎥ . ⎢ ⎥ ⎢⎣50 ⎥⎦ ⎢⎣ 0 0 0 ⎥⎦ На основе уравнения межотраслевого баланса запишем 3

3

j =1

j =1

x3 = ∑ a3 j ⋅ x j + y3 = ∑ a3 j ⋅ x j + 50 = 50 (все коэффициенты в третьей строке матрицы

А равны 0). 3 3 x 2 = ∑ a 2 j ⋅ x j + y 2 = ∑ a 2 j ⋅ x j + 30 = a 21 ⋅ x 1 + a 22 ⋅ x 2 + a 23 ⋅ x 3 + 30 = 0,2 ⋅ x 2 + 0,05 * 50 + 30 = j=1 j =1 = 0,2 ⋅ x 2 + 32,5 x 2 − 0,2 x 2 = 32,5 0,8 ⋅ x 2 = 32,5 x 2 = 40,625

38  

3

3

j=1

j=1

x1 = ∑ a1j ⋅ x j + y1 = ∑ a1j ⋅ x j + 20 = a11 ⋅ x1 + a12 ⋅ x 2 + a13 ⋅ x 3 + 20 = 0,3 ⋅ x1 + 0,25 ⋅ 40,625 + 0.20 ⋅ 50 + + 20 = 0,3 ⋅ x1 + 40,16 x1 − 0,3x1 = 40,16 0,7 ⋅ x 2 = 40,16 x1 = 57,37

⎡57,370⎤ Таким образом, вектор валовых выпусков продукции X = ⎢⎢40,625⎥⎥ . ⎢⎣50,000⎥⎦

Матричный метод во внутризаводском планировании состоит в разработке таблиц – матриц, охватывающих важнейшие исходные и результативные показатели плана, включая матричный баланс предприятия. Внутрипроизводственные связи предприятия отражаются в первом квадранте, состоящем из 4 подквадрантов: 1а – показывает внутрипроизводственные связи основных цехов; 1б – расход продукции основных цехов на производство продукции вспомогательных цехов; 1в – потребление основными цехами продукции и услуг вспомогательных цехов; 1г – внутрипроизводственные связи вспомогательных цехов. Во 2-ом квадранте показан план производства и реализации продукции, в 3-ем – расход ресурсов со стороны, денежные расходы и вновь созданная стоимость, в 4-ом – распределение доходов предприятия. Матричная модель показывает предприятие как систему, имеющую вход (3-ий кв.), выход (2-ой и 4-ый кв.) и внутреннюю структуру (1-ый кв.). Основным методом матричного моделирования являются (как и в межотраслевом балансе) системы линейных алгебраических уравнений, описывающих процесс производства и распределения продукции в пределах предприятия и на сторону. ПРИМЕР Пусть народное хозяйство состоит из двух отраслей: сельского хозяйства и промышленности. Межотраслевые потоки и конечный продукт даны в табл.5.1. Допустим, что в следующем году конечный продукт сельского хозяйства увеличится в два раза, а в промышленности не изменится. Рассчитать все показатели и построить межотраслевой баланс с учётом изменений.

Таблица 5.1 Отрасли Сельское хозяйство Промышленность

Сельское хозяйство 7 12

39  

Промышленность 21 15

Конечный продукт 72 123

Решение По данным табл.5.2 составим первоначальный межотраслевой баланс. Таблица 5.2 Отрасли Сельское Промыш- Итого Конечный Валовой хозяйство ленность продукт продукт Сельское 7 21 28 72 100 хозяйство Промышленность 12 15 27 123 150 Итого 19 36 55 195 250 Добавленная стои81 114 195 мость Валовой продукт 100 150 250 -

Рассчитаем коэффициенты прямых затрат. а11=х11 : х1=7:100=0,07, а12=х12:х2=21:150=0,14, а21=х21:х1=12:100=0,12, а22=х22:х2=15:150=0,10. ⎡0,07 0,14⎤ ⎥. ⎣ 0,12 0,10⎦

Матрица коэффициентов прямых затрат имеет вид: А= ⎢

Расчёт коэффициентов полных затрат производится в следующей последова⎡1 0⎤ ⎡ 0,93 − 0,14⎤ - =⎢ тельности. Сначала рассчитывают матрицу │Е-А│= ⎢ ⎥. ⎥ ⎣− 0,12 0,90 ⎦ ⎣0 1 ⎦ ⎡0,90 0,12 ⎤

Затем определяют матрицу алгебраических дополнений : ⎢ ⎥ , которую ⎣ 0,14 0,93⎦ ⎡0,90 0,14 ⎤

транспонируют и получают матрицу, называемую присоединенной: ⎢ ⎥. ⎣ 0,12 0,93⎦ Определитель обращаемой матрицы │Е-А│равен 0,93х0,90-(-0,12)х(0,14)=0,8202. Умножив присоединённую матрицу на обратную величину определителя, получаем матрицу полных затрат: ⎡0,90 0,14 ⎤ ⎡1,0973 0,17069⎤ ⎥=⎢ ⎥. ⎣ 0,12 0,93⎦ ⎣0,1463 1,13386 ⎦

В = ( E − A) −1 = 1/0,8202 ⎢

Конечный продукт по условию в новом балансе будет представлен векто⎡144⎤

ром: Y = ⎢ ⎥ . Тогда валовой продукт будет получен по формуле (5.6): 123 ⎣



⎡1,0973 0,17069⎤

⎡144⎤

⎡179,0⎤

X = ( E − A) −1 ⋅ Y = ⎢ ⎥х ⎢ ⎥=⎢ ⎥. ⎣0,1463 1,13386 ⎦ ⎣123⎦ ⎣160,5⎦

Чтобы получить 1-ый квадрант нового баланса, надо матрицу прямых затрат умножить слева на вектор валового выпуска, развернутый в диагональную матрицу.

40  

⎡0,07 0,14⎤

⎡179,0

АХДиаг.= ⎢ ⎥х ⎢ ⎣ 0,12 0,10⎦ ⎣ 0

0 ⎤ = 160,5⎥⎦

⎡12,5 22,5⎤ ⎢21,5 16,0 ⎥ . ⎣ ⎦

Новый межотраслевой баланс представлен в таблице 5.3. Таблица 5.3 Отрасли Сельское хозяйство Промышленность Итого Добавленная стоимость Валовой продукт

Сельское хозяйство 12,5

Промышленность 22,5

21,5 34,0 145,0 179,0

Итого 35,0

Конечный продукт 144,0

Валовой продукт 179,0

16,0 38,5 122,0

37,5 72,5 267,0

123,0 267,0 -

160,5 339,5 -

160,5

339,5

-

-

Изменились все показатели, хотя по условию только конечный продукт возрос и то только в одной отрасли – сельском хозяйстве. Задания для самостоятельного выполнения ⎡3 1,5 ⎢ ⎢2 3 ⎢ ⎣4 5

0,5⎤ ⎥ 0,6⎥ , в 5.1. Матрица коэффициентов полных затрат имеет вид: ⎥ 3⎦ конечное потребление должно быть направлено 600 ед. продукции первого вида, 1000 ед. второго и 500 - ед. третьего. Найти план производства для каждого вида продукции. 5.2. Условия те же, что и в задаче 5.1, но в конечное потребление должно быть направлено 200 ед. продукции первого вида, 120 - второго и 400 ед. – третьего. Найти план производства по каждому виду продукции. 5.3. Матрица коэффициентов прямых затрат имеет вид: ⎡ 0,3 0,2 0,1⎤ ⎢ ⎥ ⎢0,7 0,5 0,4⎥ Валовой выпуск продукции первого вида составляет 8 млн. ед., ⎢ ⎣0,2



0,2 0,3⎦ второго – 22 млн. ед. , третьего - 12 млн. ед. Чему равна конечная продукция каждого вида? ⎡ 0,8 0,5 0,6 ⎤ ⎢ ⎥ 5.4. Матрица коэффициентов прямых затрат имеет вид: ⎢ 0,1 0,2 0,4 ⎥ . ⎢ ⎣0,01

41  



0,1 0,05⎦

Валовой выпуск каждого подразделения равен соответственно: 12000, 2600 и 400 ед. Найти товарную продукцию каждого подразделения. 5.5. Три рудника, мощности которых по добыче руды равны, соответственно, 3000, 2500 и 1600 тыс. т, снабжают рудой четыре обогатительные фабрики, мощности по переработке руды которых равны, соответственно, 1200, 2400, 2100 и 1400 тыс.т. Уравнения ограничений транспортной задачи могут быть записаны в виде АХ=У. Напишите в развернутом виде матрицу А. 5.6. На основе исходных данных (табл. 5.4) рассчитать: 1) коэффициенты полных затрат; 2) план производства продукции каждой отрасли; 3) отраслевую структуру производства; 4) схему межотраслевого баланса. Таблица 5.4 Коэффициенты прямых затрат и конечный продукт Отрасли 1 2 3 Конечный продукт, млн. руб. 1 0,3 0,2 0,4 540 2 0,2 0,3 0,1 1260 3 0,1 0,3 0,2 800 5.7. Отрасли производства товаров и услуг объединены в два сектора: 1) производство товаров и услуг длительного пользования; 2) производство товаров и услуг кратковременного пользования (табл. 5.5). Таблица 5.5 Сектор1 Сектор 2 Покупатели Сектор 1 24 90 6 Сектор 2 15 45 90 Рассчитать: 1) общий сбыт каждого сектора; 2) валовой национальный продукт и величину добавленной стоимости; 3) матрицу коэффициентов «затраты – выпуск» (прямых затрат); 4) стоимостные показатели сбыта каждого сектора, если конечное потребление товаров длительного пользования 100 ед., а товаров кратковременного пользования – 90 ед.; 5) схему межотраслевого баланса; 6) сколько должно быть выпущено продукции в секторе «производство товаров длительного пользования», чтобы обеспечить поставку потребителю единицы продукции «кратковременного пользования»; ⎡5 ⎤

⎡5 ⎤



⎣ ⎦

7) векторы Х, если Y = ⎢ ⎥ и Y = ⎢ ⎥ . 100 85 ⎦

42  

5.8. Производственное объединение «Алюминий» включает рудники по добыче боксита, глинозёмный и алюминиевый заводы. Плановое задание предусматривает изготовить для отправки другим потребителям, тыс. т.: боксита – 660, анодной массы – 55, алюминиевых чушек – 10, слитков – 30, силумина – 90. Матрица коэффициентов прямых затрат приведена в таблице 5.6. Рассчитать коэффициенты полных затрат и план производства для всех подразделений предприятия. Таблица 5.6 Продукт

Боксит

Боксит Глинозём Анодная масса Алюминий – сырец Чушки Слитки Силумин

Глинозём

Анодная масса 0 0 0

Алюмин. сырец 0 1,92 0,544

Чушки

Слитки

Силумин

0 0 0

0 0 0

0 0 0

Товарная продукция 660 680 55

0 0 0

2,4 0 0

0

0

0

0

1,002

1,033

0,894

0

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0

0 0 0

10 30 90

5.9. Объединение охватывает шахты и рудники по добыче угля и руды, плавильный завод по выплавке слитков, прокатный завод по выпуску стальных листов. Матрица коэффициентов прямых затрат дана в табл. 5.7. Таблица 5.7 Продукция Уголь Руда Слитки Стальные листы

Уголь 0,1 0 0 0

Руда 0,1 0 0 0

Слитки 0,5 1,0 0 0

Стальные листы 0,1 0 1,0 0

Необходимо поставить потребителям 3000 т угля, 6000 т слитков и 12000 т стальных листов. Определить: 1) сколько каждого вида продукции надо произвести; 2) где будет использован весь добытый уголь; 3) объяснить содержание элемента (2.4) матрицы полных затрат и связать его с исходной производственной функцией, содержащейся в матрице коэффициентов прямых затрат. 5.10. Матрица коэффициентов прямых затрат никелевого завода дана в табл. 5.8. Пользуясь тем, что матрица является треугольной, рассчитать производственную программу никелевого завода и матрицу полных затрат, не прибегая к обращению матрицы прямых затрат. Товарной продукцией является катодный никель в количестве 122000 т. Объяснить экономический смысл коэф43  

фициента b46 в матрице полных затрат и почему он не равен 0, хотя соответствующий коэффициент прямых затрат равен 0. Пусть товарный выпуск увеличится на 5%. Рассчитать новую производственную программу и объяснить все изменения. Таблица 5.8 Продукция

Руда

Концентрат

Агломерат

Файнштейн

Руда Концентрат Агломерат Файнштейн Анодный никель Катодный никель

0 0 0 0 0

1,27 0 0 0 0

0 1,68 0 0 0

0 0 14,53 0 0

0

0

0

0

Анодный никель 0 0 0 1,62 0 0

Катодный никель 0 0 0 0 1,06 0

5.11. Матрица прямых затрат и товарная продукция медеплавильного завода даны в табл. 5.9. Пользуясь свойством треугольной матрицы, рассчитать производственную программу завода и матрицу полных затрат, не обращая матрицу прямых затрат. Объяснить экономический смысл коэффициента b15 в матрице полных затрат. Показать по технологической цепочке, как он рассчитывается и почему не равен 0, хотя коэффициент прямых затрат a15=0. Пусть товарный выпуск медной катанки увеличится на 20 тыс.т, а медного купороса на 10%. Определить и объяснить все изменения в производственной программе. Таблица 5.9 Продукт

1

2

3

4

5

6

7

8

1. Черновая медь 2. Аноды 3. Катоды 4. Вайербарсы 5. Катанка 6. Серная кислота 7. Медный купорос 8. Селен

0

1,015

0

0

0

0

0,45

0

Товарная продукция, тыс.т 0

0 0 0 0 0

0 0 0 0 0

1,018 0 0 0 0

0 1,020 0 0 0

0 1,008 0 0 0

0 0 0 0 0

0 0 0 0 0,56

0 0 0 0 9,5

0 0 150 10 45

0

0

0

0

0

0

0

0

8

0

0

0

0

0

0

0

0

0,3

5.12. Два цеха выпускают продукцию двух видов. Матрица прямых затрат имеет вид:

⎡0,20 0,10 ⎤ ⎢0,25 0,20⎥ . Товарная продукция первого цеха составляет 130, а ⎣ ⎦

второго – 190 т. Требуется выявить распределение между цехами продукции, 44  

идущей на внутреннее потребление, и найти общий объём продукции, выпускаемой каждым цехом. Составить матрицу (модель) выпуска продукции с учетом внутреннего потребления. 5.13. Пусть экономика страны условно состоит из двух отраслей: сельского хозяйства и промышленности. Межотраслевые потоки (усл. ед.) показаны в табл. 5.10. Таблица 5.10 Отрасли Сельское Промышленность Конечный продукт хозяйство Сельское 600 400 2000 хозяйство Промышленность 1500 800 1700 1. Составить матрицу коэффициентов прямых затрат. Сколько продукции сельского хозяйства расходуется на производство 1 ед. продукции промышленности? 2. Сколько продукции должен поставить сельскохозяйственный сектор, чтобы промышленность обеспечила поставку 1 ед. продукции в конечное использование? 3. Пусть конечный спрос на продукцию сельского хозяйства возрос (упал) на 15%, а на продукцию промышленности – на 30%. Как изменится объём производства каждой отрасли? 5.14. В табл. 5.11 приведены коэффициенты прямых затрат и товарная продукция (тыс.т) завода по производству свинца. Таблица 5.11 Продукция 1. Агломерат 2. Черновой свинец 3. Рафинированный свинец 4. Свинцовый прокат

1

2

3

4

0 0

1,027 0

0 1,038

0 0

Товарная продукция 0 0

0

0

0

1,005

150

0

0

0

0

10

1. Рассчитать производственную программу завода, пользуясь треугольной матрицей затрат; 2. Как вычислить матрицу полных затрат при отсутствии обратных связей? Сколько коэффициентов надо определить? 3. Объяснить экономический смысл коэффициентов полных затрат (1.4) и (2.4) и показать по технологической цепочке, как они рассчитаны и почему не равны 0 в отличии от соответствующих коэффициентов прямых затрат. 45  

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Экономико-математические методы и прикладные модели: учеб. пособие для вузов /В.В.Федосеев, А.Н.Гармаш, Д.Ж.Дайитбетов [и др.]; под ред. В.В.Федосеева. –М.: ЮНИТИ, 2000. 2. Экономико–математические методы и прикладные модели: учеб. пособие / Н.И.Холод, А.В.Кузнецов [и др.]; под ред. А.В.Кузнецова. –Минск: БГЭУ, 2000. 3. Бородич, С.А. Эконометрика /С.А.Бородич. – Минск: Новое знание, 2001. 4. Бенуни, А.Х. Математические методы в планировании и управлении цветной металлургии /А.Х.Бенуни, Б.Л.Гурфиль. – М.: Металлургия, 1974. 5. Ветров, А.А. Дисперсионный анализ в экономике /А.А.Ветров, Г.И.Ломовацкий. –М.: Статистика, 1975. 6. Введение в эконометрику /К.Доугерти. – М.: ИНФРА-М, 1999.

46  

ОГЛАВЛЕНИЕ

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ..……………………..3 1. 1.1. Проверка гипотезы о предполагаемом распределении генеральной совокупности………………………...…………………………………..……………..3 1.2. Проверка гипотезы о равенстве генеральных дисперсий………..…….6 1.3. Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема. Критерий Кохрена……………………………………….………………..……………………………8 1.4. Проверка гипотезы о значимости коэффициента корреляции……......9 1.5. Сравнение средних нормальных генеральных совокупностей, дисперодинаковы (малые независимые сии которых неизвестны и выборки)……………………………………………………………..……………...10 1.6.Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки). Критерий для средней разности………………………………………………………………12 2. ДИСПЕРСИОННЫЙ АНАЛИЗ………………………………………….15 3. ПАРНАЯ КОРРЕЛЯЦИЯ И РЕГРЕССИЯ………………………………20 4. МНОЖЕСТВЕННАЯ КОРРЕЛЯЦИЯ И РЕГРЕССИЯ…………….......29 5. МЕЖОТРАСЛЕВОЙ БАЛАНС И МАТРИЧНЫЕ МОДЕЛИ………….35 6. БИБЛИОГРАФИЧЕСКИЙ СПИСОК……………..……………………..46

47  

Smile Life

When life gives you a hundred reasons to cry, show life that you have a thousand reasons to smile

Get in touch

© Copyright 2015 - 2024 AZPDF.TIPS - All rights reserved.