Дайитбегов Дайитбег Магамедович КОМПЬЮТЕРНЫЕ

advertisement
На правах рукописи
ѲѲ461Ѳ576
Дайитбегов
Дайитбег Магамедович
КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
АНАЛИЗА ДАННЫХ В ЭКОНОМЕТРИКЕ
Специальность 08.00.13 - Математические
и инструментальные методы экономики
Автореферат
диссертации на соискание ученой степени
доктора экономических наук
1 4 0КТ 2010
Москва 2010
Диссертация выполнена па кафедре экономико-математических ме­
тодов и моделей Государственного образовательного учреждения выс­
шего профессионалыгого образования — Всероссийский заочный фи­
нансово-экономический институт
Официальные оппоненты: доктор экономических наук, профессор
Лагоша Борис Александрович
доктор экономических наук, профессор
Жеребин Всеволод Михайлович
доктор экономических наук, профессор
Мхитарян Владимир Сергеевич
Ведущая организация:
Федеральное государственное
образовательное бюджетное учреждение
высшего профессионального
образования «Финансовый
университет при Правительстве
Российской Федерации»
Защита состоится « 2?-» аеТ^Г&У-і
2010 г. в УУ- часов
в аудитории д о у на заседании диссертационного совета по защите
диссертаций при Государственном образовательном учреждении выс­
шего профессионалыгого образования «Московский государственный
университет экономики, статистики и информатики» (МЭСИ) по ад­
ресу: 119501, г. Москва, ул. Нежинская, д. 7.
С диссертацией можно ознакомиться в библиотеке ГОУ ВПО «Мос­
ковский государственный университет экономики, статистики и ин­
форматики»
Автореферат разослан «*?J» <?е/гГ*<0ЛО№ г.
Ученый секретарь диссертационного совета^/
кандидат технических наук, доцент
/////
И.Н. Мастяева
3
Общая характеристика работы
Диссертационная работа выполнена в виде опубликованной мо­
нографии на тему «Компьютерные технологии анализа данных
в эконометрике» (М.: ИЫФРА-М; Вузовский учебник, 2008.
Уч.-изд. л. — 50,76)» согласно п. 9 Положения о порядке присуж­
дения ученых степеней (в ред. Постановлений Правительства РФ
№ 490 от 12 августа 2003 г., № 227 от 20 апреля 2006 г.).
Актуальность темы диссертации обусловлена бурным прогрес­
сом в системном и прикладном программном обеспечении (ПО)
персональных компьютеров (ПК), вследствие чего у статистики как
математической и экспериментальной науки возникли принципи­
ально новые возможности применения и развития. Благодаря со­
зданию мощного профессионально-ориентированного статистичес­
кого ПО (СПО) спектр эконометрических исследований суще­
ственно расширяется и охватывает не только социально-экономи­
ческие системы, но и широкий круг экономических объектов и про­
цессов в производстве, маркетинге, менеджменте, финансово-хо­
зяйственной деятельности и др.
Следствием расширения сферы эконометрических исследований
являются рассмотренные в данной работе теоретические и методо­
логические проблемы разработки компьютерных эконометричес­
ких моделей анализа и прогноза, на примере такой специфической
области экономики, как материалоемкость продукции (изделий)
промышленного сектора экономики. Важность и целесообразность
их заключаются в следующем.
В социально-экономической политике России в процессе перехо­
да на инновационный путь развития ключевое место занимает ресур­
сосбережение. Его уровень зависит от материалоемкости продукции,
которая характерна для используемой технологии производства.
Материалоемкость продукции — важная экономическая катего­
рия, выражающая затраты труда, овеществленного в материальных,
сырьевых и топливно-энергетических ресурсах на единицу произве­
денной продукции. По своему значению для хозяйственного (эконо­
мического) развития категория материалоемкости продукции стоит
в одном ряду с такими экономическими категориями, как произво­
дительность труда и фондоотдача, поскольку все они выражают эф­
фективность использования общественного труда, т.е. его полезную
4
результативность, связанную с инновационными процессами произ­
водства. В снижении материалоемкости продукции заключены
крупные резервы экономии прошлого труда. Так, начиная с 1990-х гг.
материальные затраты составляли более половины всех затрат па
производство валового продукта нашей страны.
Материальные ресурсы, составляющие материалоемкость продук­
ции, затрачиваются на изготовление продукции конкретной номенк­
латуры в соответствующих лимитированных физических объемах
(уровнях), которые в целях планирования и управления производ­
ством выражаются через показатели норм расхода материалов. Норма
расхода материального ресурса определяет обоснованное, предельно
необходимое количество материальных затрат (в соответствующих
единицах измерения) для производства единицы продукции или ра­
бот, исходя из достигнутого уровня технического прогресса, техноло­
гии производства и планируемых организационно-технических ме­
роприятий по снижению материалоемкости. Кроме того, нормы рас­
хода — важный показатель конкурентоспособности продукции, по­
скольку они оказывают существенное воздействие на такие экономи­
ческие категории, как себестоимость, цена, прибыль и рентабельность.
Поскольку в промышленном секторе экономики среди используе­
мых материалов наибольший удельный вес приходится на номенк­
латуру проката черных металлов, а среди изделий высоким уровнем
его потребления отличаются строительные машины, в частности
одноковшовые универсальные экскаваторы на гусеничном ходу, в
работе материалоемкость продукции выражена через укрупненные
нормы расхода проката черных металлов на различные марки дан­
ного изделия.
За последние годы существенно сократились исследования и пуб­
ликации по анализу материалоемкости промышленной продукции,
эффективности использования материальных ресурсов, экспертизе
материалоемкости повой техники, моделированию норм расхода
материальных ресурсов на изделия промышленного сектора эконо­
мики.
С учетом отмеченных обстоятельств диссертация, посвященная
теоретическим и методологическим проблемам разработки и при­
менения компьютерных эконометрических моделей анализа и про­
гноза динамики норм расхода материалов и зависимости материа­
лоемкости изделий промышленного сектора экономики от их тех-
5
иико-экоиомических параметров, актуальна в общем контексте по­
литики перехода па инновационный путь развития экономики на­
шей страны.
Выбор в качестве информационно-статистической базы исследо­
ваний спецификаций технико-экономических параметров (харак­
теристик) изделий (машин) правомерен, поскольку эти параметры
и нормы расхода материалов статистически взаимосвязаны, задают
качество их потребительских свойств и являются средством описа­
ния машин, которое удовлетворяет важнейшим требованиям коли­
чественной соизмеримости, унифицированности и объективности,
предъявляемым к факторам-аргументам при их включении в эконометрическую модель.
Актуальность затронутых проблем, их недостаточная теорети­
ческая и практическая проработанность с учетом современных до­
стижений в области программного обеспечения обусловили выбор
темы и основных направлений исследований диссертационной ра­
боты, выполненной в виде опубликованной монографии.
Цель и задачи исследования. Целью настоящего исследования
является разработка теоретических и методологических основ
комплексного решения проблемы компьютерного эконометрического моделирования (на примере материалоемкости изделий про­
мышленного сектора экономики).
Достижение сформулированной цели обусловило необходимость
решения следующего комплекса научных и практических задач:
• анализ этапов разработки эконометрических моделей материа­
лоемкости изделий промышленного сектора экономики и характе­
ристика особенностей реализации выделенных этапов;
• формирование информационно-статистической базы компью­
терного анализа данных и разработка методологических принципов
технологии выбора аналитической формы экономстрической моде­
ли, задающеіі зависимость материалоемкости изделия от его техни­
ко-экономических параметров; систематизация экономико-матема­
тических основ интерпретации результатов решения эконометрической модели материалоемкости изделий;
• проведение компьютерного анализа корреляций отобранных
переменных (технико-экономических параметров) изделий и пар­
ных регрессий зависимости материалоемкости изделий от каждого
технико-экономического параметра;
6
• оценка стабильности дисперсии отклонений (гомоскедастичности) эконометрической модели и реализация компьютерных проце­
дур, направленных на устранение гетероскедастичности уравнения
рецессии материалоемкости изделий;
• анализ и реализация методик построения компьютерных линей­
ных и нелинейных многофакторных эконометрических моделей
материалоемкости изделий и удельного расхода материалов с при­
менением пошаговых процедур отбора значимых факторов;
• разработка методики получения частных уравнений множе­
ственной регрессии, определения частных коэффициентов эластич­
ности расхода материалов и комплексной оценки относительного
влияния факторов на зависимую переменную;
• формулирование теоретических и методологических основ мно­
гомерного анализа технико-экономических параметров изделий с
использованием компьютерных технологий;
• обоснование методики адаптации эконометрических моделей,
разработанных на основе пространственно-временных данных;
• разработка и систематизация методических подходов к постро­
ению компьютерных моделей анализа и прогнозирования времен­
ных рядов норм расхода материалов на изделия с применением
кривых роста и адаптивных методов;
• обоснование методики и технологии компьютерного прогноза
(ретропрогноза) с использованием статических и динамических
регрессионных моделей материалоемкости изделий;
• систематизация этапов компьютерной технологии построения
и реализации экономико-математической модели оптимизации
программы применения организационно-технических мероприя­
тий по снижению материалоемкости изделий;
• представление обобщенной схемы концептуальной модели ПО
автоматизированного рабочего места для статистической обработ­
ки данных (АРМ СтОД) и детализированной схемы состава и
структуры его функционального ПО, формулирование перспектив
развития ПО АРМ СтОД.
Компьютерные технологии анализа данных в эконометрических
исследованиях реализованы с применением отечественных статисти­
ческих пакетов прикладных программ (ППП) ОЛИМП1, СтатЭкс1
Богачев ВВ.,Поляков СВ., МакаровII.С. ОЛИМП (пакет статистического
анализа и прогнозирования): Руководство пользователя. — М.: ЦИСН, 1995.
7
перт2, VSTAT3, которые имеют достаточное функциональное напол­
нение для решения подобного рода задач. Перечисленные ППП
представляют собоіі последовательный ряд усовершенствованных
версий статистических пакетов. В частности, пакет ОЛИМП явля­
ется последующим развитием пакета АРМ СтОД4, СтатЭксперт —
усовершенствованной версией пакета ОЛИМП, а пакет VSTAT —
пакета СтатЭксперт.
Предметом исследования выступают процессы компьютерного
эконометрического моделирования материалоемкости изделий
промышленного сектора экономики.
Объектом исследования является материалоемкость готовых
изделий промышленного сектора экономики, физические объемы
которой: выражены через укрупненные нормы расхода материаль­
ных ресурсов на единицу изделия.
Теоретическую и методологическую базу исследования состав­
ляет системный подход к процессу моделирования технико-эконо­
мических систем.
Для решения задач, поставленных в диссертации, использован
аппарат теории вероятностей, математической статистики, при­
кладной статистики, факторного, компонентного и кластерного ана­
лизов, математического программирования и вычислительной мате­
матики. Кроме того, при решении задач эконометрики комплексно
применены компьютерные технологии анализа данных и прогнози­
рования.
В процессе проведения исследований широко использовались
труды отечественных и зарубежных ученых в области эконометри­
ки, экономико-математического моделирования, статистического
анализа, компьютерных информационных технологий, экономи­
ческого анализа, а также материалы научной периодики.
2
Программные продукты серии ОЛИМП: Программа статистического анализа
и прогнозирования: СтатЭксперт. - М: ЦИСІІ, 199G; Программные продукты
серии ОЛИМП: СтатЭксперт (дополнение для версии 3.01). — М.: ЦИСН,
1996.
3
Последняя версия статистического пакета из серии программных продуктов
ОЛИМП - http://www.v-stat.ru
і
ШураковВ.В.,ДайитбеговД.М.,Мизрош С.В.,Ясеновский СВ. Автоматизиро­
ванное рабочее место для статлстичсской обработки данных. — М.: Финансы и
статистика, 1990.
8
Информационно-статистическую базу исследований составляют
пространственно-временные данные за 35-летний период наблюде­
ний, которые характеризуют материалоемкость (укрупненные нормы
расхода проката черных металлов) и технико-экономические парамет­
ры различных марок изделий (экскаваторов на гусеничном ходу).
Научная новизна исследования заключается в разработке теоре­
тико-методологических положений концепции комплексного ре­
шения проблемы построения компьютерных эконометрических
моделей материалоемкости изделий промышленного сектора эко­
номики с использованием современных технологий анализа дан­
ных и прогнозирования.
Наиболее существенные результаты, полученные лично соиска­
телем и отражающие научную новизну:
1. Сформулированы: этапы построения компьютерных экономет­
рических моделей с учетом специфики предметной области матери­
алоемкости изделий и принципы формирования исходной статисти­
ческой совокупности однородных наблюдений; методология выбора
аналитической формы эконометрической модели, описывающей за­
висимость норм расхода материалов от технико-экономических па­
раметров изделий; экономико-математические основы интерпрета­
ции результатов решения эконометрических моделей материалоем­
кости изделий; методика предварительного анализа наблюдений
и восстановления пропущенных данных с использованием компью­
терных технологий.
2. Предложена методика компьютерного анализа корреляций и
парных регрессий технико-экономических параметров изделий и
норм расхода материалов с автоматическим выбором «наилучшего»
уравнения из множества заданных; проведена классификация пар­
ных регрессионных моделей по формам уравнения связи, исследова­
на гомоскедастичность эконометрических моделей и показана ком­
пьютерная технология устранения их гетероскедастичности.
3. Апробирована методология компьютерного многофакторного
экономстрического моделирования материалоемкости изделий
и удельного расхода материалов на основе линейных и нелинейных
функций.
4. Выдвинуты методологические положения комплексной оцен­
ки относительного влияния факторов-аргументов на нормы расхо­
да материалов изделий, построения частных уравнений множе-
9
ствепііой регрессии материалоемкости изделий и оценки частных
коэффициентов эластичности расхода материалов.
5. Сформулированы и реализованы теоретико-методологические
положения применения методов многомерного компьютерного
анализа технико-экономических параметров изделий при построе­
нии адекватных экоиометрических моделей, таких как: анализ выб­
росов по множеству признаков; кластерный и дискримнпаптный
анализ для классификации объектов наблюдений; оценка равенства
векторов средних двух групп (по критерию ^-статистики Хотеллинга) с целью определения качества классификации; компонент­
ный и факторный анализ для выявления некоррелированных обоб­
щающих факторов (латентных характеристик) развития явления.
Построены регрессии зависимой переменной (норм расхода мате­
риалов) на главные компоненты и обобщающие факторы.
6. Даны методические рекомендации по реализации компьютер­
ной технологии выполнения процедур адаптации экоиометричес­
ких моделей, разработанных на основе пространственно-времен­
ных наблюдений, и составлению системы одновременных уравне­
ний эконометрической модели материалоемкости с выделением
эндогенных и экзогенных переменных.
7. Аргументирована адекватность разработанных компьютерных
моделей анализа, ретропрогноза и прогноза временных рядов, отра­
жающих специфику динамики материалоемкости изделий, с ис­
пользованием методов кривых роста, Брауна, Хольта, авторегрес­
сии, авторегрессии — скользящего среднего и обобщенного линей­
ного метода прогноза. Разработаны практические рекомендации по
технологии автоматического выбора «лучшего» метода из числа
названных для аппроксимации и прогноза уровней временных ря­
дов и верификации отобранных методов прогноза на участках апп­
роксимации и ретропрогноза.
8. Реализована методика компьютерной технологии прогноза,
ретропрогноза и определения доверительных интервалов прогноза
для статических и динамических экоиометрических моделей, постро­
енных на основе пространственно-временных данных.
9. Показаны особенности компьютерной технологии построения
и решения экономико-математической модели оптимизации про­
граммы применения организационно-технических мероприятий по
снижению материалоемкости изделий.
10
10. Даны обобщенная схема концептуальной модели АРМ для ста­
тистической обработки данных и детализированная структурная
схема его функционального программного обеспечения. Обозначе­
ны основные направления дальнейшего развития АРМ СтОД.
Теоретическая и практическая значимость проведенного иссле­
дования состоит в возможности непосредственного использования
разработанных теоретических основ и методологических положе­
ний для компьютерного моделирования материалоемкости изделий
промышленного сектора экономики. Кроме того, полученные ре­
зультаты могут быть использованы в процессе преподавания в ву­
зах специальных дисциплин, предметом изучения которых являет­
ся статистическое, экономико-математическое и эконометрическое
моделирование с использованием компьютерных технологий,
в системе обучения магистрантов, аспирантов и повышения квали­
фикации преподавателей и специалистов аналитических служб
предприятий.
Результаты исследований могут быть также использованы в на­
учно-практических разработках проблем компьютерного эконометрического и экономико-математического моделирования эконо­
мических процессов в промышленном секторе экономики, созда­
ния программного обеспечения АРМ для статистического анализа
данных и прогнозирования.
Апробация результатов исследования. Диссертация выполнена
в рамках комплексной темы НИР ГОУ ВПО ВЗФЭИ «Исследова­
ние проблем математического моделирования процессов экономи­
ческого и социального развития России».
Результаты исследования использованы при разработке про­
граммных комплексов статистического анализа и прогнозирования
АРМ СтОД, ОЛИМП, СтатЭксперт и VSTAT. Они также находят
широкое применение в учебном процессе при подготовке экономи­
стов, разработке учебных дисциплин «Эконометрика», «Экономи­
ко-математические методы и прикладные модели», «Статистика»,
«Теория вероятностей и математическая статистика».
Результаты исследований и предложенные в них подходы апро­
бированы в докладах на международных, всесоюзных и всероссий­
ских научно-практических конференциях, при анализе и проекти­
ровании материалоемкости изделий на ряде предприятий промыш­
ленного сектора экономики.
11
Объем и структура диссертации. Объем диссертационной рабо­
ты, выполненной в виде опубликованной монографии, составляет
50,76 уч.-изд. л. и состоит из предисловия, десяти глав, заключения,
библиографического списка 237 наименований и пяти приложений.
Монография содержит 82 таблицы, 125 рисунков и схем.
По теме диссертации соискателем опубликовано 78 работ общим
объемом 427 п.л., в том числе авторских — 226 п.л., из них 23 книги:
две монографии, два учебника с грифом Минобразования РФ,
19 учебных пособий, из которых 7 имеют гриф Минвуза СССР, Ми­
нобразования РФ и УМО; 38 статей, из них 7 в научных журналах,
рекомендованных ВАК, 10 статей доложены на международных,
всесоюзных и всероссийских научных конференциях.
Основное содержание работы
1. Основные этапы разработки эконометрических моделей.
Анализ этапов построения компьютерных эконометрических моде­
лей выполнен с учетом специфики предметной области — матери­
алоемкости изделий промышленного сектора экономики.
Обобщенная схема этапов построения эконометрической модели,
вытекающая из особенностей ее разработки применительно к мате­
риалоемкости изделий, представлена на рис. 1.1.
В процессе моделирования важным этапом является формирова­
ние статистических совокупностей однородных групп технико-эко­
номических параметров подобных друг другу машин по качествен­
ным признакам и количественным измерениям (блок 1, рис. 1.1).
При этом используется система кодирования изделий, принятая
в отрасли (корпорации).
На первой стадии формируются матрицы значений комплекса
технико-эконометрических параметров, составляющих наряду
с основными характеристиками паспорт модели (марки) изделия
и включаемых в эконометрическую модель: X, — геометрическая
емкость ковша, м3; Х2— мощность двигателя, л.с; Х3 — конструктив­
ная масса, кг; Аг4 — наибольший радиус копания, м; Х5 — номиналь­
ная скорость передвижения, км/ч; Х6 — продолжительность рабоче­
го цикла при повороте на 90°, сек; Х7 — наибольшая высота выгруз­
ки, м; Х& — наибольшая глубина копания, м; Х9 — тип управления
1. Формирование групп анализируемых статистических
совокупностей по подобным классам объектов
наблюдений {изделий)
2. Анализ выбросов и корректировка аномальных
наблюдений для однородности исходных данных,
восстановление пропущенных данных
3. Предварительное изучение переменных,
включаемых в модель, средствами описательной
статистики и многомерного анализа
4. Вычисление парных, частных и множественных
корреляций. Определение коллинеарности
и мул ьти колли неарности переменных
5. Начальный отбор факторов модели
по результатам блоков 3 и 4
> Кластеры (группы),
выделяемые на основе
кластерного и дискриминантного
анализа
• Средние или характеристики
центральной тенденции
• Показатели изменчивости
(вариации) одномерных рядов
• Показатели, отражающие
дополнительные особенности
распределений, их форму
(закон распределения), графики
• Оценка вклада факторов
в дисперсию исходных
переменных по результатам
факторного и компонентного
анализа
. Выдвижение гипотезы о виде модели,
задаваемой уравнением регрессии,
из множества возможных
• Существенность по F-критерию
• Уровень коэффициента
детерминации
• Уровень относительной
ошибки аппроксимации
»Оценка адаптации уравнения
Случайный характер
Нормальность распределения
Равенство нулю математического
ожидания
Постоянство дисперсии
Отсутствие систематической
связи между значениями остатков
13. Получение эконометрической модели окончательного
вида. Интерпретация результатов решения задачи
14. Определение основных предпосылок использования
модели для анализа и прогнозирования уровней
зависимой переменной
Рис. 1.1. Обобщенная схема
технологии построения
эконометрической модели
13
ковшом: 0 — механический, 1 — гидравлический; -Х"|0(Г) — норма
расхода проката черных металлов, кг; Хи — оптовая цепа, руб.; Х12 —
коэффициент использования металла.
Зависимая неременная (материалоемкость, выраженная через
норму расхода материала определенной номенклатуры) и перечис­
ленные факторы (технико-экономические параметры) приводятся
к взаимно однозначному соответствию на определенный момент
времени в виде матрицы следующего вида:
(у хХ г = 1,2,..., п; j = 1,2,..., т,
• ѵ
(1.1)
где у. — уровень нормы расхода материала на /-ю модель (марку)
изделия;
лг. — значениеу-го техннко-эконометрического параметра (фак­
тора) для і-і\ марки изделия.
Матрица исходных данных анализируемой статистической сово­
купности задается по принципу «заводо-лет» в виде пространствен­
но-временных наблюдений, позволяющих расширить представитель­
ность обрабатываемых статисти­
ческих совокупностей и провести
>У//УѴ
их исследование в статике и дина­
^s"
s s / / s / / /
мике. Таким образом, в данном
'
случае в распоряжении исследо­
1
вателя имеется трехмерная пря­
О
моугольная информационная
/
структура: «объект (модели изде­
/ /І
лия) — признак (технико-эконо­
/
мические параметры изделия) —
у - параметр изделия
время», традиционно называемая
Рис. 1.2. Куб данных:
в системах обработки информа­
/'—объекты;/—признаки; ( — время
ции кубом данных (рис. 1.2).
В зависимости от задач анализа информации куб данных может
рассматриваться либо как совокупность матриц, либо как множе­
ство векторов, либо как множество временных рядов, которые в эконометрическом анализе используются каждый в отдельности или в
комплексе.
Гипотезы о виде (форме) уравнения регрессии эконометрической
модели (блок 6, рис. 1.1) проверяются с использованием качествен-
14
ных методов (эмпирический и теоретический методы, опыт преды­
дущих исследований, активный эксперимент).
С учетом отмеченных подходов рассматривались следующие
формы связи (блок 6, рис. 1.1):
т
Y = a0 + ^aJXj + E;
т
т
а х
Y = a0 +ѣ і і
+
(1-2)
т
TjHajkXjXk
+£
;
(1.3)
т
У = а0\{Г/.г;
(1.4)
rn
Y = a0+YlajlnXJ+z.
(1.5)
i=i
Линейная модель (1.2), наряду с се простотой и глубиной разра­
ботанности методики приложений, имеет то преимущество, что риск
значительной ошибки прогноза меньше.
Степенные модели (1.4), которые для нахождения коэффициен­
тов регрессии приводятся к логарифмически линейной форме, име­
ют ряд преимуществ перед линейными моделями (1.2). Как криво­
линейные функции, они имеют большую гибкость и с их помощью
легче аппроксимировать сложные зависимости. Использование сте­
пенной функции (1.4) для построения эконометрической модели
материалоемкости изделий при теоретическом подходе мотивирует­
ся тем, что формирование индивидуальных норм расхода материа­
лов на изделие (деталь) осуществляется посредством перемножения
различных типоразмеров деталей и узлов. Здесь широко применя­
ются геометрические расчеты. На величину норм расхода материа­
лов оказывает также совместное влияние сочетание техническо-экономических параметров марок (моделей) изделий (1.3).
Сказанное относится и к полулогарифмігческой функции (1.5), кото­
рую, как показали исследования, можно Широко использовать для пост­
роения эконометрических моделей материалоемкости изделий.
На второй стадии отбора факторов эконометрической модели
(блок 8, рис. 1.1) используются специальные статистические крите­
рии оценки их значимости. Для выявления однородных групп на­
блюдений применяется аппарат кластерного и дискриминантного
анализа (блок 3, рис. 1.1). С целью отбора независимых переменных
15
для включения их в уравнения регрессии привлекается факторный
и компонентный анализ (блок 5, рис. 1.1), которыіі самостоятельно
используется при решении задач факторного анализа и снижения
размерности статистических совокупностей.
Общим условием адекватности эконометрических моделей, пара­
метры которых вычисляются методом наименьших квадратов, паряду со значимостью коэффициентов регрессии, коэффициента де­
терминации, F-крнтерня уравнения, является выполнение совокуп­
ности гипотез по отношению к их остаточным отклонениям (Е)
(блок 12, рис. 1.1).
При интерпретации результатов эконометрпческого моделирова­
ния материалоемкости применительно к каждому j-му фактору
(блок 13, рис. 1.1) используются коэффициенты регрессии (а) и
эластичности (Е), [^-коэффициенты (Р) и др.
Из уравнений модели следует, что при степенной форме связи
(1.4) средний уровень изменения расхода материалов при измене­
нии величины какого-либо из факторов зависит от всех компонен­
тов уравнения. При линейной форме связи (1.2) коэффициент рег­
рессии а. показывает, на сколько единиц в среднем изменится уро­
вень нормы расхода материала при изменении значения^'-го факто­
ра на единицу своего измерения.
Для оценки относительной силы влияния факторов на зависимую
переменную используются коэффициенты эластичности расхода
материала (£.). При степенной форме связи (1.4) Е. = а, а при линей­
ной форме связи Е. различны для разных значений X. и Y, поэтому
для практических нужд его величину определяют применительно
к средним уровням зависимой (у) и независимой (Xj) переменных:
_
ях.
_ а.х,
E.—zJ-wnEj-—,
(1
.б)
где у — значение зависимой переменной, вычисленное по уравнению
(1.2) при среднем значении j-ro фактора (х,).
Показателем эффективности изменения факторов-аргументов
в аспекте их влияния на материалоемкость изделий является сум­
ма эластичностей степенной экопометрической модели (1.4):
т
т
16
При одновременном изменении факторов в 8 раз уровень расхода
материалов изменится в сѴ1 раз, т.е. при А > 1 нормы расхода матери­
алов (Г) увеличиваются в среднем в большей степени, чем факторы.
Если А < 1, то Y увеличивается в среднем в меньшей степени, чем
факторы.
При интерпретации уравнения экопомстрической модели мате­
риалоемкости изделий с учетом колеблемости (вариации) незави­
симых переменных используются также (3-коэффициенты (стандар­
тизованные коэффициенты регрессии Р):
Как одному из важнейших этапов моделирования, в работе значи­
тельное внимание уделено основным технологическим элементам
предварительного анализа данных средствами описательной
статистики (блок 3, рис. 1.1).
Каждый технико-экономический параметр, включаемый в эконометрическую модель, проверяется на однородность. Для этого ис­
пользуются одномерные и многомерные статистические процедуры
проверки аномальности наблюдений (блок 2, рис. 1.1).
При анализе выбросов и получении пропущенных (недостаю­
щих) наблюдений временных рядов и пространственных данных
можно использовать одну из четырех программных процедур кор­
ректировки (замена выбросов на новые) или восстановления про­
пущенных наблюдений:
1) вычисление скользящих средних на интервале ряда, определя­
емом критерием Ирвина;
2) интерполяция полиномами;
3) аппроксимация кривыми роста;
4) аппроксимация пространственных данных регрессионной мо­
делью.
2. Компьютерный анализ корреляций и парных регрессий. Изло­
жена методика комплексного компьютерного анализа корреляций и
парных регрессий технико-экономических параметров и уровней
материалоемкости изделий. Приведены процедуры вычисления пар­
ных, частных и множественных корреляций. Построение парных
эконометрических моделей зависимости норм расхода проката чер­
ных металлов от названных параметров осуществлено с использо-
17
ваиием процедуры автоматического выбора «наилучшего» уравнения
из множества заданных, а кроме того, выполнена их классификация
по формам уравнения связи. Исследована гомоскедастичшсть эконометрических моделей и показана технология устранения их гетероскедастичности с применением средств статистических пакетов.
Анализ показал наличие тесных парных корреляционных связей
между технико-экономическими параметрами, которые порождают
проблемы коллинеарности (дублирования) и мультиколлинеарностн при регрессионном анализе. Диалоговое окно* «Корреляционный
анализ» в наглядной и естественной форме позволяет сформиро­
вать отчет по всем видам корреляций с оценкой их существенности.
Матрицы парных, частных и множественных корреляций дают воз­
можность осуществлять предварительный отбор переменных, вклю­
чаемых в модель.
В табл. 2.1 в форме протокола представлены частные и парные
(в скобках) коэффициенты корреляции между зависимой перемен­
ной (нормой расхода проката) и тремя отобранными техпическоэкономическими параметрами изделия, а также между самими пара­
метрами.
Таблица 2.1
Матрица частных корреляций
Переменная
X,
Х2
Хі2
Ѵ=Хю
X,
-0,12 (0,05)
0,35 (0,88)
1,00
0,75 (0,95)
1,00
0,50 (0,18)
0,29 (0,84)
0,75
х2
Х12
-0,12
0,50
1,00
-0,53 (-0,18)
0,29
-0,53
1,00
0,35
Y=XW
Критическое значение на уровне 95% при 4 степенях свободы = +0,2337.
Все частные корреляции для У = Х ю - значимые (> (фишческое).
Частные коэффициенты корреляции используются для ранжиро­
вания фатсторов по степени их связи с результативной переменной,
для их отбора с целью включения в регрессионную модель, установ­
ления последовательности этого включения, определения коэффи­
циентов авторегрессии и т.д.
В монографии рассмотрены особенности различных процедур
вычисления коэффициента множественной корреляции перемен­
ных, включенных в эконометрическую модель, получение его скор­
ректированной величины и оценка значимости по F-критерию.
*3десь и далее речь идет о диалоговых окнах пакета СтатЭксмсрт, рассматриваемых
и монографии при описании компьютерных технологий анализа данных.
18
Удобной и наглядной характеристикой уравнения регрессии
является коэффициент детерминации R2(D), выражающий долю
вариации материалоемкости изделий (результативного призна­
ка) Y, которая объясняется данным уравнением с заданным пабором факторов-аргументов (технико-экономических парамет­
ров).
Протокол результатов определения множественных корреляций
отобранных четырех переменных представлен в виде табл. 2.2.
Таблица 2.2
Множественные корреляции
Переменная
Коэффициент
% точка
/^-распределения
100,00
100,00
100,00
100,00
^значение
X,
0,96
0,96
х2
Х(2
0,64
0,92
У=ХЮ
Число степеней свободы = 4 и 45, Fm,ss)=
140,18
137,92
8,19
62,21
2,61.
В табл. 2.2 коэффициенты множественной корреляции анализи­
руемых переменных образуют вектор из четырех элементов, так как
вычисляется корреляция каждой переменной с тремя остальными:
Rllxxx =0,92, Rxxx
=0,96, Rxxx
=0,96, Rx xx =0,64. В силу
</ г 1 Л 2*12
х х х
І 2 \іУ
'
х х х
2 \ пУ
х
і1х\хіУ
V
тесной связи переменных они имеют высокий уровень мультиколлинеарности и значимости по F-критерию.
В данном случае коэффициент множественной корреляции нормы
расхода проката и выбранных параметров изделий RyXxXlXn =0,92 и
коэффициент детерминации R2 показывают, что включением в ли­
нейное уравнение регрессии трех указанных факторов (Хѵ Х2 и Хп)
на 85% можно объяснить долю дисперсии уровней расхода матери­
алов на изделие (Y) и оно значимо по F-критерию.
По вектору R формируется вектор R2, на основе которого между
собой сравниваются значения коэффициентов детерминации для раз­
личных комбинаций: R2
, R2
, R2
..., R2
.
"•
Х\Хг~Хт'
X2XtX3...Xm'
XjXt...\j_tXjtl...Xm'
і ш .Г,...і г а _,
Из этого сравнения можно определить независимые переменные, вы­
зывающие мультиколлинеарпость. В уравнение регрессии включают­
ся факторы с наименьшим значением R2. При этом проверяется также
19
^-критерий значимости R. Оценка статистической значимости мультиколлинеарпости т факторов, включаемых в экопометрическую модель,
для п наблюдений проводится на основе матрицы парных корреляций
(Р) по фактическому значению критерия %2 (%2р):
xl=n-l--(2m
+ 5)lndetPr,
(2.1)
которое сравнивается с табличным распределением (%т)- Факти­
чески при этом проверяется гипотеза значимости отклонения кор­
реляционной матрицы множества независимых переменных от ор­
тогональной матрицы. Далее можно проверить степень мультиколлинеарности каждого фактора в выбранном множестве независи­
мых переменных.
Разработка эконометрической модели с применением технологии
автоматического выбора «наилучшего» уравнения парной регрес­
сии из множества возможных осуществляется в наглядной и есте­
ственной форме с использованием функции «Парная» диалогово­
го окна «Регрессионный анализ».
На основе базы данных из 51-го наблюдения по каждому из деся­
ти перечисленных технико-экономических параметров построены
парные регрессионные модели материалоемкости изделий
(табл. 2.3). При этом компьютерная технология позволяет сформи­
ровать детализированные протоколы результатов анализа, включая
графики, в рамках выбранной структуры отчета.
В табл. 2.3 среди подмножества отобранных функций иарноіі рег­
рессии с использованием главного параметра Хх лучшие с точки
зрения адекватности характеристики имеет полулогарифмическая
функция, поэтому она выбирается для анализа и прогнозирования
материалоемкости изделий.
Уравнение значимо по F-критерию и адекватно по критерию ра­
венства нулю математического ожидания отклонений регрессии.
Расчетное значение критерия Дарбина-Уотсона d> = 2,07 указывает
на отсутствие автокорреляции остатков регрессии. Подтверждается
также нормальность распределения остатков. Коэффициент элас­
тичности Е j = 0,481 показывает, что при изменении емкости ковша
на 1% уровень нормы расхода проката по экскаваторам изменится в
среднем на 0,481%.
По большинству параметров получены два наилучших уравне­
ния, но их относительные ошибки аппроксимации (е) достаточно
Парные уравнения регрессии норм расхода проката чер
и технико-экономических параметров издел
Параметр
изделия
Вид уравнения регрессии
Расчетное
значение
Р-критерия,
FP
Емкость
ковша,
м3, X,
7 = 8776,15 + 6028,24Х,
175,3
13,96
7 = 15 703,66 + 8499,43 • I n Z ,
236,1
10,10
76,6
9,90
207,6
11,95
7 - -279,96 + 25129.98.Y, -10 747,3Z12+1737,78X13
7 = 14 921,31 -Z,0'535
1
Характеристики у
Относи­
Ко
тельная
циен
ошибка
корр
аппрокси­
(кор
мации,
онно
г, %
шен
Полностью табл. 2.3 приводится в гл. 2 монографии.
21
велики. Это указывает на необходимость использования множе­
ственных уравнении регрессии.
При регрессионном анализе норм расхода материалов достаточ­
но значимые по F-критерию модели можно построить на основе
линейной и двух классов нелинейных функций. К первому клас­
су относятся уравнения регрессии, нелинейные относительно
факторов-аргументов, по линейные относительно определяемых
коэффициентов регрессии. В нашем случае примером таких урав­
нений являются полиномы второй и третьей степени и полулога­
рифмические функции. Второй класс образуют уравнения регрес­
сии, нелинейные по оцениваемым коэффициентам регрессии, к
которым относятся степенная, показательная и экспоненциальная
функции.
Рассмотрена также статистическая оценка по ^-критерию воз­
можности замены нелинейного уравнения регрессии более про­
стым, линейным.
В работе проанализированы тесты оценки стабильности (гомоскедастичности) дисперсии отклонений (о е ) экономстрической моде­
ли. Неустойчивость (гетероскедастичность) остатков показывает на­
личие неодинакового разброса ошибок регрессии (е;) по классам ма­
шин, поэтому возникает необходимость уточнения формы связи
уравнения, включения нового (рактора в экоиометрическую модель
или построения уравнения по более узким классам изделий.
Для проверки постоянства дисперсии использовались специаль­
ные тесты: ранговой корреляции Спирмена, Голдфелда-Квандта,
Уайта и Глейзера.
Для устранения гетероскедастичности экопометрических моде­
лей материалоемкости изделий могут быть использованы процеду­
ры тестов Уайта и Глейзера. В монографии описана компьютерная
процедура устранения гетероскедастичности для конкретной эконометрической модели с использованием теста Глейзера.
3. Компьютерные технологии построения многофакторных
экопометрических моделей. В данной главе сформулированы и
систематизированы методологические основы разработки компью­
терных многофакторных линейных и нелинейных экопометричес­
ких моделей материалоемкости изделий и удельного расхода мате­
риалов. При построении многофакторной эконометрической моде-
22
ли одной из наиболее существенных проблем является проблема
мультиколлинеарности. Она обусловливает задачу отсева и выбо­
ра из множества предварительно отобраттиых факторов наиболее
значимых для окончательного их включения в уравнение множе­
ственной регрессии (блоки 7, 8, 9, рис. 1.1).
Для решения задачи отсева применяются компьютерные проце­
дуры пошагового регрессионного анализа с использованием ^-кри­
терия значимости коэффициентов регрессии, частного F-критерия
включения на основе прироста факторной дисперсии, F-включения
и F-исключения по частным коэффициентам корреляции, F-критерия остановки с учетом изменения коэффициента детерминации.
Оценка значимости коэффициента регрессии проводится в авто­
матическом режиме путем сопоставления расчетного значения
^-критерия (г а .) или F-критерия (Fa) с его табличным значением
(tT) или (FT) для заданного уровня значимости/? = 0,05 или/? = 0,01.
Вначале t (F„.) ранжируются, затем исключается фактор с наи­
меньшим значением данного критерия, и расчеты по вычислению
коэффициентов регрессии повторяются (блоки 7, 8,9, рис. 1.1).
Такие последовательные исключения по ранжированным
I taj I (Fa)) выполняются до тех пор, пока все коэффициенты регрес­
сии в уравнении не окажутся значимыми. Кроме того, направление
действия факторов-аргументов (А^.) не должно противоречить логи­
ке их технико-экономического влияния на результативный признак
(У) (блок 11, рис. 1.1).
При решении задачи включения переменной в модель использу­
ется фактическое значение частного F-критерия, являющегося ме­
рой оценки ввода фактора X. в модель (F )•
Для упрощения работы в программах по умолчанию задаются
конкретные величины F-включения и ^-исключения с таким расче­
том, чтобы значение первой величины было больше второй. Напри­
мер, величина F-включения равна 3, а величина F-исключения
обычно составляет 2. Пользователь может определить и другие зна­
чения этих критериев. Перечисленные критерии дают примерно
одинаковый результат.
В работе используется реализованная в статистических пакетах
СтатЭксперт и VSTAT упрощенная процедура включения фактора
в модель, основанная на относительном уменьшении суммы квад-
23
ратов отклонений остатков уравнения регрессии (5^ ), с учетом
("^осто)) и без учета включения к имеющимся / независимым пере­
менным j-ro анализируемого фактора (^„„^)'J
r
OCT(Q
C
J=
J
J
OCTO)
Г2
•
(3.1)
OOT(/)
Процедура использует сравнение величин С. с некоторой кон­
стантой отбора (/г), задаваемой пользователем (к = 0-ьО, 1). Перемен­
ная вводится в модель, если выполняется условие С. > к (например,
k = 0,05 означает уменьшение 5^.т на 5% при вводе фактора в мо­
дель). Одновременно с вводом новых факторов в модель вычисля­
ются ^-критерии значимости коэффициентов регрессии (^.) при
всех независимых переменных уравнения, что также позволяет
контролировать значимость факторов.
В монографии проанализированы конкретные задачи построения
адекватных многофакторных эконометрических моделей материа­
лоемкости изделий с помощью статистических пакетов. Технологи­
ческие цепочки многофакторного регрессионного анализа в ППП
СтатЭксперт и VSTAT реализуются посредством диалогового окна
«Регрессионный анализ» активизацией функций «Пошаговая» и
«Линейная». При этом диалог формирования структуры отчета
осуществляется в простой, доступпоіі и естественной форме.
В связи с большими возможностями статистических пакетов по
анализу различных комбинаций факторов, автоматическому выбору
вида уравнения регрессии из заданного множества и оценке значимо­
сти его независимых переменных подбор «наилучшего» набора факто­
ров регрессионной модели может быть реализован в упрощенном ва­
рианте случайного поиска с использованием расчетного значения
F-критерия остановки (F), основанного на изменении коэффициента
детерминации при переходе от одного множества факторов к другому:
р
/_/ г ' і_д2 ; -
(3.2)
где R, — множественный коэффициент корреляции между 7и все­
ми / факторами;
R h — множественный коэффициент корреляции между У и все­
ми Іг факторами на некотором промежуточном шаге (/г < /).
24
Если F < Fr (p, l-h, n - 1 - 1), то множество факторов h на дан­
ном шаге обеспечивает такую же адекватность модели, как и «наи­
лучший» набор /, поэтому нет необходимости ее усложнения допол­
нительными факторами.
В задачах, разобранных в монографии по 20 линейным моделям
материалоемкости изделий, проводится подробный анализ ото­
бранных факторов «наилучшего» уравнения на основе значимости
изменения R2 по F-критерию остановки (3.2) с целью получения
моделей с меньшим количеством независимых переменных.
При интерпретации эконометрических моделей материалоемкости
изделий осуществляется как частный, так и комплексный анализ фак­
торов. Частный анализ предполагает использование частных уравне­
ний регрессии. При частном анализе на неизменном среднем уровне
закрепляются факторы (Х}), включенные в частное уравнение рег­
рессии, кроме одной анализируемой независимой переменной (Х;):
^
f
т
= йо + Е « ; -Хі
+а Х
Гк
/= 1
- 2,..., т, Ы).
(3.3)
т
Используя выражение С = а0 +^Г ОуХ^., данное уравнение можно
Н
представить в виде:
Yx, = Cl+a,X„l = l,2,...,m.
(3.4)
Из частных уравнений (3.4) вытекает, что эффекты влияния дру­
гих факторов приплюсованы в них к свободному члену уравнения
множественной регрессии (С;).
На базе частных уравнений регрессии вычисляются частные ко­
эффициенты эластичности расхода материалов для отдельных
классов изделий:
1 ч = а ,-хД.
(3.5)
Частные уравнения множественной регрессии, включая графики,
можно проанализировать так же, как и уравнения парной регрессии.
Для комплексной оценки относительного влияния технико-эко­
номических параметров на материалоемкость изделий используют­
ся такие характеристики модели, как средние коэффициенты элас-
25
тичности расхода материалов по каждому j-uy фактору (£,-), р-коэффициснты аргументов (р.), частные коэффициенты детерминации
переменных (d). При этом применяется процедура ранжирования
этих характеристик по факторам, подробно рассмотренная
в монографии.
В работе также показано построение нелинейных эконометрических
моделей материалоемкости изделий — степенных (1.4) и полулога­
рифмических (1.5) с применением технологий, заложенных в СПО.
Как правило, при этом подключается компьютерная процедура лине­
аризации, в том числе с помощью замены переменных. Способы их
решения с использованием компьютерных технологии, а также возни­
кающие при этом проблемы подробно рассмотрены в монографии.
4. Компьютерные технологии многомерного анализа статисти­
ческих данных. В данном разделе эконометрического моделирова­
ния отражены теоретические основы и практические вопросы изу­
чения техннко-эконометрических параметров изделий с использо­
ванием таких методов многомерного анализа, как анализ выбросов,
кластерный и дискрнминантный анализ для классификации объек­
тов, оценка равенства векторов средних двух групп при определении
качества классификации, компонентный и факторныіі анализ с це­
лью получения обобщающих некоррелированных признаков и сжа­
тия исходной матрицы данных без потери информации, а также по­
строения регрессии материалоемкости изделий па главные компо­
ненты и обобщающие факторы.
Методы многомерного анализа данных позволяют получать
обобщающие статистические выводы применительно ко всей сово­
купности переменных.
Многомерный анализ выбросов при построении эконометрических
моделей дает возможность выявить нетипичные для изучаемой сово­
купности соотношения между значениями разных переменных (фак­
торов), что невозможно сделать при одномерном анализе выбросов.
Используется алгоритм процедуры многомерного анализа выбросов
(блок 2, рис. 1.1), основанный на определении расстояния Махаланобиса (Df ) между анализируемым на аномальность вектором X. и век­
торами средних остальных переменных (X) применительно к слу­
чайной выборкетпеременных
(Xх,Хі2,...,Хіт)объемап(/=1,2,...,п)
26
и ковариационной матрице (S) по всем k = n-\ векторам, исключая
указанный вектор X:.
D?=(Xi-X)'S-1-(Xi-X).
(4.1)
Выброс считается аномальным, если фактическое значение F-статнстики (F.) превышает ее табличное (критическое) значение FT(p, т, к);
(k-m)-k 2
*' (А»-1).и ' '
<4"2>
Описанный алгоритм процедуры повторяется для выборки из
оставшихся к - 1 наблюдений, начиная с вектора с наибольшим
значением D.. Выбросы проверяются также на предмет ошибки под­
готовки данных, группировки и т.д.
При объединении однородных наблюдений в группу (кластер) по
сходству признаков используется кластерный анализ, который яв­
ляется средством многомерной классификации наблюдений с уче­
том значений всех признаков одновременно.
Технологическая цепочка компьютерной реализации задач класси­
фикации объектов на основе кластерного анализа строится с исполь­
зованием диалогового окна «Кластерный анализ», которое в есте­
ственной и наглядной форме содержит необходимую информацию
для организации решения задач. В монографии подробно рассмотре­
ны технологии решения задач кластеризации технико-экономичес­
ких параметров изделий с использованием статистических пакетов.
При многомерном анализе с целью оценки значимости отличия
друг от друга выделенных k групп переменных проводится провер­
ка гипотезы о равенстве двух векторов средних переменных (Xk)
рассматриваемых кластеров. В данном случае используется много­
мерный аналог ^-критерия Стьюдента — ^-статистика Хотеллинга
для двух выборок из и, и п., наблюдений (предполагается, что слу­
чайный вектор Xk имеет нормальное распределение). В работе рас­
смотрена методика оценки значимости выделенных кластеров
с помощью данного критерия.
Если гипотеза о равенстве векторов средних выделенных класте­
ров технико-экономических параметров подтверждается, то это
позволяет выполнить эконометрическое моделирование для всей
совокупности в целом. В противном случае эконометрические мо­
дели строятся для каждого кластера отдельно.
27
Дискримітаптпый анализ, в отличие от кластерного, позволяет
разбить совокупности наблюдений (изделий) на несколько одно­
родных групп по значениям выбранных признаков (технико-эконо­
мических показателей), используя принципы оптимизации.
В работе разбиение объектов на группы осуществляется по алго­
ритмам статистических пакетов, которые определяют каждому k-uy
множеству Pk в рамках его днскримииаитпых переменных Ху свою
линейную дискримииаитпую функцию с вектором коэффициентов
дискриминации Ak и свободным членом Су
fk=aHXki+ak2Xk2
+
... + Xkm+Ck,k = l,2,...,K.
(4.3)
Процедура отнесения наблюдения Z (z,, z,,..., zm) к одной из групп
Рк состоит в определении множества, для которого величина дискриминантной функции jk (4.3) с переменными Z имеет максималь­
ное значение, т.е. анализируемое наблюдение Z относится к множе­
ству Рк, имеющему наибольшее значение fk.
В технологической цепочке компьютерного дискриминантиого
анализа используется диалоговое окно «Дискриминантный ана­
лиз», которое в простой и наглядной форме содержит необходимую
информацию для организации решения задач.
Протокол (отчет) дискриминантиого анализа включает результа­
ты классификации наблюдений, которые отражают перегруппиров­
ку исходных данных и отнесение новых данных к соответствующей
группе классификации с учетом значений их дискриминантных
функций fk (4.3).
В монографии рассмотрены технологии дискриминантиого ана­
лиза при классификации технико-экономических параметров изде­
лий по группам с применением статистических пакетов. При эконометрическом моделировании, как правило, уравнения регрессии,
построенные для выделенных на основе кластерного и дискрими­
нантиого анализа групп классификации, имеют более точные пред­
сказательные возможности в рамках этих групп.
В многомерном анализе технико-эконометрических параметров
важное место принадлежит факторному анализу, позволяющему на
основе существующих статистических связей переменных (призна­
ков) выявить интегрированные обобщающие (латентные) характе­
ристики развития изучаемого явления и ранжировать факторы по
28
их вкладу в вариацию исходной статистической совокупности (блок
5, рис. 1.1).
В работе используется реализованная в СПО процедура выделе­
ния обобщающих характеристик исходной совокупности методом
главных компонент, представляющих собой некоррелированные
нормированные линейные комбинации факторов У, с максимально
возможными дисперсиями:
т
Y, =аІІХ1 +а21Х2 +... + ат1Хт = ^алХР
1 = 1, 2,..., т.
(4.4)
Здесь по первичным переменным X определяются коэффициен­
ты a.jуравнений главных компонент (У,), выражающие вклад каж­
дой переменной X в главную компоненту У;. При анализе собствент
ное значение ^ / = ^ « y / , соответствующее главной компоненте Yr
j=\
объясняет на Х1 / т • 100 процентов общую дисперсию исходной со­
вокупности технико-экономических параметров изделий.
В монографии проведен компьютерный компонентный анализ
десяти перечисленных технико-экономических параметров изде­
лий (Хх-Х9, Х12), дана интерпретация результатов выделения глав­
ных компонент (У,-^,,), построены адекватные уравнения регрес­
сии материалоемкости изделий для первых двух (Yv У,) и первых
трех (У,, У2, У3) главных компонент.
В статистических пакетах, наряду с методом главных компонент,
важное значение придается факторному анализу. При использова­
нии методов факторного анализа дисперсия исходных переменных
объясняется не в полном объеме, как в компонентном анализе, так
как здесь более реалистично предполагается, что часть дисперсии
остается нераспознанной из-за влияния скрытых специфических
(характерных) факторов (D).
При многомерном анализе технико-экономических параметров
изделий данный подход приоритетен, поскольку факторный анализ
позволяет преобразовать исходные переменные (X.) к новым некор­
релированным обобщающим факторам (і7,), число которых значи­
тельно меньше первоначально заданных, а исходная ковариацион­
ная или корреляционная матрица воспроизводится с достаточной
степенью точности.
29
Используемая п работе модель факторного анализа имеет вид:
Xj = anF{ + aj2F2 + aj3F3+... + ajrFr + D- =
= f,aj(F(+Dj,
/ = 1,2,...,/и.
(4.5)
t=i
Здесь по первичным переменным Х. определяются коэффициенты
о7при обобщающих факторах Fp выражающие факторные нагрузки
для технико-экономических параметров X..
В работе используются классические подходы к интерпретации
результатов факторного анализа. В частности, величина общности
г
1-, afl (J = ' ^' -' т>) применяется для оценки доли общей дисы
персии исходной переменной (технико-экономического параметра)
X, которая поддается объяснению через обобщающие факторы.
Собственное значение исходной матрицы (Х;), соответствующее
обобщающему фактору Fr объясняет долю общсіі дисперсии исход­
ных переменных, с помощью характерности dj =l-hj, / = 1, 2, ..., т,
устанавливается доля дисперсии переменной (технического пара­
метра изделия) X., не поддающаяся объяснению обобщающими
факторами.
і
=
Определяются также индивидуальные значения обобщающих
факторов (Fj) для построения уравнения регрессии норм расхода
материалов па главные факторы.
В статистических пакетах СтатЭкспсрт и VSTAT с помощью диа­
логового окна «Факторный и компонентный анализ» можно вывести
одновременно результаты компонентного и факторного анализа.
В работе продемонстрирована реализация процедур данных алго­
ритмов факторного анализа. Получены адекватные регрессионные
модели материалоемкости изделий с малым количеством факторов,
органически связанных со всей первоначальной совокупностью
технико-экономических параметров, которые вследствие этого об­
ладают математической простотой и надежностью.
5. Адаптация экоіюметрических моделей. При использовании
эконометрических моделей материалоемкости изделий, построен­
ных на основе пространственно-временных совокупностей' наблю­
дений, возникает задача их адаптации, т.е. приспособления к изме-
30
нягощимся под влиянием научно-технического прогресса условиям
производства, как во времени, так и в пространстве.
В процессе адаптации эконометрических моделей материалоем­
кости изделий в работе решаются следующие задачи:
• определение временной и пространственной устойчивости ко­
эффициентов регрессии;
• построение эконометрических моделей с применением гребне­
вой регрессии и системы структурных одновременных уравнений
для повышения их адекватности, устойчивого оценивания парамет­
ров регрессии и снижения эффекта мультиколлинеарности;
• устранение коллинеарности и мультиколлинеарности исходных
факторов на основе процедур компонентного и факторного анализа
с выявлением некоррелированных обобщающих (главных) факто­
ров и построение регрессии зависимой переменной на обобщающие
факторы;
• оценка целесообразности дополнительного включения фактора
времени t в регрессионные модели в целях снижения автокорреля­
ции остатков;
• определение временной структуры связей отобранных факто­
ров (технико-экономических параметров) и зависимой переменной
(норм расхода проката) и построение на этой основе динамических
регрессионных моделей материалоемкости изделий;
• применение специальных процедур адаптации моделей прогно­
за, разрабатываемых по данным временных рядов, т.е. построение
адаптивных моделей рядов динамики.
Для уравнения регрессии, полученного на основе временных ря­
дов норм расхода материалов по определенным маркам изделий,
важна временная устойчивость, свидетельствующая о наличии по­
стоянной зависимости между уровнями норм расхода материалов
и технико-экономическими параметрами данной марки изделий за
рассматриваемый период времени.
В случае уравнения регрессии, полученного на основе обобщения
технико-экоиомстрических параметров марок изделий разного
класса с различными типоразмерами и являющегося характеристи­
кой усредненной нормы расхода материалов, существенное значе­
ние имеет пространственная устойчивость коэффициентов регрес­
сии. Она свидетельствует о том, что уравнение регрессии отражает
однородную совокупность моделей изделия и может быть исполь-
31
зовапо применительно к каждоіі модели изделия рассматриваемых
классов.
Устойчивость коэффициентов регрессии проверяется но статис­
тическому тесту на основе испытаний значимости различий в пара­
метрах уравнений связи, построенных для отдельных частей сово­
купности наблюдений.
Нулевая гипотеза Я0 предполагает равенство между собой коэф­
фициентов регрессии каждоіі исследуемой группы (структурная
стабильность коэффициентов уравнений но группам). Алгоритм
теста предусматривает получение суммы квадратов отклонений
остатков уравнений регрессии по всем п наблюдениям и выделен­
ным к группам и определение па этой основе фактического значе­
ния f-критерия для проверки данной гипотезы.
При эконометрическом моделировании материалоемкости изде­
лий в условиях сильной коррелированности между собой факто­
ров-аргументов и их мультиколлинеарности в технологической
цепочке анализа данных предусмотрено использование процедуры
гребневой регрессии, осуществляемой с помощью функции «Гребне­
вая» диалогового окна «Регрессионный анализ».
В статистических пакетах реализован алгоритм построения однопараметрической гребневой оценки регрессии А(/е):
A(k) = (X'X + kDylX'Y,k>0,
(5.1)
где к — параметр регуляризации;
D — матрица регуляризации, в качестве которой может быть
выбрана единичная матрица (Е) или диагональная матрица, со­
ставленная из диагональных элементов матрицы Х'Х.
Процедуры гребневой регрессии па основе среднекізадратической
ошибки коэффициента регрессии позволяют вычислить относи­
тельно устойчивые оценки параметров. В работе показаны вариан­
ты построения уравнений гребневой регрессии материалоемкости
изделий при различных значениях параметра регуляризации к.
Существует подход, согласно которому главноіі причиной появ­
ления автокорреляции случайных отклонений (et) является нали­
чие тренда в пространственно-временных рядах Yt и Хг. линейной
регрессионной модели, которую можно устранить дополнительным
вводом в модель фактора времени t Причем логические построения
32
матсматико-статистических подходов дает обоснование данной ре­
комендации.
Однако исследования эконометрических моделей материалоем­
кости изделий с дополнительным фактором времени t показали, что
это не дает улучшений статистических характеристик уравнения
регрессии.
Как известно, при разработке эконометрических моделей предпола­
гается, что факторы-аргументы можно изменять независимо друг от
друга. Вместе с тем при анализе материалоемкости изделий данное
требование практически труднодостижимо, так как изменение конк­
ретной переменной влечет за собой соответствующие изменения во
всей системе взаимосвязанных признаков (технико-экономических
параметров) изделий. В связи с этим возникает проблема описания
структуры связей между анализируемыми технико-экономическими
параметрами системой совместных одновременных уравнений.
Для построения системы совместных одновременных уравнений
материалоемкости изделий применяются реализованные в статис­
тических пакетах процедуры двухшагового метода наименьших
квадратов, предназначенные для оценки параметров структурных
моделей. В частности, структурные уравнения в векторпо-матричной записи можно представить в виде:
Ук=У{-Ь + Х^а + £, k = \, 2,...,
(5.2)
где Yk — вектор зависимых (внешних эндогенных) факторов &-го
уравнения;
У, — вектор эндогенных переменных в правой части уравнений.
В его состав не входит вектор Yk;
Xt — матрица экзогенных (внутренних) факторов (техникоэкопомстрических параметров), входящих в уравнения;
а, Ь — векторы параметров, подлежащих определению;
е — вектор отклонений остатков (ошибок).
Приведенную модель можно задать, выразив вектор эндогенных
переменных Yl через экзогенные факторы X:
'Y1=[XvXi]-d
+ v = X-d + v,
(5.3)
где Х2 — множество экзогенных факторов, не входящее в исходное
структурное уравнение и используемое для получения иденти­
фицируемого или сверхидентифицируемого уравнения;
33
Ar = [ Xv X2 ] — матрица, получаемая путем присоединения мат­
рицы Х2 к матрице Х{;
d — вектор коэффициентов приведенных уравнений, подлежа­
щий определению;
ѵ — вектор отклонений остатков (ошибок).
В работе показана компьютерная технология построения различ­
ных систем совместных одновременных уравнений материалоемко­
сти изделий с выделением эндогенных и экзогенных переменных на
основе процедур двухшагового метода наименьших квадратов.
Компьютерные технологии построения эконометрических моде­
лей имеют широкие возможности их адаптации.
6. Компьютерная технология предварительного анализа, анали­
тического выравнивания и прогнозирования уровней временных
рядов. В данной главе рассматриваются методические аспекты
компьютерной технологии статистической обработки и прогнози­
рования временных рядов материалоемкости изделий на основе
моделей кривых роста.
При использовании статистических методов исследования времен­
ных рядов предполагается возможность их представления посред­
ством функции/(£), отражающей закономерную долговременную (си­
стематическую, основную) тенденцию (тренд) развития уровней ряда.
Идея прогнозирования материалоемкости изделий, как и других
экономических явлений и процессов по эконометрическим моделям
временных рядов, основана на предположении, что закономерности
развития, характерные для прошлого и настоящего, будут сохранять­
ся и в прогнозируемом периоде. Рассматриваются экстраполяция
развития явления на будущий период, т.е. перспективный прогноз,
и экстраполяция явления в прошлое — ретроспективный прогноз.
Определение качества прогноза является достаточно сложной
задачей, поскольку ее необходимо решить, когда период еще не за­
кончился и фактические значения прогнозируемого показателя
неизвестны. В условиях подобной неопределенности прогнозиро­
вание выполняется для некоторого времени в прошлом, для кото­
рого известны фактические величины прогнозируемого показателя.
Используя данный подход, в работе на основе ретропрогпоза пред­
варительно оценивается точность модели прогноза.
34
Построение моделей экстраполяциошюго прогноза по временным
рядам осуществляется по технологии, включающей ряд этапов,
обобщенная схема которых представлена на рис. 6.1.
Подготовка исходных данных, как и для других процедур анализа,
выполняется в виде таблицы Excel (блок 1, рис. 6.1). Анализ времен­
ных рядов начинается с оценок исходных данных (блок 2, рис. 6.1).
Технология построения моделей прогноза по временным рядам
в пакетах СтатЭскпсрт и VSTAT поддерживается с помощью диа­
логовых окон «Обработка временных рядов», «Построение моде­
лей и прогнозирование», «Формирование набора моделей» и др.,
в которых информация, необходимая для пользователя, системати­
зирована в удобной и естественной форме.
Для статистической оценки наличия тренда в ППП применяют­
ся метод Фостера-Стыоарта и метод средних.
Проверка статистической однородности наблюдений осуществляет­
ся методом Ирвина. При наличии подозрительных, резко выделяю­
щихся наблюдений программа выдает запрос па их устранение путем
замены фактических наблюдений на расчетные. Кроме того, могут
быть использованы процедуры восстановления пропущенных данных.
По завершении запросов по всем аномальным наблюдениям ре­
зультаты обработки временного ряда отражаются в протоколе пред­
варительного анализа ряда, который содержит семь таблиц. Прото­
кол включает базисные, цепные и средние характеристики динами­
ки, результаты проверки гипотезы об отсутствии тренда и однород­
ности данных, автокорреляционную (АКФ) и частную автокорре­
ляционную (ЧАКФ) функции и их критические уровни.
С использованием данной технологии были предварительно про­
анализированы временные ряды норм расхода проката черных ме­
таллов на изделия (экскаваторы) различных классов за 25-летний
период. Общей закономерностью является то, что нормы расхода
из года в год снижаются под влиянием факторов научно-техническо­
го прогресса (инноваций). Темпы снижения норм расхода материа­
лов в течение ряда лет замедляются при переходе к производству из­
делий новой модификации и освоении технологии их изготовления.
Основной проблемой при решении задачи аналитического вы­
равнивания временных рядов является выбор конкретной аналити­
ческой формулы, задающей тенденцию, функции/(f) из множества
возможных, так как от этого выбора зависит качество модели, кото-
35
1. Постановка задачи и подбор
исходной информации для
формирования временного ряда
2. Предварительный анализ
данных временного ряда
3. Выдвижение гипотезы о виде
моделей прогноза из множества
возможных (кривых роста,
адаптивных, авторегрессионных и др.)
• Проверка соблюдения требований
к исходным данным (однородность,
сопоставимость, устойчивость,
достаточность)
• Выявление аномальных данных
• Построение графика ряда
• Определение статистических
характеристик динамического ряда
• Оценка автокорреляционной, частной
автокорреляционной и взаимнокорреляционной функций ряда
• Проверка наличия тренда
• Предварительное сглаживание ряда
методом скользящего среднего
4. Построение моделей и численное
оценивание их параметров
6. Выбор лучших моделей
по критерию дисперсии остаточных
отклонений уравнения
• Равенство нулю математического
ожидания остатков
• Стабильность дисперсии остатков
• Независимость остатков
(отсутствие автокорреляции
остатков)
• Случайный характер остатков
-j • Нормальность распределения
остатков
• Существенность уравнения
по F-критерию
• Уровень коэффициента
детерминации
• Уровень относительной ошибки
аппроксимации
7. Получение точечного и интервального
прогнозов(ретропрогнозов)
8. Содержательный комментарий
(интерпретация) результатов
решения задачи
Верификация моделей на участках
аппроксимации и ретропрогноза
для выбора модели прогноза
Рис. 6.1. Обобщенная схема технологии построения
моделей прогноза по временным рядам
36
рое в статистических пакетах оценивается по критериям (показате­
лям), указанным в блоке 5 (рис. 6.1).
При моделировании экономических процессов имеется в виду
не адекватность вообще, а те свойства, которые принято считать су­
щественными для исследования.
С использованием в технологической цепочке диалогового окна
«Формирование набора моделей» осуществляется выбор наилуч­
шей из 16 заданных кривых роста по критерию минимального зна­
чения дисперсии остатков. После выполнения двух этапов предва­
рительного анализа данных осуществляется аналитическое вырав­
нивание и прогнозирование уровней временных рядов на основе
выбранной кривой роста (см. рис. 6.1).
Диалоговое окно «Построение моделей и прогнозирование» обес­
печивает выполнение функции прогноза и ретропрогноза. Для про­
гнозируемой величины строится доверительный интервал с задан­
ным уровнем значимости.
С учетом специфики динамики материалоемкости изделий для
аппроксимации и прогноза (ретропрогноза) норм расхода проката
на изделие наиболее адекватными из множества заданных по кри­
терию минимума дисперсии остатков (о^ т ) оказались кривые ро­
ста формы параболы второго порядка и показательной функции.
Характерными в этом плане являются результаты компьютерной
аппроксимации (аналитического выравнивания) и ретропрогноза
с упреждением на три года норм расхода проката черных металлов
на широко распространенную модель изделия с емкостью ковша
1,2 м3 по данным временного ряда за 28-летний период (рис. 6.2).
В качестве исходной базы прогноза выступают первые 25 наблюде­
ний ряда (£=1,2,..., 25). Последующие наблюдения за три года (г/2С,
У21 И У2») ЯВЛЯЮТСЯ КОНТРОЛЬНЫМИ.
Получено уравнение параболы с тенденцией второго порядка, адек­
ватное по F-критерию (F = 33,3) и критерию равенства нулю матема­
тического ожидания остатков ( 8 = -0,021), случайности и нормально­
сти распределения остатков. Критерий Дарбина-Уотсона d t = 1,24 дает
неопределенный результат оценки автокорреляции остатков.
Средний модуль ошибки ретропрогноза составляет 2,6%. Факти­
ческие уровни норм расхода проката попадают в доверительный
интервал с вероятностью 0,8.
Компьютерные технологии дают широкие возможности анализа
временных рядов и построения эконометрических моделей прогно­
за на основе кривых роста.
37
Параметры выбранной модели
Щ=+22389.154-387.093V+6.361 Г /
аі
22389.154
&
-387.093
а3
6.361
Таблица остатков
Характеристики остатков
Таблица ретропрогнозов (р = 80%)
Упреждение
1
2
3
ж
Прогноз
16 880.000
16 997.000
17 207.000
16 624.939
16 574.992
16 537.768
Нижняя
граница
15 765.532
15 573.680
15 380.725
Верхняя
Абс.
Отн.
граница откп-ние откл-ние
17 484.348 255.061
1.511
17 576.305 422.008
2.483
17 694.811 669232
3.889
Таблица характеристик ретропрогнозов
Характеристика
Среднее значение
Среднеквадратическое отклонение
Средний модуль ошибки
Минимальное отклонение
Максимальное отклонение
Абсолют
значение
448.767
170.140
448.767
255.061
669.232
Относит.
значение(%)
2.628
0.976
2.628
1.511
3.889
Аппроксимация и ретропрогноз
23
Рис. 6.2. Аппроксимация и ретропрогноз
норм расхода проката на изделие
і—г
25 1 2 3
38
7. Адаптивные модели прогнозирования уровней рядов динами­
ки и их компьютерная реализация. Исследования, проведенные
в работе, показали, что применение специальных процедур адапта­
ции моделей прогноза временных рядов материалоемкости изде­
лий, основанных на методах Брауна, Хольта, авторегрессии, авто­
регрессии — скользящего среднего, обобщенной линейной модели,
дает достаточно точные результаты краткосрочного и среднесроч­
ного рстропрогпоза норм расхода материалов на изделия. В соста­
ве прикладных статистических пакетов СтатЭксперт и VSTAT важ­
ное место занимают модули программ указанных методов. Удобное
графическое меню и детализированные протоколы решения задач
создают хорошую базу для компьютерного анализа данных и эконометрического моделирования.
В процессе краткосрочного и среднесрочного прогнозирования
экономических показателей, в частности материалоемкости изде­
лий, при изменении внешних условий, когда наиболее важными
с точки зрения предсказания становятся уровни рядов динамики
последних лет, а не инерционность развития явления, применяются
специальные адаптивные методы, улавливающие и учитывающие
подобную неравноценность данных временных рядов.
В алгоритмах процедур адаптивных моделей заложены схемы по­
стоянного пошагового сопоставления оценок ретропрогноза, получен­
ных на основе модели, с фактическими уровнями ряда и корректиров­
ки параметров модели в соответствии с имеющимися расхождениями.
Таким образом, адаптивная модель постоянно поглощает новую ин­
формацию и реагирует на изменения уровней ряда, приспосабливаясь
к ним, и к концу периода обучения отражает динамику развития эко­
номического процесса, существующую в данный момент.
Рассматриваемые модели в основном базируются на двух схемах
вычислений — скользящего среднего (СС-модели) и авторегрессии
(АР-модсли). Технология построения адаптивных моделей прогно­
за временных рядов выполняется по схеме, приведенной на рис. 6.1.
Линейная модель Хольта и ее частный вариант — модель Брауна для
прогноза уровня ряда в момент времени t на k шагов вперед (yt+k)
имеет вид:
yt+k=At+Bt-k,
к = 1,2,..., £ = 0,1,2
п,
(7.1)
где At, В{ — оценки текущего t-ro уровня и прироста ряда.
39
Па основе найденных отклонений (ошибок прогноза) ^выполня­
ется корректировка параметров А и В моделей Брауна и Хольта
соответственно по схемам:
At=At_l+Bt_^(\-^)-zt;B^Bt_i+a.2-zt,
(7.2)
At =At_l+Bc_l+al-Et;
(7.3)
Bt =Bt_l+al-a2-Er,
где (З — коэффициент дисконтирования данных, изменяющийся
в интервале от 0 до 1, характеризует степень обесценения дан­
ных за единицу времени;
а — коэффициент сглаживания, а = 1 - Р;
а,, а2 — коэффициенты сглаживания (адаптации), изменяющи­
еся в интервале от 0 до 1.
Значения коэффициентов fS, а, и а определяются с использова­
нием итерационных процедур путем многократного построения
.модели при их различных значениях и выбора наилучшей из них по
критерию минимума дисперсии остатков уравнения.
При компьютерном построении адаптивных моделей прогноза
временных рядов используются диалоговые окна «Построение мо­
делей и прогнозирование» и «Выбор адаптивной модели».
В работе подробно рассмотрены компьютерные технологии пост­
роения моделей Хольта и Брауна для аппроксимации и ретроирогноза временных рядов материалоемкости изделий. В этом контек­
сте типичным является представленный на рис. 7.1 фрагмент фор­
мируемого пакетом VSTAT протокола аппроксимации и ретропрогноза временного ряда норм расхода проката на изделие по данным
за 14 лет с упреждением на три года по модели Брауна.
Структура компьютерного протокола характеристик остатков
отражает полный комплекс оценок параметров и гипотез адекват­
ности эконометрической модели, состоящий из 15 показателей.
В целом получена достаточно адекватная и точная модель прогно­
за, средний модуль ошибки которой составляет 0,33%. Две гипоте­
зы (о гетероскедастичности и случайности) не получили своего
подтверждения.
В работе также исследуются задачи построения авторегрессион­
ных моделей (АР-моделей) материалоемкости изделий. Как изве­
стно, АР-модели широко используются для описания стационарных
случайных процессов. Согласно схеме авторегрессии порядка т,
40
текущий уровень ряда представляется в виде взвешенной суммы т
предыдущих наблюдений:
Уі =а1 -Vt-i
+а
2 -Vt-2
+а
3 -Vt-Ъ +-
+ а
т -Vt-m +£t>
t = 2,3,...,n.
(7.4)
Хотя ЛР-модели, вообще говоря, не предназначены для описания
процессов с тенденцией (трендом), вместе с тем они достаточно точно
и гибко отображают колебания уровней ряда, что является весьма важ­
ным для описания развития неустойчивых экономических процессов.
Кроме того, здесь учитывается такое важное свойство рядов экономи­
ческих явлений, как взаимозависимость уровней одного и того же ряда
друг от друга, т.е. от достигнутого уровня в предшествующий период.
АР-модели на первом этапе формируют стационарный ряд, ис­
ключая при необходимости тенденцию, путем перехода от исходно­
го ряда к ряду разностей соседних значений членов ряда. Провер­
ка необходимости перехода от исходного ряда к разностному осу­
ществляется с помощью критерия Дики-Фуллера.
Предварительный анализ временных рядов материалоемкости
изделий показал, что его автокорреляционная функция имеет вид
экспоненциально затухающий, что характерно для авторегрессионных процессов. В частной автокорреляционной функции статисти­
чески значим коэффициент только для первого лага. По остальным
лагам наблюдается резкое падение абсолютных величин частных
коэффициентов автокорреляции, что, в свою очередь, свидетель­
ствует о возможности описания исходного временного ряда авто­
регрессионной моделью первого порядка.
Как показали исследования динамики материалоемкости изделий,
для экономичной параметризации иногда целесообразно совместно
включить в модель члены, описывающие авторегрессию, и члены,
моделирующие скользящее среднее, которые, как известно, образуют
смешанный процесс авторегрессии — скользящею среднего (АРСС).
В случае, когда коэффициенты автокорреляции существенно от­
личаются от нуля при больших лагах, возможно описание ряда ди­
намики моделью авторегрессии — скользящего среднего:
Р
Я
« = 2,3,..., я, - 1 < а . < + 1 и - 1 < 6 . < + 1 .
(7-5)
Модель
а\
Метод Брауна (+0.200)
0.20
Характеристики остатков
Характеристика
Среднее значение
Дисперсия
Приведенная дисперсия
Средний модуль остатков
Относительная ошибка
Критерий Дарбина-Уотсона
Коэффициент детерминации
Р-значение(Ш =1,п2 = 9)
Асимметрия
Эксцесс
Гипотеза о среднем
Гипотеза о гетероскедастичности
Ги потеза о случай ности
Гипотеза о нормальности
Гипотеза о независимости
Значение
25.23
10 71525
13 87452
82.00
025
1.86
0.83
4258
-0.34
0.03
0.00
1.00
1.00
0.00
0.00
Таблица ретропрогнозов (р = 90%)
Упреж­
Нижняя
Прогноз
Факт
дение
граница
1
31 895.40
31 960.04 31 723.61
2
31 895.40
31 946.34 31 700.26
31 735.80
31 932.65 31 675.87
3
Верхняя
граница
32 196.47
32 192.43
32 189.42
Таблица характеристик ретропрогнозов
.,
Абсолют.
Характеристика
Среднее значение
Среднеквадратическое отклонение
Средний модуль ошибки
Максимальное отклонение
Минимальное отклонение
значение
-104.14
65.79
104.14
-196.85
-50.94
Абс.
откл-ние
-64.64
^50.94
-196.85
Отн.
откл-ние
-0.20
-0.16
-0.62
Относит.
значение (%)
-0.33
0.21
0.33
-0.62
-0.16
Аппроксимация и ретропрогноз
Верхняя граница
Прогноз
Нижняя граница
Факт
Рис. 7.1. Фрагмент протокола построения модели прогноза
временного ряда норм расхода проката на изделие по методу Брауна
42
При формализации моделей временных рядов, представленных без
свободного члена, АРСС-модель центрированных элементов ряда и
интегрированная модель АРИСС (р, q, d) нестационарного процесса
для ряда первых разностей (с/ = 1) задаются в виде уравнений:
& - У + <Ѵ(У*-І-У) + (Ѵ(У»-І-У) + ".+
+ ар-(!/с-р-Ю-Т<Рі-еы>
(7.6)
Ayt = Ay + a, -(Ayt_, -Ay) + a 2 -(Az/,_2 -A#) + ...+
+а„(Д&-„-Ду)-ЕМ*-,-
(7.7)
В монографии рассмотрены аргоритмы АРСС-моделей и методи­
ка построения компьютерной АРИСС-модели прогноза материало­
емкости изделий. Для идентификации данной модели в технологи­
ческой цепочке решения задачи используется диалоговое окно
«Идентификация модели Бокса-Джеикинса», где, задавая значе­
ния параметров в диапазоне (р = 0+5; q = 0+2; d= 1+5), автомати­
чески выбирается модель с наименьшей дисперсией остатков.
На рис. 7.2 показан фрагмент компьютерного протокола результа­
тов построения АРИСС (1,1,1)-модсли прогноза материалоемкос­
ти изделия с емкостью ковша 0,45-0,5 м3 с упреждением на три года
по данным норм расхода проката на изделие за 28 лет.
Ретропрогноз норм расхода проката на изделие дает точные резуль­
таты. Без учета выброса средняя относительная ошибка ретропропюза
составляет 0,84%. В целом данная модель адекватна по основным ста­
тистическим критериям: F = 157,52; ?2 = 0,88; ё % = 2,5%; d= 2,12; г =
= 11,25; нормальность и случайность остатков подтверждаются.
Обобщенная линейная модель прогноза временного ряда
(ОЛИМП) является распространением моделей авторегрессии —
скользящего среднего для моделирования нестационарных времен­
ных рядов.
С формальной точки зрения, соотношение модели ОЛИМП со­
ответствует модели АРСС (р, q), за исключением того, что на вхо­
де модели может быть нестационарный временной ряд (г/():
Р
Я
yt = y + 2 > , . ( | / t _ , - y ) - £ M w . t = 2, 3,..., п.
j=i
<=i
(7.8)
43
Модель
АРИСС<1, 1, 1)
а,
-0,59
гь.
0,53
Таблица ретропрогнозов (р = 85%)
Упреж­
дение
1
2
3
Факт
Прогноз
7960,00
7853,00
9568,00
7881,06
7799,41
7716,17
Нижняя
граница
7414,17
7329,73
7246,10
Верхняя
граница
8347,95
8269,08
8186,24
Абс.
Отн.
откл-ние откл-ние
78,94
0,99
0,68
53,59
1851,83
19,35
Таблица характеристик ретропрогнозов
Характер истика
Среднее значение
Среднеквадратическое отклонение
Средний модуль ошибки
Максимальное отклонение
Минимальное отклонение
У
11500
11000
10 500•
10 000
9 500
9 000
8 500
8 000
7 500
7 000
6 500
Абсолют.
значение
661,46
841,79
661,46
1851,83
53,59
Относит.
значение(%)
7,01
8,73
7,01
19,35
0,68
Аппроксимация и ретропрогноз
——— Верхняя граница
—<^— Прогноз
1—і—і—і—і—і—і—і—і—і—і—і—і—і
1
1
1
1
1
1
Г
Рис. 7.2. Фрагмент протокола аппроксимации и ретропрогноза
уровней временного ряда норм расхода по АРИСС-модели
Коэффициенты скользящего среднего Р; должны находиться
в интервале от - 1 до+1, на коэффициенты авторегрессии а. не накла­
дывается ограничений.
Исследования показали, что с помощью модели ОЛИМП с дос­
таточной степенью надежности могут быть построены эконометрические модели прогноза материалоемкости изделий на базе времен­
ных рядов норм расхода материалов.
44
Для идентификации модели ОЛИМП в статистических пакетах пре­
дусмотрено диалоговое окно «Идентификация модели ОЛИМП»,
которое позволяет осуществить автоматический выбор модели
в диапазоне параметров (р - 0+5, q = 1+5) по критерию минималь­
ного значения дисперсии остатков уравнения.
В монографии рассмотрена технология выполнения расчетов по
алгоритму метода ОЛИМП при построении модели прогноза вре­
менного ряда материалоемкости изделий.
Проведенный анализ точности на участках аппроксимации и ретропрогноза (прогноза) временных рядов материалоемкости изде­
лий с использованием различных моделей показывает, что все они
с определенной степенью адекватности, точности и надежности мо­
гут быть применены для решения подобного рода задач (табл. 7.1).
Эти модели построены по данным временного ряда норм расхода
проката черных металлов на изделие за 28-летний период, пред­
ставленного на рис. 7.2.
С использованием диалоговых окон и других средств статистичес­
ких пакетов СтатЭксперт и VSTAT решается задача программного
(автоматического) выбора из множества возможных одной «лучшей»
модели прогноза временного ряда или нескольких «лучших» моделей
по обобщающим критериям адекватности, точности и качества или
минимальному значению отклонений остатков (ошибок) моделей.
Таким образом, компьютерные адаптивные модели имеют широкие
возможности аппроксимации и прогноза уровней временных рядов.
8. Компьютерное прогнозирование с использованием регресси­
онных моделей. Рассматриваются методологические основы ком­
пьютерного прогнозирования с применением статических и дина­
мических регрессионных моделей материалоемкости изделий.
Здесь понятие «статическая регрессионная модель» подразумевает
неизменность величин коэффициентов регрессии в течение всех
периодов упреждения прогнозов.
В отличие от статических, динамические регрессионные модели
имеют переменную структуру связей, т.е. в данном случае использу­
ются переменные значения коэффициентов регрессии, задаваемые
как функции от времени для каждого промежутка (интервала) про­
гноза показателя. Структура связей может измениться во времени
из-за совершенствования технологии производства, проектирования
Сравнительные характеристики точности моделей врем
на участках аппроксимации и ретропрогноза
Участок аппроксимации
Модель прогноза
временного ряда
Кривая роста:
у , = 11 382,93 - 373,24t + 9,89^
Брауна (0,581)
Хольта (0,901; 0,189)
АР (1,0), «1 = 0,86
АР (1,1), ои = 0,56
АРИСС (1,1,1),
а, = -0,59; Pi = 0,53
ОЛИМП (1,1),
а, =-0,862; 3,= 0,067
ОЛИМП (1,1),
а, = -0,87; р, = 0,07
Средне
ратиче
ошиб
ретроп
ноза
і*
Дисперсия
остатков
(ошибок),
Относитель­
ная ошибка
аппрокси­
мации, ~г%
0,92
73 149,94
2,80
675,
0,91
0,92
0,92
0,85
81 704,90
76 862,84
60 767,18
103 246,54
2,77
2,61
2,76
3,03
804,
807,
827,
1020,
0,88
76 625,40
2,50
841,
0,92
60 537,67
2,24
794,
0,92
60 672,59
2,16
820,
46
новых машин и т.д. И в том и в другом случае должны определяться
значения факторов для соответствующих интервалов прогноза.
Наряду с точечными значениями прогноза показателя (Yk) по /г-му
изделию вычисляются границы доверительных интервалов Yk воз­
можных отклонений от установленной закономерности под влия­
нием случайных факторов с заданной вероятностью р и известны­
ми срсднсквадратичсскими отклонениями остатков уравнения
(оост) и ошибок значений прогноза для k-vo изделия (ак):
Yk=-Yk±tT(p;n-m-l)-ck,
k = i,2,...,K,
(8.1)
1/2
где
стА =с ост ! + - + £
x
x
X
(4~ jflL( ij- J)
(8.2)
Здесь xkj — заданное (прогнозируемое) значение^-го фактора
(технико-экономического параметра) по А'-му изделию.
При прогнозе уровней зависимой переменной УДнорм расхода
материала), в свою очередь, возникает задача прогноза значений
самих факторов-аргументов Х° (технико-экономических парамет­
ров изделий) по соответствующим периодам упреждений. В данном
случае проводятся отдельные исследования возможных прогноз­
ных значений факторов X или же их уровни могут быть указаны
в проектном задании.
Временные тенденции изменения технических параметров изде­
лий имеют монотонный характер, скорости изменения связей не­
значительны и аппроксимируются линейными трендами. Это выте­
кает из динамики некоторых основных технических параметров
отечественных экскаваторов с емкостью ковша 0,5-0,65 м3 за более
чем 60 лет (табл. 8.1).
Таким образом, изменение системы факторов, оказывающих влия­
ние на технические параметры машин, происходит плавно и медлен­
но. Развитие тенденций изменения связей между параметрами машин
и нормами расхода материалов также носит эволюционный характер.
В работе представлены методика и результаты компьютерного
прогнозирования материалоемкости изделий по статическим моде­
лям с различным набором факторов.
47
Таблица 8.1
Динамика некоторых основных технических параметров экскаваторов
(индексы моделей изделия (марки машин) ЭО-505, ЭО-505А, Э-518,
Э-652, Э-652А, Э-652Б (ЭО-4111 Б), ЭО-4111 Г)
Значения технических
Геомет­
Продолжи­
рическая Общий тельность
емкость рабочий рабочего
цикла при
Годы стандарт­
вес
ного
(масса),
поворо­
ковша,
т.Хз
те на 90°,
3
м ,Х,
сек, Х6
19300,5
26,0
18,0
1935
19361945
19461950
19511955
0,5
26,0
параметров по годам
Геомет­
рическая Общий
емкость рабочий
вес
Годы стандарт­
ного
(масса),
ковша,
т,Х3
м 3 ,Х,
Продолжи­
тельность
рабочего
цикла при
поворо­
те на 90°,
сек, Хц
19561960
0,65
21,5
15,0
19611964
0,65
19,0
15,0
19651968
0,65
21,2
17,0
0,65
21,2
17,0
0,65
23,0
17,5
18,0
0,5
22,5
15,5
0,5
21,0
15,5
19691986
19871992
В этом плане типичными являются представленные на рис. 8.1
результаты ретропрогноза норм расхода проката на изделия с уров­
нем вероятности 85% и упреждением на три года по линейной рег­
рессионной модели с факторами X,, Х6, Хя, Х12.
Базу пропюза составляет выборка из 75 наблюдений, из них кон­
трольными являются данные трех последних лет из 28 наблюдений
по нормам расхода проката и указанным техническим параметрам
изделий.
В технологической цепочке решения задач прогноза наряду с вы­
полнением типовых процедур используется диалоговое окно «Регрес­
сионный анализ», в котором в естественной форме отмечаются требу­
емые функции пропюза, в том числе и функция «Ретроирогноз»
В данном случае уравнение имеет значимые коэффициенты
и адекватные характеристики: £% = 5,4%; dp =2,07; R =0,929;
Fp =137,39; ё = -0,39.
48
РЕТРОПРОГНОЗ
Линейная регрессия. Зависимая переменная — Y = Х 10
Функция: Y(X) = а0 + алХ, + а Д + а ^ + а12Х12
Оценка коэффициентов линейной регрессии
Перемен- Коэффи- Среднекв. *-значе- Нижняя
Верхняя Эластич- Бетание
оценка
оценка
ность
коэф-т
ная
циент отклонение
3707,648
6,157 18933,326 26724,585
0,000
0,000
Св. член 22828955
587,779
2,063
595,149
1830,309
0,090
0,147
X,
1212729
167,606
7,477
1077,134
1429,341
1,366
0,642
1253,238
хе
353,030
1,879
32,406
1034,263
0,249
0,132
663,335
xs -60433,598
6171,508 -8,172 -56918,008 -43949,188
-2,054 -0,270
х12Критическое
знанение f-распределения при 42 степенях свободы (р = 85%)=+1,051
Таблица ретропрогнозов (р = 85%)
Верхняя
Упреж­
Нижняя
Факт
Прогноз
граница
дение
граница
1
14 385,000 12 087,640 11623,304 12 551,976
2
12 520,000 10 975,364 10521,147 11 429,581
3
11 100,000 10 749,829 10 256,537 11 243,121
Абс.
откл-ние
Отн.
откл-ние
2297,360
1544,636
350,171
15,971
12,337
3,155
27
17 207,000 16 352,962 15 940,158 16 765,766
854,038
4,963
28
25 809,000 25 795,209 25 260,838 26 329,580
13,791
0,053
Таблица характеристик ретропрогнозов
Абсолют.
Характеристика
значение
Среднее значение
1064,151
Среднеквадратическое отклонение
2243,889
Средний модуль ошибки
1468,500
Относит.
значение
4,405
9,806
7,786
Аппроксимация и ретропрогноз
——•———
Верхняя граница
Прогноз
Нижняя граница
Факт
29
36
43
3
Номер наблюдения
Рис. 8 . 1 . Фрагмент протокола ретропрогноза материалоемкости
изделий по модели множественной регрессии
49
Исследования показали возможность получения более точных
прогнозных уравнений регрессии с ограниченным кругом факторов
для узкого подкласса по типоразмерам марок изделий.
В работе использована упрощенная методика разработки динами­
ческой регрессионной модели, реализованная в ППП ОЛИМП. Тех­
нология построения данной модели включает создание общего
файла наблюдений за Глет. Период наблюдений (7) разбивается на
k интервалов (диапазонов). Предполагается, что за время одного ин­
тервала (диапазона) коэффициенты регрессии устойчивы. Получа­
ются линейные уравнения регрессии с вычислением характеристик
адекватности для каждого из указанных диапазонов. Создается т + 1
файлов, которые содержат временные ряды коэффициентов регрес­
сии, полученных в уравнениях регрессии соответствующих диапа­
зонов: 1) ѵ а02 а№; 2) аи, аа,..., аи,...; т + 1) аа1> ат2,.... атк.
На основе данных временных рядов этих файлов строятся их
тренды и в автоматическом режиме выполняется анализ и прогноз
коэффициентов регрессии («0,*+/>«/,*+/) с периодом упреждения /,
т.е. на момент времени (k + /). Тогда точечный прогноз материало­
емкости изделий с упреждением / (Yk+l) будет иметь вид:
т
¥
ы =<*омі+И^мі
'х1к+і>
l= 1
> 2> 3> -
(8.3)
В монографии при разработке методики построения динамичес­
ких регрессионных моделей прогноза в качестве исходной инфор­
мации использовались данные о нормах расхода проката черных
металлов и технических параметрах по маркам изделий экскавато­
ров за 25-летний период (Г= 25). Общее количество наблюдений
(и) — 423 объекта, которые были систематизированы по девяти вре­
менным интервалам (диапазонам) шириной в основном три года.
В работе приводится прогноз коэффициентов регрессии по фай­
лам их временных рядов на основе кривых роста, адаптивных и
авторегрессионных моделей. Расчеты ретропрогноза норм расхода
проката на изделия с применением динамических регрессионных
моделей (8.3) показали их достаточную точность.
Как свидетельствует проведенный анализ, прогнозы на основе
моделей множественной регрессии, как правило, менее точны по
сравнению с моделями временных рядов, построенных с использо­
ванием одномерных методов.
50
Когда для анализа и прогноза применяется регрессионная модель
пространственно-временных данных, вместо к моделей рядов дина­
мики по k маркам изделий, строится одна обобщающая регрессион­
ная модель зависимости изучаемого показателя от определяющих
факторов. Поэтому регрессионные модели являются удобным
и эффективным инструментом анализа причинно-следственных
связей экономических процессов. По этой причине они находят
широкое применение в оценке, анализе и прогнозировании различ­
ных экономических явлений.
9. Экономико-математическая модель оптимизации примене­
ния организационно-технических мероприятий по экономии рас­
хода материалов. Рассмотрена методика построения и реализации
компьютерной экономико-математической модели оптимизации
программы внедрения организационно-технических мероприятий
(ОТМ) по снижению материалоемкости изделий.
Программы внедрения ОТМ учитывают результаты инновацион­
ных процессов, направленных на совершенствование технологии
производства и проектирования машин и снижение материалоем­
кости продукции. Исходной базой программы внедрения ОТМ слу­
жит примерный перечень направлений экономии материальных
ресурсов и коэффициенты экономии или замены для расчета про­
ектируемых уровней их расхода в промышленном производстве.
В монографии методика компьютерного экономико-математичес­
кого моделирования оптимизации программы внедрения ОТМ по
одной из задач апробирована применительно к направлениям ОТМ
из восьми вариантов (j = 1, 8) с соответствующими коэффициента­
ми экономии (замены), общими объемами ресурсов этих мероприя­
тий Q\. и нормативными объемами применения ресурсов соответ­
ствующих вариантов ОТМ (Ь.) к изделиям семи номенклатур
0' = Ѵ7).
С учетом принятых обозначений и исходных условий в двумер­
ном измерении целевая функция, максимизирующая эффектив­
ность применения ОТМ к изделиям, имеет вид:
7
8
Нх) = ѢИсѵ-Мі-хі)-*тз-х>
і=1 ;=1
где Nt — годовой объем производства г'-го изделия;
(9.1)
51
е.. — эффективность примеисния^-го варианта ОТМ к г'-му изде­
лию, определяемая как разность себестоимости изделия до (а>((,))
и после (т(Р)) применения ОТМ, отнесенная к приведенным зат­
ратам (р..) па внедрение: с~ = (Ц0> - wjV) / рі}•:,
xr — неизвестные переменные, определяющие интенсивность
применения./-х вариантов ОТМ к г-м изделиям,
На неизвестные переменные модели накладываются ограниче­
ния, указывающие на целесообразность применениям-то варианта
ОТМ к f-му изделию:
(
1, если j-й вариант ОТМ используется к г-му изделию;
—
—
(9 2)
О в противном случае, і = 1, 7; j = 1, 8.
' '
Система функциональных ограничений на ресурсы внедряемых
вариантов ОТМ (()1.)можно записать в виде:
£ѴЛѴ*,<!21.,; = Г8.
(9.3)
Рассматриваемая модель (9.1)-(9.3) является задачей целочис­
ленного программирования с булевыми переменными (X). В работе
изложены особенности технологии решения задачи с булевыми
переменными (X), подробно описаны этапы этой технологии, про­
анализированы результаты решения задачи с использованием ком­
плекса программ (надстройки) «Поиск решения» в среде Excel.
Показаны методика заполнения шаблона решения задачи для век­
тора ограничения ресурсов Q1 и отчет результатов ее реализации.
В случае реализации задач целочисленного программирования
с использованием указанного комплекса программ, исходя из требо­
ваний целочислешюсти при дискретной оптимизации, можно полу­
чить только один отчет по результатам решения задачи без анализа
устойчивости результатов. Поэтому здесь возможно моделирование
изменения результатов решения задачи при уменьшении или увели­
чении величин элементов вектора правоіі части ограничений и коэф­
фициентов, используемых в целевой функции и системе функцио­
нальных ограничений. Кроме того, сопоставляя значения ограниче­
ний левой и правой частей, нетрудно определить неиспользуемые
остатки определенных ресурсов, которые при наращивании в преде­
лах соответствующих норм их расхода могут привести к возрастанию
52
целевой функции. В работе выполнен анализ результатов решения в
условиях изменения объемов ресурсов внедряемых ОТМ.
10. Краткий экскурс в историю развития статистического про­
граммного обеспечения ЭВМ. В завершающей части работы сде­
лан краткий экскурс в историю развития статистического про­
граммного обеспечения ЭВМ. Изложены тенденции развития ста­
тистических пакетов программ, влияние интернет-технологий на
развитие и распространение ПО персональных компьютеров. Дан
краткий обзор некоторых современных научных и статистических
пакетов программ, рассмотрены состав и структура ПО автомати­
зированного рабочего места для статистической обработки данных
и перспективы его развития.
По своим функциональным возможностям развитие статисти­
ческих пакетов идет по двум направлениям: 1) специализирован­
ные пакеты, ориентированные на реализацию определенных раз­
делов статистики или методов, используемых в конкретных пред­
метных областях, и 2) статистические пакеты общего назначе­
ния, имеющие универсальную направленность, для решения задач
широкого диапазона. Они имеют свой специализированный про­
блемно-ориентированный язык для управления заданиями и дан­
ными, транслятор с входного языка, информатор, библиотеку из
функциональных модулей СПО, графическое диалоговое окно,
развитые графические средства, средства интеллектуальной под­
держки пользователей, средства подключения к сети Интернет,
экспорт и импорт данных в различных форматах и др.
Развитие интернет-технологий явилось мощным толчком к стре­
мительному качественному развитию ПО в целом и статистическо­
го ПО в частности, расширению его рынка и доступа пользователей
к программным продуктам. Благодаря интернет-технологиям в со­
став ПО ПК вносятся качественно новые программные средства,
расширяющие его возможности в различных сферах приложений и
особенно коммуникаций.
Наличие у ПК развитого системного и прикладного ПО, гибких
средств диалога, возможности эксплуатации в сети и автономном
режиме позволило сделать их необходимым атрибутом рабочего
места широкого круга специалистов. В связи с этим возникла акту­
альная проблема разработки общих принципов и методов исполь-
53
зовапия ПК на рабочих местах специалистов для информационного
обеспечения обработки и анализа данных. Одним из способов ее
решения является создание автоматизированных рабочих мест
(АРМ) для обработки информации.
АРМ для статистической обработки данных (СтОД) представляет
собой комплекс аппаратных и программных средств, обеспечивающих
оперативное удовлетворение информационных и вычислительных
потребностей специалиста и размещенных на его рабочем месте.
АРМ является наиболее эффективной организационной формой
использования ПК для автоматизации интеллектуального труда
специалистов. Возможность непосредственного активного диалога
с вычислительной системой выдвигает некоторые специфические
требования к построению ПО АРМ и его применению с целью из­
менения характера труда специалистов, появлению качественно
новых возможностей всесторонней обработки и анализа данных и
визуализации результатов.
С учетом этих требований концептуальная модель ПО АРМ для
статистической обработки данных имеет структуру, приведенную
на рис. 10.1.
Архив
Графический
процессор
(W
і
Табличный
процессор
Диалоговый
процессор
Конвертор
Выход в Интернет
Интерфейс с СУБД
Средства обучения,
помощи, справок,
методической
документации
{
S
Статистический
процессор
Рис. 10.1. Обобщенная схема концептуальной модели ПО АРМ
для статистической обработки данных
На рис. 10.2 представлена до некоторой степени детализирован­
ная схема состава и структуры функционального ПО АРМ по ос-
-rasi
*
Структурны*
анзішэ
АЧІ-.ІЕІ,',:
—
Pd'-,. -н
І
«
A*o.
,
тгйга
'са^рймсннесг,*
Г „ "U(- X
UI-.JJFKIV^IKJ
П „э ^ „ян [
і"
Г,
д
н „j?; ~
О £ „ 1 « 2 Г 2d»
I
р..і-'f
ЕЗ-.1ІЛ-І
1
t,-_ .i
h
|
>LW ' " . I
h
•
*
-
г
ЦЗ.Л І..Ч"' tit. Б ' р •}
С t j
-
Л»
J Слсмгалзш.»
~^l
I •
t»
- к
U - н*-
Аз "СЫЛ
г-
„
Oi'j - Ь
а к* "'It
г
п
Апі-чо
гюча-.и
M
d. •"'а - (SVЛі
Ча~іотн»;/ a-im'3
га
LnJJ
•-
КОрЪг.гЩЧ
rts:HDJ,^CS2*n«
І + J **• e)-3 гад
«4
—к*
L
«деигим
* В
О - Л Л I ІJ
^ 7 , 'Л 3 ,
v
к
Г
| .1 - ",„ . H
1 .,•- --J b
|,. , r , „ f - >
| Г с,. '. ч u U
0 J » T Н.Ч
ЧКТим
из ь*«сжзс'ьа
)^гН
и
«PCPCr.FUi'S
Г pf » Н 1в ІГ'3
*-•»
pjctr „>i\ щ и
Анализ
корреляций
-*ч
"
J
и, j
Иішш ірсиенны) ршоі
іирогмоз*раванке
Огредген/е
сгаткѵчсси.я
"з
ЧР •' І » С Ц с , . н - ' С L ' ,
L
Рсгргескзйныи знала]
и протомившие
Непараметвическая
статистика. Сбрзботаэ
НЕЧИСЛОВОЙ информации
*
1 г,
и•іэга
(1
v,
1
"
у:деля
нСЗЗ
•
LJ и ~
гз
4 1
I I
If"
Рис. 10.2. Схема состава и структуры ПО АРМ для статисти
56
новным процедурным блокам, ориентированным на статистический
анализ данных в экономических приложениях.
Под моделью АРМ здесь понимается образ объекта — схемати­
ческое описание процессов хранения, извлечения, передачи, обра­
ботки и отображения информации, которые возникают при реше­
нии задач. А термин «концептуальная» подчеркивает, что это ос­
новная точка зрения на предмет или явление, руководящая идея
для их системного изложения.
Функциональное 110 АРМ (см. рис. 10.2) предназначено для авто­
матизации обработки экономической информации статистически­
ми методами. Оно структурируется по укрупненным функциональ­
ным блокам, включающим свои специфичные процедуры. Блок
«Статистическая обработка и анализ» включает различные направ­
ления (методы) обработки данных, которые также представлены
в форме декомпозиции структур, состоящих из своих автономных
процедур анализа данных.
В заключении монографии излагаются основные результаты и вы­
воды, вытекающие из общей лопіки проведенного исследования.
Основные публикации по теме диссертации
Монографии, учебники, учебные пособия
1. Компьютерные технологии анализа данных в эконометрике: Монография. —
М: ИНФРА-М; Вузовский учебник, 2008. - 50,76 п.л.
2. Компьютерные технологии анализа данных в эконометрике: Монография. —
М.: ИНФРА-М; Вузовский учебник, 2010. — XIV, 575 с. — Полная электронная
версия (электронная библиотека на сайте — http.:www.infra-m.ru).
3. Автоматизированное рабочее место для статистической обработки дан­
ных: Монография. — М.: Финансы и статистика, 1990. — 12 п.л. / 3 авт. л.
А. Информатика в экономике: Учебное пособие / Под ред. проф. Б.Е. Один­
цова, проф. А.Н. Романова. Гриф НМС по заочному экономическому образова­
нию. — М.: Вузовский учебник, 2008. — 30 п.л. / 0,6 авт. л.
5. Информационные системы в экономике: Учебное пособие / Под ред. проф.
A.II. Романова, проф. Б.Е. Одинцова. Гриф Мшюбрпауки РФ. — М.: Вузовский
учебник, 2008. — 26 п.л. / 0,63 авт. л.
6. Основы маркетинга: Практикум с учебно-технологическим тренингом:
Учебное пособие / Под ред. проф. Д.М. Дайитбегова, проф. И.М. Синяевой.
Гриф Совета УМО по образованию в области менеджмента. — М.: Вузовский
учебник, 2007. — 23 и.л.
57
7. Компьютерные информационные технологии в маркетинге: Учебник /
Под ред. проф. ГЛ. Титорспко. Гриф Минобразования России. — М: ЮПИТИДЛИА, 2000. - 21 п.л. / 2 авт. л.
8. Экономико-математические методы и прикладные модели: Учебное посо­
бие / Под ред. В.В. Федосеева. Гриф Минобразования России. — М.: ЮНИТИ,
1999.-24,5 п.л./3,5 авт. л.
9. Информатика в статистике: Словарь-справочник / Под ред. Д.М. Дайитбегова, В.П. Божко, Л.М. Дуброва и др. — М.: Финансы и статистика, 1994. — 13,19 п.л.
10. Основы алгоритмизации и алгоритмические языки: Учебник.- 2-е изд.
Гриф Комитета по Высшей школе РФ. — М.: Финансы и статистика, 1992. —
31,65п.л./23авт.л.
11. Программирование на языке Паскаль для персональных ЭВМ: Учебное
пособие. - М.: МЭСИ, 1989. - 16,5 п.л.
12. Основы алгоритмизации: Учебное пособие. — М.: МЭСИ, 1989. — 8,5 п.л.
13. Автоматизированное рабочее место для статистической обработки эконо­
мической информации: Учебное пособие. — М.: МЭСИ, 1987. — 12 п.л. / 3 авт. л.
14. Программирование па языке Бейсик для персональных ЭВМ: Учебное
пособие. - М.: МЭСИ, 1986. - 5,0 п.л. / 1,5 авт. л
15. Программное обеспечение статистической обработки данных: Учебное
пособие. Гриф Минвуза СССР. — М.: Финансы и статистика, 1984. — 12 п.л. /
3 авт. л.
16. Организация наборов данных в ОС ЕС ЭВМ: Учебное пособие. Гриф
Минвуза СССР. — М.: Финансы и статистика, 1982. — 18 п.л. / 12 авт. л.
17. Создание и обработка наборов данных: Учебное пособие. — М.: МЭСИ,
1982.- 6,0пл./3,0авт. л.
18. Основы алгоритмизации и алгоритмические языки: Учебное пособие.
Гриф Минвуза СССР. - М.: Статистика, 1979. - 24,23 п.л. / 12,5 авт. л.
19. Математическое обеспечение статистической обработки данных: Учебное
пособие. - М.: МЭСИ, 1978. - 5,5 пл. / 1,5 авт. л.
20. Основы алгоритмизации и алгоритмические языки: Учебное пособие.
Ч. І . - М . : МЭСИ, 1977.-5,0 п.л.
21. Основы алгоритмизации и алгоритмические языки: Учебное пособие.
Ч. II. - М.: МЭСИ, 1977. - 5,0 пл.
22. Основы алгоритмизации и алгоритмические языки: Учебное пособие.
Ч. III. - М.: МЭСИ, 1977. - 6,0 пл.
23. Математическое обеспечение статистической обработки опытных наблю­
дений: Учебное пособие. - М.: МЭСИ, 1974. - 7,5 пл. / 5 авт. л.
24. Моделирование экономических информационных потоков в системах
управления при проектировании АСУ: Учебное пособие. — М.: МЭСИ, 1973. —
4,0 пл. / 3,0 авт. л.
58
Статьи в научных сборниках, журналах и доклады
на научных конференциях
Г. Обобщенная линейная модель прогноза временных рядов норм расхода
материалов на изделия / / Сегодня и завтра российской экономики: Научноаналитический сборник. — 2009. — № 29. — 0,63 п.л.
2*. Компьютерное моделирование и прогнозирование материалоемкости из­
делий в машиностроении / / РИСК: Ресурсы, Информация, Снабжение, Кон­
куренция: Аналитический журнал о логистике. — 2009. — № 2. — 0,70 п.л.
3'. Компьютерная технология построения динамических регрессионных мо­
делей прогноза материалоемкости изделий / / Вопросы статистики: Научноинформационный журнал. — 2009. — № 6. — 0,68 п.л.
4*. Использование фактора времени в эконометрических моделях, построен­
ных на основе пространственно-временных наблюдений / / Сегодня и завтра
российской экономики: Научно-аналитический сборник. — 2008. — № 21. —
0,44 п.л.
5'. Классификация моделей парной регрессии материалоемкости изделий / /
Сегодня и завтра российской экономики: Научно-аналитический сборник. —
2008.-№21.-0,44 нл.
6. Технология разработки нелинейных эконометрических моделей материа­
лоемкости изделий / / Инновационный путь развития РФ как важное условие
преодоления мирового финансово-экономического кризиса: Материалы Меж­
дународной научно-практической конференции 21-22 апреля 2009 г.: Пленар­
ное заседание. - М.: ВЗФЭИ, 2009. - 0,71 п.л.
7. Анализ эконометрической модели материалоемкости продукции / / Соци­
ально-экономическая и финансовая политика России в процессе перехода на
инновационный путь развития: Материалы Международной научно- практи­
ческой конференции 22-23 апреля 2008 г.: Пленарное заседание. — М.:
ВЗФЭИ, 2008.-0,46 п.л.
8. Состояние развития автоматизированных рабочих мест для статистичес­
кого анализа данных / / Информационные системы в науке, экономике и обра­
зовании: Сб. науч. ст. Первой межгосударственной научно-практической кон­
ференции. — Махачкала: ДГУ, 1998. - 1,5 п.л.
9.0 концепции развития автоматизированных рабочих мест для статическо­
го анализа данных / / Экономика и финансы России в современных условиях:
Сб. науч. трудов ВЗФЭИ. — М.: Экономическое образование, 1997. — 1,7 п.л.
10. Вопросы организации сохранности информации при ее передаче по от­
крытым каналам связи в экономических системах// Роль финансов в стабили­
зации экономики России: Сб. тезисов научно-практической конференции
ВЗФЭИ. — М.: Экономическое образование, 1997. — 0,5 н.л. / 0,2 авт. л.
59
11. Разработка автоматизированного рабочего места по обеспечению сохран­
ности информации при передаче ее но открытым каналам связи и экономичес­
ких системах: Сб. науч. ст. ВЗФЭИ. — М.: Экономическое образование, 1997. —
ОД іі.л./0,2авт.л.
12. Электронная система статистического анализа и прогнозирования
ОЛИМП / / Информатика в статистике: Словарь-справочник. — М.: Финансы
и статистика, 1994. — 0,7 п.л. / 0,2 авт. л.
13. Автоматизированное рабочее место для статистической обработки дан­
ных (АРМ СтОД) / / Информатика в статистике: Словарь-справочник. — М.:
Финансы и статистика, 1994. — 0,3 п.л.
14. Термины по разделу «Применение вычислительной техники в статисти­
ке» / / Статистический словарь / Гл. ред. М.Л. Королев. — 2-е изд., перераб. и
доп. — М.: Финансы и статистика, 1989. — 1,0 п.л.
15. Вопросы анализа укрупненных норм расхода материалов с применением
АРМ для статистической обработки данных / / Компьютеризация информаци­
онных процессов в народном хозяйстве: Всесоюзная конференция: Тезисы док­
ладов. - М.: МЭСИ, 1988. - 0,13 п.л.
16. Программное обеспечение автоматизированного рабочего места для статис­
тической обработки данных (АРМ СтОД) / / Программно-алгоритмическое обес­
печение прикладного многомерного сташстігческого анализа: III Всесоюзная шко­
ла-семинар: Тезисы докладов. — М.: 1ДЭМИ А11 СССР 1987. - 0,43 п.л. / 0,11 авт. л.
17*. Персональные ЭВМ и их использование для организации автоматизиро­
ванных рабочих мест / / Бухгалтерский учет: Научно-информационный жур­
нал. - 1987. - № 1.0. - 0,4 пл. / 0,13 авт. л.
18. Вопросы планирования организационно-технических мероприятий по
экономии расхода материалов с применением микро-ЭВМ / / Технологические
средства проектирования систем обработки данных на базе мини- и микроЭВМ: Сб. науч. ст. - М.: МЭСИ, 1987. - 0,26 п.л. / 0,13 авт. л.
19. Анализ выбросов и многомерная классификация объектов с помощью
средств АРМ для статистической обработки данных / / Технологические сред­
ства проектирования систем обработки данных на базе мини- и микро-ЭВМ:
Сб. науч. ст. - М.: МЭСИ, 1987. - 0,44 п.л. / 0,2 авт. л.
20*. Автоматизированное рабочее место для статистической обработки дан­
ных / / Вестник статистики: Научно-информационный журнал. — 1986. —
№ 11. - 0,6 п.л. / 0,2 авт. л.
21. Автоматизированное рабочее место для статистической обработки дан­
ных в учебном процессе статистиков// Первый Всемирный конгресс общества
математической статистики н теории вероятностей им. Бернулли: Тезисы. Т. 3. —
М.: Наука, 1986. - 0,04 пл.
60
22. Проблемы разработки многомерных статистических моделей анализа и
проектирования норм расхода материалов / / Применение многомерного ста­
тистического анализа в экономике и оценке качества продукции: III Всесоюз­
ная научно-техническая конференция: Тезисы докладов. Ч. I. -М.: ЦЭМИ АН
СССР, 1985. - 0,2 п.л.
23. Экономико-математическая модель оптимизации планирования орга­
низационно-технических мероприятие но снижению норм расхода материа­
лов в производстве отрасли / / Математическое обеспечение ЭВМ и АСУ: Сб.
науч. ст. - М.: МЭСИ, 1984. - 0,96 п.л.
24. Адаптация статистических моделей норм расхода материалов / / Математико-статнетический анализ экономических показателей: Сб. науч. ст. — М.:
МЭСИ, 1984. - 0,35 п.л.
25. Проблемы разработки статистических моделей прогнозирования укруп­
ненных норм расхода материалов / / Моделирование экономических процес­
сов: Сб. науч. ст. - М.: МЭСИ, 1984. - 0,87 п.л.
26. Состояние и перспективы использования программного обеспечения ста­
тистического анализа данных в экономическом вузе// Программно-алгорит­
мическое обеспечение прикладного многомерного статистического анализа:
II Всесоюзная школа-семинар: Тезисы докладов. — М.: ЦЭМИ АН СССР, 1983. —
0,4 п.л. / 0,3 авт. л.
27. Методологические вопросы построения логической структуры базы данных
системы агрегируемых показателей / / ПО ЭВМ и АСУ и их использование в си­
стеме учета и статистики: Сб. науч. ст. — М.: МЭСИ, 1983. — 0,49 п.л. / 0,24 авт. л.
28. Развитие концепции автоматизированных рабочих мест / / Теоретиче­
ские и практические основы механизированной обработки экономической ин­
формации: Сб. науч. ст. - М.: МЭСИ, 1982. - 0,43 и.л. / 0,21 авт. л.
29. Анализ организации и методов доступа к наборам данных в системах об­
работки экономической информации (на болгарском языке) / / Интегрирован­
ная обработка информации в промышленных организациях: Международная
научная конференция. — Свищов, 1981. — 0,48 п.л. / 0,4 авт. л.
30. Анализ методов организации и доступа к наборам данных / / Избранные
главы по программированию Ч. П. / Под ред. проф. В.В. Щуракова. — М.:
МЭСИ, 1980. - 1,0 п.л. / 0,4 авт. л.
31. Математико-статистический анализ зависимости объемов работ респуб­
ликанских министерств от определяющих факторов// Опыт применения при­
кладных методов математики и вычислительной техники в народном хозяй­
стве. — М.: Статистика, 1975. — 0,43 п.л. / 0,4 авт. л.
32. Характеристика состояния математического обеспечения и классифика­
ция программ анализа корреляций и регрессий / / Математическое обеспече­
ние ЭВМ и АСУ: Сб. науч. ст. Ч. I. - М.: МЭСИ, 1973. - 0,7 п.л. / 0,5 авт. л.
61
Учебно-методические разработки
1. Эконометрика: Методические указания по выполнению лабораторноіі ра­
боты для студентов бакалавриата, обучающихся по направлению 080100.62
«Экономика». - 2-е изд. - М.: ВЗФЭИ, 2010. - 3,25 п.л. / 0,5 авт. л.
2. Экономико-математические методы и прикладные модели: Методические
указания по выполнению лабораторноіі работы для студентов бакалавриата,
обучающихся по направлениям 080500.62 «Менеджмент», 080100.62 «Эконо­
мика». - 2-е изд. - М.: ВЗФЭИ, 2010. - 1,25 н.л. / 0,25 авт. л.
3. Логистика: Методические указания по проведению лабораторной работы
для студентов специальности 080507.65 «Менеджмент организации». — М.:
ВЗФЭИ, 2010. - 1,5 п.л. / 0,35 авт. л.
4. Методические указания по дипломному проектированию для студентов
специальности 0102 «Прикладная математика». — М.: МЭСИ, 1992. — 2 п.л. /
0,9 апт. л.
5. Описание применения диалогового пакета автоматизации статистической
обработки данных (BP_STAT) на ПЭВМ. - М.: МЭСИ, 1991. - 3,0 п.л. / 1,0
авт. л.
6. Краткое руководство по работе па АРМ для статистической обработки
экономической информации. — М.: МЭСИ, 1988. — 1,0 п.л. / 0,3 авт. л.
7. Методические указания к выполнению лабораторных работ и курсовых
проектов по дисциплинам системного и прикладного программирования. — М.:
МЭСИ, 1983. - 4,0 п.л. / 1,0 авт. л.
8. Лабораторный практикум по курсам «Основы системного программироваішя»,*Основы алгоритмизации и алгоритмические языки». — М.: МЭСИ,
1978.-1,74 п.л./0,85 авт. л.
" Издания, рекомендованные ВАК РФ.
^жг
-
ЛР ИД № 00009 от 25.08.99 г.
Подписано в печать 29.07.10. Формат бОхЭО'/к
Бумага офсетная. Гарнитура Times. Усл. псч. л. 2,5.
Тираж 100 экз. Заказ № 1771.
Редакционно-издательский отдел
Всероссийского заочного
финансово-экономического института (ВЗФЭИ)
Олеко Дундича, 23, Москва, Г-96, ГСП-5, 123995
Download