|
Прогнозирование с использованием полигональной регрессииС. Н. Лапач, А. В. Чубенко, П. Н. Бабич НТУУ «Киевский политехнический институт», Украинский НИИ фармакологии и токсикологии Проблема прогнозаПри построении эмпирических зависимостей задача прогнозирования в фармацевтическом и медицинском менеджменте остается одной из самых сложных. Это связано со многими причинами, в том числе:
Очень популярной является рекомендация использовать при спецификации фундаментальные представления о процессе [1]. Эта рекомендация является, с одной стороны, бесспорной истиной, а с другой практически трудно применимой. Трудность применения состоит как раз в отсутствии фундаментальных представлений, которые можно считать бесспорными истинами, пригодными для спецификации математической модели. Кроме того, фундаментальные представления меняются в процессе развития науки. Задачи же необходимо решать оперативно, при отсутствии полной информации о всех сторонах и факторах наблюдаемого процесса и, тем более, о скрытых механизмах, движущих этим процессом. Очень часто бесспорные законы или закономерности слишком всеобщи и грубы для того, чтобы использовать для практической деятельности. В связи с этим возникает проблема: как правильно поступать в данной ситуации. Позволим себе напомнить некоторые факты из истории науки, касающиеся нашего вопроса. Так, до гелиоцентрической системы Коперника применялась геоцентрическая система Птолемея. Мало известно, что система Коперника была окончательно принята только после Ньютона. До этого ее применение оправдывалось только меньшим объемом расчетов. Чем это было вызвано? С одной стороны, до Ньютона не было фундаментальных представлений о причинах, которые позволили бы перейти к гелиоцентрической системе; с другой стороны, точность описания реально наблюдаемых астрономами движений планет была практически одинаковой у обеих систем [2]. Таких примеров можно привести достаточно много. И в наше время существует много процессов и явлений, которые разные ученые описывают разными моделями. В связи с этим Пуанкаре рекомендует вопрос о соответствии модели истинным процессам оставить как не имеющий смысла в прикладных задачах, а при составлении модели руководствоваться следующими правилами [3]:
Боксом отмечается, что модель может быть неправильной, но практически полезной [4] (кстати, такой и была модель Птолемея). Часто имеющуюся теоретическую модель, являющуюся бесспорной истиной, достаточно тяжело применить на практике ввиду недостаточной точности. Например, логистическая кривая [5] очень хорошо описывает общий ход многих процессов развития. Практически же применяется для прогноза не очень часто ввиду сложности получения удовлетворительной точности до того, как процесс прошел все свои стадии. Следует также иметь в виду, что все методы идентификации обеспечивают наилучшую интерполяцию, а не экстраполяцию. Построение же доверительных интервалов для экстраполяции не более чем самообман. Из численных методов хорошо известно, что при увеличении порядка интерполирующего полинома погрешности растут (особенно для быстроменяющихся функций) [6], особенно в точках, отличных от тех, по которым собственно получены коэффициенты полинома [7]. Практически это вызывает явление осцилляции аппроксимирующей кривой вокруг опорных точек (чем точнее аппроксимация в точках, тем хуже интерполяция) [8]. В связи с этим мы предлагали использовать в целях прогноза последние точки временного ряда, в которых процесс предполагается неизменным и строить по нему прогноз с помощью линейной аппроксимации [9, 10]. При наличии ясно выраженных сезонных изменений, естественно, необходимо их учесть в виде периодической составляющей модели [11]. Следует отметить, что сложность представляет выбор этого фрагмента (неправильный выбор изменяет прогноз). В данной работе мы предлагаем формализацию этого процесса с помощью полигональной регрессии. Полигональная регрессияПолигональная регрессия является аналитическим представлением экспериментальных данных с помощью ломаной линии, состоящей из отрезков прямых, построенная по методу наименьших квадратов. Еще у Себера [12] рассматривается двухфазная линейная регрессия с точкой переключения. Эта регрессия предназначалась для случаев, когда в некоторой точке на процесс было оказано некоторое воздействие, которое привело к изменению зависимости. В дальнейшем в литературе рассматривались случаи более чем двух фаз и делались попытки обобщения задач на многомерный случай [13, 14]. Растригин [15] показывает, что для решения задач экстраполяции полигональная регрессия предпочтительней полиномиальной. В работе Кузьмина [16] предложена функция, позволяющая описать одномерную многофазную регрессию без системы условий и фиктивных переменных в виде единого аналитического выражения, что значительно облегчает ее практическое использование. Пример построения прогнозаПо имеющимся данным строится наилучшая полигональная регрессия (по критерию минимальной остаточной дисперсии). Рассмотрим решение поставленной задачи на примере данных, приведенных на рис. 1 (это реальные данные). Полигональная модель имеет следующий общий вид где XП координаты точки перелома, а Для построения оптимальной (по минимуму остаточной дисперсии полигональной регрессии необходимо найти координаты точки перелома. Для дискретного аргумента задача может быть решена простым перебором, для непрерывного аргумента методом половинного деления или случайного поиска с заданной точностью. Соответствующее значение XП и будет точкой перелома. Для приведенного примера соответствующее уравнение имеет вид:
Y = 34237,23 + 3557,33 X - 2820,13 (X - 8)+,
т. е. точка изменения тенденции 8 четвертый квартал 2001 г. Уравнение в виде полинома 2-й степени для этих же данных
Y = 55884,5 + 14836x - 3496,98z,
где: x = 0,166667(X - 7); Уравнение в виде полинома 4-й степени для этих же данных
Y = 55884,5 + 14836x + 3879,05v 3496,98z,
где: x = 0,166667(X - 7); В таблице 1 представлены значения, рассчитанные по четырем моделям (линейной, полином 2-й степени, полином 4-й степени и полигональной), и фактические значения объема фармацевтического рынка Украины (по данным мониторинга розничных продаж IMS MiDAS). Таблица 1. Данные по объему фармацевтического рынка (фактические и прогнозные)
Рис. 1 является графическим отображением приведенной таблицы. Из сравнения представленных четырех вариантов аппроксимирующих функций можно сделать следующие выводы. Как по статистическим характеристикам, так и по точности аппроксимации, уравнение полинома 4-й степени наилучшее. Вместе с тем следует иметь в виду, что остаточные дисперсии для представленных аппроксимирующих функций при имеющихся значительных флуктуациях исходных данных различаются не более чем на 20-40%, что делает их с точки зрения критерия Фишера принадлежащими к одной генеральной совокупности, т. е. статистически неразличимыми. Таким образом, все указанные функции при аппроксимации и интерполяции практически равнозначны. Если же мы рассмотрим их прогнозные свойства (рис. 1), то картина окажется совершенно иной. Прогноз по модели полинома четвертой степени дает совершенно неправдоподобные значения. Линейный прогноз также показывает не ту тенденцию, которая на самом деле имеет место. Прогнозы по полигональной и параболической моделям на данном отрезке практически не различаются. Но начиная с последней точки направление прогноза по параболической и полигональной модели начинают различаться: первая предсказывает падение объемов, а вторая медленный рост. Чем больше изменяется функция на исследуемом участке, чем больше случайные флуктуации, тем хуже будет полиномиальная модель, даже второй степени. С другой стороны, использование одной функции входит в противоречие с представлением о том, что в течение времени происходит изменение происходящих процессов, что должно описываться разными функциями. Таким образом, использование полигональной регрессии позволяет:
Для автоматизации процесса построения полигональной регрессии написан макрос на языке Visual Basic Application для использования в электронной таблице Excel. Литература
© Провизор 1998–2022
|
Грипп. Прививка от гриппа
Нужна ли вакцинация?
Как и чем лечить кашель?
Безрецептурные лекарства при сухом и влажном кашле Устойчивость микробов к антибиотикам →
Помогает ли одежда из шелка лечить экзему?
Что лучше развивает ребёнка — книжки с картинками или с текстом? О безопасности автокресел для детей в возрасте от 4 до 12 лет
Аллергический ринит
Забеременеть в 40 Лечение бесплодия. Обзор существующих вариантов Аденома простаты. Как и чем лечить ? |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|