Определение существенных параметров и выбор диапазона их изменения
Характеристики (признаки) объектов, выступающие в роли ценообразующих факторов регрессионной модели, могут иметь разнообразную природу. Часть из них являются количественными характеристиками (например, площадь), другие – дискретными (например, удаленность от МКАД, км), третьи носят качественный характер (например, состояние).
Каждому типу признаков соответствуют свой тип шкал измерений (количественные или неколичественные порядковые, номинальные), группа допустимых преобразований значений шкалы и подмножество корректных методов обработки величин, применение которых не изменяет результата статистического моделирования.
Методы регрессионного анализа являются методами обработки количественных (числовых) величин. При этом разделение количественных признаков на непрерывные и дискретные в некоторой степени условно, поскольку из-за ограничений точности измерений даже непрерывные по своей природе показатели (например, площадь) могут рассматриваться как дискретные. Однако с точки зрения практики решения оценочных задач, наоборот, допустимо рассматривать дискретный количественный признак как непрерывный, если число принимаемых им значений достаточно велико. Более того, во многих случаях методы, предназначенные для обработки непрерывных количественных данных, можно эффективно применять и для обработки дискретных признаков с небольшим числом градаций. В частности, теория линейных регрессионных моделей с ненулевым свободным членом не накладывает никаких ограничений на характер значений количественных признаков – они могут быть непрерывными и дискретными, в том числе бинарными. Примечательно, что оценки линейной регрессионной модели с ненулевым свободным членом инвариантны относительно линейных преобразований значений влияющих факторов, т. е. для измерения значений признаков могут быть использованы произвольная точка отсчета шкалы и масштаб.
Шкалы количественных значений являются числовыми, т. е. позволяют количественно измерять степень проявления некоторого свойства (признака) при заданной единице измерения. Они применяются, когда имеется возможность численно оценить объем различий между значениями признака у разных объектов.
Порядковые шкалы используются для отражения отношений между объектами. Порядковый признак обычно отражает разную степень проявления некоторого свойства, но не дает количественной меры для его выражения. Значения таких признаков могут быть заданы в баллах, когда объекты можно разбить на заранее известное число упорядоченных классов, или в рангах, когда объекты ранжируются, упорядочиваются, выстраиваются в ряд по степени проявления свойства, точная количественная мера для которого не определена. Ранг – порядковый номер объекта в таком ряду.
Номинальные шкалы (шкалы наименований, классов) используются, когда можно разбить объекты на классы – группы объектов, однородные по свойству, отражаемому некоторым признаком, но нельзя задать никакого естественного упорядочения между самими классами. Бинарный признак, принимающий всего две градации (например, 1 и 2) может быть рассмотрен как частный случай номинальной переменной.
Данный текст является ознакомительным фрагментом.