Logo ru.artbmxmagazine.com

Логлинейная регрессия для насыщенных и иерархических моделей, применяемых к оценке недвижимости.

Anonim

Проблема, с которой оценщик сталкивается ежедневно, - это анализ качественных переменных (нечисловых). Поскольку качественные переменные не представляют линейного поведения (и не сводятся к линейному); При применении обычных методов множественной регрессии они могут создавать нереалистичные модели или просто не сходиться ни к какому значению.

Логлинейная регрессия - это статистический метод, целью которого является изучение «классификации» качественных переменных. По сути, это модель множественной линейной регрессии между качественными переменными и неперовским логарифмом частоты данных (ссылочная) в форме:

логлинейная-регрессия-для-насыщенных-и-иерархических-моделей-применяется-к-оценке-недвижимости-1

Предыдущая модель соответствует полной модели (насыщенной) для качественных переменных A, B и C; однако предыдущая модель - тяжелая и сложная модель. По элементарному принципу экономии необходимо найти одну или несколько более простых моделей, которые генерируют результат с приемлемой степенью точности, и мы определяем их как «Иерархические модели» в том смысле, что если параметр равен нулю, они также будут такими. те условия более низкого порядка.

Статистический пакет SPSS позволяет с помощью алгоритма определять насыщенную модель и наиболее подходящую иерархическую модель.

Таким образом, мы получаем модель, переменная отклика которой представляет собой неперианский логарифм частоты («количество») данных (ссылочных), а проектные переменные - качественные переменные, выбранные для определения ценности свойства.

Ключевые слова: регрессия, корреляция, логлинейный анализ, анализ соответствий, дихотомия, качественная переменная, категориальная переменная, многомерный анализ, таблица сопряженности, иерархическая модель, насыщенная модель.

  • Теоретическая основа:

1.1 Что такое логлинейная регрессия?

Логлинейные модели, в отличие от моделей множественной регрессии, позволяют лучше анализировать случай качественных (категориальных) дихотомических или политомических переменных.

В логлинейном анализе его можно определить как метод, целью которого является изучение отношений между качественными (или нечисловыми) переменными.

Регрессионный или логлинейный анализ - это статистический метод, целью которого является изучение «классификации» качественных переменных.

Логлинейная регрессия - это, по сути, модель множественной линейной регрессии между качественными переменными и неперовским логарифмом частоты данных (ссылочная) в форме:

Фундаментальное использование логлинейного анализа заключается в определении вклада различных выбранных категориальных переменных в формирование «таблицы непредвиденных обстоятельств».

1.2 Что такое таблицы непредвиденных обстоятельств?

Она определяется как «Таблица непредвиденных обстоятельств» (таблицы кросс-таблицы), комбинация двух или более таблиц частотного распределения, организованных так, что каждая ячейка или прямоугольник результирующей таблицы представляет собой единственную комбинацию «переменных в перекрестной таблице». ».

Таким образом, «Таблица непредвиденных обстоятельств» позволяет нам исследовать наблюдаемые частоты, которые принадлежат каждой из конкретных комбинаций двух или более переменных.

Например:

Таблица непредвиденных обстоятельств анализа взаимосвязи между предпочтениями населения жить в доме или квартире в двух основных городах:

ЖИЗНЬ В ДОМАХ ЖИТЬ В КВАРТИРЕ.
КАРАКАС 10 40 50
ВАЛЕНСИЯ 30 20 50
50 50 100

Изучая эти частоты, мы можем определить взаимосвязи между переменными «Таблицы непредвиденных обстоятельств» (например, население Каракаса явно предпочитает жить в квартирах).

Логлинейная регрессия предоставляет нам более сложный способ анализа «таблиц непредвиденных обстоятельств» и определения статистических взаимодействий выбранных переменных.

1.3 Расчетные переменные vs. Переменные ответа

В методах множественной регрессии мы говорим о «независимых переменных» и «зависимых переменных», определяя зависимую переменную как то, что объясняется комбинацией независимых переменных.

В логлинейной регрессии невозможно говорить о зависимых или независимых переменных, поскольку речь идет о связи только неперовского логарифма частоты (появления или количества данных) на основе ряда категориальных (качественных) переменных.

Итак, мы поговорим о «проектных переменных» и «ответной переменной»; « Проектные переменные » - это те категориальные переменные (дихотомические или политомические), которые мы выбираем для построения нашей таблицы непредвиденных обстоятельств, а « переменная ответа » - частота или появление данных.

1.4 Степень соответствия

Степень соответствия логлинейной регрессии основана на «значимости» отклонения (невязки) между наблюдаемой частотой данных и ожидаемой частотой, сгенерированной логлинейной моделью.

То есть модель будет лучше в зависимости от минимизации разницы между наблюдаемой и ожидаемой частотой.

Значимость (p) или «степень соответствия» конкретной логлинейной модели будет оцениваться с помощью: традиционного критерия хи-квадрат () и статистического критерия максимального правдоподобия Пирсона () (или хи-квадрат отношения правдоподобия Пирсона, как его называют по-английски).

Таким образом, чтобы были соблюдены следующие параметры:

  • Хи-квадрат (): максимальная статистика максимального правдоподобия Пирсона (): максимальная значимость (сигн.): Минимум (насыщенная логлинейная модель

2.1 Определение насыщенной модели

Анализ или логлинейная регрессия анализирует неперианский логарифм (Ln) частоты каждой ячейки или ячейки таблицы непредвиденных обстоятельств с помощью линейной модели.

Следовательно, Ln частоты каждой ячейки или бокса можно выразить как сумму вкладов различных переменных, участвующих в формировании логлинейной модели.

Насыщенная (или полная) модель определяется как модель, которая содержит ВСЕ возможные основные эффекты и ВСЕ возможные комбинации (эффекты 2-го, 3-го или n-го порядка) выбранных переменных, составляющих ее.

Потому что насыщенная логлинейная модель может идеально воспроизводить исследуемые данные, поскольку содержит все возможные комбинации выбранных переменных; Предполагается, что это тяжелая и сложная модель, и обычно это не самая желательная модель.

По элементарному принципу экономичности необходимо найти одну или несколько более простых моделей, которые генерируют результат с приемлемой степенью точности, и мы определяем их как «Иерархические модели», которые будут проанализированы позже.

2.2 Пример насыщенной логлинейной модели

Предположим, что для исследования оценки квартир для отдыха в прибрежном городе мы хотим изучить взаимосвязь между переменными категории:

X: вид на океан

Y: Здание с бассейном

Z: Здание с парковочными местами для посетителей

Уравнение для насыщенной логлинейной модели задается следующим образом:

Куда:

Представляет частоту каждой ячейки или сетки продукта таблицы непредвиденных обстоятельств взаимодействия данных (ссылочных) и выбранных переменных.

Представляет независимый член уравнения

Представляет «основной эффект» количественной или категориальной переменной X

Представляет «основной эффект» количественной или категориальной переменной Y

Представляет «основной эффект» количественной или категориальной переменной Z

Представляет «эффект второго порядка» или комбинацию категориальных переменных X ý Y

Представляет «эффект второго порядка» или комбинацию категориальных переменных X ý Z

Представляет «эффект второго порядка» или комбинацию категориальных переменных Y ý Z

Представляет «эффект третьего порядка» или комбинацию переменных категории X, Y и Z

2.3 Недостаток насыщенной модели

Насыщенная модель, хотя, очевидно, всегда верна, включает в себя неуправляемое количество уравнений; например, для предыдущего случая Девять уравнений. Поэтому это тяжелая и чрезвычайно сложная модель.

Следовательно, необходимо найти одну или несколько более простых моделей, которые учитывают эти частоты с приемлемой степенью точности для данного уровня достоверности.

При анализе таблиц непредвиденных обстоятельств четвертого порядка или выше определение наилучшей модели логлинейной регрессии может быть очень трудным. Именно здесь может потребоваться поиск более простой модели корреляции.

  • Иерархические логлинейные модели

3.1 Определение

Иерархические логлинейные модели определяются как различные модели, все подмножества (уравнения более низкого порядка, чем насыщенная модель), происходящие из насыщенной логлинейной модели, которые удовлетворяют следующим условиям:

  1. Если параметр имеет значение NULL, то это будут и члены более низкого порядка, что существует полная независимость между выбранными переменными.

Если эти условия соблюдены, с приемлемой степенью точности создается более простая и элегантная логлинейная модель.

3.2 Иерархические отношения

Для модели с тремя (3) проектными переменными A, B и C можно получить большое количество иерархических моделей более низкого порядка, например следующие:

  • Иерархическая модель третьего порядка (насыщенная модель): иерархические модели второго порядка Иерархические модели первого порядка ИЛИ любая допустимая комбинация:

3.3 Получение иерархической модели наилучшего соответствия

3.3.1 Общий метод

Метод поиска наилучшей иерархической модели, наиболее часто используемый статистическими пакетами, посвященными так называемому «обратному исключению».

Эта методология сочетает в себе использование k (th) -заказов и критерия хи-квадрат для поиска иерархической модели или нескольких значимых иерархических моделей.

  1. Мы начинаем с вычисления насыщенной модели. Иерархическая модель или иерархические модели более высокого порядка анализируются. Модель или модели этого порядка, которые не имеют значения, удаляются (). Иерархические модели более низкого порядка удаляются в тех же переменных. Иерархические модели анализируются. Процесс продолжается до точки, когда большее количество эффектов не может быть устранено без ущерба для предсказательной силы модели (), остается постоянным или имеет тенденцию к уменьшению или увеличению.

3.3.2 Использование SPSS при определении моделей логлинейной регрессии

Целью этой монографии является вовсе не текст о методах логлинейной регрессии.

Скорее, это применение нового статистического инструмента для решения проблем, связанных с оценкой, в случае использования нечисловых или качественных переменных.

Поэтому, как только статистико-математическая теория логлинейных моделей (насыщенных и иерархических) будет изложена очень схематично, мы приступим к изучению практического случая с использованием статистического пакета SPSS версии 10.0.

Статистический пакет SPSS через модуль логлинейной обработки позволяет определять насыщенные и иерархические статистические модели.

В рамках «Иерархических моделей» SPSS позволяет либо автоматически выбирать иерархическую модель наилучшего соответствия, либо позволяет пользователю выбирать или моделировать любое подмножество переменных.

Разработка этой монографии основана на автоматическом определении наилучшего соответствия иерархической модели в соответствии с алгоритмом SPSS.

SPSS использует метод, названный «Обратное исключение», ранее упомянутый, для определения логлинейной модели наилучшего соответствия.

Следует отметить, что алгоритм «Backend» длинный, он занимает около пятнадцати (15) страниц текста при печати результатов.

В принципе, процесс расчета можно свести к следующим общим этапам:

  1. Правильно изученные данные для корреляции в «Редакторе данных» (Data Editor) пакета SPSSLos процедуры расчета в SPSS находятся в меню Анализировать в меню Анализировать подпрограмму или модуль является логлинейным. Внутри модуля логлинейный, Найдите три (3) подменю:
    1. ОбщиеЛогит
  • Выбор модели … Как только на экране появится логлинейный анализ выбора модели, перейдите к:
    1. Выберите «Проектные переменные» для корреляции. Определите минимальный и максимальный диапазоны данных, которые составляют каждую из «Проектных переменных».
    Определите параметры расчета и вывода для моделей E Запустите анализ, нажав кнопку OK.
  1. После того, как SPSS завершит вычисления, он представит выходные данные моделей на экране SPSS Viewer в текстовой форме. Оттуда пользователь может либо распечатать его на бумаге, либо «экспортировать» результат в текстовый файл для использования в текстовый процессор или электронную таблицу.

3.4 Интерпретация результатов SPSS

Возможно, самая большая проблема для инженера-оценщика - это интерпретация результатов SPSS.

Во-первых, вы должны иметь некоторые базовые знания о том, что вы собираетесь делать, поскольку статистический пакет генерирует большой объем информации, которую вы должны знать, как идентифицировать и оценивать. Во-вторых, необходимо четко понимать, что пакет SPSS будет создавать «Таблицы непредвиденных обстоятельств» разных уровней, и необходимо иметь базовые знания для их повторной сборки, чтобы иметь возможность интерпретировать результаты модели.

Специальный статистический пакет SPSS представляет стандартный вывод, который обычно состоит из:

  1. Генерация насыщенной логлинейной модели Управляющая статистика насыщенной логлинейной модели
    1. Степени свободы (F.) Хи-квадрат () Статистика максимального правдоподобия Пирсона () Значимость (Вероятность) Другая контрольная статистика
    Процедура обратного исключения для расчета иерархической логлинейной модели наилучшего соответствия, в которой программное обеспечение:
    1. Часть насыщенной логлинейной модели Анализирует все возможные иерархические модели, начиная с наивысшего порядка и заканчивая низшим порядком. Указывает для каждой из «Иерархических моделей» их соответствующую статистику управления. Предлагает в конце как «Иерархическую модель наилучшего соответствия» ту, которая имеет
      1. «Статистика максимального правдоподобия Пирсона» (): максимум «Значимость» (): минимум
  1. Генерация:
    1. Иерархическая логлинейная модель «наилучшего соответствия» Иерархическая логлинейная модель статистики управления
      1. Статистические данные максимального правдоподобия Пирсона по степеням свободы (DF) ()
  • Значение (вероятность)

4.0. Логлинейная регрессия для насыщенных и иерархических моделей применительно к оценке недвижимости.

4.1 Применение логлинейной регрессии к оценке недвижимости

Проблема, с которой ежедневно сталкивается оценщик, - это анализ качественных или категориальных переменных (нечисловых), таких как вид квартиры, качество микрорайона, помещения в местах общего пользования, безопасность; которые, будучи «нематериальными характеристиками», несомненно, способствуют формированию или разрушению ценности собственности.

Поскольку качественные или категориальные переменные не имеют линейного поведения (и не сводятся к линейному); применяя традиционные методы множественной регрессии, включая методы нейронных сетей; они могут давать противоречивые результаты или просто не сходиться ни к какому значению.

4.2 Оценка по таблицам непредвиденных обстоятельств

Потому что конечной целью логлинейного анализа является определение соответствия «таблиц непредвиденных обстоятельств». Оценка имущества будет основана на расположении его характеристик в «созданной таблице непредвиденных обстоятельств».

Поэтому здесь будет представлен другой подход к традиционной методологии подготовки оценки.

До сих пор физические характеристики (площадь, возраст, местонахождение и т. Д.) Объекта недвижимости анализировались с целью определения его стоимости.

В этом новом подходе «Диапазон значений» свойства будет зависеть от его положения в «Таблице непредвиденных обстоятельств», созданной «Логлинейным анализом». Потому что переменная «Цена» (или Цена за единицу) теперь просто еще одна «Проектная переменная».

В соответствии с этой новой перспективой, «категория», которая до сих пор имела переменную «Цена» (или Цена за единицу), была уменьшена, и теперь она стала еще одним компонентом различных параметров, которые вместе могут определять положение свойство в таблице непредвиденных обстоятельств и, следовательно, определить его «Диапазон значений».

4.3 Пример применения

Благодаря новизне метода и сложности интерпретации входных / выходных данных. Этот метод будет объяснен шаг за шагом на основе подхода очень простой модели оценки.

4.3.1 Описание проблемы

Речь идет об оценке квартир для отдыха в нескольких подобных проектах в венесуэльском Барловенто (недалеко от Рио-Чико, штат Миранда), таких как Los Canales, Las Mercedes, Lagunamar и т. Д.

Поскольку это простой пример приложения, была отобрана только небольшая выборка из 18 справочных данных по очень похожим квартирам.

4.3.2 Выбранные категориальные переменные

Поскольку этот пример иллюстрирует доказательство логистической регрессии, будут использоваться только следующие категориальные или качественные переменные:

4.3.3 Избранные ссылки

Все ссылки были взяты из подчиненного офиса государственного реестра Рио-Чико и соответствуют документам, нотариально заверенным в первом квартале 2003 года.

4.3.4 Кодирование данных

В соответствии с критериями, используемыми в разделе 4.3.2 в отношении выбранных проектных переменных, будет подготовлена ​​матрица закодированных данных, чтобы их можно было ввести в статистический пакет SPSS.

4.3.4.1 Выбор проектных переменных

4.3.4.1 Кодирование проектных переменных

4.3.5 Выдержки из выходных данных статистического пакета SPSS

4.3.5.1 Спецификация логлинейной модели

* * * * * * * * ИЕРАРХИЧЕСКИЙ АЛЛОГЛИНЕЙНЫЙ * * * * * * * *

ДАННЫЕ Информация

Принято 18 невзвешенных случаев.

0 случаев отклонено из-за выхода за пределы допустимого диапазона значений фактора.

0 дел отклонено из-за отсутствия данных.

В анализе будут использоваться 18 взвешенных случаев.

Информация о ФАКТОРЕ

Ярлык уровня фактора

ЦЕНА 4

РЫНОК 2

БАССЕЙН 2

ВИД 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

4.3.5.2 Статистика управления насыщенной логлинейной моделью

* * * * * * * * ИЕРАРХИЧЕСКИЙ АЛЛОГЛИНЕЙНЫЙ * * * * * * * *

ДИЗАЙН 1 имеет генерирующий класс

ЦЕНА * РЫНОК * БАССЕЙН * ВИД

Примечание: для насыщенных моделей ко всем наблюдаемым ячейкам добавлено 0,500.

Это значение можно изменить с помощью подкоманды CRITERIA = DELTA.

Алгоритм Iterative Proportional Fit сходимся на итерации 1.

Максимальная разница между наблюдаемым и установленным предельным итоговым значением составляет 0,000

а критерий сходимости - 0,250

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Статистика критерия согласия

Отношение правдоподобия хи-квадрат = 0,00000 DF = 0 P = 1,000

Хи-квадрат Пирсона = 0,00000 DF = 0 P = 1,000

4.3.5.3 Метод обратного исключения: список всех возможных эффектов 3-го, 2-го и 1-го порядка

* * * * * * * * ИЕРАРХИЧЕСКИЙ АЛЛОГЛИНЕЙНЫЙ * * * * * * * *

Тесты ЧАСТИЧНЫХ ассоциаций.

Название эффекта DF Partial Chisq Prob Iter

ЦЕНА * РЫНОК * БАССЕЙН 3.044.9976 3

ЦЕНА * РЫНОК * ВИД 3.189.9794 2

ЦЕНА * БАССЕЙН * ВИД 3.000 1.0000 4

РЫНОК * БАССЕЙН * ВИД 1.000 1.0000 3

ЦЕНА * РЫНОК 3 7,869 0,0488 4

ЦЕНА * БАССЕЙН 3 5,039.1690 3

РЫНОК * БАССЕЙН 1.629.4276 4

ЦЕНА * ВИД 3 5.917.1157 4

РЫНОК * ОБЗОР 1.777.3779 4

БАССЕЙН * ВИД 1 7.530.0061 2

ЦЕНА 3 8.089.0442 2

РЫНОК 1.223.6370 2

БАССЕЙН 1.896.3438 2

ВИД 1.896.3438 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

4.3.5.3 Метод обратного исключения: выбор иерархической модели наилучшего соответствия

Шаг 9

Лучшая модель имеет генерирующий класс

ЦЕНА * РЫНОК

ЦЕНА * СМОТРЕТЬ

С ВИДОМ НА БАССЕЙН

Отношение правдоподобия хи-квадрат = 6,33129 DF = 18 P = 0,995

* * * * * * * * ИЕРАРХИЧЕСКИЙ АЛЛОГЛИНЕЙНЫЙ * * * * * * * *

Последняя модель имеет генерирующий класс

ЦЕНА * РЫНОК

ЦЕНА * СМОТРЕТЬ

С ВИДОМ НА БАССЕЙН

Алгоритм Iterative Proportional Fit сходимся на итерации 0.

Максимальная разница между наблюдаемым и установленным предельным итоговым значением составляет 0,000

а критерий сходимости - 0,250

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Логлинейная модель наилучшего соответствия:

4.3.5.4 Определение наблюдаемых и ожидаемых частот иерархической логлинейной модели:

Наблюдаемые, ожидаемые частоты и остатки.

Фактор Код Счетчик OBS Счетчик EXP Остаточный Стандарт Остаточный

ЦЕНА 1

РЫНОК 0

БАССЕЙН 0

ВИД 0 3,0 2,5.45.28

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0 1.0 1.5 -.45 -.38

ВИД 1.0.0.00.00

РЫНОК 1

БАССЕЙН 0

ВИД 0 1.0.6.36.46

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0.0.4 -.36 -.60

ВИД 1.0.0.00.00

ЦЕНА 2

РЫНОК 0

БАССЕЙН 0

ВИД 0 2,0 1,7.30.23

ВИД 1.0.0.00.00

БАССЕЙН 1

ПРОСМОТР 0 1.0 1.0.03.03

ВИД 1 3,0 3,3 -,33 -,18

РЫНОК 1

БАССЕЙН 0

ВИД 0 1.0.8.15.16

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0.0.5 -.48 -.70

ВИД 1 2,0 1,7.33.26

ЦЕНА 3

РЫНОК 0

БАССЕЙН 0

ВИД 0.0.0.00.00

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0.0.0.00.00

ВИД 1.0.0.00.00

РЫНОК 1

БАССЕЙН 0

ВИД 0.0.6 -.64 -.80

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0 1.0.4.64 1.06

ВИД 1.0.0.00.00

ЦЕНА 4

РЫНОК 0

БАССЕЙН 0

ВИД 0.0.0.00.00

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0.0.0.00.00

ВИД 1.0.0.00.00

РЫНОК 1

БАССЕЙН 0

ВИД 0.0.6 -.64 -.80

ВИД 1.0.0.00.00

БАССЕЙН 1

ВИД 0 1.0.4.64 1.06

ВИД 1 2.0 2.0.00.00

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Статистика критерия согласия

Отношение правдоподобия хи-квадрат = 6,33129 DF = 18 P = 0,995

Хи-квадрат Пирсона = 4,96161 DF = 18 P = 0,999

4.3.6 Построение таблицы непредвиденных обстоятельств

4.3.7 Другой способ представить Таблицу удержания в более легком для понимания виде:

4.3.8 Примеры применения:

4.3.8.1 Пример № 1:

Будьте квартирой для отдыха в урбанизации Los Canales со следующими характеристиками:

  • Новые апартаменты, вид на канал, здание с бассейном

Все строки, которые включают следующие характеристики, находятся в «Таблице непредвиденных обстоятельств»:

  • NEW = 1VIEW = 1POOL = 1

Это составит следующую под-игру:

Как указано в Таблице непредвиденных обстоятельств, существует четыре (4) возможных диапазона цен (ЦЕНА) для определения стоимости квартиры, подлежащей оценке. Но при наблюдении за четвертым рядом можно заметить, что ОЖИДАЕМАЯ ЧАСТОТА максимальна.

Таким образом, Квартира находится в этой строке в Таблице непредвиденных расходов, и ее ценовой диапазон составляет PRICE = 4. Это означает, что стоимость указанной собственности находится в диапазоне квартир, превышающем 55 миллионов боливаров.

4.3.8.2 Пример № 2:

Будьте квартирой для отдыха в урбанизации Los Canales со следующими характеристиками:

  • Б / у апартаменты, вид на канал, здание с бассейном

Решение:

Все строки, которые включают следующие характеристики, находятся в «Таблице непредвиденных обстоятельств»:

  • NEW = 0VIEW = 1POOL = 1

Это составит следующую под-игру:

Как указано в таблице непредвиденных обстоятельств, существует четыре (4) возможных диапазона цен (ЦЕНА) для определения стоимости оцениваемой квартиры. Но при наблюдении за второй строкой можно заметить, что ОЖИДАЕМАЯ ЧАСТОТА максимальна.

Таким образом, Квартира находится в этой строке в Таблице непредвиденных расходов, и ее ценовой диапазон составляет PRICE = 2. Это означает, что стоимость указанной собственности находится в диапазоне квартир от 25 до 40 миллионов боливаров.

4.3.8.3 Пример № 3:

Будьте квартирой для отдыха в урбанизации Los Canales со следующими характеристиками:

  • Б / у КвартираВид на каналЗдание без бассейна

Решение:

Все строки, которые включают следующие характеристики, находятся в «Таблице непредвиденных обстоятельств»:

  • NEW = 0VIEW = 1POOL = 0

Это составит следующую под-игру:

Как указано в таблице непредвиденных обстоятельств, существует четыре (4) возможных диапазона цен (ЦЕНА) для определения стоимости оцениваемой квартиры. Но при просмотре таблицы непредвиденных обстоятельств можно заметить, что ОЖИДАЕМАЯ ЧАСТОТА равна 0,0 для всех возможных комбинаций данных.

Логическим выводом для этого случая является то, что в модель было предоставлено недостаточно данных для генерации любого типа комбинации между проектными переменными, в частности для определения стоимости этого типа квартиры.

Следовательно, стоимость этой квартиры не может быть определена с использованием существующей иерархической логлинейной модели.

  • Выводы
  1. Методы иерархической логлинейной регрессии гораздо лучше объясняют поведение статистических явлений, чем методы множественной регрессии или нейронные сети в случае категориальных рядов данных. В задачах классификации иерархические логлинейные модели генерируют гораздо более точные результаты, чем Модели множественной логистической регрессии, несмотря на то, что оба метода предназначены для категориальных рядов данных, для разнородных рядов данных (смешанные категориальные и количественные), искусственные нейронные сети и методы множественной регрессии, намного превосходят иерархические логлинейные модели. Использование иерархических логлинеарных моделей является мощным инструментом для «массовой оценки» движимого и недвижимого имущества, поскольку позволяет классифицировать имущество в рамках заранее установленных таблиц непредвиденных обстоятельств.статистический пакет SPSS очень подробно описывает обработку, работу и интерпретацию результатов. Громоздко адаптировать иерархические логлинейные модели как простой инструмент анализа, который будет использоваться оценщиками, не имеющими базовых знаний в этой области.

Инженер Роберто Пиол Пуппио

CIV 32.290 / SOITAVE 260

www.joinme.net/rpiol

Электронная почта: [email protected]

2003 ноября

БИБЛИОГРАФИЯ

  • БЕРРИДЖ Д. (1994) «Оценка степени соответствия регрессионных моделей для порядковых категориальных данных», 9-й международный семинар по статистическому моделированию, Университет Эксетера. London.CAMERON T. и QUIGGIN J. (1994) «Оценка с использованием данных условной оценки из« дихотомического выбора с последующей »анкетой». Журнал экономики и менеджмента окружающей среды. Предстоящий. Нью-Йорк ТАБАХНИК Б.Г. и ФИДЕЛЛ Л.С. (1996). «Использование многомерной статистики», 3-е изд. Харпер Коллинз, Нью-Йорк, ДЖОРДЖ Д. и МЭЛЛЕРИ П. (2000) «Шаг за шагом по SPSS для окон». Аллин и Бэкон. Массачусетс. Джобсон Дж. Д. (1992) «Прикладной многомерный анализ данных. Том II ». Springer Verlag. Нью-Йорк. ЛОЗАРЕС К., ЛОПЕС П. И БОРРАС В. (1998) "Взаимодополняемость лог-линейных и анализ соответствий при разработке и анализе типологий".Документы Автономного университета Барселоны. Номер 55 с. 79-93. Барселона.PIOL R. (1989-2002) «Статистические методы, применяемые к оценке недвижимости». SOITAVE. Каракас.PIOL R. (2002) "Нейронные сети в оценке недвижимости". Журнал SOITAVE. Номер 54 сентябрь 2002 с. 42-49 Каракас РАЗЛИЧНЫЕ АВТОРЫ (1999) «Тесты независимости с использованием многосторонних таблиц сопряженности в spss». Техасский университет. Остин РАЗЛИЧНЫЕ АВТОРЫ (1995) «Логлинейный анализ частотных таблиц» Электронный учебник Statsoft, Inc. См. Http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) «Анализ таблиц непредвиденных обстоятельств». Н. Скофилд и П. Уайтли (редакторы). Лондон.Каракас.PIOL R. (2002) "Нейронные сети в оценке недвижимости". Журнал СОИТАВЕ. Номер 54 сентябрь 2002 с. 42-49 Каракас РАЗЛИЧНЫЕ АВТОРЫ (1999) «Тесты независимости с использованием многосторонних таблиц сопряженности в spss». Техасский университет. Остин РАЗЛИЧНЫЕ АВТОРЫ (1995) «Логлинейный анализ частотных таблиц» Электронный учебник Statsoft, Inc. См. Http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) «Анализ таблиц непредвиденных обстоятельств». Н. Шофилд и П. Уайтли (редакторы). Лондон.Каракас.PIOL R. (2002) "Нейронные сети в оценке недвижимости". Журнал SOITAVE. Номер 54 сентябрь 2002 с. 42-49 Каракас РАЗЛИЧНЫЕ АВТОРЫ (1999) "Тесты независимости с использованием многосторонних таблиц сопряженности в spss". Техасский университет. Остин РАЗЛИЧНЫЕ АВТОРЫ (1995) «Логлинейный анализ частотных таблиц» Электронный учебник Statsoft, Inc. См. Http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) «Анализ таблиц непредвиденных обстоятельств». Н. Шофилд и П. Уайтли (редакторы). Лондон.Электронный учебник. См. Http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) «Анализ таблиц непредвиденных обстоятельств». Н. Шофилд и П. Уайтли (редакторы). Лондон.Электронный учебник. См. Http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) «Анализ таблиц непредвиденных обстоятельств». Н. Шофилд и П. Уайтли (редакторы). Лондон.

РЕГРЕССИЯ ЛОГИНОВ ДЛЯ НАСЫЩЕННЫХ И ИЕРАРХИЧЕСКИХ МОДЕЛЕЙ, ПРИМЕНЯЕМЫХ ДЛЯ ОЦЕНКИ НЕДВИЖИМОСТИ.

Прислал: инженер Роберто Пиол Пуппио - [email protected]

Дихотомическая переменная (например, «С видом на океан» = 1 или «Без вида на океан» = 0) является примером качественной / категориальной переменной. Поскольку качественная и дихотомическая переменная "Вид на море" не является линейной в сочетании с другими независимыми переменными, будь то количественные или качественные (например, площадь строительства, возраст собственности и т. Д.) В модели множественной линейной регрессии, очень маловероятно, что можно будет правильно оценить или спрогнозировать переменную «Цена за единицу» на основе этих смешанных переменных.

Когда используются количественные (или числовые) переменные, они говорят о «методах прогнозирования или оценки»; тогда как, когда используются качественные или категориальные переменные, тогда можно говорить о «методах классификации»

Концепция, аналогичная остаточной теории, которая используется в методах множественной регрессии для выявления нетипичных данных, содержащихся в серии данных.

Тест максимальной правдоподобия Пирсона (LRT, L 2 или G 2как это известно в разных текстах), это статистический тест согласия между двумя моделями. Относительно более сложная модель сравнивается с более простой моделью, чтобы увидеть, насколько хорошо они сравниваются для определенного набора данных. LRT действителен только при сравнении с иерархически вложенными моделями. То есть более сложная модель должна отличаться от простой только добавлением одной или нескольких переменных; таким образом, чтобы добавление дополнительных переменных обеспечивало большее соответствие. Однако есть момент, когда добавление дополнительных переменных НЕ существенно улучшит точность соответствия более простой модели. LRT поддерживает объективный критерий выбора среди возможных моделей. LRT начинается со сравнения хи-квадратов формы:

То есть оценивается разница натуральных логарифмов хи-квадратов на основе разницы степеней свободы. LRT примерно соответствует модели.

Можно процитировать аналогию этой концепции с концепцией факторного анализа множественной регрессии. Факторный анализ позволяет получить более простую модель множественной линейной регрессии с меньшим количеством переменных, исключив «несущественные переменные», но в то же время поддерживая приемлемый результат на заранее определенном уровне уверенности.

Тест «Полная независимость» подразумевает, что в иерархической модели все переменные независимы друг от друга. Это получается путем сравнения хи-квадратов каждой переменной с «нулевой гипотезой» (полученной из таблицы для соответствующих ей степеней свободы). Где должно быть выполнено:

Если вышесказанное верно, это означает, что независимая иерархическая модель значительно отличается от насыщенной модели, предполагая, что эта иерархическая модель содержит переменную или переменные, необходимые для получения хорошей корреляции или соответствия.

SPSS версии 10.0 является собственностью SPSS, Inc. Все права защищены.

Однако SPSS позволяет полностью экспортировать выходные данные в виде текстового файла, позволяя инженеру-оценщику добавлять выдержки из него в отчет об оценке для поддержки операций.

Подменю выбора модели… - это подпрограмма или модуль, в котором находится алгоритм определения иерархических моделей; однако здесь «насыщенная модель» определяется автоматически, поскольку метод обратного исключения начинается с вычисления насыщенной модели, как уже объяснялось в тексте.

Поскольку логлинейная регрессия - это метод, ориентированный на классификацию категориальных переменных, данные обычно выражаются в виде целых чисел (например: 0 и 1 в случае дихотомических переменных).

Для лучшего объяснения и подробных инструкций по работе с программой обратитесь к Руководству по эксплуатации SPSS.

Выходные данные SPSS могут различаться в зависимости от параметров расчета и вывода, определенных пользователем.

Логлинейные модели печатаются в виде многоуровневых матриц в выводе пакета.

Иерархическая логлинейная модель печатается в виде многоуровневой матрицы в выходных данных пакета.

Очевидно, что переменная «Цена» или «Цена за единицу» является числовой или количественной переменной и, следовательно, должна быть «преобразована» в качественную или категориальную переменную. Для этого больше нельзя будет говорить о ценовой переменной (цене за единицу), а о переменной «ценовой диапазон».

Обратите внимание, что это только категориальные или качественные переменные.

SPSS представляет вывод на экране SPSS Viewer в текстовой форме. Этот вывод можно распечатать или экспортировать в виде текстового файла.

Насыщенная логлинейная модель содержит все возможные «основные эффекты» и все возможные комбинации «комбинированных переменных эффектов», поэтому она идеально воспроизводит данные (). Насыщенная логлинейная модель не показана в этом отрывке из выходных данных SPSS.

Пакет SPSS достигает определения «наилучшего соответствия» иерархической логлинейной модели, начиная с насыщенной модели и устраняя те эффекты любого порядка, которые не вносят значительного вклада в модель; чтобы «Статистика максимального правдоподобия Пирсона» () была максимальной, а «Значимость» () - минимальной.

Иерархическая логлинейная модель представляет «Таблицу непредвиденных обстоятельств» в виде многоуровневой матрицы на выходе пакета. Теперь мы перейдем к «вооружению» этого вывода в матричной форме для его более легкой интерпретации. «Ожидаемые частоты» будут использоваться в качестве коэффициентов «Таблицы непредвиденных обстоятельств».

Таблица MS-Excel будет использоваться для построения таблицы непредвиденных обстоятельств.

Не забывайте, что данные составлены всего из 18 ссылок, поскольку это дидактическая модель.

Аналогия с этим типом проблемы - это случай моделей множественной регрессии, которые прекрасно объясняют конкретное свойство; но оценка не выполняется при применении той же модели регрессии к другому свойству с физическими характеристиками, сильно отличающимися от первого.

Логлинейная регрессия для насыщенных и иерархических моделей, применяемых к оценке недвижимости.