Logo ru.artbmxmagazine.com

Автоматизация операций с minitab для временных рядов

Оглавление:

Anonim

Вам приходилось делать определенные тесты более одного раза? Если да, хотели бы вы дать мышке отдохнуть? С MINITAB вы можете легко автоматизировать операции, чтобы сэкономить время. Есть несколько способов сделать это, от быстрого и простого метода вырезания / вставки до более мощного метода с использованием локального макроса.

Как это работает? Почти все операции в MINITAB могут быть выполнены с использованием командной сессии. Фактически, когда вы заполняете диалоговое окно и нажимаете OK, MINITAB генерирует командный сеанс, который содержит всю информацию, которую вы выбрали в нем. Вы можете использовать эти командные сеансы «как есть». или измените их, если хотите, загрузите их за один шаг, и MINITAB запустит весь анализ.

Предположим, у вас есть еженедельный сбор данных, и вы генерируете три разных графика из этих данных. Конечно, каждую неделю вы должны заполнять диалоговые окна для всех трех графиков, что будет означать много щелчков мышью. Вместо этого вы можете загрузить скрипт, сгенерировавший эти диаграммы, одним быстрым шагом.

Эта статья содержит несколько простых примеров того, как автоматизировать операции временных рядов в MINITAB.

Минитаб Временные ряды.

Данное руководство содержит концепцию, применение и исполнение в Minitab системы версии 15, по теме временных рядов

ОСНОВНЫЕ ПОНЯТИЯ СЕРИИ ВРЕМЕНИ

1.1 ВВЕДЕНИЕ

Каждое учреждение, будь то семья, компания или правительство, должно строить планы на будущее, если оно хочет выжить и прогрессировать. Сегодня различные учреждения требуют знать будущее поведение определенных явлений, чтобы планировать, прогнозировать или предотвращать.

Рациональное планирование требует предвидения будущих событий, которые могут произойти. Прогнозирование, в свою очередь, часто основывается на том, что произошло в прошлом. Таким образом, существует новый тип статистического вывода о будущем некоторой переменной или совокупности переменных на основе прошлых событий. Наиболее важным методом для того, чтобы сделать выводы о будущем на основе того, что произошло в прошлом, является анализ временных рядов.

Существует бесчисленное множество приложений, которые можно найти в различных областях знаний, таких как экономика, физика, геофизика, химия, электричество, демография, маркетинг, телекоммуникации, транспорт и т. Д.

Временные ряды

Примеры

1. Экономическая серия: - Цены на статью - Уровень безработицы - Уровень инфляции

- индекс цен и др.

2. Физическая серия: - Метеорология - Количество сброшенной воды - Максимальная суточная температура

- Скорость ветра (энергия ветра)

- солнечная энергия и др.

3. Геофизика: - Сейсмологическая серия
4. Демографические серии: - Темпы роста населения - Рождаемость, смертность - Результаты переписей населения
5. Маркетинговые серии: - Спрос серии, расходы, предложения
6. Телекоммуникационные серии: - Анализ сигналов
7. Транспортные серии: - Трафик серии

Одна из проблем, которую пытается решить временной ряд, - это предсказание. Это дано в серии {x (t1),…, x (tn)}. Наша цель состоит в том, чтобы описать поведение ряда, исследовать механизм генерации временных рядов, найти возможные временные закономерности, которые позволят нам преодолеть неопределенность будущего., Отныне мы будем изучать, как построить модель для объяснения структуры и прогнозирования эволюции переменной, которую мы наблюдаем с течением времени. Интересующие переменные могут быть макроэкономическими (индекс потребительских цен, спрос на электроэнергию, ряд экспорта или импорта и т. Д.), Макроэкономическими (продажи компании, запасы на складе, рекламные расходы сектора), физическими (скорость ветра на ветряной электростанции, температура в процессе, течение реки, концентрация в атмосфере загрязняющего вещества) или социальная (число рождений, браков, смертей или голосов за политическую партию).

1.2 ОПРЕДЕЛЕНИЕ ВРЕМЕННОЙ СЕРИИ

Во многих областях знаний интересующие наблюдения получают в последовательные моменты времени, например, каждый час, в течение 24 часов, ежемесячно, ежеквартально, раз в полгода или регистрируются какой-либо группой на постоянной основе.

Мы называем серию измерений определенного явления или эксперимента, записанных последовательно во времени. Эти наблюдения будут обозначаться {x (t1), x (t2),…, x (tn)} = {x (t): t Î T Í R}, где x (ti) - значение переменной x в данный момент ты. Если T = Z, временной ряд называется дискретным, а если T = R, временной ряд называется непрерывным. Когда ti + 1 - ti = k для всех i = 1,…, n-1, ряд называется равномерно распределенным, в противном случае он будет неравномерно распределенным.

Отныне мы будем работать с дискретными временными рядами, равномерно распределенными, и в этом случае мы будем предполагать и без ограничения общности, что: {x (t1), x (t2),…, x (tn)} = {x (1), x (2)),…, x (n)}.

1.3 ПЕРВЫЙ ШАГ ПРИ АНАЛИЗЕ ЛЮБОЙ ВРЕМЕННОЙ СЕРИИ

Первым шагом в анализе временных рядов является построение ряда. Это позволяет нам обнаружить основные компоненты серии.

График серии позволит:

а) Обнаружить выброс: относится к точкам в серии, которые находятся за пределами нормы. Выбросы - это наблюдение ряда, которое соответствует ненормальному поведению явления (без будущих инцидентов) или ошибке измерения.

Должно быть определено извне, является ли данная точка выбросом или нет. Если найдено, что это должно быть опущено или заменено другим значением перед анализом ряда.

Например, при исследовании ежедневного производства на заводе возникла следующая ситуация, см. Рисунок 1.1:

Кажется, что две точки в рамке соответствуют ненормальному поведению ряда. При исследовании этих двух пунктов было установлено, что они соответствуют двум дням безработицы, что естественным образом сказалось на производстве в те дни. Проблема была решена путем удаления наблюдений и интерполяции.

б) Это позволяет обнаружить тренд: тренд представляет преобладающее поведение ряда. Это можно условно определить как изменение среднего значения за период (см. Рисунок 1.2).

c) Сезонные колебания: сезонные колебания представляют собой периодическое движение временных рядов. Продолжительность единицы периода, как правило, составляет менее одного года. Это может быть квартал, месяц или день и т. Д. (См. Рисунок 1.3).

Математически мы можем сказать, что ряд представляет сезонное изменение, если существует число s такое, что x (t) = x (t + k × s).

Основными силами, которые вызывают сезонные колебания, являются погодные условия, такие как:

  1. зимой продажа мороженого, продажа шерсти летом, экспорт фруктов в марте.

Все эти явления показывают сезонное поведение (ежегодное, еженедельное и т. Д.)

d) Нерегулярные вариации (случайный компонент): нерегулярные (случайные) движения представляют все типы движений во временном ряду, кроме тренда, сезонных колебаний и циклических колебаний.

2. МОДЕЛИ СЕРИИ КЛАССИЧЕСКОГО ВРЕМЕНИ

2.1 МОДЕЛИ РАЗЛОЖЕНИЯ

Классическая модель для временного ряда предполагает, что ряды x (1),…, x (n) могут быть выражены как сумма или произведение трех компонентов: тренда, сезонности и члена случайной ошибки.

Существует три модели временных рядов, которые обычно принимаются как хорошее приближение к истинным отношениям между компонентами наблюдаемых данных. Эти:

  1. Добавка: X (t) = T (t) + E (t) + A (t) Мультипликативный: X (t) = T (t) • E (t) • A (t) Смешанный: X (t) = T (t) • E (t) + A (t)

Куда:

  • Ряд X (t), наблюдаемый в момент времени tT (t), компонент тренда E (t), сезонный компонент A (t), случайный (случайный) компонент

Обычным предположением является то, что A (t) - это случайный компонент или белый шум с нулевым средним и постоянной дисперсией.

Аддитивная модель (1) подходит, например, когда E (t) не зависит от других компонентов, таких как T (t), если, наоборот, сезонность меняется в зависимости от тренда, наиболее подходящей моделью является мультипликативная модель (два). Понятно, что модель 2 можно превратить в добавку, взяв логарифмы. Проблема, которая возникает, состоит в том, чтобы правильно моделировать компоненты серии.

На рисунке 2.1 показаны возможные шаблоны, за которыми могут следовать серии, представленные моделями (1), (2) и (3).

2.2 ОЦЕНКА ТРЕНДА

Здесь мы будем предполагать, что сезонная компонента E (t) отсутствует и аддитивная модель является адекватной, то есть:

X (t) = T (t) + A (t), где A (t) - белый шум.

Существует несколько методов оценки T (t). Наиболее широко используемые состоят из:

  1. Подберите функцию времени, такую ​​как полином, экспонента или другая гладкая функция т. Смягчите (или отфильтруйте) значения в ряду. Используйте различия.

2.2.1 НАСТРОЙКА ФУНКЦИИ

Следующие графики иллюстрируют некоторые формы этих кривых.

Примечание:

  1. кривая тренда должна охватывать относительно длительный период, чтобы быть хорошим представлением долгосрочного тренда. Прямолинейный и экспоненциальный тренд применимы в краткосрочной перспективе, поскольку долгосрочная кривая S может казаться прямой линией в ограниченный период время (например).

На рисунке 2.2 обе кривые (прямая и Гомпертца) хорошо подходят, но в долгосрочной перспективе проекции сильно расходятся.

Пример 1. В таблице 2.1 приведены квартальные данные по жилищным единицам, начатым в Соединенных Штатах с третьего квартала 1964 года по второй квартал 1972 года. (Следует отметить, что для анализа тенденций рассматриваемый период должен быть более продолжительным. Однако, поскольку основная цель состоит в том, чтобы проиллюстрировать метод декомпозиции и методы вывода из элементов, разложенных таким образом, недостаточность данных не должно интересовать.)

Таблица 2.1. Новые единицы жилья начались в Соединенных Штатах с третьего квартала 1964 года до второго квартала 1972 года (в тысячах единиц).

Год я II III IV Всего годовой
1964 398 352
1965 283 454 392 3. 4. 5 1474
1966 274 392 290 210 1166
1967 218 382 382 340 1322
1968 298 452 423 372 1545
1969 336 468 387 309 1500
1970 264 399 408 396 1467
1971 389 604 579 513 2085
1972 510 661

Пусть t будет каждым из 32 кварталов с 1964 по 1972 г., то есть t = 1 для третьего квартала 1964 г., t = 2 для четвертого квартала и т. Д. Таким образом, областью определения t является множество целых чисел от 1 до 32 включительно. Пусть T (t) жилья начинается ежеквартально. Значения t и T (t) приведены в таблице 2.2. Рассчитать значения a и b на линии тренда

T (t) = a + bt

Следующие цифры получены из данных таблицы 2.1.

Таблица 2.2. Расчет динамики жилищного строительства в Соединенных Штатах начался с третьего квартала 1964 года по второй квартал 1972 года.

Четверть года

T

Т (т)

тенденция
1964: 3

один

398

291,73

4

два

352

298,07

1965: 1

3

283

304,41

два

4

454

310,75

3

5

392

317,09

4

6

3. 4. 5

323,43

1966: 1

7

274

329,77

два

8

392

336,11

3

9

290

342,45

4

10

210

348,79

1967: 1

одиннадцать

218

355,13

два

12

382

361,47

3

13

382

367,81

4

14

340

374,15

1968: 1

15

298

380,49

два

16

452

386,83

3

17

423

393,17

4

18

372

399,51

1969: 1

19

336

405,85

два

20

468

412,19

3

21

387

418,53

4

22

309

424,87

1970: 1

2. 3

264

431,21

два

24

399

437,55

3

25

408

443,89

4

26

396

450,23

1971: 1

27

389

456,57

два

28

604

462,91

3

29

579

469,25

4

30

513

475,59

1972: 1

31

510

481,93

два

32

661

488,27

Таким образом, линия тренда

T (t) = 285,39 + 6,34 × t

На рисунке 2.3 графически показана линия тренда, скорректированная на квартальные данные в таблице 2.2. Пунктирная линия после 1972 года представляет прогнозы (см. Раздел 3 «Прогнозы»).

Разработка в Minitab:

  1. Откройте Minitab. Скопируйте данные на лист Minitab. Выберите: Stat à Time Series à Trend Analysis.

  1. В окне анализа тенденций мы выбираем переменную щелчком мыши, оставляем тип модели линейным и нажимаем кнопку ОК.

  1. Minitab отображает следующий график, который, как мы видим, аналогичен представленному в ходе упражнения.

  1. Если мы хотим получить 4 графика в одном окне, выберите опцию Графики…

Нажмите Четыре в одном.

Нажмите ОК

Minitab отображает следующий график.

2.2.2. МЯГКОСТЬ. ЛИНЕЙНЫЕ ФИЛЬТРЫ

Одним из способов визуализации тренда является сглаживание серии. Основная идея состоит в том, чтобы определить из наблюдаемого ряда новый ряд, который сглаживает не-трендовые эффекты (сезонность, случайные эффекты), чтобы мы могли определить направление тренда (см. Рисунок 2.4).

Мы используем линейное выражение, которое преобразует ряд X (t) в сглаженный ряд Z (t): Z (t) = F (X (t)), t = 1,…, n

такой, что F (X (t)) = T (t). Функция F называется линейным фильтром. Наиболее используемый линейный фильтр - скользящее среднее.

2.2.2.1 СРЕДНИЕ ДВИЖЕНИЯ

Цель состоит в том, чтобы удалить сезонные и случайные компоненты из серии. Для месячных рядов с годовой сезонностью (s = 12) получается сглаженный ряд,

Для квартального ряда с годовой сезонностью (s = 4) сглаженный ряд определяется как

Эта процедура называется: конечно-симметричный фильтр.

Примечание: смягчается, когда происходит много резких изменений, нерегулярных движений.

Пример 2: На основе данных в примере 1 скользящее среднее рассчитывается путем сложения значений для определенного числа последовательных периодов и последующего деления полученной суммы на число охватываемых периодов. В данном случае это квартальный ряд, и для этого используется формула (2).

Таблица 2.3: Расчет скользящей средней по четырем четвертям по центру для жилищных инициатив в США, с третьего квартала 1964 года по второй квартал 1972 года (в тысячах единиц)

Год за кварталом

Исходные данные И

Мобильный Итого за четыре четверти

Четыре четверти скользящей средней

Скользящая средняя по четырем четвертям

(один)

(два)

(3)

(4)

(5)

1964: 3

398

4

352

1965: 1

283

1487

372

371

два

454

1481

370

369

3

392

1474

369

367

4

3. 4. 5

1465

366

359

1966: 1

274

1403

351

338

два

392

1301

325

308

3

290

1166

292

285

4

210

+1110

278

276

1967: 1

218

+1100

275

287

два

382

1192

298

314

3

382

1322

331

341

4

340

1402

351

359

1968: 1

298

1472

368

373

два

452

1513

378

382

3

423

1545

386

391

4

372

1583

396

398

1969: 1

336

1599

400

395

два

468

1563

391

383

3

387

1500

375

366

4

309

1428

357

348

1970: 1

264

1359

340

342

два

399

1380

3. 4. 5

356

3

408

1467

367

382

4

396

1592

398

424

1971: 1

389

1797

449

471

два

604

+1968

492

507

3

579

2085

521

536

4

513

2206

552

559

1972: 1

510

2263

566

два

661

Например, в таблице 2.3 скользящее среднее за четыре квартала за первый квартал 1965 года получается путем сложения значений третьего и четвертого кварталов 1964 года и первого и второго кварталов 1965 года, а затем деления суммы на 4. Среднее для второго квартала 1965 года это получается путем сложения значений четвертого квартала 1964 года со значениями первого, второго и третьего кварталов 1965 года, а затем деления суммы на 4. Следовательно, для каждого последующего среднего значения квартал, который идет первым, вычитается и последний добавлен.

В столбце 4 таблицы 2.3 показаны скользящие средние за четыре квартала, полученные на основе данных о жилищном строительстве за 1964–1972 годы. Скользящее среднее не устраняет очень заметных колебаний в ряду, но существенно уменьшает амплитуду колебаний. исходных данных.

Если при расчете скользящего среднего вводится нечетное количество периодов, процесс будет проще, поскольку число периодов до и после периода, для которого рассчитывается среднее, одинаково. Если число периодов четное, как в этом примере, вы не можете использовать одинаковое количество периодов до и после указанного периода. Следовательно, скользящее среднее должно быть на полпути между значениями двух последовательных периодов и не связано с каким-либо периодом. Эта проблема может быть решена путем вычисления скользящего среднего по центру, что достигается путем получения сначала скользящего среднего с двумя четвертями из уже полученных скользящих средних. Первое центрированное скользящее среднее является средним из первых двух скользящих средних за четыре четверти,второе центрированное скользящее среднее - это среднее из скользящих средних за четыре секунды и третью четверть и т. д. Таким образом, будет равное количество периодов после и до указанного периода, для которого рассчитывается центрированная скользящая средняя. Центрированные скользящие средние видны в столбце 5 таблицы 2.3.

Согласно формуле 2, расчет будет следующим:

Это значение соответствует центрированной скользящей средней, показанной в столбце 5.

На рисунке 2.5 графически показана корректировка скользящего среднего в соответствии с таблицей 2.3, где черный сегмент представляет исходную серию, а синий - сглаженную серию.

Разработка в Minitab:

  1. Откройте Minitab. Скопируйте данные на рабочий лист Minitab:

  1. Выберите: Статистика à Временной ряд à Скользящее среднее…

  1. Выберите с помощью переменной переменную с временным рядом и поместите длину МА.

В этом случае он равен 4 (4 квартала в год). Нажмите ОК

  1. Minitab отображает график со скользящей средней.

Резюме

Временной ряд называется набором измерений определенного явления или эксперимента, записываемых последовательно во времени, например, каждый час, ежемесячно, ежеквартально, раз в полгода и т. Д. В этой заметке мы работали с дискретными временными рядами, равномерно распределенными в в этом случае предполагается, что:: {x (t1), x (t2),…, x (tn)} = {x (1), x (2),…, x (n)}. Из-за вводного характера он был ограничен случаем одномерных временных рядов.

При анализе временных рядов первое, что нужно сделать, - это построить график ряда. Это позволяет нам обнаружить основные компоненты серии. График рядов позволит: обнаруживать выбросы, обнаруживать тренды, сезонные колебания, нерегулярные колебания (или случайные составляющие).

Классическая модель временных рядов может быть выражена как сумма или произведение трех компонентов: тренда, сезонности и случайной ошибки. Есть три модели временного ряда. Эти:

  1. Добавка: X (t) = T (t) + E (t) + A (t) Мультипликативный: X (t) = T (t) • E (t) • A (t) Смешанный: X (t) = T (t) • E (t) + A (t)

Чтобы получить модель, необходимо оценить тренд и сезонность. Для оценки тренда предполагается, что сезонная составляющая отсутствует. Оценка достигается путем подгонки полинома или сглаживания ряда к функции времени через скользящие средние. Для оценки сезонности необходимо определиться с моделью, которая будет использоваться (смешанная или аддитивная). Как только тренд и сезонность будут оценены, мы можем предсказать.

Методы, рассмотренные в этой заметке, носят описательный характер, поэтому суждение и знание этого явления играют важную роль при выборе модели.

Недостаток классических методов заключается в том, что они адаптируются с течением времени, что подразумевает, что процесс оценки должен быть начат заново при наличии знания новых данных.

Команда, состоящая из:

Инженер Герардо Вальдес Фуэнтес

Инж. Роза Исела Мелендес Лопес

Лицо Хосе Луиса Чавеса Давила

Инженер Ренато Элмер Васкес Гарсия

Мастер в области администрирования и лидерства.

Северо-Восточный автономный университет.

Библиография:

Статистика для администраторов, Ричард И. Левин и Дэвид С. Рубин.

Редакционный зал Прентис

Автоматизация операций с minitab для временных рядов