Logo ru.artbmxmagazine.com

Корреляция и линейная регрессия

Оглавление:

Anonim

Задача:

Цель этого проекта - узнать, как использовать программу MINITAB и, больше всего, узнать как можно больше о том, что такое вероятность и статистика. Для них мы должны сделать следующий проект, который будет опубликован и показан нашим одноклассникам и тем, кто хочет видеть его на интернет-странице gestiopolis.com. Все, чему мы научимся, мы обязаны нашему любимому учителю, который преподает нам класс Математики III, мы надеемся, что наш проект наиболее удовлетворителен для наших провидцев и читателей и что мы не разочаровываем их. Не говоря уже о том, чтобы сказать или добавить, мы попрощались со следующим проектом, который был им показан.

Задний план.

переменная

Переменная - это символ, который представляет неопределенный элемент в данном наборе. Указанный набор называется универсальным набором переменной, юниверса или домена переменной, и каждый элемент набора является значением переменной. Пусть x - переменная, вселенная которой есть множество {1,3,5,7,9,11,13}; тогда x может иметь любое из этих значений: 1,3,5,7,9,11,13. Другими словами, x можно заменить любым нечетным положительным целым числом, меньшим 14. По этой причине часто говорят, что переменная является заменой для любого элемента в ее вселенной.

Переменная - это элемент формулы, предложения или алгоритма, который может приобретать или заменяться любым значением (всегда в пределах своей вселенной). Значения, которые может принимать переменная, могут быть определены в пределах диапазона и / или ограничены критериями или условиями членства для юниверса, который им соответствует (в этих случаях юниверс переменной становится подмножеством большей вселенной, которую вы бы имели без ограничений).

измерение

Измерение - это определение соотношения между измерением или событием объекта и определенной единицей измерения. Размер объекта и единицы должен быть одинаковой величины. Важной частью измерения является оценка ошибок или анализ ошибок.

Это для сравнения неизвестной величины, которую мы хотим определить, и известной величины той же величины, которую мы выбираем в качестве единицы. Имея в качестве ориентира две вещи: объект (то, что вы хотите измерить) и единицу измерения, уже установленную в английской системе, международной системе или десятичной системе.

Мы называем результат измерения измерения.

Когда мы измеряем что-то, это должно быть сделано с большой осторожностью, чтобы избежать изменения системы, которую мы наблюдаем. С другой стороны, мы не должны упускать из виду тот факт, что измерения выполняются с некоторой ошибкой, из-за несовершенства приборов или ограничений измерительного прибора, экспериментальных ошибок, поэтому измерение должно проводиться так, чтобы произведенное изменение было намного меньше, чем экспериментальная ошибка, которая может быть сделана.

Измерение или измерение является прямым, когда у нас есть измерительный прибор, который его получает, поэтому, если мы хотим измерить расстояние от точки «A» до точки «B», и у нас есть инструмент, который позволяет нам проводить измерения.

Дисперсионная диаграмма

График строится путем построения точек на координатной плоскости в соответствии с наблюдаемыми четными значениями, чтобы показать связь между двумя переменными.

Коэффициент корреляции Пирсона

Коэффициент корреляции Пирсона является статистическим показателем, который измеряет линейную зависимость между двумя количественными переменными. В отличие от ковариации, корреляция Пирсона не зависит от масштаба измерения переменных.

Расчет коэффициента линейной корреляции осуществляется путем деления ковариации на произведение стандартных отклонений обеих переменных:

Будучи:

σXY ковариация (X, Y)

σX и σY - стандартные отклонения краевых распределений.

I.- Компания, которая производит детали для оборудования, хочет разработать модель для оценки количества рабочих часов, необходимых для серийных серий различных размеров. Выбирается случайная выборка из 14 производственных циклов (по 2 для каждого размера партии 20, 30, 40, 50, 60, 70, 80), и получаются следующие результаты.

Размер лота (X)

Часовщик (Y)

20

50

20

55

30

73

30

67

40

87

40

95

50

108

50

112

60

128

60

135

70

148

70

160

80

170

80

162

а) Построить диаграмму рассеяния

б) Прогнозировать среднее количество рабочих часов, необходимое для серийного запуска партии размером 100.

Размер лота (X)

Часовщик (Y)

(Х-Х-)

(X-X_) 2

(Y-Y_)

(Y-Y_) 2

(X-X _) (Y-Y_)

20

50

-30

900

-60,71

3685,7

1,821.3

20

55

-30

900

-55,71

3103,6

1,671.3

30

73

-20

400

-37,71

1422,04

754,2

30

67

-20

400

-43,71

1910,56

874,2

40

87

-10

100

-23,71

562,16

237,1

40

95

-10

100

-15,71

246,8

157,1

50

108

0

0

-2,71

7,34

0

50

112

0

0

1,29

1,66

0

60

128

10

100

17,29

298,94

172,9

60

135

10

100

24,29

590004

242,9

70

148

20

400

37,29

1390,54

754,8

70

160

20

400

49,29

2429,5

985,8

80

170

30

300

59,29

3515,3

1,778.7

80

162

30

300

51,29

2630,66

1,538.7

Σ = 700

Σ = 1550

Σ = 5600

Σ = 21794,8

Σ = 10982

X__ = 50

Y_ = 110,71

X_ = среднее значение X Y_ = среднее значение Y Sx = стандартное отклонение X

Sy = стандартное отклонение Y Sxy = ковариация r = коэффициент корреляции

Процедура формул и результатов:

Уравнение линейной регрессии

б) Прогнозировать среднее количество рабочих часов, необходимое для серийного запуска партии размером 100.

Y = a + bX

Y = 12,71 + 1,96X

Y = 12,71 + 1,96 (100) = 208,71

Диаграмма рассеяния регрессии

II.- Компания, занимающаяся жилой недвижимостью в большом городе, хочет иметь возможность прогнозировать ежемесячную стоимость аренды квартир на основе их размера, определяемого квадратными футами пространства. Выбирается случайная выборка, и сгенерированная информация показывает следующее

В долларах (X)

В квадратных футах (Y)

950

850

1600

1450

1200

1085

1500

1232

950

718

1700

1485

+1650

1136

+935

+726

875

700

1150

+956

1400

1100

+1650

1285

2300

1985

1800

1369

1400

1175

1450

1225

1100

1245

1700

1259

1200

1150

1150

+896

1600

1361

+1650

1040

1200

755

800

1000

1750

1200

а) Построить диаграмму рассеяния

б) Используйте метод наименьших квадратов, чтобы найти коэффициенты регрессии a и b.

в) установить уравнение регрессии

г) Прогноз среднемесячной арендной платы за квартиру, которая имеет 1000 квадратных футов.

Икс

И

X-Х-

(X-X_) 2

Y-Y_

(Y-Y_) 2

(X-X _) (Y-Y_)

950

850

-436,4

190444,96

-285,32

81407.5024

124513648

1600

1450

213,6

45624,96

314,68

99023.5024

67215.648

1200

1085

-186,4

34744,96

-50,32

2532.1024

9379.648

1500

1232

113,6

12904,96

96,68

9347.0224

10982.848

950

718

-436,4

190444,96

-417,32

174159.982

182 118 448

1700

1485

313,6

98344,96

349,68

122276.102

109659.648

+1650

1136

263,6

69484,96

0,68

0,4624

179248

+935

+726

-451,4

203761,96

-409,32

167542.862

184767.048

875

700

-511,4

261529,96

-435,32

189503.502

222622.648

1150

+956

-236,4

55884,96

-179,32

32155.6624

42391.248

1400

1100

13,6

184,96

-35,32

1247.5024

-480352

+1650

1285

263,6

69484,96

149,68

22404.1024

39455.648

2300

1985

913,6

834664,96

849,68

721956.102

776267.648

1800

1369

413,6

171064,96

233,68

54606.3424

96650.048

1400

1175

13,6

184,96

39,68

1574.5024

539648

1450

1225

63,6

4044,96

89,68

8042.5024

5703.648

1100

1245

-286,4

82024,96

109,68

12029.7024

-31412,352

1700

1259

313,6

98344,96

123,68

15296.7424

38786.048

1200

1150

-186,4

34744,96

14,68

215,5024

-2736.352

1150

+896

-236,4

55884,96

-239,32

57274.0624

56575.248

1600

1361

213,6

45624,96

225,68

50931.4624

48205.248

+1650

1040

263,6

69484,96

-95,32

9085.9024

-25126,352

1200

755

-186,4

34744,96

-380,32

144643.302

70891.648

800

1000

-586,4

343864,96

-135,32

18311.5024

79351.648

1750

1200

363,6

132204,96

64,68

4183.5024

23517.648

Σ = 36046,4

Σ = 29518,32

Σ = 3139726

Σ = 1999747,44

Σ =

2130018,8

д) Прогноз среднемесячной арендной платы за квартиру, которая имеет 1000 квадратных футов.

III.- Следующие данные относятся к проценту высокопроизводительных радиальных шин, изготовленных определенным производителем, которые все еще пригодны для использования после использования указанного количества миль.

Определите уравнение регрессии, которое наилучшим образом соответствует данным, и определите полезный процент для пробега 25 000 миль.

Количество пройденных миль (в тысячах), X

Полезный процент, Y

один

98,2

два

91,7

5

81,3

10

64,0

20

36,4

30

32,6

40

17,1

50

11,3

----

Икс

И

(XX_)

(X-X_) ²

(Y-Y)

(у-ỹ) ²

(x-x _) (y-ỹ)

один

98,2

-18,75

351562

44125

1947.015

-827343

два

91,7

-17,75

315062

37625

1415.640

-667843

5

81,3

-14,75

217562

27225

741200

-401568

10

64,0

-9,75

95062

9925

98505

-96768

20

36,4

0,25

0,062

-17675

312405

-4418

30

32,6

10,25

105062

-21475

461175

-220118

40

17,1

20,25

410062

-36975

1367150

-748743

50

11,3

30,25

915062

-23825

567630

-720706

Σ =

158

Σ =

432,6

Σ =

2409.496

Σ =

6910,72

Σ =

- 3607 507

----

Уравнение линейной регрессии

Определите уравнение регрессии, которое наилучшим образом соответствует данным, и определите полезный процент для пробега в 25 000 миль.

Y = a + bx

Y = 23,85 + (-1,53) (25) = 46,0583

IV.- Проводится исследование количества сахара, превращенного в определенном процессе при различных температурах. Данные собираются и записываются следующим образом:

Температура (X)

Обработанный сахар (Y)

один

8,1

1,1

7,8

1.2

8,5

1,3

9,8

1.4

9,5

1,5

8,9

1,6

8,6

1,7

10,2

1,8

9,3

1,9

9,2

два

10,5

а) Оцените линию линейной регрессии.

б) Оцените среднее количество обработанного сахара, когда закодированная температура составляет 1,75.

Температура (X)

Обработанный сахар (Y)

X-Х-

(X-X_) 2

Y-Y_

(Y-Y_) 2

(X-X _) (Y-Y_)

один

8,1

-0,5

0,25

-1,0272

1,0552

0,5136

1,1

7,8

-0,4

0,16

-1,3272

1,7616

0,5309

1.2

8,5

-0,3

0,09

-0,6272

0,3934

0,1881

1,3

9,8

-0,2

0.04

0,6727

0,4525

-0,1345

1.4

9,5

-0,1

0,01

0,3727

0,1389

-0,0372

1,5

8,9

0

0

-0,2272

0,0516

0

1,6

8,6

0,1

0,01

-0,5272

0,2780

-0,0527

1,7

10,2

0.2

0.04

1,0727

1,1507

0,2145

1,8

9,3

0,3

0,09

0,1727

0,0298

0,0518

1,9

9,2

0,4

0,16

0,0727

0,0052

0,0290

два

10,5

0,5

0,25

1,3727

1,8843

0,6863

= 16,5

Σ = 100,4

Σ = 1,1

Σ = 7.2018

Σ = 1,99

X_ = 1,5

X_ = 9 127

Уравнение линейной регрессии

б) Оцените среднее количество обработанного сахара, когда закодированная температура составляет 1,75.

----

Решение в MINITAB

Следующие шаги, с помощью которых мы можем создать таблицу данных, графики, формулы и больше вероятности и статистики с помощью программы MINITAB. Следующие изображения и процедуры - это то, что мы будем использовать для построения точечного графика:

Шаг 1.- Откройте MINITAB

Шаг 2. - Разместите себя на главном экране

Шаг 3. Поместите Данные, которые будут получены в таблицы. Например, таблица размера лота (X) и рабочего времени (Y).

Шаг 4.- Получите диаграмму рассеяния, выполнив следующие шаги:

4.1.- Открыть меню График

4.2.- Выберите Scatterplot и нажмите.

4.3.- После нажатия появится окно с надписью scatterplots, выберите простую модель и нажмите кнопку ОК.

4.4.- Появится другое окно для размещения переменных «X» и «Y», когда появится это окно, поместите переменные в соответствующие столбцы, как показано на следующем рисунке:

4.5.- Нажмите кнопку ОК, и график рассеяния будет отображаться.

Примечание: если вам нужен график рассеяния с линией регрессии, просто выберите график рассеяния с регрессией и выполните следующие шаги, уже упомянутые, как показано на следующем рисунке:

Точечная диаграмма с линейной регрессией.

Учебный опыт:

Опыт, полученный при выполнении финальной работы, был хорошим и плохим по следующим причинам.

Это было хорошо, потому что:

• Он научил нас больше работать в команде и стараться изо всех сил в нашей работе.

• Мы всегда доверяем себе, чтобы прояснить наши сомнения.

• Он преподавал свой класс с мастерством и удовольствием, что многим учителям не хватает правды.

• Он всегда был очень уважительным к классу.

Правда заключается в том, что единственное плохое, что мы можем выделить, это давление, которое испытывают все студенты, поскольку экзамены близки, и большинство учителей заказывают выпускные работы с высоким процентом квалификации, с другой стороны, мы стараемся делать все возможное, чтобы выполнить с ожиданиями учителя в момент сдачи работы и сдачи с хорошей оценкой.

Выводы:

Вся команда согласилась со следующим:

Нам очень понравилось, как он учил нас математике III, так как он всегда

слишком терпелив, объясняя свой учебный план.

Следует также отметить, что он был одним из лучших учителей, которые учили нас, потому что он всегда приходил с большим энтузиазмом, чтобы преподавать свой предмет. Это побудило нас стараться изо всех сил в своей области.

Истина - это пример, которому нужно следовать, чтобы научить нас видеть раздел математики с очень хорошим отношением, а не с таким тяжелым и / или трудным предметом.

Ну, это все на данный момент, и спасибо вам за все это время, что вы с очень хорошим отношением учили нас своему предмету, надеясь, что наша дружба будет продолжаться, даже если в будущем вы не учили нас в университете.

Библиография:

www.wikipedia.com

Учебный материал предоставлен учителем.

Записки из тетради.

Скачать оригинальный файл

Корреляция и линейная регрессия