Logo ru.artbmxmagazine.com

Расчет доверительных интервалов с использованием minitab

Anonim

Темой, которая будет разработана, является Доверительный интервал, и, ссылаясь на Ричарда И. Левина и Дэвида С. Рубина, в их книге «Статистика для администраторов», сформулируйте концепцию доверительного интервала следующим образом:

доверительный интервал-статистика

Диапазон значений с обозначенной вероятностью, который включает в себя реальное значение параметра совокупности.

Чтобы понять эту концепцию более четко, вначале необходимо прокомментировать другие, которые, будучи связаны с ней, облегчают ее понимание.

Некоторые из этих концепций для обзора:

  • Оценка. Точка. Оценка. Интервальная оценка. Уровень достоверности. Пределы достоверности.

Оценить

(Del lat. Aestimatĭo, -ōnis). F. Признательность и ценность, которая дается и в которой что-то ценится и учитывается. - 2. Верно. То, что осуществляется при определенных налогах для определения стоимости налоговой базы.

Это понятие, которое мы можем найти в словаре. Но это также концепция, которую мы постоянно применяем в нашей повседневной жизни.

Каждый делает оценки. Чтобы пересечь улицу, и мы видим приближающуюся машину, мы оцениваем ее скорость и расстояние между нами и машиной, чтобы решить, ждать ли, чтобы пересечь или бежать, чтобы пересечь улицу.

Неявное в этом примере является одной из причин для оценки в качестве администраторов, менеджеров или руководителей групп: принятие решений на основе расчетов, оценка.

Администраторы должны делать быстрые оценки, результат которых влияет на организацию посредством решения, принятого на основе оценки. Оценки сделаны в:

  • Университет для определения уровня зачисления из года в год. В кредитном бюро, чтобы определить, сможет ли клиент досрочно оплатить свой долг, исходя из своих предыдущих кредитных привычек, которые были бы История. Чтобы установить бюджеты, основанные на информации из прошлого.

В каждом из этих случаев мы пытаемся сделать вывод, что, зная что-то о популяции из выборки, мы, как лица, принимающие решения, часто будем вынуждены принимать решения, доверяя своим инстинктам в наших предчувствиях, но в идеале каждый Его позиция заключается в том, что эти решения принимаются на основе наличия информации и применения статистических знаний для повышения эффективности.

С самого начала для Концепции оценки мы заключаем, что причины ее применения заключаются в следующем:

  1. Для того, чтобы принимать рациональные решения, на благо организации. Извлечение чего-либо из выборочной информации. Из методов с разумной точностью весь этот процесс должен быть в состоянии предоставить информацию для выполнения. лучший способ принятия решений.

Существует два типа оценки в отношении населения.

  • Оценить. Пунктуальная оценка интервала.

Эта последняя концепция поможет нам понять объективную концепцию нашей экспозиции - доверительный интервал.

Оценка Точки

Точечная оценка - это одно число, которое используется для оценки неизвестного параметра (данных) населения.

Пример: глава университета делал бы точную оценку, когда говорил: «В следующем учебном году, согласно нашим текущим данным, указывается, что по предмету« Философия и письма »у нас будет 350 студентов».

Утверждение похоже на подбрасывание монеты: либо true, либо false, у вас есть только два варианта. Поэтому точечная оценка часто оказывается недостаточной, потому что у вас есть только два варианта: это правильно или неправильно. Также, если нам скажут, что начальник отдела ошибается в своих оценках, возникнет следующий вопрос. Насколько далека оценка от реальной? Другими словами, какова оценка ошибки? Это не то же самое, что сказать, что оценка неверна для 10 студентов, чем для 90, разница определяется концепцией: НАДЕЖНОСТЬ.

Пример точечной оценки: среднее значение выборки является оценкой среднего значения надежной совокупности, особенно когда выборка достаточно велика. Но это точечная оценка, потому что она дает только один результат.

Чтобы объяснить это, даже если это уже видимая тема, мы рассмотрим формулу:

Где: ∑ x - сумма всех элементов в выборке.

И п число элементов.

Давайте посмотрим на пример клинической компании, которая производит одноразовые шприцы для подкожных инъекций. Каждый шприц поставляется в стерильной упаковке, которая, в свою очередь, поставляется в больших гофрокартонных коробках. В связи с тем, что шприцы упакованы в картонные коробки, они обрабатывают различное количество содержимого, поскольку шприцы продаются за штуку, поэтому для оценки компании необходимо оценить количество штук в коробке. биллинг.

Был взят случайный образец из 35 коробок, и было зафиксировано количество шприцев, содержащихся в указанном образце:

101 103 112 102 98 97 93
105 100 97 107 93 94 97
97 100 110 106 110 103 99
93 98 106 100 112 105 100
114 97 110 102 98 112 99

Используя формулу, мы получим следующее.

X = ∑x = 3570 = 102 шприца

п 35

Таким образом, при использовании выборочного среднего в качестве нашей оценки точечная оценка среднего составляет 102 шприца.

Вывод, который мы пришли бы к предыдущему примеру:

Таким образом, используя выборочное среднее в качестве оценщика, точечная оценка для одноразового шприца для подкожных инъекций составляет 102 шприца на коробку. Цена производства довольно низкая (около 25 центов), поэтому и точка, и покупатель примут эту оценку в качестве основы для выставления счета, а производитель может сэкономить время и затраты на подсчет каждой из шприцы, содержащиеся в коробках.

Цель взятия образцов - узнать больше о населении, будь то учащиеся, поступающие в следующий учебный год, или об общей поставке шприцев для подкожных инъекций, как в предыдущем примере, анализ которого начался с выборки из 35 человек. коробки.

Для этого мы можем положиться на точечные оценки, такие как выборочное среднее или интервальные оценки, в нашей следующей теме.

Интервальная оценка

Интервальная оценка описывает диапазон значений, в пределах которых это может быть параметром совокупности.

Среди его характеристик мы находим:

  • В интервальных оценках обрабатывается дополнительная концепция, которая подразумевает неопределенность, которая сопровождала упомянутую оценку. Заявление о интервале, в пределах которого вероятна средняя величина неизвестной совокупности. Чтобы предоставить указанное утверждение, необходимо найти ошибку стандарт среднего.

Чтобы объяснить это лучше, мы будем опираться на следующий пример:

Предположим, что директор по маркетинговым исследованиям на заводе по производству автозапчастей должен оценить средний срок службы автомобильных аккумуляторов, которые производит ваша компания. Выбирается случайная выборка из 200 аккумуляторов, регистрируемая от имени владельцев автомобилей и их адресов, таким же образом, как эти люди были опрошены относительно срока службы аккумулятора их автомобилей. После применения формулы среднего значения мы имеем в результате: 36 месяцев средней жизни.

Если точечная оценка среднего значения выборки используется в качестве наилучшей оценки среднего значения µ населения , то сообщается, что средний срок службы батарей компании составляет 36 месяцев.

Но предположим, что директор также знает о неопределенности, которая, вероятно, сопровождала оценку, то есть утверждение о интервале, в пределах которого может быть неизвестное среднее значение. Это определяется путем расчета стандартной ошибки среднего.

Для этого используется стандартная формула расчета средней ошибки:

Предположим, что стандартное отклонение 200 батарей было предварительно рассчитано и было определено как 10 месяцев. Используя эти данные и формулу, указанную в предыдущем окне. Получилось бы так.

Теперь можно сделать вывод, что оценка срока полезного использования батарей компании составляет 36 месяцев, а стандартная ошибка, сопровождающая эту оценку, составляет 0,707. Другими словами, фактическая продолжительность жизни для всех батарей может быть где-то в этом диапазоне оценки от 35 293 до 36 707 месяцев.

Мы уже подошли к первоначальной концепции выставки, доверительному интервалу, чтобы понять оценку интервала, отметив ее разницу с помощью оценки точки.

Напомним, что концепция Ричарда И. Левина и Дэвида С. Рубина в их книге «Статистика для администраторов» устанавливает концепцию доверительного интервала следующим образом:

Диапазон значений с обозначенной вероятностью, который включает в себя реальное значение параметра совокупности

Поскольку мы делаем это, чтобы понять концепцию доверительного уровня интервала, это вероятность того, что истинный параметр оценки находится в пределах оценки интервала.

То есть, опираясь на пример 200 батарей, сколько из них попадет в интервал, в котором находится среднее значение выборки, с пределами, которые мы установили с помощью формулы для стандартной ошибки среднего.

Уровень доверия

В статистике вероятность того, что мы связываем или относимся к интервальной оценке, называется уровнем достоверности.

Насколько мы уверены, что оценка, которую мы сделали для интервала, включает большую часть выборки, то есть проанализированных случаев.

Давайте проанализируем практический пример:

Рассмотрим, например, случай покупателя магазина электротоваров, который спрашивает о времени ожидания доставки новой стиральной машины. В таблице приведены вопросы, которые клиент может задать, и возможные ответы. Если вы наблюдаете, вы можете видеть, что существует прямая связь между уровнем достоверности и доверительным интервалом любой оценки.

Вопрос клиента Ответ сотрудника. Уровень доверия Доверительный интервал вовлечен
Будет ли стиральная машина прибывать через год? Я уверен в этом. Более 99% Один год.
Будет ли стиральная машина доставлена ​​мне через месяц? Я почти уверен, что он прибудет через месяц. Не менее 95% Один месяц
Будет ли стиральная машина доставлена ​​мне через неделю? Я весьма уверен. Около 80% Одна неделя
Завтра доставишь мне стиральную машину? Я не уверен, смогу ли я сделать это. Около 40% Один день
Придет ли стиральная машина до того, как я вернусь домой? Существует небольшая вероятность сделать это. Около 1% Один час.
  • Следует отметить, что когда доверительный интервал шире или длиннее, как в случае доставки, которая занимает год, оценка принимает очень нереалистичное значение, несмотря на то, что администратор дает ей уровень достоверности 99%. к этой оценке. Поскольку покупатель устанавливает более узкий интервал (время доставки), менеджер магазина соглашается с более низким уровнем уверенности, прибудет ли стиральная машина до того, как я вернусь домой? у него очень низкий уровень (1%).

Таким образом, мы находим доверительный интервал предыдущего примера:

Северная Каролина интервал
Более 99% Один год.
Не менее 95% Один месяц

Пределы доверия

Доверительный интервал часто выражается в виде стандартных ошибок, а не числовых значений. Следующим образом.

х ± 1,64 σ х, в которой:

x + 1.64 σ x = верхний предел интервала.

х - 1,64 σ х = нижний предел интервала.

Эти пределы известны как доверительные пределы доверительного интервала. (ЛИК)

ЧТО ТАКОЕ MINITAB?

Minitab - это компьютерная программа, предназначенная для выполнения основных и расширенных статистических функций. Он сочетает в себе удобство использования Microsoft Excel с возможностью запуска статистического анализа. В 1972 году преподаватели программы статистического анализа в Университете штата Пенсильвания разработали MINITAB как облегченную версию OMNITAB, программы статистического анализа Национального института стандартов и технологий США (NIST). Полная версия в 2006 году стоит 1195 долларов, но в качестве дополнения к некоторым учебникам предлагается студенческая и академическая версия.

Рабочая среда с Minitab делится на:

  • Панель меню. Панель инструментов. Область «Сессия». Область «Рабочий лист».

Минитаб среда

Доверительные интервалы

Пример веса мешка фри

вопрос

Предположим, вы хотите рассчитать доверительный интервал для 100 пакетов с картофелем фри с установленным весом 40 грамм и вам необходимо убедиться, что средний процесс находится в пределах 2,5 грамм, что является целью.

Один из способов ввода данных - сбор, используя столбец, суммы сотен жареных пакетов, это называется сбором данных.

Чтобы обработать другую опцию в Minitab, мы случайным образом сгенерируем ряд данных следующим образом:

1.-Calc Меню> Случайные данные> Нормальный

Откроется диалоговое окно с вопросами, такими как количество строк, среднее значение и стандартное отклонение.

Поскольку мы работаем с определенным весом упаковки, это указывается путем ввода в полях: в среднем 40 и отклонения 2,5 грамма, количества строк: 100, столбец находится в магазине в столбце (столбцах) двойным щелчком мыши, в списке в левом поле.

Нажмите ОК

Серия из 100 чисел будет сгенерирована случайным образом, как показано ниже.

После того, как наши отношения из 100 пакетов фри (серии чисел) были созданы, мы приступаем к установлению доверительного интервала.

Но прежде чем продолжить.

Что такое доверительный интервал?

Доверительный интервал - это диапазон возможных значений периметра популяции (например, µ), основанный на данных выборки. Например, очень часто вы будете использовать образец для расчета µ. Конфиденциальный интервал скажет вам, как далеко вы будете ждать этого расчета. Когда использовать доверительный интервал?

Используйте доверительный интервал, чтобы сделать выводы из одной или нескольких выборок данных.

  1. - Меню Стат> Основная статистика> 1-образец t.

(См. Следующий рисунок, чтобы увидеть последовательность нажатий)

Затем появится диалоговое окно с указанием уровня достоверности искомого интервала и переменной для работы (это в случае нескольких столбцов, дважды щелкните столбец для работы, чтобы перейти к разделу от переменных).

Нажмите на графики

Выберите Boxplot данных.

Нажмите ОК

Интерпретация результатов

Доверительный интервал

Доверительный интервал - это диапазон возможных значений µ. Графически это показано красной линией и двумя квадратными квадратами ниже графика.

Это 95% доверительный интервал, потому что мы берем 100 выборок из одной популяции, 95 интервалов выборок будут включать µ. Поэтому для любого примера, который может быть на 95% уверен, что µ находится в пределах доверительного интервала.

На следующем листе графическое изображение максимально развернуто для удобства восприятия.

Область Session также предоставляет вам информацию, обработанную из исходных данных:

Интерпретировать:

N (количество данных).

М (Среднее).

St Dev (стандартное отклонение)

95% ДИ (95% доверительный интервал).

(39 426 40 428) (доверительный интервал.

Если вы хотите сохранить сгенерированный проект:

Нажмите Файл меню> Сохранить проект как.

Дайте имя и сохраните в нужном месте.

Обобщение пособия.

  • Серия случайных данных была сгенерирована. (Вместо этого параметра Сбор данных дается из сетки или из файлов данных.) Придание ему определенных характеристик. (Среднее и стандартное отклонение.) Был проведен анализ и обработка указанных данных. (Доверительный интервал) Получено из предыдущего информационного процесса. Мы знаем доверительный интервал с уровнем надежности 95%.

Библиография

«Статистика для администраторов», Ричард И. Левин и Дэвид С. Рубин. Редакционный зал Prentice.

Скачать оригинальный файл

Расчет доверительных интервалов с использованием minitab