1 просмотров

Плюс четыре доверительных интервала

Более точный расчет значения неизвестной доли населения

  • Делиться
  • флипборд
  • Эл. адрес

Деловая женщина просматривает графики на цифровом планшете на деловой встрече

Монти Ракусен / Getty Images

  • доктор философии по математике, Университет Пердью
  • Магистр математики, Университет Пердью
  • Бакалавр математики, физики и химии, Университет Андерсона

Кортни К. Тейлор, доктор философии, профессор математики в Университете Андерсона и автор книги «Введение в абстрактную алгебру».

В логической статистике доверительные интервалы для долей населения основаны на стандартном нормальном распределении для определения неизвестных параметров данной совокупности с учетом статистической выборки совокупности. Одна из причин этого заключается в том, что для подходящих размеров выборки стандартное нормальное распределение отлично подходит для оценки биномиального распределения. Это замечательно, потому что, хотя первое распределение является непрерывным, второе — дискретным.

Существует ряд вопросов, которые необходимо решить при построении доверительных интервалов для пропорций. Один из них касается так называемого доверительного интервала «плюс четыре», который приводит к необъективной оценке.Однако эта оценка неизвестной доли населения в некоторых ситуациях работает лучше, чем несмещенные оценки, особенно в тех ситуациях, когда в данных нет ни успехов, ни неудач.

В большинстве случаев наилучшей попыткой оценить долю населения является использование соответствующей доли выборки. Предположим, что существует популяция с неизвестной долей п его особей, содержащих определенный признак, то формируем простую случайную выборку размером н из этого населения. Из этих н особи, мы подсчитываем их количество Д которые обладают интересующей нас чертой. Теперь мы оцениваем p, используя нашу выборку. Доля выборки Да/нет является несмещенной оценкой п.

Когда использовать доверительный интервал плюс четыре

Когда мы используем интервал плюс четыре, мы модифицируем оценку п. Мы делаем это, добавляя четыре к общему количеству наблюдений, таким образом объясняя фразу «плюс четыре». Затем мы разделяем эти четыре наблюдения на два гипотетических успеха и две неудачи, что означает, что мы добавляем два к общему количеству успехов. конечным результатом является то, что мы заменяем каждый экземпляр Да/нет с (Д + 2)/(н + 4), и иногда эту дробь обозначают п с тильдой над ним.

Доля выборки обычно очень хорошо подходит для оценки доли совокупности. Однако в некоторых ситуациях нам необходимо немного изменить нашу оценку. Статистическая практика и математическая теория показывают, что модификация интервала плюс четыре подходит для достижения этой цели.

Одной из ситуаций, которая должна заставить нас рассмотреть интервал плюс четыре, является неравномерная выборка. Во многих случаях из-за того, что доля населения очень мала или велика, доля выборки также очень близка к 0 или очень близка к 1. В такой ситуации мы должны рассматривать интервал плюс четыре.

Еще одна причина использования интервала плюс четыре заключается в том, что у нас небольшой размер выборки.Интервал плюс четыре в этой ситуации обеспечивает лучшую оценку доли населения, чем использование типичного доверительного интервала для доли.

Правила использования доверительного интервала плюс четыре

Доверительный интервал плюс четыре — это почти волшебный способ более точного вычисления выводной статистики, поскольку простое добавление четырех воображаемых наблюдений к любому заданному набору данных, двух успешных и двух неудачных, позволяет более точно предсказать долю набора данных, которая подходит по параметрам.

Однако доверительный интервал плюс четыре не всегда применим к каждой проблеме. Его можно использовать только в том случае, если доверительный интервал набора данных превышает 90%, а размер выборки составляет не менее 10. Однако набор данных может содержать любое количество успехов и неудач, хотя он работает лучше, когда есть либо нет успехов, либо нет неудач в любых заданных данных населения.

Имейте в виду, что в отличие от расчетов обычной статистики, расчеты логической статистики основаны на выборке данных для определения наиболее вероятных результатов в совокупности. Хотя доверительный интервал плюс четыре корректирует большую погрешность, эту погрешность необходимо учитывать, чтобы обеспечить наиболее точное статистическое наблюдение.

голоса
Рейтинг статьи
Статья в тему:  В чем важность химии?
Ссылка на основную публикацию
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x