Разница между описательной и логической статистикой
Область статистики делится на два основных раздела: описательная и выводная. Каждый из этих сегментов важен, поскольку предлагает разные методы для достижения разных целей. Описательная статистика описывает, что происходит в популяции или наборе данных. Логическая статистика, напротив, позволяет ученым делать выводы из выборки и обобщать их на большую совокупность. Два типа статистики имеют некоторые важные различия.
Описательная статистика
Описательная статистика — это тип статистики, который, вероятно, приходит в голову большинству людей, когда они слышат слово «статистика». В этой ветке статистики целью является описание. Числовые меры используются, чтобы рассказать об особенностях набора данных. Есть ряд элементов, которые относятся к этой части статистики, например:
- Среднее значение или мера центра набора данных, состоящая из среднего значения, медианы, моды или среднего диапазона.
- Разброс набора данных, который можно измерить с помощью диапазона или стандартного отклонения
- Общие описания данных, такие как сводка по пяти числам
- Измерения, такие как асимметрия и эксцесс
- Изучение взаимосвязей и корреляции между парными данными
- Представление статистических результатов в графическом виде
Эти меры важны и полезны, потому что они позволяют ученым видеть закономерности среди данных и, таким образом, понимать эти данные. Описательную статистику можно использовать только для описания изучаемой совокупности или набора данных: результаты нельзя обобщать на какую-либо другую группу или совокупность.
Типы описательной статистики
Социологи используют два вида описательной статистики:
Показатели центральной тенденции фиксируют общие тенденции в данных, рассчитываются и выражаются как среднее значение, медиана и мода. Среднее сообщает ученым среднее математическое значение всего набора данных, например, средний возраст вступления в первый брак; медиана представляет собой середину распределения данных, например возраст, который находится в середине диапазона возрастов, в которых люди впервые вступают в брак; и этот способ может быть наиболее распространенным возрастом, в котором люди впервые вступают в брак.
Меры распространения описывают, как данные распределяются и соотносятся друг с другом, в том числе:
- Диапазон, весь диапазон значений, присутствующих в наборе данных
- Распределение частоты, которое определяет, сколько раз конкретное значение встречается в наборе данных.
- Квартили, подгруппы, сформированные в наборе данных, когда все значения разделены на четыре равные части по диапазону, среднее значение того, насколько каждое значение отклоняется от среднего значения, которое показывает, какой разброс существует в данных.
- Стандартное отклонение, которое иллюстрирует разброс данных относительно среднего
Показатели распространения часто визуально представлены в таблицах, круговых и гистограммах, а также в гистограммах, чтобы помочь понять тенденции в данных.
Выведенный статистика
Выводная статистика создается с помощью сложных математических расчетов, которые позволяют ученым делать выводы о тенденциях в отношении большей совокупности на основе изучения взятой из нее выборки. Ученые используют логическую статистику для изучения взаимосвязей между переменными в выборке, а затем делают обобщения или прогнозы о том, как эти переменные будут относиться к большей совокупности.
Как правило, невозможно обследовать каждого члена популяции в отдельности. Поэтому ученые выбирают репрезентативное подмножество населения, называемое статистической выборкой, и на основе этого анализа они могут что-то сказать о населении, из которого была получена выборка.Есть два основных подразделения логической статистики:
- Доверительный интервал дает диапазон значений для неизвестного параметра генеральной совокупности путем измерения статистической выборки. Это выражается в терминах интервала и степени уверенности в том, что параметр находится в пределах интервала.
- Тесты значимости или проверки гипотез, когда ученые делают заявления о населении, анализируя статистическую выборку. По замыслу в этом процессе присутствует некоторая неопределенность. Это может быть выражено в терминах уровня значимости.
Методы, которые социологи используют для изучения взаимосвязей между переменными и, таким образом, для создания выводной статистики, включают анализ линейной регрессии, анализ логистической регрессии, ANOVA, корреляционный анализ, моделирование структурными уравнениями и анализ выживания. При проведении исследований с использованием статистики логического вывода ученые проводят тест на значимость, чтобы определить, могут ли они обобщить свои результаты на более широкую популяцию. Общие тесты значимости включают хи-квадрат и t-критерий. Они говорят ученым о вероятности того, что результаты их анализа выборки репрезентативны для населения в целом.
Описательная статистика против логической статистики
Хотя описательная статистика полезна для изучения таких вещей, как разброс и центр данных, ничто в описательной статистике не может быть использовано для каких-либо обобщений. В описательной статистике такие измерения, как среднее значение и стандартное отклонение, указываются как точные числа.
Несмотря на то, что в логической статистике используются некоторые похожие вычисления, такие как среднее значение и стандартное отклонение, в логической статистике основное внимание уделяется другому. Логическая статистика начинается с выборки, а затем обобщается на совокупность. Эта информация о населении не указывается в виде числа. Вместо этого ученые выражают эти параметры как диапазон потенциальных чисел вместе со степенью достоверности.