Верны ли определения?
А) Бесповторная выборка — выборка, при которой объекты извлекают по одному из всей генеральной совокупности.
В) Выборочная совокупность или выборка представляет собой результаты наблюдений над ограниченным числом объектов из этой совокупности.
Подберите правильный ответ
Верны ли определения?
А) Варианта — это среднее арифметическое значение признака выборочной совокупности.
В) Предельная ошибка выборки — это максимально возможное расхождение средних или максимум ошибок при заданной вероятности ее появления.
Подберите правильный ответ
Верны ли определения?
А) Внутригрупповая дисперсия определяется как средняя арифметическая дисперсий, взвешенная по объемам групп.
В) Распределение случайной величины — совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины.
Подберите правильный ответ
Верны ли определения?
А) Выборочная дисперсия определяется как среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.
В) Генеральная дисперсия определяется как среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.
Подберите правильный ответ
Верны ли определения?
А) Выборочная средняя есть среднее арифметическое значение признака выборочной совокупности.
В) Простой случайный отбор — выборка, при которой отобранный объект в генеральную совокупность не возвращается.
Подберите правильный ответ
Верны ли определения?
А) Выборочная средняя определяется как среднее арифметическое значение признака выборочной совокупности.
В) Генеральная средняя — среднее арифметическое значение признака выборочной совокупности.
Подберите правильный ответ
Верны ли определения?
А) Повторная выборка — выборка, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
В) Выборочное распределение — это вероятностное пространство, элементами которого являются наблюдения (х1), (х2), (xn) и все элементы которого равновероятны: (Р(хi) = 1/n).
Подберите правильный ответ
Верны ли определения?
А) Статистическое распределение выборки — это функция распределения F (х) генеральной совокупности.
В) Частота — это число наблюдений значения случайной величины.
Подберите правильный ответ
Верны ли определения?
А) Эффективная статистическая оценка — статистическая оценка, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию.
В) Выборочное пространство — вероятностное пространство, элементами которого являются наблюдения (х1), (х2), (xn) и все элементы которого равновероятны: (Р(хi) = 1/n).
Подберите правильный ответ
Верны ли определения?
А) Генеральная совокупность — это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины, или совокупность результатов всех мыслимых наблюдений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объектов.
В) Выборочное среднее квадратическое отклонение можно рассчитать как квадратный корень из выборочной дисперсии.
Подберите правильный ответ
Верны ли определения?
А) Дисперсия дискретной случайной величины равна математическому ожиданию квадрата отклонения случайной величины от ее математического ожидания.
В) Групповая дисперсия есть среднее арифметическое значений признака, принадлежащих группе.
Подберите правильный ответ
Верны ли определения?
А) Коэффициент вариации определяется как выраженное в процентах отношение выборочной средней к выборочному среднему квадратическому отклонению:
В) Доверительный интервал покрывает неизвестный параметр с заданной надежностью.
Подберите правильный ответ
Верны ли определения?
А) Мода — элемент выборки, встречающийся с наибольшей частотой.
В) Медиана — элемент выборки, встречающийся с наибольшей частотой.
Подберите правильный ответ
Верны ли определения?
А) Отклонение определяется как разность между наибольшей и наименьшей вариантами.
В) Размах варьирования — определяется как разность между наибольшей и наименьшей вариантами.
Подберите правильный ответ
Верны ли утверждения?
А) Состоятельная статистическая оценка — это свойство выборки отражать характеристики изучаемой генеральной совокупности.
В) Статистическая оценка есть приближенное значение неизвестного параметра, полученное по выборке.
Подберите правильный ответ
Выборочная совокупность задана таблицей распределения
Выборочная средняя равна 2, n = 50. Выборочная дисперсия равна __________
Выборочная совокупность задана таблицей распределения
Найти выборочную среднюю.
Дана таблица частот выборочного распределения:
Общая средняя равна __________
Пусть дана таблица частот для некоторых двух групп:
Межгрупповая средняя равна
_________ называют математическое ожидание величины Xk: μ = M (Xk)
__________ определяется как число наблюдений значения случайной величины
Вероятность заданной ошибки выборки составляет __________
Дисперсия групповых средних относительно общей средней —
Дисперсия значений признака всей совокупности относительно общей средней
Дисперсия значений признака, принадлежащих группе, относительно групповой средней —
К отбору, не требующему расчленения генеральной совокупности на части, относятся: 1) простой случайный бесповторный отбор; 2) простой случайный повторный отбор; 3) типический отбор; 4) серийный отбор
К отбору, требующему расчленения генеральной совокупности на части, относятся: 1) механический; 2) простой случайный повторный отбор; 3) типический отбор; 4) серийный отбор
Максимально возможное расхождение средних или максимум ошибки при заданной вероятности ее появления называют __________
Математическое ожидание величины (Х-М(Х))k — это
Отношение суммы частот вариант, попавших в i-й интервал, к длине интервала — это _________
Отношение частоты случайной величины к объему выборки — это
Последовательность вариант, записанных в возрастающем порядке, — это
Приближенное значение неизвестного параметра, полученное по выборке, — это
Разность между значением признака и общей средней — это _________
Разность между наибольшей и наименьшей вариантами составляет __________
Совокупность результатов всех мыслимых наблюдений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объектов, — это
Соответствие между наблюдаемыми вариантами и их частотами или относительными частотами — это
Среднее арифметическое значение признака выборочной совокупности называют __________
Среднее арифметическое значений признака генеральной совокупности называют __________
Среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения — это _________
Среднее значение k-x степеней разностей хi — С: Mk* = (Σni (xi — С)k)/n называют _________
Среднее значение отклонения равно
Статистическая оценка, которая имеет наименьшую возможную дисперсию, — это
Статистическая оценка, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки, — это _________
Сумма произведений отклонений на соответствующие частоты равна __________
Ошибка
репрезентативности
— расхождение между выборочной
характеристикой и характеристикой
генеральной совокупности.
Ошибки
репрезентативности
-
Систематические
— возникают в результате нарушения
научных принципов отбора единиц
совокупности (преднамеренные и
непреднамеренные). -
Случайные
возникают в результате несплошного
характера наблюдения (средняя и
предельная ошибки выбора).
Случайные
ошибки могут быть доведены до незначительных
размеров, а главное, их размеры и пределы
можно определить с достаточной точностью
на основании закона больших чисел.
Средняя
ошибка выборки
— такое расхождение между средними
выборочной и генеральной совокупностями,
которое не превышает ±.
В
математической статистике доказывается,
что значения средней ошибки выборки
определяются по формулам:
Формула
для определения величины средней ошибки
выборки для количественного признака:
Формула
для определения величины средней ошибки
выборки для альтернативного признака:
Полученное
значение средней ошибки необходимо для
установления возможного значения .
Которое определяется по формуле:
Но
такое суждение можно гарантировать не
с абсолютной
достоверностью, а лишь с определенной
степенью
вероятности.
В
математической статистике доказывается,
что пределы значений характеристик
генеральной совокупности отличаются
от характеристик выборочной совокупности
лишь с вероятностью, которая определена
числом 0,683.
Это
означает, что в 683 случаях из 1000 генеральная
средняя будет находиться в установленных
пределах, т.е. отклонение ГС от ВС не
превысит однократной средней ошибки
выборки. В остальных 317 случаях они могут
выйти за эти пределы. Вероятность можно
повысить, если расширить пределы
отклонений. Так, при удвоенном значении
,
вероятность достигает 0,954 ().
Если утроить значение то вероятность
увеличится до 0,997 ().
Возможное |
Вероятность |
|
0,683 |
|
0,954 |
|
0,997 |
Если
обозначить значение увеличения
за
t,
то можно записать в общем виде:
Множитель
t
называется коэффициентом
доверия.
Известный русский математик А.М.Ляпунов
дал выражение конкретных значений
множителя t
для различных степеней вероятности в
виде функции:
На
практике пользуются готовыми таблицами
этой функции.
t |
0 |
0,1 |
0,5 |
1 |
1,5 |
2 |
2,5 |
2,6 |
3 |
4 |
(t) |
0,1 |
0,0797 |
0,3829 |
0,6827 |
0,8664 |
0,9545 |
0,9876 |
0,9907 |
0,9973 |
0,99994 |
Из
вышесказанного следует, что лишь с
определенной степенью вероятности
можно утверждать, что показатели
генеральной совокупности и их отклонения
не превысят величину .
Полученную величинуназываетсяпредельной
ошибкой выборки.
Предельная
ошибка выборки
—
максимально
возможное расхождение выборочной и
генеральной средних,
т.е.
максимум ошибки при заданной вероятности
ее появления.
Предельная
ошибка выборки для количественного
признака:
Предельная
ошибка выборки для альтернативного
признака:
В
связи с тем, что существуют различные
методы, виды и способы отбора единиц из
генеральной совокупности формулы для
расчета средней ошибки выборки также
будут различаться:
Способ |
Оцениваемый |
Повторный |
Бесповторный |
Собственно случайный механический |
Средняя |
|
|
Доля |
|
|
|
Типический |
Средняя |
|
|
Доля |
|
|
|
Серийный |
Средняя |
|
|
Доля |
|
|
— средняя из групповых дисперсий;
wi
— доля
единиц совокупности, обладающих изучаемым
признаком в i-й
типической
группе;
— средняя из групповых дисперсий для
доли. В табл. 6.6 представлены формулы
для исчисления средней ошибки выборки
при типическом отборе;
S
– общее число серий;
s
– число отобранных серий;
—
межгрупповая дисперсия средних,
определяемая по формуле:
—
межгрупповая дисперсия доли, определяемая
по формуле:
— средняя
i-й
серии;
—
средняя по всей выборочной совокупности;
w
— доля признака i-й
серии;
— общая доля признака во всей выборочной
совокупности.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Между признаками выборочной совокупности и признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой статистического наблюдения. При массовом наблюдении ошибки неизбежны, но возникают они в результате действия различных причин. Величина возможной ошибки выборочного признака слагается из ошибок регистрации и ошибок репрезентативности. Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п.
Под ошибкой репрезентативности (представительства) понимают расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности. Ошибки репрезентативности бывают случайными и систематическими.
Систематические ошибки связаны с нарушением установленных правил отбора. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности. В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки. Особенность ошибки смещения состоит в том, что, представляя собой постоянную часть ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается. Кроме того, величину случайной ошибки можно определить, тогда как размер ошибки смещения непосредственно практически определить очень сложно, а иногда и невозможно. Поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.
Ошибки смещения бывают преднамеренными и непреднамеренными. Причиной возникновения преднамеренной ошибки является тенденциозный подход к выбору единиц из генеральной совокупности. Чтобы не допустить появления такой ошибки, необходимо соблюдать принцип случайности отбора единиц.
Непреднамеренные ошибки могут возникать на стадии подготовки выборочного наблюдения, формирования выборочной совокупности и анализа ее данных. Чтобы не допустить появления таких ошибок, необходима хорошая основа выборки, т. е. та генеральная совокупность, из которой предполагается производить отбор, например список единиц отбора. Основа выборки должна быть достоверной, полной и соответствовать цели исследования, а единицы отбора и их характеристики должны соответствовать действительному их состоянию на момент подготовки выборочного наблюдения. Нередки случаи, когда в отношении некоторых единиц, попавших в выборку, трудно собрать сведения из-за их отсутствия на момент наблюдения, нежелания дать сведения и т. п. В таких случаях эти единицы приходится заменять другими. Необходимо следить, чтобы замена осуществлялась равноценными единицами.
Случайная ошибка выборки возникает в результате случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности, т. е. она связана со случайным отбором. Теоретическим обоснованием появления случайных ошибок выборки являются теория вероятностей и ее предельные теоремы.
Сущность предельных теорем состоит в том, что в массовых явлениях совокупное влияние различных случайных причин на формирование закономерностей и обобщающих характеристик будет сколь угодно малой величиной или практически не зависит от случая. Так как случайная ошибка выборки возникает в результате случайных различий между единицами выборочной и генеральной совокупностей, то при достаточно большом объеме выборки она будет сколь угодно мала.
Предельные теоремы теории вероятностей позволяют определять размер случайных ошибок выборки. Различают среднюю (стандартную) и предельную ошибку выборки. Под средней (стандартной) ошибкой выборки понимают расхождение между средней выборочной и генеральной совокупностей. Предельной ошибкой выборки принято считать максимально возможное расхождение, т. е. максимум ошибки при заданной вероятности ее появления.
Интересно
В математической теории выборочного метода сравниваются средние характеристики признаков выборочной и генеральной совокупностей и доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются.
Чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик. На основании теоремы, доказанной П. Л. Чебышевым, величину стандартной ошибки простой случайной выборки при достаточно большом объеме выборки (n) можно определить по формуле:
где µх– стандартная ошибка.
Из этой формулы средней (стандартной) ошибки простой случайной выборки видно, что величина µх зависит от изменчивости признака в генеральной совокупности (чем больше вариация признака, тем больше ошибка выборки) и от объема выборки n чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик).
Академик А. М. Ляпунов доказал, что вероятность появления случайной ошибки выборки при достаточно большом ее объеме подчиняется закону нормального распределения. Эта вероятность определяется по формуле:
В математической статистике употребляют коэффициент доверия t, и значения функции F(t) табулированы при разных его значениях, при этом получают соответствующие уровни доверительной вероятности.
Коэффициент доверия позволяет вычислить предельную ошибку выборки, вычисляемую по формуле:
Из формулы вытекает, что предельная ошибка выборки равна кратному числу средних ошибок выборки.
Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью.
Выборочное наблюдение дает возможность определить среднюю арифметическую выборочной совокупности х и величину предельной ошибки этой средней ∆х, которая показывает с определенной вероятностью), насколько выборочная может отличаться от генеральной средней в большую или меньшую сторону.
Тогда величина генеральной средней будет представлена интервальной оценкой, для которой нижняя граница будет равна.
Интервал, в который с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительным, а вероятность Р – доверительной вероятностью.
Чаще всего доверительную вероятность принимают равной 0,95 или 0,99, тогда коэффициент доверия t равен соответственно 1,96 и 2,58. Это означает, что доверительный интервал с заданной вероятностью заключает в себе генеральную среднюю.
Наряду с абсолютной величиной предельной ошибки выборки рассчитывается и относительная ошибка выборки, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:
Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки. Средняя (стандартная) ошибка выборки зависит от объема выборки и степени вариации признака в генеральной совокупности.
Ошибка выборки г —
средние
, или стандартные
; предельные.
(Статистика туризма)
ОПРЕДЕЛЕНИЕ СРЕДНЕЙ ОШИБКИ ВЫБОРКИ
Ошибка выборки
— расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности. Факторы, влияющие на величину ошибки выборки:
1) степень вариации изучаемого признака; 2) численность выборки; 3) методы отбора единиц в выборочную совокупность; 4) принятый…
(Общая теория статистики)
Нахождение ошибок и объема большой выборки
Одна из задач, которую позволяет решать выборочный метод, — нахождение ошибки выборки. В теории статистики определяют среднюю (стандартную), предельную и относительную ошибки выборочного наблюдения. В теории вероятностей доказывается, что при случайном и механическом отборах средняя ошибка выборки для…
(Общая теория статистики)
РАСЧЕТ СРЕДНИХ И ПРЕДЕЛЬНЫХ ОШИБОК ВЫБОРКИ ПРИ РАЗЛИЧНЫХ ВИДАХ ОТБОРА
Ошибка выборки г —
расхождение (разность) между характеристиками генеральной и выборочной совокупностей. Все возможные ошибки выборки подразделяют: на средние
, или стандартные
; предельные.
Ошибка выборки может возникнуть по разным причинам и…
(Статистика туризма)
ПРЕДЕЛЬНАЯ ОШИБКА ВЫБОРКИ. ОПРЕДЕЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ
Предельной ошибкой выборки
принято считать максимально возможное расхождение (х-х), т.е. максимум ошибки при заданной вероятности ее появления; х —
выборочная средняя, х — генеральная средняя. В математической статистике употребляют коэффициент доверия
t
и значения функции…
(Общая теория статистики)
СРЕДНЯЯ И ПРЕДЕЛЬНАЯ ОШИБКИ ВЫБОРКИ. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ И ЕГО ПОСТРОЕНИЕ
Определение 2.11. Наибольшее возможное отклонение А выборочной средней (или доли) от генеральной средней (или доли) при данной надежности у называется предельной ошибкой.
Следующая теорема позволяет просто найти предельную ошибку по средней ошибке выборки. Теорема 2.1. Предельная ошибка равна…
(Математическая статистика)
Ошибка выборки
— это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методом отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования.
Для репрезентативности выборки важно обеспечить случайность отбора, с тем, чтобы все объекты генеральной совокупности имели равные вероятности попасть в выборку. Для обеспечения репрезентативности выборки применяют следующие способы отбора:
· собственно-случайная
(простая случайная) выборка (последовательно отбирается первый случайно попавшийся объект);
· механическая
(систематическая) выборка;
· типическая
(стратифицированная, расслоенная) выборка (объекты отбираются пропорционально представительству различных типов объектов в генеральной совокупности);
· серийная
(гнездовая) выборка.
Отбор единиц в выборочную совокупность может быть повторным или бесповторным. При повторном отборе
попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. При бесповторном отборе
попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует
Выборочное наблюдение всегда связано с ошибкой, поскольку число отобранных единиц не равно исходной (генеральной) совокупности. Случайные ошибки выборки обусловлены действием случайных факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Поэтому получаемые случайные ошибки должны быть статистически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка таких ошибок и является основной задачей, решаемой в теории выборочного наблюдения. Обратной задачей является определение такой минимально необходимой численности выборочной совокупности, при которой ошибка не превысит заданной величины. На выработку навыков в решении этих задач и направлен материал данного раздела.
Собственно-случайная выборка
. Ее суть заключается в отборе единиц из генеральной совокупности в целом, без разделения ее на группы, подгруппы или серии отдельных единиц. При этом единицы отбираются в случайном порядке, не зависящем ни от последовательности расположения единиц в совокупности, ни от значений их признаков.
После проведения отбора с использованием одного из алгоритмов, реализующих принцип случайности, или на основе таблицы случайных чисел, определяются границы генеральных характеристик. Для этого рассчитываются средняя и предельная ошибки выборки.
Средняя ошибка повторной собственно-случайной выборки
определяется по формуле
где σ — среднее квадратическое отклонение изучаемого признака;
n — объем (число единиц) выборочной совокупности.
Предельная ошибка выборки
связана с заданным уровнем вероятности. При решении представленных ниже задач требуемая вероятность составляет 0,954 (t = 2) или 0,997 (t = 3). С учетом выбранного уровня вероятности и соответствующего ему значения t предельная ошибка выборки составит:
Тогда можно утверждать, что при заданной вероятности генеральная средняя будет находиться в следующих границах:
При определении границ генеральной доли
при расчете средней ошибки выборки используется дисперсия альтернативного признака, которая вычисляется по следующей формуле:
где w — выборочная доля, т. е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака.
При решении отдельных задач необходимо учитывать, что при неизвестной дисперсии альтернативного признака можно использовать ее максимально возможную величину, равную 0,25.
Пример
. В результате выборочного обследования незанятого населения, ищущего работу, проведенного на основе собственно-случайной повторной выборки
были получены данные, приведенные в табл. 1.14.
Таблица 1.14
Результаты выборочного обследования незанятого населения
С вероятностью 0,954 определите границы:
а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого населения.
Решение.
Для определения средней ошибки выборки необходимо, прежде всего, определить выборочную среднюю величину и дисперсию изучаемого признака. Для этого, при ручном способе расчета целесообразно построить таблицу 1.15.
Таблица 1.15
Расчет среднего возраста незанятого населения и дисперсии
На основании данных таблицы рассчитываются необходимые показатели:
· выборочная средняя величина:
;
· дисперсия:
· среднеквадратичное отклонение:
.
Средняя ошибка выборки составит:
года.
Определим с вероятностью 0,954 (t
= 2) предельную ошибку выборки:
года.
Установим границы генеральной средней: (41,2 — 1,6) (41,2+1,6) или:
Таким образом, на основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средний возраст незанятого населения, ищущего работу, лежит в пределах от 40 до 43 лет.
Для ответа на вопрос, поставленный в пункте «б» данного примера, по выборочным данным определим долю лиц в возрасте до 25 лет и рассчитаем дисперсию доли:
Рассчитаем среднюю ошибку выборки:
Предельная ошибка выборки с заданной вероятностью составит:
Определим границы генеральной доли:
Следовательно, с вероятностью 0,954 можно утверждать, что доля лиц в возрасте до 25 лет в общей численности незанятого населения находится в пределах от 3,9 до 1 1,9%.
При расчете средней ошибки собственно-случайной бесповторной
выборки необходимо учитывать поправку на бесповторность отбора:
где N — объем (число единиц) генеральной совокупности/
Необходимый объем собственно-случайной повторной выборки
определяется по формуле:
Если отбор бесповторный, то формула приобретает следующий вид:
Полученный на основе использования этих формул результат всегда округляется в большую сторону до целого значения.
Пример.
Необходимо определить, сколько учащихся первых классов школ района необходимо отобрать в порядке собственно-случайной бесповторной выборки, чтобы с вероятностью 0,997 определить границы среднего роста первоклассников с предельной ошибкой 2 см. Известно, что всего в первых классах школ района обучается 1100 учеников, а дисперсия роста по результатам аналогичного обследования в другом районе составила 24.
Решение.
Необходимый объем выборки при уровне вероятности 0,997 (t
= 3) составит:
Таким образом, для получения данных о среднем росте первоклассников с заданной точностью необходимо обследовать 52 школьника.
Механическая выборка
. Данная выборка заключается в отборе единиц из общего списка единиц генеральной совокупности через равные интервалы в соответствии с установленным процентом отбора. При решении задач на определение средней ошибки механической выборки, а также необходимой ее численности, следует использовать приведенные выше формулы, применяемые при собственно-случайном бесповторном отборе.
Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке — каждая 20-я единица (1:0,05) и т.д.
Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.
Важной особенностью механической выборки является то, что формирование выборочной совокупности можно осуществить, не прибегая к составлению списков. На практике часто используют тот порядок, в котором фактически размещаются единицы генеральной совокупности. Например, последовательность выхода готовых изделий с конвейера или поточной линии, порядок размещения единиц партии товара при хранении, транспортировке, реализации и т.д.
Типическая выборка.
Эта выборка применяется в тех случаях, когда единицы генеральной совокупности объединены в несколько крупных типичных групп. Отбор единиц в выборку производится внутри этих групп пропорционально их объему на основе использования собственно-случайной или механической выборки (при наличии необходимой информации отбор также может производиться пропорционально вариации изучаемого признака в группах).
Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации.
Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.
Средняя ошибка типической выборки определяется по формулам:
(повторный отбор);
(бесповторный отбор),
где — средняя из внутригрупповых дисперсией.
Пример
. В целях изучения доходов населения по трем районам области сформирована 2%-ная выборка, пропорциональная численности населения этих районов. Полученные результаты представлены в табл. 16.
Таблица 16
Результаты выборочного обследования доходов населения
Необходимо определить границы среднедушевых доходов населения по области в целом при уровне вероятности 0,997.
Решение.
Рассчитаем среднюю из внутригрупповых дисперсий:
где N i
— объем i
-и группы;
n, — объем выборки из /-и группы.
Серийная выборка
. Эта выборка используется в тех случаях, когда единицы изучаемой совокупности объединены в небольшие равновеликие группы или серии. Единицей отбора в этом случае является серия. Серии отбираются с использованием собственно-случайной либо механической выборки, а внутри отобранных серий обследуются все без исключения единицы.
В основе расчета средней ошибки серийной выборки лежит межгрупповая дисперсия:
(повторный отбор);
(бесповторный отбор),
где x i
— число отобранных i
— серий;
R
— общее число серий.
Межгрупповую дисперсию при равновеликих группах вычисляют следующим образом:
где х i
— средняя i-и серии;
х
— общая средняя по всей выборочной совокупности.
Пример
. В целях контроля качества комплектующих из партии изделий, упакованных в 50 ящиков по 20 изделий в каждом, была произведена 10%-ная серийная выборка. По попавшим в выборку ящикам среднее отклонение параметров изделия от нормы соответственно составило 9 мм, 11, 12, 8 и 14 мм. С вероятностью 0,954 определите среднее отклонение параметров по всей партии в целом.
Решение.
Выборочная средняя:
мм.
Величина межгрупповой дисперсии:
С учетом установленной вероятности Р
= 0,954 (t
= 2) предельная ошибка выборки составит:
мм.
Произведенные расчеты позволяют заключить, что среднее отклонение параметров всех изделий от нормы находится в следующих границах:
Для определения необходимого объема серийной выборки при заданной предельной ошибке используются следующие формулы:
(повторный отбор);
(безповторный отбор).
Предельная ошибка
— максимально возможное расхождение средних или максимум ошибок при заданной вероятности ее появления.
1. Предельную ошибку выборки для средней при повторном отборе в рассчитывают по формуле:
где t — нормированное отклонение — «коэффициент доверия», который зависит от вероятности, гарантирующей предельную ошибку выборки;
мю х — средняя ошибка выборки.
2. Предельная ошибка выборки для доли
при повторном отборе определяется по формуле:
3. Предельная ошибка выборки для средней при бесповторном отборе:
Предельную относительную ошибку
выборки определяют как процентное соотношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности. Она определяется таким образом:
Малая выборка
Теория малых выборок была разработана английским статистиком Стьюдентом
в начале 20 века. В 1908 г. он выявил специальное распределение, которое позволяет и при малых выборках соотносить t и доверительную вероятность F(t). При n больше 100 дают такие же результаты, что и таблицы интеграла вероятностей Лапласа, при 30 < n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.
Основное преимущество выборочного наблюдения среди прочих других — возможность рассчитать случайную ошибку выборки.
Ошибки выборки бывают систематические и случайные.
Систематические
— в том случае, когда нарушен основной принцип выборки — случайности. Случайные
— возникают обычно ввиду того, что структура выборочной совокупности всегда отличается от структуры генеральной совокупности, как бы правильно ни был произведен отбор, то есть, несмотря на принцип случайности отбора единиц совокупности, все же имеются расхождения между характеристиками выборочной и генеральной совокупности. Изучение и измерение случайных ошибок репрезентативности и является основной задачей выборочного метода.
Как правило, чаще всего рассчитывают ошибку средней и ошибку доли. При расчетах используются следующие условные обозначения:
Средняя, рассчитанная в пределах генеральной совокупности;
Средняя, рассчитанная в пределах выборочной совокупности;
р
— доля данной группы в генеральной совокупности;
w
— доля данной группы в выборочной совокупности.
Используя условные обозначения, ошибки выборки для средней и для доли можно записать следующим образом:
Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать любые значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок μ.
В отличие от систематической, случайную ошибку можно определить заранее, до проведения выборки, согласно предельных теорем, рассматриваемых в математической статистике.
Средняя ошибка определяется с вероятностью 0,683. В случае другой вероятности говорят о предельной ошибке.
Средняя ошибка выборки для средней и для доли определяется следующим образом:
В этих формулах дисперсия признака является характеристикой генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными xapaктеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность большом объеме точно воспроизводит характеристики генеральной совокупности.
Формулы определения средней ошибки для различных способ отбора:
Способ отбора |
Повторный | Бесповторный | ||
ошибка средней | ошибка доли | ошибка средней | ошибка доли | |
Собственно-случайный и механический | |
|||
Типический | |
|||
Серийный |
μ —
средняя ошибка;
∆ — предельная ошибка;
п —
численность выборки;
N —
численность генеральной совокупности;
Общая дисперсия;
w —
доля данной категории в общей численности выборки:
Средняя из внутригрупповых дисперсии;
Δ 2 — межгрупповая дисперсия;
r —
число серий в выборке;
R
— общее число серий.
Предельная ошибка
для всех способов отбора связана со средней ошибкой выборки следующим образом:
где t
— коэффициент доверия, функционально связанный с вероятностью, с которой обеспечивается величина предельной ошибки. В зависимости от вероятности коэффициент доверия t принимает следующие значения:
t | P |
0,683 | |
1,5 | 0,866 |
2,0 | 0,954 |
2,5 | 0,988 |
3,0 | 0,997 |
4,0 | 0,9999 |
Например, вероятность ошибки равна 0,683. Это значит, что генеральная средняя отличается от выборочной средней по абсолютной величине не более чем на величину μ
с вероятностью 0,683, то если — выборочная средняя, — генеральная средняя, то с
вероятностью 0,683.
Если мы хотим обеспечить большую вероятность выводов, тем самым мы увеличиваем границы случайной ошибки.
Таким образом, величина предельной ошибки зависит от следующих величин:
Колеблемости признака (прямая связь), которую характеризует величина дисперсии;
Численности выборки (обратная связь);
Доверительной вероятности (прямая связь);
Метода отбора.
Пример расчета ошибки средней и ошибки доли.
Для определения среднего числа детей в семье методом случайной бесповторной выборки из 1000 семей отобраны 100. Результаты приведены в таблице:
Определите:
.
— с вероятностью 0,997 предельную ошибку выборки и границы, в которых находится средне число детей в семье;
— с вероятностью 0,954 границы, в которых находится удельный вес семей с двумя детьми.
1. Определим предельную ошибку средней с вероятностью 0,977. Для упрощения расчетов воспользуемся способом моментов:
p
= 0,997 t
= 3
средняя ошибка средней, 0,116 — предельная ошибка
2,12 – 0,116 ≤ ≤ 2,12+ 0,116
2,004 ≤ ≤ 2,236
Следовательно, с вероятностью 0,997 среднее число детей в семье в генеральной совокупности, то есть среди 1000 семей, находится в интервале 2,004 — 2,236.
На основании зарегистрированных в соответствии с программой статистического наблюдения значений признаков единиц выборочной совокупности рассчитываются обобщающие выборочные характеристики: выборочная средняя
() и выборочная доля
единиц, обладающих каким-либо интересующим исследователей признаком, в общей их численности (w
).
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки
.
Ошибки выборки, как ошибки любого другого вида статистического наблюдения, подразделяются на ошибки регистрации и ошибки репрезентативности. Основной задачей выборочного метода является изучение и измерение случайных ошибок репрезентативности.
Выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки
также являются случайными величинами
и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок.
Средняя ошибка выборки
(µ
— мю) равна:
для средней
; для доли
,
где р
— доля определенного признака в генеральной совокупности.
В этих формулах σ х 2
и р
(1-р
) являются характеристиками генеральной совокупности, которые при выборочном наблюдении неизвестны. На практике их заменяют аналогичными характеристиками выборочной совокупности на основании закона больших чисел, по которому выборочная совокупность при достаточно большом объеме достаточно точно воспроизводит характеристики генеральной совокупности. Методы расчета средних ошибок выборки для средней и для доли при повторном и бесповторном отборах приведены в табл. 6.1.
Таблица 6.1.
Формулы расчета средней ошибки выборки для средней и для доли
Величина всегда меньше единицы, поэтому величина средней ошибки выборки при бесповторном отборе оказывается меньше, чем при повторном. В тех случаях, когда доля выборки незначительна и множитель близок к единице, поправкой можно пренебречь.
Утверждать, что генеральная средняя значения показателя или генеральная доля не выйдет за границы средней ошибки выборки можно лишь с определенной степенью вероятности. Поэтому, для характеристики ошибки выборки кроме средней ошибки рассчитывают предельную ошибку выборки
(Δ), которая связана с гарантирующим ее уровнем вероятности.
Уровень вероятности (Р
) определяет величина нормированного отклонения (t
), и наоборот. Значения t
даются в таблицах нормального распределения вероятностей. Наиболее часто используемые сочетания t
и Р
приведены в табл. 6.2.
Таблица 6.2
Значения нормированного отклонения t
при соответствующих значениях уровней вероятности Р
t |
1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 |
Р |
0,683 | 0,866 | 0,954 | 0,988 | 0,997 | 0,999 |
t
— коэффициент доверия, зависящий от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t
-кратную среднюю ошибку. Он показывает, сколько средних ошибок содержится в предельной ошибке
. Так, если t
= 1, то с вероятностью 0,683 можно утверждать, что разность между выборочными и генеральными показателями не превысит одной средней ошибки.
Формулы для расчета предельных ошибок выборки приведены в табл. 6.3.
Таблица 6.3.
Формулы расчета предельной ошибки выборки для средней и для доли
После исчисления предельных ошибок выборки находят доверительные интервалы для генеральных показателей
. Вероятность, которая принимается при расчете ошибки выборочной характеристики, называется доверительной. Доверительный уровень вероятности 0,95 означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы; вероятности 0,954 — в 46 случаях из 1000, а при 0,999 — в 1 случае из 1000.
Для генеральной средней наиболее вероятные границы, в которых она будет находится с учетом предельной ошибки репрезентативности, будут иметь вид:
Наиболее вероятные границы, в которых будет находится генеральная доля, будут иметь вид:
Отсюда, генеральная средняя
, генеральная доля
.
Приведенные в табл. 6.3. формулы используются при определении ошибок выборки, осуществляемой собственно случайным и механическим методами.
При стратифицированном отборе в выборку обязательно попадают представители всех групп и обычно в тех же пропорциях, что и в генеральной совокупности. Поэтому ошибка выборки в данном случае зависит главным образом от средней из внутригрупповых дисперсий. Исходя из правила сложения дисперсий можно сделать вывод, что ошибка выборки для стратифицированного отбора всегда будет меньше, чем для собственно случайного.
При серийном (гнездовом) отборе мерой колеблемости будет межгрупповая дисперсия.