Что представляет собой конкретная ошибка выборки

Работа по теме: otvety_matstat. Глава: Конкретная ошибка выборки, распределение конкретных ошибок выборки. ВУЗ: РГАУ.
  1. Конкретная ошибка выборки, распределение конкретных ошибок выборки

  • Ошибка
    выборочного наблюдения – представляет
    собой разность между величиной параметра
    в генеральной совокупности и его
    величиной, вычисленной по результатам
    выборочного наблюдения.

  • Конкретная
    ошибка – это ошибка проведенной выборки.

  • Если
    из генеральной совокупности повторить
    выборку многократно, то каждый раз
    будем получать новую величину конкретной
    ошибки. Некоторые из этих новых величин
    конкретных ошибок будут совпадать друг
    с другом по величине и по знаку, т.е.
    имеет место распределение ошибок; часть
    из этих новых величин будет равно 0,т.е.
    наблюдается совпадение оценки и
    параметра генеральной совокупности.

  1. Средняя ошибка выборки для выборочной средней и выборочной доли

Средняя
ошибка

– это средняя квадратическая из всех
возможных конкретных ошибок оценки.

  • Средняя
    ошибка показывает насколько в среднем
    мы можем ошибиться, если на основе
    оценки сделаем выводы о параметре
    генеральной совокупности.

  • Расчет средней
    ошибки повторной простой случайной
    выборки производится следующим
    образом:

  • cредняя
    ошибка для средней

  • cредняя
    ошибка для доли

41
– 50 отсутствуют

50

Условие: Если значение ошибки (чаще
всего предельной) заранее задано.

Вопрос: Какова должна быть min
численность выборки, чтобы ошибка с
принятым доверительным уровнем
вероятности не выходила за заданные
границы.

Алгоритм решения данной задачи вытекает
из формулы расчета предельной ошибки

Из этого равенства вытекает

Необходимая численность выборки
определяется округленно в большую
сторону до целых единиц.

Возникает проблема с

(дисперсия),
так как выборка не проводилась, а величина
ее дисперсии уже известна. Поэтому, если
исследованная ген. Совокупность
подвергалась ранее выборочному
наблюдению, то можно воспользоваться
значением дисперсии по данным предыдущей
выборки, если выборочного наблюдения
не было, то можно провести экспресс
выборку.

Интервалы предельной ошибки задаются
в % от оценки (выборочной средней). Формула
для расчета min численности
выборки


,

-квадрат
выборочного коэф. вар-ии,

— квадрат ошибки в %

51

Условие: При установленных границах
ошибки имеет место ограничение в
численности выборки.

Вопрос: Какова гарантия (вероятность),
что при заданной численности выборки
ошибка не выйдет за установленные
границы.

Если вероятность окажется 0,90 и более –
эта выборка с высокой степенью надежности
гарантирует, что ошибка не превысит
установленную величину

Если вер-ть ниже 0,90, то следует либо
примириться с большей ошибкой, либо
найти возможность увеличения численности
выборки.

Коэф t связан с уровнем
вероятности. Исходя из

Получаем

Находим искомый уровень вероятности
по табл. «Значение интеграла нормального
распределения вероятностей» или
«Критические точки t
распределения Стьюдента»

52

При случайном отборе каждой единице
ген.совокупности присваивается метка
, которая не должна быть связана с
изучаемым признаком. Далее используются
различные приемы, обеспечивающие
случайность отбора (таблица случайных
чисел, лототрон), осуществляющие отбор
меток, как заменителей единиц.

Случайный отбор делится на: повторный
и бесповторный.

Повторный отбор – единицы ген.совокупности,
после фиксации значения признака,
возвращаются обратно в генеральную
совокупность. Поэтому численность
ген.совокупности остается постоянной,
и вероятность попадания каждой единицы
в выборку не изменяется. Из этого способа
формирования выборочной совокупности
исходя алгоритмы расчета средней и
предельной ошибок.

Бесповторный отбор – единицы, попавшие
в выборку в ген.совокупность не
возвращаются. Численность ген.совокупности
уменьшается, вероятность попадания
единиц в выборку возрастает

При этом отборе делается поправка на
конечность ген.совокупности для расчета
средней и предельной ошибок

При больших значениях N,
единицей в знаменателе можно пренебречь

Следовательно, алгоритмы (средняя,
предельная) будут такими:


<
1, средняя и предельная ошибки всегда
меньше, чем при повторном отборе.

С введением
,
меняются формулы для расчета других
ошибок (не всех)

53

Механический отбор используется в том
случае, если единицы генеральной
совокупности располагаются в каком-либо
порядке во времени или пространстве,
или есть возможность это сделать. Порядок
не должен быть связан с изучаемым
явлением.

Пример: социологические обследования
– люди в алфавитном прорядке.

1)Находится шаг или интервал отбора :

2)Осуществляется отбор из совокупности,
упорядоченной, с указанным шагом

3)Случайная и предельная ошибки находятся
по формулам случайного бесповторного
отбора, так как механический осуществляется
как бесповторный.

54

Типический отбор используют, если в
ген.совокупности имеются своеобразные
группы единиц (партии сена с разными
сроками заготовки, группы животных на
откорме разного возраста), или же можно
выделить такие группы (коровы с разными
месяцами лактации).

После определения качественно отличных
частей, определяется представительство
из каждой части в выборке

Ni
-численность i-той
группы в ген.совокупности, представительство
которой в выборке надо определить; N-
общая численность генеральной
совокупности, n – общая
численность выборки, ni
– единицы из i-той группы,
которые должны быть взяты в выборку.

Следовательно

Иногда представительство групп в выборке
определяют пропорционально средним
квадратическим отклонениям изучаемого
признака в выделенных группах
ген.совокупности, дисперсиям или объемам
вариации.

Затем производится случайный бесповторный
или механический отборы из групп.

При расчете средней и предельной ошибок
учитывается колеблемость признака
только внутри групп,

Так как остаточная дисперсия является
частью общей, типический отбор обеспечиваем
min ошибку при прочих равных
условиях.

55

Представительство групп в выборке
устанавливается пропорционально их
численности

Ni
-численность i-той
группы в ген.совокупности, представительство
которой в выборке надо определить; N-
общая численность генеральной
совокупности, n – общая
численность выборки, ni
– единицы из i-той группы,
которые должны быть взяты в выборку.

Следовательно

Иногда представительство групп в выборке
определяют пропорционально средним
квадратическим отклонениям изучаемого
признака в выделенных группах
ген.совокупности, дисперсиям или объемам
вариации.

56

Серийный отбор/гнездовой отбор

Выборка формируется из серий/гнезд,
состоящих из нескольких единиц. Отбор
гнезд проводится механически.

При расчете ошибок учитываются только
межсерийные различия. Формулы для
расчента средней и предельной ошибок
для выборочной средней

и

соответственно средняя и предельная
ошибки выборочной средней, ni
и Ni
число серий (гнезд) соответственно
в выборочной и ген.совокупностях,

— межсерийная дисперсия.

57

Под статистической гипотезой понимается
некоторое предположение о ген.совокупности,
которое может быть проверено на основе
выборки. Так как предположение может
касаться распределения численностей
или количественной статистической
характеристики ген.совокупности, эти
гипотезы получили название статистических.

Большинство научных гипотез требуют
экспериментальной проверки, а так как
данные любого эксперимента являются
выборкой, то результаты любого эксперимента
подлежат статистической обработке в
режиме проверки гипотез. Подобная
обработка нужна, чтобы не повторяя до
бесконечности эксперимент (не доводя
до ген.совокупности) иметь основание
на основе единственного эксперимента
(одной выборки) формулировать выводы.

58

Формулировка двух гипотез: Нулевая
(рабочая) Ho, альтернативная
Ha.

Выбор Ho определяется с
одной стороны практическими соображениями,
а с другой — законом распределения, так
называемого критерия. Практическая
сторона – в качестве Ho
рекомендуется выдвигать предположение
противоположное тому, во что изначально
верит исследователь. Из теории проверки
гипотез следует, что если Ho
была принята, то она – единственно
верная. Если была принята Ha,
то вывод – однозначный. Ну а так как
исследователь заинтересован в
однозначности вывода, то свое предположение
он относит к Ha. Ha-выдвигается
в противоположность Ho.

59

Ошибка первого рода – Ho
верна, но отвергается, т.к. критерий
находится в критической области. Ошибка
второго рода – Ho не верна,
но мы принимаем ее, т.к значение критерия
случайно оказалось в области согласия

Уровень значимости – вероятность
допущения ошибки первого рода. Также
это совокупная вероятность появления
таких значений критерия, при которых
отвергается Ho. Иногда
уровень значимости трактуется упрощенно,
как вероятность ошибки окончательного
вывода относительно выдвинутых гипотез.
Уровень значимости устанавливается
самим исследователем не выше значения
α=0,10, стандартными уровнями значимости
являются значения равные 0,05 и 0,01.

Соотношение между областью согласия и
критической областью регулируется
уровнем значимости.

Область согласия – круг значений, при
котором принимается Ho.
Критическая область – Ho
отвергается.

При статистической обработке результатов
ошибкам первого и второго, которые
влекут бОльшие материальные потери
должно отдаваться предпочтение, т.е.
они должны минимизироваться. Ошибки
первого рода минимизируются уменьшением
уровня значимости, второго рода –
увеличением до допустимых (0,10) значений.

60

Статистический критерий – инструмент
проверки выдвинутых гипотез. Это некая
случайная величина, имеющая алгоритм
расчета и закон распределения. Его
значение может быть рассчитано по
выборке – фактическое значение Qфакт
. Так как критерий имеет закон
распределения, то можно определить
вероятность появления тех или иных
значений критерия.

Выбор критерия зависит от

  1. содержание гипотезы (распределение
    численности, средняя генеральная,
    дисперсия в ген.совокупности)

  2. численность выборки

Критерии подразделяются на: параметрические
и непараметрические

Параметрические – выдвигают по отношению
к выборке некие предварительные условия
(о законе распределения). На основе этого
вида критерия делаются более надежные
выводы, и параметрическим критериям
отдается предпочтение

Непараметрические- условий не выдвигают.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

What Is a Sampling Error?

A sampling error is a statistical error that occurs when an analyst does not select a sample that represents the entire population of data. As a result, the results found in the sample do not represent the results that would be obtained from the entire population.

Sampling is an analysis performed by selecting a number of observations from a larger population. The method of selection can produce both sampling errors and non-sampling errors.

Key Takeaways

  • A sampling error occurs when the sample used in the study is not representative of the whole population. 
  • Sampling is an analysis performed by selecting a number of observations from a larger population.
  • Even randomized samples will have some degree of sampling error because a sample is only an approximation of the population from which it is drawn.
  • The prevalence of sampling errors can be reduced by increasing the sample size.
  • In general, sampling errors can be placed into four categories: population-specific error, selection error, sample frame error, or non-response error.

Understanding Sampling Errors

A sampling error is a deviation in the sampled value versus the true population value. Sampling errors occur because the sample is not representative of the population or is biased in some way. Even randomized samples will have some degree of sampling error because a sample is only an approximation of the population from which it is drawn.

Calculating Sampling Error

The sampling error formula is used to calculate the overall sampling error in statistical analysis. The sampling error is calculated by dividing the standard deviation of the population by the square root of the size of the sample, and then multiplying the resultant with the Z-score value, which is based on the confidence interval.

Sampling Error

=

Z

×

σ

n

where:

Z

=

Z

 score value based on the

 confidence interval (approx

=

1.96

)

σ

=

Population standard deviation

n

=

Size of the sample

begin{aligned}&text{Sampling Error}=Ztimesfrac{sigma}{sqrt{n}}\&textbf{where:}\&Z=Ztext{ score value based on the}\&qquad text{confidence interval (approx}=1.96)\&sigma=text{Population standard deviation}\&n=text{Size of the sample}end{aligned}

Sampling Error=Z×nσwhere:Z=Z score value based on the confidence interval (approx=1.96)σ=Population standard deviationn=Size of the sample

Types of Sampling Errors

There are different categories of sampling errors.

Population-Specific Error

A population-specific error occurs when a researcher doesn’t understand who to survey.

Selection Error

Selection error occurs when the survey is self-selected, or when only those participants who are interested in the survey respond to the questions. Researchers can attempt to overcome selection error by finding ways to encourage participation.

Sample Frame Error

A sample frame error occurs when a sample is selected from the wrong population data.

Non-response Error

A non-response error occurs when a useful response is not obtained from the surveys because researchers were unable to contact potential respondents (or potential respondents refused to respond).

Eliminating Sampling Errors

The prevalence of sampling errors can be reduced by increasing the sample size. As the sample size increases, the sample gets closer to the actual population, which decreases the potential for deviations from the actual population. Consider that the average of a sample of 10 varies more than the average of a sample of 100. Steps can also be taken to ensure that the sample adequately represents the entire population.

Researchers might attempt to reduce sampling errors by replicating their study. This could be accomplished by taking the same measurements repeatedly, using more than one subject or multiple groups, or by undertaking multiple studies.

Random sampling is an additional way to minimize the occurrence of sampling errors. Random sampling establishes a systematic approach to selecting a sample. For example, rather than choosing participants to be interviewed haphazardly, a researcher might choose those whose names appear first, 10th, 20th, 30th, 40th, and so on, on the list.

Examples of Sampling Errors

Assume that XYZ Company provides a subscription-based service that allows consumers to pay a monthly fee to stream videos and other types of programming via an Internet connection.

The firm wants to survey homeowners who watch at least 10 hours of programming via the Internet per week and that pay for an existing video streaming service. XYZ wants to determine what percentage of the population is interested in a lower-priced subscription service. If XYZ does not think carefully about the sampling process, several types of sampling errors may occur.

A population specification error would occur if XYZ Company does not understand the specific types of consumers who should be included in the sample. For example, if XYZ creates a population of people between the ages of 15 and 25 years old, many of those consumers do not make the purchasing decision about a video streaming service because they may not work full-time. On the other hand, if XYZ put together a sample of working adults who make purchase decisions, the consumers in this group may not watch 10 hours of video programming each week.

Selection error also causes distortions in the results of a sample. A common example is a survey that only relies on a small portion of people who immediately respond. If XYZ makes an effort to follow up with consumers who don’t initially respond, the results of the survey may change. Furthermore, if XYZ excludes consumers who don’t respond right away, the sample results may not reflect the preferences of the entire population.

Sampling Error vs. Non-sampling Error

There are different types of errors that can occur when gathering statistical data. Sampling errors are the seemingly random differences between the characteristics of a sample population and those of the general population. Sampling errors arise because sample sizes are inevitably limited. (It is impossible to sample an entire population in a survey or a census.)

A sampling error can result even when no mistakes of any kind are made; sampling errors occur because no sample will ever perfectly match the data in the universe from which the sample is taken. 

Company XYZ will also want to avoid non-sampling errors. Non-sampling errors are errors that result during data collection and cause the data to differ from the true values. Non-sampling errors are caused by human error, such as a mistake made in the survey process.

If one group of consumers only watches five hours of video programming a week and is included in the survey, that decision is a non-sampling error. Asking questions that are biased is another type of error.

What Is Sampling Error vs. Sampling Bias?

In statistics, sampling means selecting the group that you will actually collect data from in your research.

Sampling bias is the expectation, which is known in advance, that a sample won’t be representative of the true population. For instance, if the sample ends up having proportionally more women or young people than the overall population.

Sampling errors are statistical errors that arise when a sample does not represent the whole population once analyses have been undertaken.

Why Is Sampling Error Important?

Being aware of the presence of sampling errors is important because it can be an indicator of the level of confidence that can be placed in the results. Sampling error is also important in the context of a discussion about how much research results can vary.

How Do You Find the Sampling Error?

In survey research, sampling errors occur because all samples are representative samples: a smaller group that stands in for the whole of your research population. It’s impossible to survey the entire group of people you’d like to reach.

It’s not usually possible to quantify the degree of sampling error in a study since it’s impossible to collect the relevant data from the entire population you are studying. This is why researchers collect representative samples (and representative samples are the reason why there are sampling errors).

What Is Sampling Error vs. Standard Error?

Sampling error is derived from the standard error (SE) by multiplying it by a Z-score value to produce a confidence interval.

The standard error is computed by dividing the standard deviation by the square root of the sample size.

The Bottom Line

Sampling error occurs when a sample drawn from a population deviates somewhat from that true population. Large sampling errors can lead to incorrect estimates or inferences made about the population based on statistical analysis of that sample.

In general, sampling errors can be placed into four categories: population-specific error, selection error, sample frame error, or non-response error. A population-specific error occurs when the researcher does not understand who they should survey. A selection error occurs when respondents self-select their participation in the study. (This results in only those that are interested in responding, which skews the results.) A sample frame error occurs when the wrong sub-population is used to select a sample. Finally, a non-response error occurs when potential respondents are not successfully contacted or refuse to respond.

What Is a Sampling Error?

A sampling error is a statistical error that occurs when an analyst does not select a sample that represents the entire population of data. As a result, the results found in the sample do not represent the results that would be obtained from the entire population.

Sampling is an analysis performed by selecting a number of observations from a larger population. The method of selection can produce both sampling errors and non-sampling errors.

Key Takeaways

  • A sampling error occurs when the sample used in the study is not representative of the whole population. 
  • Sampling is an analysis performed by selecting a number of observations from a larger population.
  • Even randomized samples will have some degree of sampling error because a sample is only an approximation of the population from which it is drawn.
  • The prevalence of sampling errors can be reduced by increasing the sample size.
  • In general, sampling errors can be placed into four categories: population-specific error, selection error, sample frame error, or non-response error.

Understanding Sampling Errors

A sampling error is a deviation in the sampled value versus the true population value. Sampling errors occur because the sample is not representative of the population or is biased in some way. Even randomized samples will have some degree of sampling error because a sample is only an approximation of the population from which it is drawn.

Calculating Sampling Error

The sampling error formula is used to calculate the overall sampling error in statistical analysis. The sampling error is calculated by dividing the standard deviation of the population by the square root of the size of the sample, and then multiplying the resultant with the Z-score value, which is based on the confidence interval.

Sampling Error

=

Z

×

σ

n

where:

Z

=

Z

 score value based on the

 confidence interval (approx

=

1.96

)

σ

=

Population standard deviation

n

=

Size of the sample

begin{aligned}&text{Sampling Error}=Ztimesfrac{sigma}{sqrt{n}}\&textbf{where:}\&Z=Ztext{ score value based on the}\&qquad text{confidence interval (approx}=1.96)\&sigma=text{Population standard deviation}\&n=text{Size of the sample}end{aligned}

Sampling Error=Z×nσwhere:Z=Z score value based on the confidence interval (approx=1.96)σ=Population standard deviationn=Size of the sample

Types of Sampling Errors

There are different categories of sampling errors.

Population-Specific Error

A population-specific error occurs when a researcher doesn’t understand who to survey.

Selection Error

Selection error occurs when the survey is self-selected, or when only those participants who are interested in the survey respond to the questions. Researchers can attempt to overcome selection error by finding ways to encourage participation.

Sample Frame Error

A sample frame error occurs when a sample is selected from the wrong population data.

Non-response Error

A non-response error occurs when a useful response is not obtained from the surveys because researchers were unable to contact potential respondents (or potential respondents refused to respond).

Eliminating Sampling Errors

The prevalence of sampling errors can be reduced by increasing the sample size. As the sample size increases, the sample gets closer to the actual population, which decreases the potential for deviations from the actual population. Consider that the average of a sample of 10 varies more than the average of a sample of 100. Steps can also be taken to ensure that the sample adequately represents the entire population.

Researchers might attempt to reduce sampling errors by replicating their study. This could be accomplished by taking the same measurements repeatedly, using more than one subject or multiple groups, or by undertaking multiple studies.

Random sampling is an additional way to minimize the occurrence of sampling errors. Random sampling establishes a systematic approach to selecting a sample. For example, rather than choosing participants to be interviewed haphazardly, a researcher might choose those whose names appear first, 10th, 20th, 30th, 40th, and so on, on the list.

Examples of Sampling Errors

Assume that XYZ Company provides a subscription-based service that allows consumers to pay a monthly fee to stream videos and other types of programming via an Internet connection.

The firm wants to survey homeowners who watch at least 10 hours of programming via the Internet per week and that pay for an existing video streaming service. XYZ wants to determine what percentage of the population is interested in a lower-priced subscription service. If XYZ does not think carefully about the sampling process, several types of sampling errors may occur.

A population specification error would occur if XYZ Company does not understand the specific types of consumers who should be included in the sample. For example, if XYZ creates a population of people between the ages of 15 and 25 years old, many of those consumers do not make the purchasing decision about a video streaming service because they may not work full-time. On the other hand, if XYZ put together a sample of working adults who make purchase decisions, the consumers in this group may not watch 10 hours of video programming each week.

Selection error also causes distortions in the results of a sample. A common example is a survey that only relies on a small portion of people who immediately respond. If XYZ makes an effort to follow up with consumers who don’t initially respond, the results of the survey may change. Furthermore, if XYZ excludes consumers who don’t respond right away, the sample results may not reflect the preferences of the entire population.

Sampling Error vs. Non-sampling Error

There are different types of errors that can occur when gathering statistical data. Sampling errors are the seemingly random differences between the characteristics of a sample population and those of the general population. Sampling errors arise because sample sizes are inevitably limited. (It is impossible to sample an entire population in a survey or a census.)

A sampling error can result even when no mistakes of any kind are made; sampling errors occur because no sample will ever perfectly match the data in the universe from which the sample is taken. 

Company XYZ will also want to avoid non-sampling errors. Non-sampling errors are errors that result during data collection and cause the data to differ from the true values. Non-sampling errors are caused by human error, such as a mistake made in the survey process.

If one group of consumers only watches five hours of video programming a week and is included in the survey, that decision is a non-sampling error. Asking questions that are biased is another type of error.

What Is Sampling Error vs. Sampling Bias?

In statistics, sampling means selecting the group that you will actually collect data from in your research.

Sampling bias is the expectation, which is known in advance, that a sample won’t be representative of the true population. For instance, if the sample ends up having proportionally more women or young people than the overall population.

Sampling errors are statistical errors that arise when a sample does not represent the whole population once analyses have been undertaken.

Why Is Sampling Error Important?

Being aware of the presence of sampling errors is important because it can be an indicator of the level of confidence that can be placed in the results. Sampling error is also important in the context of a discussion about how much research results can vary.

How Do You Find the Sampling Error?

In survey research, sampling errors occur because all samples are representative samples: a smaller group that stands in for the whole of your research population. It’s impossible to survey the entire group of people you’d like to reach.

It’s not usually possible to quantify the degree of sampling error in a study since it’s impossible to collect the relevant data from the entire population you are studying. This is why researchers collect representative samples (and representative samples are the reason why there are sampling errors).

What Is Sampling Error vs. Standard Error?

Sampling error is derived from the standard error (SE) by multiplying it by a Z-score value to produce a confidence interval.

The standard error is computed by dividing the standard deviation by the square root of the sample size.

The Bottom Line

Sampling error occurs when a sample drawn from a population deviates somewhat from that true population. Large sampling errors can lead to incorrect estimates or inferences made about the population based on statistical analysis of that sample.

In general, sampling errors can be placed into four categories: population-specific error, selection error, sample frame error, or non-response error. A population-specific error occurs when the researcher does not understand who they should survey. A selection error occurs when respondents self-select their participation in the study. (This results in only those that are interested in responding, which skews the results.) A sample frame error occurs when the wrong sub-population is used to select a sample. Finally, a non-response error occurs when potential respondents are not successfully contacted or refuse to respond.

Понравилась статья? Поделить с друзьями:
  • Что понимают под ошибкой первого рода
  • Что политики ошибочно считают источником экономического прогресса при каком условии этот фактор
  • Что показывает стандартная ошибка регрессии
  • Что показывает среднеквадратическая ошибка
  • Что показывает предельная ошибка выборки