Виды выборки в статистике. Реферат: Выборочный метод в статистике


План

  • Введение
  • 1. Роль выборки
  • Заключение
  • Список литературы

Введение

Статистика - аналитическая наука, которая необходима всем современным специалистам. Современный специалист не может быть грамотным, если он не владеет статистической методологией. Статистика - важнейший инструмент связи предприятия с обществом. Статистика одна из важнейших дисциплин в учебном плане всех специальностей, т.к. статистическая грамотность - неотъемлемая составляющая высшего образования, а по количеству отведенных часов в учебном плане она занимает одно из первых мест. Работая с цифрами, каждый специалист должен знать, как получены те или иные данные, какова их природа исчисления, насколько они полны и достоверны.

1. Роль выборки

Множество всех единиц совокупности, обладающих определенным признаком и подлежащих изучению, носит в статистике название генеральной совокупности.

На практике по тем или иным причинам не всегда возможно или же нецелесообразно рассматривать всю генеральную совокупность. Тогда ограничиваются изучением лишь некоторой части ее, конечной целью которого является распространение полученных результатов на всю генеральную совокупность, т.е. применяют выборочный метод.

Для этого из генеральной совокупности особым образом отбирается часть элементов, так называемая выборка, и результаты обработки выборочных данных (например, средние арифметические значения) обобщаются на всю совокупность.

Теоретической основой выборочного метода является закон больших чисел. В силу этого закона при ограниченном рассеивании признака в генеральной совокупности и достаточно большой выборке с вероятностью, близкой к полной достоверности, выборочная средняя может быть сколь угодно близка к генеральной средней. Закон этот, включающий в себя группу теорем, доказан строго математически. Таким образом, средняя арифметическая, рассчитанная по выборке, может с достаточным основанием рассматриваться как показатель, характеризующий генеральную совокупность в целом.

2. Методы вероятностного отбора, обеспечивающие репрезентативность

Для того чтобы можно было по выборке делать вывод о свойствах генеральной совокупности, выборка должна быть репрезентативной (представительной), т.е. она должна полно и адекватно представлять свойства генеральной совокупности. Репрезентативность выборки может быть обеспечена только при объективности отбора данных.

Выборочная совокупность формируется по принципу массовых вероятностных процессов без каких бы то ни было исключений от принятой схемы отбора; необходимо обеспечить относительную однородность выборочной совокупности или ее разделение на однородные группы единиц. При формировании выборочной совокупности должно быть дано четкое определение единицы отбора. Желателен приблизительно одинаковый размер единиц отбора, причем результаты будут тем точнее, чем меньше единица отбора.

Возможны три способа отбора: случайный отбор, отбор единиц по определенной схеме, сочетание первого и второго способов.

Если отбор в соответствии с принятой схемой проводится из генеральной совокупности, предварительно разделенной на типы (слои или страты), то такая выборка называется типической (или расслоенной, или стратифицированной, или районированной). Еще одно деление выборки по видам определяется тем, что является единицей отбора: единица наблюдения или серия единиц (иногда используют термин "гнездо"). В последнем случае выборка называется серийной, или гнездовой. На практике часто используется сочетание типической выборки с отбором сериями. В математической статистике, обсуждая проблему отбора данных, обязательно вводят деление выборки на повторную и бесповторную. Первая соответствует схеме возвратного шара, вторая - безвозвратного (при рассмотрении процесса отбора данных на примере отбора шаров разного цвета из урны). В социально-экономической статистике нет смысла применять повторную выборку, поэтому, как правило, имеется в виду бесповторный отбор.

Так как социально-экономические объекты имеют сложную структуру, то выборку бывает довольно трудно организовать. Например, чтобы провести отбор домохозяйств при изучении потребления населением крупного города, легче произвести сначала отбор территориальных ячеек, жилых домов, потом квартир или домохозяйств, затем респондента. Такая выборка называется многоступенчатой. На каждой ступени используются разные единицы отбора: более крупные - на начальных ступенях, на последней ступени единица отбора совпадает с единицей наблюдения.

Еще один вид выборочного наблюдения - многофазовая выборка. Такая выборка включает определенное количество фаз, каждая из которых отличается подробностью программы наблюдения. Например, 25% всей генеральной совокупности обследуются по краткой программе, каждая 4-я единица из этой выборки обследуется по более полной программе и т.д.

При любом виде выборки отбор единиц производится тремя отмеченными способами. Рассмотрим процедуру случайного отбора. Прежде всего, составляется список единиц совокупности, в котором каждой единице присваивается цифровой код (номер или метка). Затем производится жеребьевка. Закладываются в барабан шары с соответствующими номерами, они перемешиваются и проводится отбор шаров. Выпавшие номера соответствуют единицам, попавшим в выборку; число номеров равно запланированному объему выборки.

Отбор жеребьевкой может быть подвержен смещениям, вызванным недостатками техники (качеством шаров, барабана) и другими причинами. Более надежен с точки зрения объективности отбор по таблице случайных чисел. Такая таблица содержит серии цифр, чередующихся случайным образом, отобранных путем электронных сигналов. Так как мы пользуемся десятичной цифровой системой 0, 1, 2,., 9, вероятность появления любой цифры равна 1/10. Следовательно, если бы нужно было создать таблицу случайных чисел, включающую 500 знаков, то из них около 50 были бы 0, столько же - 1 и т.д.

Часто используется отбор по какой-либо схеме (так называемая направленная выборка). Схема отбора принимается такой, чтобы отразить основные свойства и пропорции генеральной совокупности. Простейший способ: по спискам единиц генеральной совокупности, составленным так, чтобы упорядочивание единиц было бы не связано с изучаемыми свойствами, проводится механический отбор единиц с шагом, равным N: п. Обычно отбор начинают не с первой единицы, а отступив полшага, чтобы уменьшить возможность смещения выборки. Частота появления единиц с теми или иными особенностями, например студентов с тем или иным уровнем успеваемости, живущих в общежитии, и т.д. будет определяться той структурой, которая сложилась в генеральной совокупности.

Для большей уверенности в том, что выборка отразит структуру генеральной совокупности, последняя подразделяется на типы (страты или районы), и проводится случайный или механический отбор из каждого типа. Общее число единиц, отобранных из разных типов, должно соответствовать объему выборки.

Особые трудности возникают, когда нет списка единиц, а отбор нужно произвести либо на местности, либо из образцов продукции на складе готовой продукции. В этих случаях важно детально разработать схему ориентации на местности и схему отбора и следовать ей, не допуская отклонений. Например, счетчик имеет указание двигаться от определенной автобусной остановки на север по четной стороне улицы и, отсчитав два дома от первого угла, войти в третий и провести опрос в каждом 5-м жилом помещении. Неукоснительное следование принятой схеме обеспечивает выполнение главного условия формирования репрезентативной выборки - объективности отбора единиц.

От случайной выборки следует отличать квотный отбор, когда выборка конструируется из единиц определенных категорий (квот), которые должны быть представлены в заданных пропорциях. Например, при опросе покупателей универмага может быть запланировано провести отбор 150 респондентов, в том числе 90 женщин, из них 25 - девушек,20 - молодых женщин с маленькими детьми, 35 - женщин среднего возраста, одетых в деловой костюм, 10 - женщин 50 лет и старше; кроме того, планировался опрос 70 мужчин, из них 25 - подростков и юношей,20 - молодых мужчин с детьми, 15 - мужчин, которые одеты в костюмы, 10 - мужчин, одетых в спортивную одежду. Для определения потребительских ориентаций и предпочтений такая выборка, может быть, и хороша, но если мы захотим по ней установить среднюю сумму покупок, их структуру, мы получим непредставительные результаты. Это происходит потому, что квотная выборка нацелена на отбор определенных категорий.

Выборка может быть нерепрезентативной, даже если она формируется в соответствии с известными пропорциями генеральной совокупности, но отбор проводится без какой-либо схемы - единицы набираются как угодно, лишь бы обеспечить соотношение их категорий в тех же пропорциях, что и в генеральной совокупности (например, соотношение мужчин и женщин, респондентов в возрасте моложе и старше трудоспособного и в трудоспособном и т.д.).

Эти замечания должны предостеречь вас от подобных подходов к формированию выборки и еще раз подчеркнуть необходимость объективного отбора.

3. Организационные и методологические особенности случайной, механической, типической и серийной выборки

В зависимости от того, как осуществляется отбор элементов совокупности в выборку, различают несколько видов выборочного обследования. Отбор может быть случайным, механическим, типическим и серийным.

Случайным является такой отбор, при котором все элементы генеральной совокупности имеют равную возможность быть отобранными. Другими словами, для каждого элемента генеральной совокупности обеспечена равная вероятность попасть в выборку.

выборка статистическая вероятностный случайный

Требование случайности отбора достигается на практике с помощью жребия или таблицы случайных чисел.

При отборе способом жеребьевки все элементы генеральной совокупности предварительно нумеруются и номера их наносятся на карточки. После тщательной перетасовки из пачки любым способом (подряд или в любом другом порядке) выбирается нужное число карточек, соответствующее объему выборки. При этом можно либо откладывать отобранные карточки в сторону (тем самым осуществляется так называемый бесповторный отбор), либо, вытащив карточку, записать ее номер и возвратить в пачку, тем самым давая ей возможность появиться в выборке еще раз (повторный отбор). При повторном отборе всякий раз после возвращения карточки пачка должна быть тщательно перетасована.

Способ жеребьевки применяется в тех случаях, когда число элементов всей изучаемой совокупности невелико. При большом объеме генеральной совокупности осуществление случайного отбора методом жеребьевки становится сложным. Более надежным и менее трудоемким в случае большого объема обрабатываемых данных является метод использования таблицы случайных чисел.

Механический отбор производится следующим образом. Если формируется 10% -ная выборка, т.е. из каждых десяти элементов должен быть отобран один, то вся совокупность условно разбивается на равные части по 10 элементов. Затем из первой десятки выбирается случайным образом элемент. Например, жеребьевка указала девятый номер. Отбор остальных элементов выборки полностью определяется указанной пропорцией отбора N номером первого отобранного элемента. В рассматриваемом случае выборка будет состоять из элементов 9, 19, 29 и т.д.

Механическим отбором следует пользоваться осторожно, так как существует реальная опасность возникновения так называемых систематических ошибок. Поэтому прежде чем делать механическую выборку, необходимо проанализировать изучаемую совокупность. Если ее элементы расположены случайным образом, то выборка, полученная механическим способом, будет случайной. Однако нередко элементы исходной совокупности бывают частично или даже полностью упорядочены. Весьма нежелательным для механического отбора является порядок элементов, имеющий правильную повторяемость, период которой может совпасть с периодом механической выборки.

Нередко элементы совокупности бывают упорядочены по величине изучаемого признака в убывающем или возрастающем порядке и не имеют периодичности. Механический отбор из такой совокупности приобретает характер направленного отбора, так как отдельные части совокупности оказываются представленными в выборке пропорционально их численности во всей совокупности, т.е. отбор направлен на то, чтобы сделать выборку представительной.

Другим видом направленного отбора является типический отбор. Следует отличать типический отбор от отбора типичных объектов. Отбор типичных объектов применялся в земской статистике, а также при бюджетных обследованиях. При этом отбор "типичных селений" или "типичных хозяйств" производился по некоторым экономическим признакам, например по размерам землевладения на двор, по роду занятий жителей и т.п. Отбор такого рода не может быть основой для применения выборочного метода, так как здесь не выполнено основное его требование - случайность отбора.

При собственно типическом отборе в выборочном методе совокупность разбивается на группы, однородные в качественном отношении, а затем уже внутри каждой группы производится случайный отбор. Типический отбор организовать сложнее, чем собственно случайный, так как необходимы определенные знания о составе и свойствах генеральной совокупности, но зато он дает более точные результаты.

При серийном отборе вся совокупность разбивается на группы (серии). Затем путем случайного или механического отбора выделяют определенную часть этих серий и производят их сплошную обработку. По сути дела, серийный отбор представляет собой случайный или механический отбор, осуществленный для укрупненных элементов исходной совокупности.

В теоретическом плане серийная выборка является самой несовершенной из рассмотренных. Для обработки материала она, как правило, не используется, но представляет определенные удобства при организации обследования, особенно в изучении сельского хозяйства. Например, ежегодные выборочные обследования крестьянских хозяйств в годы, предшествовавшие коллективизации, проводились способом серийного отбора. Историку полезно знать о серийной выборке, поскольку он может встретиться с результатами таких обследований.

Кроме описанных выше классических способов отбора в практике выборочного метода используются и другие способы. Рассмотрим два из них.

Изучаемая совокупность может иметь многоступенчатую структуру, она может состоять из единиц первой ступени, которые, в свою очередь, состоят из единиц второй ступени, и т.д. Например, губернии включают в себя уезды, уезды можно рассматривать как совокупность волостей, волости состоят из сел, а села - из дворов.

К таким совокупностям можно применять многоступенчатый отбор, т.е. последовательно осуществлять отбор на каждой ступени. Так, из совокупности губерний механическим, типическим или случайным способом можно отобрать уезды (первая ступень), затем одним из указанных способов выбрать волости (вторая ступень), далее провести отбор сел (третья ступень) и, наконец, дворов (четвертая ступень).

Примером двухступенчатого механического отбора может служить давно практикуемый отбор бюджетов рабочих. На первой ступени механически выбираются предприятия, на второй - рабочие, бюджет которых обследуется.

Изменчивость признаков исследуемых объектов может быть различной. Например, обеспеченность крестьянских хозяйств собственной рабочей силой колеблется меньше, чем, скажем, размеры их посевов. В связи с этим меньшая по объему выборка по обеспеченности рабочей силой будет столь же представительной, как и большая по числу элементов выборка данных о размерах посевов. В этом случае из выборки, по которой определяются размеры посевов, можно сделать под выборку, достаточно репрезентативную для определения обеспеченности рабочей силой, осуществив тем самым двухфазный отбор. В общем случае можно добавить и следующие фазы, т.е. из полученной подвыборки сделать еще подвыборку и т.д. Этот же способ отбора применяется в тех случаях, когда цели исследования требуют различной точности при исчислении разных показателей.

Задание 1. Описательная статистика

На экзамене 20 студентов получили следующие оценки (по 100 бальной шкале):

1) Построить ряд распределения частот, относительных и накопленных частот для 5 интервалов;

2) Построить полигон, гистограмму и кумулятивный полигон;

3) Найти среднюю арифметическую, моду, медиану, первый и третий квартили, межквартальный размах, стандартное отклонение и коэффициенты вариации. Проанализировать данные с использованием этих характеристик и указать интервал, включающий 50% центральных значений указанных величин.

1) x (min) =53, x (max) =98

R=x (max) - x (min) =98-53=45

h=R/1+3.32lgn, где n - объем выборки, n=20

h= 45/1+3.32*lg20= 9

a (i) - нижняя граница интервала, b (i) - верхняя граница интервала.

a (1) = x (min) - h/2, b (1) = a (1) +h, тогда, если b (i) - верхняя граница i-го интервала (причем a (i+1) =b (i)), то b (2) =a (2) +h, b (3) =a (3) +h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равно или больше x (max).

a (1) = 47.5 b (1) = 56.5

a (2) = 56.5 b (2) = 65.5

a (3) = 65.5 b (3) = 74.5

a (4) = 74.5 b (4) = 83.5

a (5) = 83.5 b (5) = 92.5

a (6) = 92.5 b (6) = 101.5

Интервалы, a (i) - b (i)

Подсчет частот

Частота, n (i)

Накопленная частота, n (hi)

2) Для построения графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот W (i) = n (i) /n, накопленных относительных частот W (hi) и найдем отношение W (i) /h, заполнив таблицу.

x (i) =a (i) +b (i) /2; W (hi) =n (hi) /n

Статистический ряд распределения оценок:

Интервалы, a (i) - b (i)

Для построения гистограммы относительных частот по оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте W (i) данного i-го интервала. Тогда высота элементарного прямоугольника должна быть равна W (i) /h.

Из гистограммы можно получить полигон того же распределения, если середины верхних оснований прямоугольников соединить отрезками прямой.

Для построения кумуляты дискретного ряда по оси абсцисс откладываем значения признака, а по оси ординат - относительные накопленные частоты W (hi). Полученные точки соединяем отрезками прямых. Для интервального ряда по оси абсцисс откладываем верхние границы группировки.

3) Среднее арифметическое значение находим по формуле:

Мода рассчитывается по формуле:

Нижняя граница модального интервала; h - ширина интервала группировки; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. = 23,125.

Найдем медиану:

n=20: 53,58,59,59,63,67,68,69,71,73,78,79,85,86,87,89,91,91,98,98

Подставив значения, получаем: Q1=65;

Значение второго квартиля совпадает со значением медианы, поэтому Q2=75.5; Q3= 88.

Межквартальный размах равен:

Среднеквадратическое (стандартное) отклонение находим по формуле:

Коэффициент вариации:

Из данных расчетов видно, что 50% центральных значений указанных величин включает в себя интервал 74,5 - 83,5.

Задание 2. Статистическая проверка гипотез.

Предпочтения в спорте для мужчин, женщин и подростков следующие:

Проверить гипотезу о независимости предпочтения от пола и возраста б = 0,05.

1) Проверка гипотезы о независимости предпочтений в спорте.

Коэффициент Пирсена:

Табличное значение критерия хи-квадрат со степенью свободы 4 при б = 0,05 равно ч 2 табл =9,488.

Так как, то гипотеза отвергается. Различия в предпочтениях существенные.

2. Гипотеза о соответствии.

Волейбол как вид спорта ближе всего к баскетболу. Проверим соответствие в предпочтениях для мужчин, женщин и подростков.

Ф 2 =0.1896+0.1531+0.1624+0.1786+0.1415+0.1533 = 0.979.

При уровне значимости б = 0,05 и степени свободы k = 2 табличное значение ч 2 табл =9,210.

Так как Ф 2 >, то различия в предпочтениях существенные.

Задание 3. Корреляционно-регрессионный анализ.

Анализ дорожно-транспортных происшествий дал следующую статистику относительно процента водителей, моложе 21 года и числа происшествий с тяжелыми последствиями на 1000 водителей:

Провести графический и корреляционно-регрессионный анализ данных, спрогнозировать число ДТП с тяжелыми последствиями для города, в котором число водителей, моложе 21 года равно 20% от общего числа водителей.

Получаем выборку объема n = 10.

x - процент водителей моложе 21 года,

y - число происшествий на 1000 водителей.

Уравнение линейной регрессии имеет вид:

Последовательно вычисляем:

Аналогично находим

Выборочный коэффициент регрессии

Связь между x, y сильная.

Уравнение линейной регрессии принимает вид:

На рисунке представлено поле рассеяния и график линейной регрессии . Проводим прогноз для x n =20 .

Получаем y n =0 .2 9*20-1 .4 6 = 4 .3 4 .

Прогнозное значение получилось больше всех значений, представленный в исходной таблице . Это следствие того, что корреляционная зависимость прямая и коэффициент равен 0,29 достаточно большой . На каждую единицу приращения Дx он дает приращение Дy =0 .3

Задание 4 . Анализ временных рядов и прогнозирование .

Спрогнозировать значения индексов на ближайшую неделю, используя:

а) метод скользящей средней, выбрав для ее вычисления трехнедельные данные;

б) экспоненциальную взвешенную среднюю, выбрав в качестве б=0,1.

Из таблицы случайных чисел находим номера 41, 51, 69, 135, 124, 93, 91, 144, 10, 24.

Располагаем их в порядке возрастания: 10, 24, 41, 51, 69, 91, 93, 124, 135, 144.

Проводим новую нумерацию от 1 до 10. Получаем исходные данные для десяти недель:

Экспоненциальное сглаживание при б = 0,1 дает только одно значение.

Для середины всего срока получаем три прогноза: 12,855; 1309; 12,895.

Наблюдается согласование этих прогнозов.

Задание 5 . Индексный анализ .

Компания занимается перевозкой грузов. Имеются данные за ряд лет по объемам перевозки 4-х видов грузов и стоимости перевозки единицы груза.

Определите простые индексы цен, количества и стоимости для каждого вида продукта, а также индексы Ласпейреса и Паше и индекс стоимости. Прокомментируйте полученные результаты содержательно.

Решение. Вычислим простые индексы:

Индекс Ласпейреса:

Индекс Паше:

Индеек стоимости:

Индивидуальные индексы указывают на разнобой в изменении цен и количеств по грузам А, В, С, Д. Агрегатные индексы указывают на общие тенденции изменения. В целом стоимость перевозимых грузов уменьшилась на 13%. Причина в том, что самый дорогой груз уменьшился на 42% по количеству, а его тариф почти не изменился.

Годы 16-20 нумеруем по порядку от 1 до 5. Исходные данные принимают вид:

Сначала исследуем динамику количества груза А.

Показатель

Абсолютные приросты

Темпы роста, %

Темпы прироста, %

При этом темпы роста усреднялись по формулам :

, .

Для темпа прироста в любом случае Т пр р -1 .

Теперь рассматриваем груз Д .

Показатель

Абсолютные приросты

Темпы роста, %

Темпы прироста, %

Заключение

Средние величины и их разновидности в статистике играют большую роль. Средние показатели широко применяются в анализе, так как именно в них находят свое проявление закономерности массовых явлений и процессов как во времени, так и в пространстве. Так, например, закономерность повышения производительности труда находит свое выражение в статистических показателях роста средней выработки на одного работающего в промышленности, закономерность неуклонного роста уровня благосостояния населения проявляется в статистических показателях увеличения средних доходов рабочих и служащих и т.д.

Широкое применение имеют такие описательные характеристики распределения варьирующего признака как мода и медиана. Они являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.

Так, чтобы охарактеризовать наиболее часто встречающуюся величину признака, применяют моду, а чтоб показать количественную границу значения варьирующего признака, которую достигла половина членов совокупности - медиану.

Таким образом, средние величины помогают изучать закономерности развития промышленности, конкретной отрасли, общества и страны в целом.

Список литературы

1. Теория статистики: Учебник / Р.А. Шмойлова, В.Г. Минашкин, Н.А. Садовникова, Е.Б. Шувалова; Под ред.Р.А. Шмойловой. - 4-е изд., перераб. и доп. - М.: Финансы и статистика, 2005. - 656с.

2. Гусаров В.М. Статистика: Учебное пособие для вузов. - М.: ЮНИТИ-ДАНА, 2001.

4. Сборник задач по теории статистики: Учебное пособие/ Под ред. проф.В. В. Глинского и к. э. н., доц.Л.К. Серга. Изд. З-е. - М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002.

5. Статистика: Учебное пособие/Харченко Л-П., Долженкова В.Г., Ионин В.Г. и др., Под ред. В.Г. Ионина. - Изд.2-е, перераб. и доп. - М.: ИНФРА-М. 2003.

Подобные документы

    Дескриптивная статистика и статистический вывод. Способы отбора, обеспечивающие репрезентативность выборки. Влияние вида выборки на величину ошибки. Задачи при применении выборочного метода. Распространение данных наблюдения на генеральную совокупность.

    контрольная работа , добавлен 27.02.2011

    Выборочный метод и его роль. Развитие современной теории выборочного наблюдения. Типология методов отбора. Способы практической реализации простой случайной выборки. Организация типической (стратифицированной) выборки. Объем выборки при квотном отборе.

    доклад , добавлен 03.09.2011

    Цель выборочного наблюдения и формирование выборки. Особенности организации различных видов выборочного наблюдения. Ошибки выборочного отбора и методы их расчета. Применение выборочного метода для анализа предприятий топливно-энергетического комплекса.

    курсовая работа , добавлен 06.10.2014

    Выборочное наблюдение как метод статистического исследования, его особенности. Случайный, механический, типический и серийный виды отбора при образовании выборочных совокупностей. Понятие и причины возникновения ошибки выборки, методы ее определения.

    реферат , добавлен 04.06.2010

    Понятие и роль статистики в механизме управления современной экономикой. Сплошное и несплошное статистическое наблюдение, описание выборочного метода. Виды отбора при выборочном наблюдении, ошибки выборки. Производственные и финансовые показатели.

    курсовая работа , добавлен 17.03.2011

    Изучение выполнения плана. Десятипроцентное выборочное обследование по методу случайного бесповторного отбора. Себестоимость продукции завода. Предельная ошибка выборки. Динамика средних цен и объема продажи продукта. Индекс цен переменного состава.

    контрольная работа , добавлен 09.02.2009

    Получение выборки объема n-нормального распределения случайной величины. Нахождение числовых характеристик выборки. Группировка данных и вариационный ряд. Гистограмма частот. Эмпирическая функция распределения. Статистическое оценивание параметров.

    лабораторная работа , добавлен 31.03.2013

    Сущность понятий выборки и выборочного наблюдения, основные виды и категории отбора. Определение объема и численности выборки. Практическое применение статистического анализа выборочного наблюдения. Расчет ошибок выборочной доли и выборочной средней.

    курсовая работа , добавлен 17.02.2015

    Понятие о выборочном наблюдении. Ошибки репрезентативности, измерение ошибки выборки. Определение необходимой численности выборки. Применение выборочного метода вместо сплошного. Дисперсия в генеральной совокупности и сопоставление показателей.

    контрольная работа , добавлен 23.07.2009

    Виды отбора и ошибки наблюдения. Способы отбора единиц в выборочную совокупность. Характеристика коммерческой деятельности предприятия. Выборочное обследование потребителей продукции. Распространение характеристик выборки на генеральную совокупность.

Выборка

Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Характеристики выборки:

  • Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.
  • Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки

  • Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.
  • Существует необходимость в сборе первичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30-35.

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми . Примеры зависимых выборок:

  • пары близнецов,
  • два измерения какого-либо признака до и после экспериментального воздействия,
  • мужья и жёны
  • и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми , например:

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев:

  • и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.

Пример нерепрезентативной выборки

  1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия.
    • Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора
  2. Исследование с использованием только одной группы - экспериментальной.
  3. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Типы выборки

Выборки делятся на два типа:

  • вероятностные
  • невероятностные

Вероятностные выборки

  1. Простая вероятностная выборка:
    • Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Процедура построения простой случайной выборки включает в себя следующие шаги:

1. необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;

2. определить предполагаемый объем выборки, то есть ожидаемое число опрошенных;

3. извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.

4. выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам

  • Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:

1. зачастую сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.

2. результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

3. результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

4. в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки.

  • Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.
  1. Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.
  2. Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.
  3. Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.
  4. «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.

Невероятностные выборки

Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.

  1. Квотная выборка – выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих. Минусы: обычно такие выборки нерепрезентативны, т.к. нельзя учесть сразу несколько социальных параметров. Плюсы: легкодоступный материал.
  2. Метод снежного кома. Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)
  3. Стихийная выборка – выборка так называемого «первого встречного». Часто используется в теле- и радиоопросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов. Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.
  4. Маршрутный опрос – часто используется, если единицей изучения является семья. На карте населённого пункта, в котором будет производиться опрос, нумеруются все улицы. С помощью таблицы (генератора) случайных чисел отбираются большие числа. Каждое большое число рассматривается как состоящее из 3-х компонентов: номер улицы (2-3 первых числа), номер дома, номер квартиры. Например, число 14832: 14 – это номер улицы на карте, 8 – номер дома, 32 – номер квартиры.
  5. Районированная выборка с отбором типичных объектов. Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

6.Модальная выборка. 7.экспертная выборка. 8.Гетерогенная выборка.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности .

Рандомизация

Рандомизация , или случайный отбор , используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза , можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором (Гудвин Дж., с. 147).

Попарный отбор

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать...

Стратометрический отбор

Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол , возраст , политические предпочтения, образование , уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.

Приближённое моделирование

Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.

Приближенное моделирование – формирование модели, которая для четко оговоренного класса систем (процессов) описывает его поведение (или нужные явления) с приемлемой точностью.

Примечания

Литература

Наследов А. Д. Математические методы психологического исследования. - СПб.: Речь, 2004.

  • Ильясов Ф. Н. Репрезентативность результатов опроса в маркетинговом исследовании // Социологические исследования. 2011. № 3. С. 112-116.

См. также

  • В некоторых типах исследований выборку делят на группы:
    • экспериментальная
    • контрольная
  • Когорта

Ссылки

  • Понятие выборки. Основные характеристики выборки. Типы выборки

Wikimedia Foundation . 2010 .

Синонимы :

Смотреть что такое "Выборка" в других словарях:

    выборка - группа испытуемых, представляющих определенную популяцию и отобранных для эксперимента или исследования. Противоположное понятие совокупность генеральная. Выборка есть часть совокупности генеральной. Словарь практического психолога. М.: АСТ,… … Большая психологическая энциклопедия

    выборка - выборка Часть генеральной совокупности элементов, которая охватывается наблюдением (часто ее называют выборочной совокупностью, а выборкой — сам метод выборочного наблюдения). В математической статистике принят… … Справочник технического переводчика

    - (sample) 1. Небольшое количество товара, отобранное, чтобы представлять все его количество. См.: продажа по образцу (sale by sample). 2. Небольшое количество товара, переданное потенциальным покупателям, чтобы дать им возможность провести его… … Словарь бизнес-терминов

    Выборка - часть генеральной совокупности элементов, которая охватывается наблюдением (часто ее называют выборочной совокупностью, а выборкой сам метод выборочного наблюдения). В математической статистике принят принцип случайного отбора; это… … Экономико-математический словарь

    - (sample) Произвольный отбор подгруппы элементов из основной совокупности, характеристики которых используются для оценки всей совокупности в целом. Выборочный метод используется, когда слишком долго или слишком дорого обследовать всю совокупность … Экономический словарь

    См … Словарь синонимов

Выборочное исследование.

Понятие о выборочном методе.

Выборочное наблюдение – это такое несплошное наблюдение, при котором отбор подлежащих исследованию единиц совокупности осуществляется случайно, отобранная часть подвергается исследованию, после чего результаты распространяются на всю совокупность.

К использованию выборочного метода прибегают в тех случаях,

1 когда само наблюдение связано с порчей или уничтожением наблюдаемых единиц (пряжа на пряность, электрическая лампочка на продукт горения)

2 большой объем совокупности

3 большие затраты (финансовые и трудовые).

Обычно выборочному обследованию подвергается 5-10% всей совокупности, реже 15-25%.

Целью выборочного наблюдения является определение характеристик генеральной средней и генеральной доли (P). Характеристики выборочной совокупности –выборочная средняя и выборочная доля (w) отличаются от генеральных характеристик на величину ошибки выборки (). Потому необходимо вычислять ошибку выборки или ошибку репрезентативности, которая определяется по формулам, разработанным в теории вероятности для каждого вида выборки и способа отбора.

Существуют следующие способы отбора единиц:

1 отбор по схеме возвращенного шара, обычно называемый повторной выборкой .

При повторном отборе вероятность попадания каждой отдельной единицы в выборку остается постоянной, т.к. после отбора какой- то единицы, она снова возвращается в совокупность и снова может быть выбранной.

2 отбор по схеме невозвращенного шара, называемый бесповторной выборкой. В этом случае каждая отобранная единица не возвращается обратно, и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастет) (жеребьевка), таблицы случайных чисел например 75 из 780.

Виды выборок.

1 Собственно – случайная.

Это такая, при которой отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности.

При этом количество отобранных единиц обычно определяется исходя из принятой доли выборки.

Для выборки есть отношение числа единиц выборочной совокупности и к численности единиц генеральной совокупности N.

Так при 5% выборке из партии товара в 2000 единиц численность выборки n составляет 100 ед. (
), а при 20% выборке она составит 400 ед.

(
)

Важное условие собственно случайной выборки в том, что каждой единице генеральной совокупности предоставляется равная возможность попасть в выборочную совокупность.

При случайном отборе предельная ошибка выборки для средней равна

- дисперсия выборочной совокупности

n- численность выборки

t- коэффициент доверия, который определяется по таблице значений интегральной функции Лапласа при заданной вероятности P.

При бесповторном отборе предельная ошибка выборки определяется по формуле для средней

где N –численность генеральной совокупности доли

Для определения зольности угля в порядке случайной выборке было обследовано 100 проб угля. В результате обследования установлено, что средняя зольность угля в выборке 16%, = 5%. В 10-ти пробах зольность угля составила >20% с вероятностью 0,954 определить пределы, в которых будет находиться средняя зольность угля в месторождении и доля угля с зольность >20%

Средняя зольность

определяем предельную ошибку выборки


2*0.5=1%

при p=0.954 t=2

доля угля с зольностью >20%

выборочная доля определяется

где m- доля единиц, обладающих признаком

ошибку выборки для доли

С вероятностью 0,954 можно утверждать, что доля угля с зольностью более 20% в месторождении будет находиться в пределах

P= 10%+(-)6% или

Механическая выборка.

Это разновидность собственно – случайной. В этом случае вся генеральная совокупность делится на n равных частей и затем из каждой части отбирается одна единица.

Все единицы генеральной совокупности должны располагаться в определенном порядке. При этом по отношению к изучаемому показателю единицы генеральной совокупности могут быть упорядочены по существенному, второстепенному или нейтральному признаку. При этом из каждой группы должна отбираться та единица, которая находится в середине каждой группы. Это позволяет избежать систематической ошибки выборки.

Применяют: при обследовании покупателей в магазинах, посетителей в поликлиниках, каждый 5,4,3 и т.д

Пример механическая выборка

Для определения среднего срока пользования краткосрочным кредитом в банке будет произведена 5% механическая выборка, в которую попало 100 счетов. В результате обследования установлено, что средний срок пользования краткосрочным кредитом 30 дней при
9дней в 5-ти счетах срок пользования кредитом > 60 дней.

Ошибка выборки

т.е. с вероятность 0,954 можно утверждать, что срок пользования кредитом колеблется

1 в пределах 30дн.+(-)2дня, т.е.

2 доли кредитов со сроком > 60дней.

выборочная доля составит

ошибку доли определим

с вероятностью 0,954 можно утверждать, что доля кредитов в банке со сроком пользования >60дней будет находиться в пределах

Типическая выборка.

Генеральная совокупность разделяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность

Например: пр. тр. работников, состоящих из отдельных групп по квалификации.

Важная особенность – дает более точные результаты по сравнению с другими, т.к. в выборке участвует типологическая единица.

Отбор единиц наблюдения в выборочную совокупность производится различными методами. Рассмотрим типическую выборку с пропорциональным отбором внутри типических групп.

Объем выборки из типической группы при отборе пропорциональном численности типических групп, определяется по формуле

где =V выборки из типической группы

= V типической группы.

Предельная ошибка выборочной средней и доли при бесповторном случайном и механическом способе отбора внутри типических групп рассчитывается по формулам


где =дисперсия выборочной совокупности

Пример: типическая выборка

Для определения среднего возраста мужчин, вступающих в брак, в районе была произведена 5% выборка с отбором единиц пропорционально численности типических групп

Внутри групп применялся механический отбор

С вероятностью 0,954 определить пределы в которых будут находиться средний возраст мужчин, вступивших в брак, и долю мужчин, вступивших в брак вторично.

средний возраст вступают в брак мужчины в выборочной совокупности

предельная ошибка выборки

с вероятностью 0,954 можно утверждать, что средний возраст мужчин, вступающих в брак, будет находиться в пределах

для мужчин, вступающих во второй брак находиться в пределах

выборочная доля определяется

выборочная дисперсия альтернативного признака равна

с вероятностью 0,954 можно утверждать, что доля вступающих в брак во второй раз находится в пределах

Серийная выборка.

При серийной выборке совокупность делят на одинаковые по объему группы – серии. Выборочную совокупность отбираются серии. Внутри серий производится сплошное наблюдение единиц, попавших в серию.

При бесповторном отборе иопределяют по формуле

где
- межсерийная дисперсия

где
выборочная средняя серии

выборочная средняя серийной выборки

R- число серий генеральной совокупности

r- число отобранных серий

Пример: в цехе 10 бригад с целью изучения их производительности труда будет осуществлена 20% серийная выборка, в которую попали 2 бригады. В результате обследования установлено, что

с вероятностью 0,997 определить пределы, в которых будет находиться средняя выработка рабочих цеха.

выборочная средняя серийной выборки определяется по формуле

с вероятностью 0,997 можно утверждать, что средняя выработка рабочих цеха находится в пределах

На складе готовой продукции цеха находятся 200 ящиков деталей по 40 штук в каждом ящике. Для проверки качества готовой продукции будет произведена 10% серийная выборка. В результате выборки установлено, что для бракованных деталей составляет 15%. Дисперсия серийной выборки равна 0,0049.

С вероятностью 0,997 определить пределы, в которых находится доля бракованной продукции в партии ящиков

Доля бракованных деталей будет находиться в пределах

определим предельную ошибку выборки для доли по формуле

с вероятностью 0,997 можно утверждать, что доля бракованных деталей

в партии находится в пределах

В практике проектирования выборочного наблюдения возникает потребность нахождении численности выборки, которая необходима для обеспечения определенной точности расчета генеральных характеристик - средней и доли.

Предельная ошибка выборки, вероятность ее появления и вариация признака предварительно известны.

При случайном повторном отборе численность выборки определяется по формуле

при случайном бесповторном и механическом отборе численность выборки

для типической выборки

для серийной выборки

Пример в районе проживает 2000 семей.

Предполагается провести их выборочное обследование методом случайного бесповторного отбора для нахождения среднего размера семьи.

Определить необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит 1 человека при среднем квадратическом отклонении 3 человека.

В городе проживает 10тыс. семей. С помощью механической выборки предлагается определить долю семей с тремя детьми и более. Какова должна быть численность выборки, чтобы с вероятностью Р=0,954 ошибка выборки не превышала 0,02, если на основе предыдущих обследований известно, что дисперсия равна 0,02?

Выборка

Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Характеристики выборки:

  • Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.
  • Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки

  • Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.
  • Существует необходимость в сборе первичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30-35.

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми . Примеры зависимых выборок:

  • пары близнецов,
  • два измерения какого-либо признака до и после экспериментального воздействия,
  • мужья и жёны
  • и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми , например:

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев:

  • и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.

Пример нерепрезентативной выборки

  1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия.
    • Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора
  2. Исследование с использованием только одной группы - экспериментальной.
  3. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Типы выборки

Выборки делятся на два типа:

  • вероятностные
  • невероятностные

Вероятностные выборки

  1. Простая вероятностная выборка:
    • Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Процедура построения простой случайной выборки включает в себя следующие шаги:

1. необходимо получить полный список членов генеральной совокупности и пронумеровать этот список. Такой список, напомним, называется основой выборки;

2. определить предполагаемый объем выборки, то есть ожидаемое число опрошенных;

3. извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц. Если в выборке должно оказаться 100 человек, из таблицы берут 100 случайных чисел. Эти случайные числа могут генерироваться компьютерной программой.

4. выбрать из списка-основы те наблюдения, номера которых соответствуют выписанным случайным числам

  • Простая случайная выборка имеет очевидные преимущества. Этот метод крайне прост для понимания. Результаты исследования можно распространять на изучаемую совокупность. Большинство подходов к получению статистических выводов предусматривают сбор информации с помощью простой случайной выборки. Однако метод простой случайной выборки имеет как минимум четыре существенных ограничения:

1. зачастую сложно создать основу выборочногo наблюдения, которая позволила бы провести простую случайную выборку.

2. результатом применения простой случайной выборки может стать большая совокупность, либо совокупность, распределенная по большой географической территории, что значительно увеличивает время и стоимость сбора данных.

3. результаты применения простой случайной выборки часто характеризуются низкой точностью и большей стандартной ошибкой, чем результаты применения других вероятностных методов.

4. в результате применения SRS может сформироваться нерепрезентативная выборка. Хотя выборки, полученные простым случайным отбором, в среднем адекватно представляют генеральную совокупность, некоторые из них крайне некорректно представляют изучаемую совокупность. Вероятность этого особенно велика при небольшом объеме выборки.

  • Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.
  1. Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина К определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.
  2. Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т. п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.
  3. Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.
  4. «Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснована. «Удобную» выборку часто используют для предварительного тестирования анкет.

Невероятностные выборки

Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.

  1. Квотная выборка – выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих. Минусы: обычно такие выборки нерепрезентативны, т.к. нельзя учесть сразу несколько социальных параметров. Плюсы: легкодоступный материал.
  2. Метод снежного кома. Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)
  3. Стихийная выборка – выборка так называемого «первого встречного». Часто используется в теле- и радиоопросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов. Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.
  4. Маршрутный опрос – часто используется, если единицей изучения является семья. На карте населённого пункта, в котором будет производиться опрос, нумеруются все улицы. С помощью таблицы (генератора) случайных чисел отбираются большие числа. Каждое большое число рассматривается как состоящее из 3-х компонентов: номер улицы (2-3 первых числа), номер дома, номер квартиры. Например, число 14832: 14 – это номер улицы на карте, 8 – номер дома, 32 – номер квартиры.
  5. Районированная выборка с отбором типичных объектов. Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

6.Модальная выборка. 7.экспертная выборка. 8.Гетерогенная выборка.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности .

Рандомизация

Рандомизация , или случайный отбор , используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза , можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором (Гудвин Дж., с. 147).

Попарный отбор

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать...

Стратометрический отбор

Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол , возраст , политические предпочтения, образование , уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.

Приближённое моделирование

Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.

Приближенное моделирование – формирование модели, которая для четко оговоренного класса систем (процессов) описывает его поведение (или нужные явления) с приемлемой точностью.

Примечания

Литература

Наследов А. Д. Математические методы психологического исследования. - СПб.: Речь, 2004.

  • Ильясов Ф. Н. Репрезентативность результатов опроса в маркетинговом исследовании // Социологические исследования. 2011. № 3. С. 112-116.

См. также

  • В некоторых типах исследований выборку делят на группы:
    • экспериментальная
    • контрольная
  • Когорта

Ссылки

  • Понятие выборки. Основные характеристики выборки. Типы выборки

Wikimedia Foundation . 2010 .

Синонимы :
  • Щепкин, Михаил Семёнович
  • Генеральная совокупность

Смотреть что такое "Выборка" в других словарях:

    выборка - группа испытуемых, представляющих определенную популяцию и отобранных для эксперимента или исследования. Противоположное понятие совокупность генеральная. Выборка есть часть совокупности генеральной. Словарь практического психолога. М.: АСТ,… … Большая психологическая энциклопедия

    выборка - выборка Часть генеральной совокупности элементов, которая охватывается наблюдением (часто ее называют выборочной совокупностью, а выборкой — сам метод выборочного наблюдения). В математической статистике принят… … Справочник технического переводчика

    Выборка - (sample) 1. Небольшое количество товара, отобранное, чтобы представлять все его количество. См.: продажа по образцу (sale by sample). 2. Небольшое количество товара, переданное потенциальным покупателям, чтобы дать им возможность провести его… … Словарь бизнес-терминов

    Выборка - часть генеральной совокупности элементов, которая охватывается наблюдением (часто ее называют выборочной совокупностью, а выборкой сам метод выборочного наблюдения). В математической статистике принят принцип случайного отбора; это… … Экономико-математический словарь

    ВЫБОРКА - (sample) Произвольный отбор подгруппы элементов из основной совокупности, характеристики которых используются для оценки всей совокупности в целом. Выборочный метод используется, когда слишком долго или слишком дорого обследовать всю совокупность … Экономический словарь

    выборка - См … Словарь синонимов

Один из главных компонентов тщательно продуманного исследования – определение выборки и что такое репрезентативная выборка. Это как в примере с тортом. Ведь не обязательно съедать весь десерт, чтобы понять его вкус? Достаточно небольшой части.

Так вот, торт – это генеральная совокупность (то есть все респонденты, которые подходят для опроса). Она может быть выражена территориально, например, лишь жители Московской области. Гендерно – только женщины. Или иметь ограничения по возрасту – россияне старше 65 лет.

Высчитать генеральную совокупность сложно: нужно иметь данные переписи населения или предварительных оценочных опросов. Поэтому обычно генеральную совокупность «прикидывают», а из полученного числа высчитывают выборочную совокупность или выборку .

Что такое репрезентативная выборка?

Выборка – это чётко определенное количество респондентов. Её структура должна максимально совпадать со структурой генеральной совокупности по основным характеристикам отбора.

Например, если потенциальные респонденты – всё население России, где 54% — это женщины, а 46% — мужчины, то выборка должна содержать точно такое же процентное соотношение. Если совпадение параметров происходит, то выборку можно назвать репрезентативной. Это значит, что неточности и ошибки в исследовании сводятся к минимуму.

Объем выборки определяется с учётом требований точности и экономичности. Эти требования обратно пропорциональны друг другу: чем больше объем выборки, тем точнее результат. При этом чем выше точность, тем соответственно больше затрат необходимо на проведение исследования. И наоборот, чем меньше выборка, тем меньше на неё затрат, тем менее точно и более случайно воспроизводятся свойства генеральной совокупности.

Поэтому для вычисления объема выбора социологами была изобретена формула и создан специальный калькулятор :

Доверительная вероятность и доверительная погрешность

Что означают термины «доверительная вероятность » и «доверительная погрешность »? Доверительная вероятность – это показатель точности измерений. А доверительная погрешность – это возможная ошибка результатов исследования. К примеру, при генеральной совокупности более 500 00 человек (допустим, проживающие в Новокузнецке) выборка будет равняться 384 человека при доверительной вероятности 95% и погрешности 5% ИЛИ (при доверительном интервале 95±5%).

Что из этого следует? При проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного. И мы получим репрезентативную выборку с минимальной вероятностью статистической ошибки.

После того, как подсчет объема выборки выполнен, можно посмотреть есть ли достаточное число респондентов в демо-версии Панели Анкетолога . А как провести панельный опрос можно подробнее узнать .

Понравилась статья? Поделитесь с друзьями!