Home News

Случайная выборка (Random Sample)

01.09.2018

видео Случайная выборка (Random Sample)

Математическая статистика 001. Выборочный метод. Выборочные представления.

Вы уже знаете, что с помощью Minitab можно сгенерировать набор случайных данных любой величины, под любое распределение и с любыми параметрами. А если еще не знаете, или вы на этом сайте впервые, то обязательно начните с заметки Генератор случайных величин .



Кроме того, Minitab может помочь нам с отбором случайной выборки из массива наблюдений. Разумеется, программа не сделает за вас всю работу и физический отбор образцов все еще остается на ваших плечах, однако, по крайней мере, с выбором у вас не будет проблем.

Итак, запускаем Minitab :

Для начала сгенерируем 100 наблюдений. Для этой заметки я выбрал распределение Пуассона и следующие параметры:


Лекция 11: Выборочное наблюдение. Способы формирование выборки

Для демонстрации работы с различными данными, скопируем полученные данные в колонки C2 и C3. Если вы повторяете за мной, то у вас должно было получиться 3 идентичных колонки с данными:


Лекция 3: Репрезентативная выборка и методы выборочного исследования

Теперь изменим кодировку для колонок C2 и C3: В меню Data выберите опцию Change Data Type . В диалоговом окне укажите колонку C2 в поле Variables . Из выпадающего списка Choose type выберите Text :

Таким образом, мы указали программе, что значения в колонке C2 следует воспринимать как текстовые. Повторим те же операции для колонки С3, выбрав на этот раз дату или время. Если вы выбрали Elapsed time , то у вас должно было получиться так:

Появившиеся обозначения “T” и “D” в заголовках колонок свидетельствуют о кодировке данных – текст и дата, соответственно.

Теперь перейдем непосредственно к отбору проб – случайной выборке:

В меню Calc выберите Random Data , а затем Sample From Columns . В диалоговом окне укажите: В строке Number of rows to sample – количество образцов в выборке. Для примера нам будет достаточно 5. В поле From columns – укажите, из какой колонки следует выбрать образцы. Начнем с первой – C1. В поле Store samples in – укажите, в какой колонке записать значения выборки. Любая свободная подойдет, например C5.

Нажмите OK. Повторите те же операции для колонок C2 и C3, сохраняя значения выборки в колонках C6 и C7. В результате у нас получилось 3 случайные выборки из трех колонок с данными:

Как вы видите, мы можем работать с числовыми, текстовыми и многими другими форматами данных. Кроме того, вы помните, что мы скопировали данные из колонки C1 в колонки C2 и C3, получив идентичные значения в строках (в первой строке 4, 4 и 4,00:00:00:000). В то же время значения в строках колонок C5, C6 и C7 отличаются (в первой строке 4, 5 и 4,00:00:00:000). Это говорит о том, что программа взяла выборку из каждой колонки, независимо от значений в других колонках.

Если повторить опыт или весь эксперимент от начала, то выборка будет всегда разной. Однако если вам понадобится воспроизвести выборку, получив уже неслучайные величины, то сделайте следующее:

В меню Calc выберите Set Base . В диалоговом окне задайте номер алгоритма. Например, 777:

Теперь каждый раз после задания номера алгоритма, вы получите одну и ту же выборку:

Обрабатываете большие массивы данных, и требуется сократить количество значений? А может, к вам пришла поставка деталей, и вы хотите выбрать коробки для входящего контроля качества? Тогда эта заметка – ваша инструкция.

rss