Статистические методы анализа данных типы данных. Статистические методы

Для анализа данных могут применяться разные методы. Статистические методы анализа данных предназначены для их уплотнения, выявления взаимосвязей и структур.

Статистические методы – методы анализа статистических данных. По своей природе они делятся на количественные и категориальные.

Количественные (метрические ) данные являются непрерывными по своей структуре. Эти данные либо измерены с помощью интервальной шкалы (числовая шкала, количественно равные промежутки которой отображают равные промежутки между значениями измеряемых характеристик), либо с помощью шкалы отношений (кроме расстояния определен и порядок значений).

Категориальные (неметрические ) данные – это качественные данные с ограниченным числом уникальных значений и категорий. Существует два вида категориальных данных: номинальные – используется для нумерации объектов и порядковые – данные, для которых существует естественный порядок категорий.

Статистические методы делятся на одно- и многомерные. Одномерные методы используются тогда, когда все элементы выборки оцениваются единым измерителем либо если этих измерителей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

3.4.3.1. Одномерные статистические методы

Одномерные статистические методы (Univariate techniques ) – методы статистического анализа данных в случаях, если существует единый измеритель для оценки каждого элемента выборки либо если эти измерителей несколько, но каждая переменная анализируется отдельно от всех остальных .

Одномерные методы (рис. 3.9) можно классифицировать на основе того, какие данные анализируются: метрические или неметрические. Метрические данные (metric data ) измеряются по интервальной или относительной шкале. Неметрические данные (nonmetric data ) оцениваются по номинальной или порядковой шкале. Затем эти методы делят на классы на основе того, сколько выборок – одна, две или более – анализируется в ходе исследования. Стоит отметить, что число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные.

Рис. 3.9.

Рассмотрим некоторые из перечисленных на рис. 3.9 одномерных статистических методов.

Однофакторный дисперсионный анализ

Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак. Однофакторный дисперсионный анализ используется в тех случаях, когда есть в распоряжении три или более независимые выборки, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений. Для этих выборок предполагают, что они имеют разные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами, если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).

Вариационный ряд

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Вариационный ряд – это упорядоченное распределение единиц совокупности чаще всего по возрастающим (реже по убывающим) значениям признака и подсчет числа единиц с тем или иным значением признака. Существуют следующие формы вариационного ряда: ранжированный ряд – представляет собой перечень отдельных единиц совокупности в порядке возрастания (или убывания) изучаемого признака; дискретный вариационный ряд – таблица, состоящая из конкретных значений варьирующего признака х и числа единиц совокупности с данным значением f -признака частот; интервальный ряд – значения непрерывного признака задаются интервалами, которые характеризуются интервальной частотой т.

Вариационный анализ предназначен для проверки того, существенно ли влияет изменение независимых переменных на зависимые. Например, данный метод используется для ответов на следующие вопросы:

  • влияет ли вид рекламы на объем продаж;
  • влияет ли цвет рекламного объявления на количество людей, вспомнивших рекламу;
  • влияет ли выбор сбытовой политики на величину продаж?

Статистическая проверка значимости результатов маркетинговых исследований .

В процессе анализа данных у исследователя регулярно возникает вопрос: достаточно ли значимы результаты исследования? Другими словами, может ли результат объясняться тем, что в выборку попали респонденты, которые нс представляют генеральную совокупность в целом? Для ответа на этот вопрос используют статистические гипотезы.

Гипотезы – это предположения или теории, которые исследователь выдвигает относительно некоторых характеристик генеральной совокупности, подлежащей обследованию. Пользуясь статистическими приемами, исследователь пытается установить, существует ли эмпирическое доказательство, подтверждающее выдвинутые гипотезы. Проверка статистических гипотез позволяет рассчитать вероятность наступления какого-либо события. Но в условиях отсутствия полной всесторонней информации (что естественно в случаях использования данных выборки) всегда есть некоторая вероятность и ошибочного заключения.

Выдвижение гипотезы (нулевой или альтернативной). Нулевая гипотеза (H 0), называемая также гипотезой status quo, представляет собой утверждение, в котором исследователь констатирует факт отсутствия каких-либо отличий либо влияний в исходных данных. Она предназначена для определения согласованности исходных данных с выдвинутым предположением. Исследователю необходимо сформулировать нулевую гипотезу так, чтобы отказ от нее приводил к желательному заключению. Например, предприятие рассматривает возможность разработки нового товара и выведения его на рынок. Для принятия положительного решения необходимо, чтобы объем продаж увеличился на 20%. Выдвинем следующее предположение: объем продаж увеличится менее чем на 20%. Это предположение и называется нулевой гипотезой и обозначается как Н 0: Р ≤ 0,20.

Альтернативная гипотеза (H a) предназначена для определения согласованности данных с нулевой гипотезой и опровергает ее. В нашем примере против нулевой гипотезы можно выдвинуть альтернативную гипотезу вида Н а: Р > 0,20.

Если данные проверки гипотезы приводят к отказу от нулевой гипотезы, то принимается альтернативная гипотеза, в соответствии с которой можно ожидать увеличения объема продаж на 20%.

Существует множество методов для проверки статистических гипотез, основные методы перечислены в табл. 3.10 и впоследствии описаны с примерами.

Таблица 3.10

Статистические критерии для проверки статистических гипотез

Область применения

Число подгрупп или выборочных совокупностей

Виды шкал

Критерий

Специальные требования

Гипотезы о частоте распределения

Номинальная

Случайная

Случайны или нет наблюдаемые различия в ответах респондентов

Две и более

Номинальная

Случайная выборка, независимые выборки

Случайны или нет различия в численности мужчин и женщин, реагирующих на продвижение товара

Порядковая

Случайная выборка, естественный порядок данных

Случайно или нет распределение женщин, отдающих предпочтение определенному цвету туши (от темного до светлого)

Гипотезы о средних величинах

Одна (большая выборка)

Метрическая (интервальная или относительная)

Z-Критерий для одной средней

Случайная выборка, п > 30

Случайно или нет наблюдаемое различие между выборочной оценкой средней и стандартной или ожидаемой величиной средней

Одна (малая выборка)

t- Критерий для одной средней

Случайная выборка, n < 30

Случайно или нет наблюдаемое различие между выборочной оценкой средней и стандартной или ожидаемой величиной средней. Применяется для малой выборки

Две (большие выборки)

Z-Критерий для двух средних

Случайная выборка, п > 30

Случайно или нет наблюдаемое различие между средними для двух подгрупп (средний доходу мужчин и женщин)

Две (малые выборки)

ANOVA (анализ вариации)

Случайная

Случайна или нет вариация между средними для трех и более подгрупп (средняя величина расходов на развлечения для различных социальных групп)

Гипотезы о пропорциях

Одна (большая выборка)

Z- Критерий для одной пропорции

Случайная выборка, п > 30

Случайно или нет различие между выборочной оценкой пропорций и некоторой группой стандартных или ожидаемых оценок (процентом тех, кто собирается купить данный товар)

Две (большие выборки)

Z- Критерий для двух пропорций

Случайно или нет наблюдаемое различие между оцениваемыми пропорциями для двух подгрупп (процентом мужчин и женщин, которые имеют высшее образование)

Перед тем как разобрать основные критерии для проверки статистических критериев, нужно установить правила принятия решений. Правила принятия решения необходимы для того, чтобы подтвердить или опровергнуть нулевую гипотезу. Эти правила в статистике называются "уровнями значимости" (а). Они являются показателями качества статистической проверки гипотез и характеризуют вероятность ошибочного заключения. А поскольку всякое решение, принимаемое на основе ограниченного ряда наблюдений, неизбежно сопровождается вероятностью ошибочного решения, важно определить, насколько велика эта вероятность. На практике часто пользуются следующими стандартными значениями а: 0,1; 0,05; 0,01; 0,005; 0,001. При фиксированном объеме выборки обычно задается величина а – вероятность ошибочного отвержения проверяемой гипотезы Н 0.

Критерии для проверки гипотез о средних величинах (Z-критерий и t -критерий). Одной из важных проблем в маркетинговых исследованиях является определение средней величины для генеральной совокупности на основе выборочных данных. Соответствующая статистическая проверка гипотезы о средней величине осуществляется с помощью Z-критерия, который используется в случае, если выборка достаточно большая (п > 30). Для малой выборки (п < 30) используется ί-критерий Стьюдента с (п – 1) степенями свободы (п – объем выборки). Для проверки гипотез о двух и более выборочных средних производится оценка различий между средними величинами.

t -Критерий для одной выборки

t -Критерий (t-test) – одномерный метод проверки гипотез, использующий ί-распределение. Применяется, если стандартное отклонение неизвестно и размер выборки мал.

t -Распределение (t-statistic ) – распределение Стьюдента, симметричное колоколоподобное распределение, используемое для проверки выборок небольшого размера. При большом количестве наблюдений стремится к нормальному распределению.

t -Критерий для одной выборки позволяет проверить гипотезу о равенстве выборочного среднего некоторому заданному числу.

В так называемых одновыборочных t -критериях наблюдаемое среднее X (вычисленное по реализации выборки) сравнивается с ожидаемым (или эталонным) средним выборки μ (т.е. с некоторым теоретическим средним):

Статистика критерия:

имеет t -распределение Стьюдента с (п – 1) степенью свободы.

Выборочное стандартное отклонение s оценивается по наблюдаемой реализации выборки:

Вычисленное значение t проверяют на предмет попадания в критическую область (критическое значение можно найти по таблицам). Если вычисленное значение t попадает в критическую область, то говорят, что H 0 отвергается на уровне а в пользу альтернативы.

Например, пусть установлены некоторые фиксированные показатели эффективности деятельности торговой компании: уровень рентабельности товарооборота – 20%. Таким образом, имея данные о рентабельности (скажем, по месяцам), мы можем применить одновыборочный f-критерий для проверки гипотезы о равенстве среднего уровня рентабельности заданному значению.

Отметим, что в данном случае необходимо применить односторонний критерий, так как нарушение эффективности коммерческой деятельности произойдет только в случае снижения показателя рентабельности относительно нормативного.

Пример . Случайным образом в городе были отобраны десять магазинов. Им был предложен для продажи в течение определенного промежутка времени новый безалкогольный напиток. Компания рассчитывала на продажу 100 бутылок нового напитка в день в каждом магазине. Только в этом случае ожидаемая прибыль оправдает расходы на продвижение нового товара (табл. 3.11).

Таблица 3.11

Фактические данные об объемах продаж магазинов

Номер магазина

Средний объем продаж магазина х i

Отклонение от продаж в день

Квадрат отклонения средней величины

1. Выдвигаем нулевую и альтернативную гипотезы:

H 0: М < 100 бутылок (М – средний объем продаж в магазине за неделю).

H 1 : М > 100 бутылок.

  • 2. Установление допустимого уровня ошибки выборки (σ). Для σ = 0,05 и количеству степеней свободы 10-1=9 табличное (критическое) значение t= 2,2622.
  • 3. Расчитываем стандартное отклонение:

4. Расчет стандартной ошибки:

5. Расчет t -критерия:

t -Критерий для двух независимых выборок

t -Критерий для двух независимых выборок (двухвыборочный f-критерий) проверяет гипотезу о равенстве средних в двух выборках (предполагается нормальность распределения переменных, а также равенство дисперсий выборок). Критерий применяется, например, если необходимо сравнить два региона по доходу на душу населения.

Алгоритм принятия решения об отклонении или не отклонении нулевой гипотезы аналогичен рассмотренному выше (одновыборочный t -критерий)

t -Критерий для двух зависимых выборок

t -Критерий для двух зависимых (парных) выборок применяется, например, для оценки эффективности работы предприятия в разные годы или после каких-то нововведений. Нулевая гипотеза также гласит об отсутствии различий (среднее значение разности наблюдений в двух группах равно нулю).

Алгоритм принятия решения об отклонении или не отклонении нулевой гипотезы аналогичен рассмотренному выше.

Z-Критерий для одной выборки

Для выводов относительно средней величины в генеральной совокупности на основе данных выборки можно использовать Z-критерий, если соблюдаются два условия:

  • 1) распределение переменной в генеральной совокупности является нормальным;
  • 2) объем выборки достаточно большой.

Z-Критерий основан на стандартном нормальном распределении и рассчитывается следующим образом:

где – выборочная средняя; X – генеральная средняя по Н 0; S x – стандартная ошибка оценки средней величины.

При этом средняя ошибка оценки равна

Стандартное отклонение где п – объем выборки.

Пример. Один из салонов красоты провел исследование по 500 клиентам, которым предложили сравнить обслуживание в данном салоне с другими, функционирующими в этом же городе. Респонденты могли выбрать следующие ответы

Средний балл, рассчитанный по данным ответов респондентов, оказался равен 3,5, со среднеквадратическим отклонением 1,5. Может ли менеджер быть уверен в том, что в генеральной совокупности средний балл обслуживания будет не ниже 3 (средний балл по используемой шкале)?

Н 0: М ≤ 3 (М – оценка по используемой шкале),

Н 0:М> 3.

  • 2. Установление допустимого уровня ошибки выборки (σ). Для σ = 0,05 табличное значение Z-критерия равно 1,64.
  • 3. Выборочное среднеквадратическое отклонение: у х = 1,5.
  • 4. Расчет стандартной ошибки оценки генеральной средней

по формуле

5. Расчет Z-критерия:

6. Принятие решения о нулевой гипотезе: нулевая гипотеза может быть отвергнута, так как расчетная величина Ζ = 7,454 больше, чем критическая величина Ζ = 1,64. Менеджер может быть уверен в том, что средняя оценка обслуживания выше, чем 3.

Ζ-Критерий для двух независимых выборок

ЛПР часто бывают заинтересованы в проверке различий между группами покупателей. Если выборки сформированы случайным образом и данные одной выборки не оказывают влияния на значения другой, то такие выборки считают независимыми. В практическом маркетинге гипотезы о параметрах двух выборок используются для определения значимости различий между потребителями и теми, кто не употребляет (не использует) товар определенной торговой марки; или различий в потреблении между двумя группами людей (мужчин и женщин, городским и сельским населением, людьми с высокими и низкими доходами, холостыми и семейными, работающими и пенсионерами, жителями двух стран и др.).

Для проверки значимости различий используют Z-критерий:

где – разница между средними в первой и второй выборках; – разница между средними по нулевой гипотезе; – стандартная ошибка различий между двумя средними.

При этом стандартная ошибка рассчитывается исходя из среднеквадратических отклонений по отдельным группам:

Пример . Менеджер одного из магазинов самообслуживания был уверен, что мужчины чаще посещают магазин, чем женщины. Для иллюстрации проверки гипотез о двух средних величинах вернемся к данным о 215 посетителях магазина (табл. 3.12).

Таблица 3.12

Исходные данные для проверки различий между двумя независимыми выборками

1. Выдвижение нулевой и альтернативной гипотез:

H 0: Х т – X f 0, среднее число посещений магазина мужчинами т) такое же или меньше, чем среднее число посещений магазина женщинами (X f). Другими словами, мужчины реже посещают этот магазин, чем женщины;

H 1: Х т – X f > 0, среднее число посещений магазина мужчинами выше, чем число посещений магазина женщинами.

2. Определение фактических различий в средних значениях показателей:

  • 3. Выбор уровня ошибки выборки ). Предположим, что допустимый уровень ошибки выборки в данном случае равен 0,05. Табличное значение Z-критерия для уровня значимости 0,05 равно 1,6449.
  • 4. Среднеквадратическое отклонение составит:
    • для мужчин

для женщин

5. Расчет стандартной ошибки различий между двумя средними величинами по формуле

6. Расчет статистики Z-критерия:

7. Формулирование выводов. Расчетное значение величины Z = 2,782 больше, чем критическое значение Z = 1,64. Нулевая гипотеза отвергается. Менеджер может сделать вывод с вероятностью 95% о том, что в среднем мужчины чаще посещают магазины самообслуживания, чем женщины.

Критерии согласия: -критерий для одной выборки

Для оценки случайности или существенности расхождений между частотами эмпирического и теоретического распределений используется ряд показателей, именуемых критериями согласия. Одним из основных и наиболее распространенных показателей является критерий, предложенный К. Пирсоном:

где – наблюдаемая частота в каждой категории; – ожидаемая частота.

К. Пирсоном найдено распределение величины и составлены таблицы, позволяющие определить предельное верхнее значение при заданном уровне значимости и числе степеней свободы, значение которого в общем случае равно количеству наблюдений за вычетом числа ограничений, необходимых для расчета статистической характеристики. Если фактическое значение меньше табличного, то расхождения между эмпирическими и теоретическими частотами считают случайными, а гипотезу о принятом законе распределения принимают.

Пример . Менеджеру магазина электронной техники необходимо проверить эффективность трех мероприятий, проводимых в магазине с целью привлечения покупателей. Он хотел бы оценить эффект каждого мероприятия по числу покупателей магазина по следующим данным.

Менеджер должен выяснить, существенны ли различия между числом посетителей магазина в различные периоды времени. На этот вопрос позволяет ответить критерий . Обратимся к последовательности проведения расчета в соответствии с рассмотренным ранее процессом проверки гипотез:

1) выдвигаются нулевая и альтернативная гипотезы:

Н 0: число посетителей магазина во время проведения трех мероприятий одинаковое,

H 1: существует значительная разница в численности посетителей магазина во время проводимых мероприятий;

2) определяется ожидаемое (теоретическое) число посетителей в случае, если нулевая гипотеза верна. Естественно предположить, что численность посетителей должна быть одинакова при условии отсутствия влияния других факторов.

Ожидаемое число посетителей можно определить по формуле

3) рассчитывается величина χ2:

Критерии согласия:-критерий для двух независимых выборок

Маркетинговым исследователям часто бывает необходимо определить, существует ли связь между двумя и более переменными. Чтобы сформулировать маркетинговую стратегию, необходимо найти ответ на вопросы: существуют ли различия в группировках мужчин и женщин на активных, умеренных и слабых потребителей или одинакова ли доля респондентов, покупающих и не покупающих данный товар, в группах с низким, средним и высоким доходом. В описанных ситуациях обычно используется -критерий для двух независимых выборок:

где – наблюдаемое число в каждой i -й строке j -ого столбца; – ожидаемое число в i -й строке j- ого столбца.

Пример. Менеджеру необходимо определить природу связи, если она есть, между полом покупателей и частотой посещения магазинов. Частота посещения магазинов изучалась в трех категориях:

  • 1) 1–5 посещений в месяц – слабые потребители;
  • 2) 6–14 посещений – умеренные потребители;
  • 3) 15 и более раз – активные потребители.

Исходные данные приведены в табл. 3.12.

Среднее число посещений магазина мужчинами:

Среднее число посещений магазина женщинами:

Для проведения теста необходимо:

1) сформулировать нулевую и альтернативную гипотезы:

H 0: между полом и частотой посещения магазина связи нет;

H 1: связь между двумя переменными существенна;

2) определить ожидаемые частоты для каждой группы, попавшей в исследование, используя итоговые данные по соответствующим строкам и столбцам (табл. 3.13);

Таблица 3.13

Расчет ожидаемых (теоретических) частот

4) сравнить табличное значение с расчетным (теоретическим). Табличное значение (для уровня значимости 0,05 и степеней свободы) равно 5,991. Так как расчетное значение (= 13,35) больше, чем табличная величина,

нулевая гипотеза отвергается, и можно сделать вывод о том, что существуют различия между мужчинами и женщинами по частоте посещения магазина.

Критерий Колмогорова – Смирнова

Критерий Колмогорова – Смирнова предполагает определение эмпирических накопленных частостей (долей) и сравнение их с теоретическими частостями. Он используется в тех случаях, когда исходные данные упорядочены. Точка, в которой два распределения будут иметь максимальное расхождение (по модулю), может быть использована в качестве расчетного критерия, обозначаемого черези определяемого по формуле

где – накопленные частости (доли) эмпирического распределения; – накопленные частости теоретического распределения. Величина , рассчитанная по данным выборки, сравнивается с критическим значением :

где λ – критерий Колмогорова – Смирнова, соответствующий заданному уровню значимости α, и – размер выборки.

Различным значениям соответствуют различные значения вероятностей. Эти показатели табулированы. При уровне значимости а = 0,05 значение λ для большой выборки равно 1,36. Как и для показателя χ2, считается вполне допустимым рассматривать расхождения между эмпирическими и теоретическими частотами случайными, если фактическое значение D„ меньше критического значения Экрит.

Пример . Предположим, производителя красок интересует мнение потребителей о пяти новых оттенках цветов синей краски (табл. 3.14). Производителю важно знать, отдают ли потребители предпочтение какому-либо из цветов. В ходе обследования были опрошены 1000 респондентов.

Таблица 3.14

Результаты опроса респондентов относительно их предпочтений

Задача состоит в том, чтобы определить, случайно ли были отобраны цвета респондентами или приведенные данные характеризуют значительное предпочтение светлых цветов.

Тест Колмогорова – Смирнова включает следующие этапы:

1) определение нулевой и альтернативной гипотез:

Н 0: потребители не отдают предпочтение ни одному из оттенков;

Н 1: предпочтения потребителей существенны;

  • 2) расчет теоретических накопленных частостей, соответствующих нулевой гипотезе. Нулевая гипотеза заключается в том, что не существует разницы в предпочтениях потребителей для различных оттенков нового цвета. Если это так, то доля лиц, отдающих предпочтение каждому из оттенков, должна быть равна 1/5 (или 0,2);
  • 3) расчет эмпирических накопленных частостей по данным выборки.

В табл. 3.15 приведены необходимые для расчета критерия данные.

Таблица 3.15

Данные для расчета критерия Колмогорова – Смирнова

4) выбор уровня значимости α.

При уровне значимости критическое значение λ равно 1,36, следовательно, для большой выборки определяется по формуле

5) определение фактического значения D n, равного максимальному абсолютному отклонению между теоретическими и эмпирическими частостями.

Наибольшая абсолютная разность равна 0,24, которая и является величиной D n по критерию Колмогорова – Смирнова;

6) сравнение расчетного значения D n и критического значения . Принятие решения о нулевой гипотезе.

Так как расчетное значение превосходит критическое значение , нулевая гипотеза об отсутствии предпочтений отвергается: респонденты предпочитают светлые тона.

3.4.3.2. Многомерные статистические методы

Многомерные статистические методы прекрасно подходят для анализа данных, если для оценки данных каждого элемента выборки используются два или больше измерителей, а эти переменные анализируются одновременно. Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровня (средних показателей) и распределений (дисперсий) явлений и сосредоточиваются на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Многомерные статистические методы (multivariate techniques) – методы статистического анализа, применяемые для анализа данных, если для оценки каждого элемента выборки используются два или больше измерителя и эти переменные анализируются одновременно (рис. 3.10). Данные методы применяются для определения одновременных взаимосвязей между двумя или больше явлениями.

Рис. 3.10.

Кросс-табуляция (cross-tabulation ) – статистический метод, при котором одновременно характеризуются значения двух или более переменных. Кросс-табуляция заключается в создании таблиц сопряженности признаков, отражающих совместное распределение двух или более переменных с ограниченным количеством категорий или определенными значениями.

Дисперсионный анализ (variance analysis) – метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путем исследования значимости различий в средних значениях. В отличие от t-критерия позволяет сравнивать средние значения грех и более групп. Разработан Р. Фишером для анализа результатов экспериментальных исследований. В литературе также встречается обозначение ANOVA (ANalysis Of VAriance ).

Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:

  • 1) вариативность, обусловленную действием каждой из исследуемых независимых переменных;
  • 2) вариативность, обусловленную взаимодействием исследуемых независимых переменных;
  • 3) вариативность случайную, обусловленную всеми неучтенными обстоятельствами.

Ковариационный анализ (analysis of covariance) – тесно связанный с дисперсионным анализом статистический метод, в котором зависимая переменная статистически корректируется на основе связанной с ней дополнительной информации, с тем чтобы устранить вносимую извне изменчивость и таким образом повысить эффективность анализа.

Дискриминантный анализ (discriminant analysis) – метод для анализа данных маркетинговых исследований в том случае, когда зависимая переменная категориальная, а предикторы (независимые переменные) интервальные. Цель дискриминантного анализа – это различение (дискриминация) объектов наблюдения на классы по заранее определенным признакам.

Регрессионный анализ (regression analysis) – статистический метод исследования влияния одной или нескольких независимых переменных х 1, х 2, ..., x p на зависимую переменную у. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные – критериальными. Цели регрессионного анализа:

  • определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными);
  • предсказание значения зависимой переменной с помощью независимой (независимых);
  • определение вклада отдельных независимых переменных в вариацию зависимой.

Корреляционный анализ (correlation analysis) – статистический метод, выявляющий взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). Цель корреляционного анализа – обеспечить получение некоторой информации об одной переменной с помощью другой переменной.

Факторный анализ (factor analysis) – метод многомерной математической статистики, применяемый при исследовании статистически связанных признаков с целью выявления определенного числа скрытых от непосредственного наблюдения факторов. Цель факторного анализа – наблюдая большое число измеряемых переменных, выявить небольшое число латентных макропеременных-факторов, которые в основном определяют поведение измеряемых переменных.

Кластерный анализ (cluster analysis ) – многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Цель кластерного анализа – разбиение наблюдений, респондентов (строк матрицы данных) на относительно однородные кластеры, исходя из рассматриваемого набора переменных, таким образом, что в один кластер попадают схожие, близкие, а в разные – далекие друг от друга наблюдения.

Многомерное шкалирование (multidimensional scaling) метод анализа данных, позволяющий располагать точки, соответствующие изучаемым объектам (шкалируемые объекты), в некотором (как правило, евклидовом) многомерном "признаковом" пространстве, так, чтобы попарные расстояния между точками в этом пространстве как можно меньше отличались от эмпирически измеренных попарных мер "близости" этих изучаемых объектов. Каждой оси этого пространства соответствует шкала, например интервальная. Критерий отличия этих двух величин называется функцией стресса. Если элементы матрицы близостей получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда аналогичные шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Цель многомерного шкалирования – поиск и интерпретация "латентных (т.е. непосредственно не наблюдаемых) переменных", дающих возможность пользователю объяснить сходства между объектами, заданными точками в исходном пространстве признаков.

Выбор определенного метода анализа зависит, кроме характера и направлений связей с переменными и уровня шкалирования, от решаемой проблемы. В табл. 3.16 представлены рекомендации по выбору метода анализа для решения типичных задач маркетинга в компании.

Многомерный статистический анализ – это трудоемкий процесс, который фактически невозможно провести без статистических программных продуктов. Существует около тысячи распространяемых на мировом рынке пакетов, решающих в том или ином поле задачи статистического анализа данных. Большую часть статистических пакетов можно разбить на две группы – это статистические пакеты общего назначения (универсальные пакеты) и специализированные пакеты.

Типичная постановка вопроса

Корреляционный и регрессионный анализ

  • Как изменится объем продаж, если расходы на рекламу сократятся на 10%?
  • Какие характеристики товара интересны данной группе потребителей?
  • Какие характеристики товара можно объединить в один фактор?
  • Какова будет цепа на услугу в следующем году?

Дискриминационный анализ

  • Как разделить потребителей на группы внутри кластера?
  • Какие характеристики работников службы маркетинга наиболее существенны для их деления на преуспевающих и неудачников?
  • Можно ли определенного человека, учитывая его возраст, доход, образование, считать достаточно надежным для выдачи кредита?

Факторный анализ

  • Можно ли сократить множество характеристик, которые клиенты компании считают важным, до небольшого количества?
  • Как можно описать различные компании с точки зрения этих факторов?

Кластерный анализ

  • Можно ли клиентов разделить на группы по их потребностям?
  • Имеет ли компания различные типы клиентов?
  • Имеет ли газета различные типы читателей?
  • Как можно классифицировать клиентов по тому, какие виды вкладов их интересуют?

Многомерное шкалирование

  • Насколько продукт или компания соответствует "идеалу" клиента?
  • Какой имидж имеет компания?
  • Как изменилось отношение клиента к продукту" в течение ряда лет?

Универсальные пакеты – предлагают широкий диапазон статистических методов. В них отсутствует ориентация на конкретную предметную область. Они обладают дружественным интерфейсом. Из зарубежных универсатьных пакетов наиболее распространены В AS, SPSS, Systat, Minilab, Statgraphics, STATISTICA.

Специализированные пакеты – как правило, реализуют несколько статистических методов или методы, применяемые в конкретной предметной области. Чаще всего это системы, ориентированные на анализ временны́х рядов, корреляционно-регресионный, факторный или кластерный анализ. Применять такие пакеты целесообразно в тех случаях, когда требуется систематически решать задачи из этой области, для которой предназначен специализированный пакет, а возможностей пакетов общего назначения недостаточно. Из российских пакетов более известны STADIA, Олимп, Класс-Мастер, КВАЗАР, Статистик-Консультант; американские пакеты – ODA, WinSTAT, Static и т.д.

Стандартные статистические методы обработки данных включены в состав электронных таблиц, таких как Excel, Lotus 1-2-3, QuattroPro, и в математические пакеты общего назначения, например Mathcad.

Статистические ме́тоды - методы анализа статистических данных. Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.

Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью. Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):

а) разработка и исследование методов общего назначения, без учета специфики области применения;

б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;

в) применение статистических методов и моделей для статистического анализа конкретных данных.

Дисперсионный анализ. Дисперсионный анализ (от латинского Dispersio – рассеивание / на английском Analysis Of Variance - ANOVA) применяется для исследования влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную (отклик). В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные), а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.

Основной целью дисперсионного анализа (ANOVA) является исследование значимости различия между средними с помощью сравнения (анализа) дисперсий. Разделение общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии. Если вы просто сравниваете средние в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий для независимых выборок (если сравниваются две независимые группы объектов или наблюдений) или t-критерий для зависимых выборок (если сравниваются две переменные на одном и том же множестве объектов или наблюдений).


Сущность дисперсионного анализа заключается в расчленении общей дисперсии изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Сравнивая компоненты дисперсии, друг с другом посредством F-критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.

Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок, которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По количеству выявляемых регулируемых факторов дисперсионный анализ может быть однофакторным (при этом изучается влияние одного фактора на результаты эксперимента), двухфакторным (при изучении влияния двух факторов) и многофакторным (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие).

Дисперсионный анализ относится к группе параметрических методов и поэтому его следует применять только тогда, когда доказано, что распределение является нормальным.

Дисперсионный анализ используют , если зависимая переменная измеряется в шкале отношений, интервалов или порядка, а влияющие переменные имеют нечисловую природу (шкала наименований).

Примеры задач. В задачах, которые решаются дисперсионным анализом, присутствует отклик числовой природы, на который воздействует несколько переменных, имеющих номинальную природу. Например, несколько видов рационов откорма скота или два способа их содержания и т.п.

Пример 1 : В течение недели в трех разных местах работало несколько аптечных киосков. В дальнейшем мы можем оставить только один. Необходимо определить, существует ли статистически значимое отличие между объемами реализации препаратов в киосках. Если да, мы выберем киоск с наибольшим среднесуточным объемом реализации. Если же разница объема реализации окажется статистически незначимой, то основанием для выбора киоска должны быть другие показатели.

Пример 2 : Cравнение контрастов групповых средних. Семь политических пристрастий упорядочены от крайне либеральные до крайне консервативные, и линейный контраст используется для проверки того, есть ли отличная от нуля тенденция к возрастанию средних значений по группам - т. е. есть ли значимое линейное увеличение среднего возраста при рассмотрении групп, упорядоченных в направлении от либеральных до консервативных.

Пример 3 : Двухфакторный дисперсионный анализ. На количество продаж товара, помимо размеров магазина, часто влияет расположение полок с товаром. Данный пример содержит показатели недельных продаж, характеризуемые четырьмя типами расположения полок и тремя размерами магазинов. Результаты анализа показывают, что оба фактора - расположение полок с товаром и размер магазина - влияют на количество продаж, однако их взаимодействие значимым не является.

Пример 4: Одномерный ANOVA: Рандомизированный полноблочный план с двумя обработками. Исследуется влияние на припек хлеба всех возможных комбинаций трех жиров и трех рыхлителей теста. Четыре образца муки, взятые из четырех разных источников, служили в качестве блоковых факторов. Необходимо выявить значимость взаимодействия жир-рыхлитель. После этого определить различные возможности выбора контрастов, позволяющих выяснить, какие именно комбинации уровней факторов различаются.

Пример 5 : Модель иерархического (гнездового) плана со смешанными эффектами. Изучается влияние четырех случайно выбранных головок, вмонтированных в станок, на деформацию производимых стеклянных держателей катодов. (Головки вмонтированы в станок, так что одна и та же головка не может использоваться на разных станках). Эффект головки обрабатывается как случайный фактор. Статистики ANOVA показывают, что между станками нет значимых различий, но есть признаки того, что головки могут различаться. Различие между всеми станками не значимо, но для двух из них различие между типами головок значимо.

Пример 6 : Одномерный анализ повторных измерений с использованием плана расщепленных делянок. Этот эксперимент проводился для определения влияния индивидуального рейтинга тревожности на сдачу экзамена в четырех последовательных попытках. Данные организованы так, чтобы их можно было рассматривать как группы подмножеств всего множества данных ("всей делянки"). Эффект тревожности оказался незначимым, а эффект попытки - значим.

Ковариационный анализ. Ковариационный анализ - совокупность методов математической статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины одновременно от набора (основных) качественных факторов и (сопутствующих) количественных факторов . Факторы F задают сочетания условий, при которых были получены наблюдения X,Y, и описываются с помощью ндикаторных переменных, причем среди сопутствующих и индикаторных переменных могут быть как случайные, так и неслучайные (контролируемые в эксперименте).

Если случайная величина Y является вектором, то говорят о многомерном ковариационном анализе.

Ковариационный анализ часто применяют перед дисперсионным анализом, чтобы проверить гомогенность (однородность, представительность) выборки наблюдений X,Y по всем сопутствующим факторам.

Понятие «статистический анализ» традиционно ассоциируется с исключительно количественными, цифровыми показателями. Слово «статистика» имеет латинское происхождение и означает «состояние, положение вещей с точки зрения закона». Наполеон Бонапарт называл статистику «бюджетом вещей». В современном понимании, этот термин может быть использован в следующих значениях:

ü как специализированная отрасль знания по вопросам сбора и анализа данных. Термин «статистика» в этом значении стало применяться с середины XVIII века в Германии.

ü как массив определенных статистических данных (статистика рождаемости, статистика посещений сайта и т.п.).

ü как измеримая функция наблюдения в математической статистике: , где - выборка.

Принято считать, что статистика, как научное направление, появилось во второй половине XVIII – начале XIX веков. Конечно, методы и процедуры статистического учета применялись и развивались задолго до XVIII века. Действительно, еще в Древнем Китае проводились переписи населения, в Древнем Риме велся учет имущества граждан, да и в других царствах-государствах было что посчитать и записать. Ценность статистических методов, прежде всего в предоставлении фактов в наиболее сжатой форме. Статистика за сотни лет своей эволюции, отдельными элементами или комплексными методиками применялась и применяется и для административного, в том числе социально-политического управления, и для ведения деятельности отдельного предприятия.

Сейчас, в современном мире статистические методы применяются практически во всех сферах деятельности человека и являются методами сбора, классификации данных с последующим их анализом с целью выявления закономерностей.

Методы статистического анализа ориентированы на решения реальных задач, поэтому постоянно появляются и развиваются новые методы. Динамизм развития статистической науки и использование в самых различных областях деятельности человека, затрудняют классификацию статистических методов. Большинство исследователей с легкостью подразделяют эти методы по способу их применения и использования. В соответствии с этим подходом, статистика, как наука в современном мире, по степени охвата исследуемой области и глубины анализа подразделяется на следующие виды:

· теоретическая статистика (общая теория статистики) – разработка и исследование методов общего характера;

· прикладная статистика – разработка методов и моделей получения анализа статистических данных конкретных явлений и процессов в различных областях деятельности. Подразделяется на ряд подразделов, например, такие хорошо разработанные направления статистики, как математическую и экономическую статистику.


· статистический анализ конкретных данных. Например, медицинская статистика, правовая статистика, биометрика (измерение каких-либо параметров тела человека), технометрика (измерение технических параметров приборов и оборудования), наукометрика (статистические параметры состояния и развития различных направлений сферы образования и науки) и т.д.

Методы статистического анализа могут быть классифицированы по объему анализируемых данных и глубине их взаимосвязи и взаимозависимости. Данная классификация приведена на рисунке 8.2.1 «Классификация методов статистического анализа».

Анализ данных и статистика - вещи одного порядка. Если статистика первооснова и источник информации, то анализ данных - это инструмент для ее исследования, и зачастую анализ данных без статистики невозможен.

Получить обучающее видео

Статистика - это изучение любых явлений в числовой форме. Статистика используется анализом данных в количественных исследованиях. Противоположность им - качественные, описывающие ситуацию без применения цифр, в текстовом выражении.

Количественный анализ статистических данных проводится по интервальной шкале и по рациональной:

  • интервальная шкала указывает, насколько тот или иной показатель больше или меньше другого и дает возможность подобрать похожие по свойствам соотношения показатели,
  • рациональная шкала показывает, во сколько раз тот или иной показатель больше или меньше другого, но в ней содержатся только положительные значения, что не всегда будет отражать реальное положение дел.

Как используют Data Mining в компании Mail.ru?

Получить обучающее видео

Методы анализа статистических данных

В анализе статистических данных можно выделить аналитический этап и описательный. Описательный этап - последний, он включает представление собранных данных в удобном графическом виде – в графиках, диаграммах, дашбордах. Аналитический этап - это анализ, заключающийся в использовании одного из следующих методов:

  • статистического наблюдения – систематического сбора данных по интересующим характеристикам;
  • сводки данных, в которой можно обработать информацию после наблюдения; она описывает отдельные факты как часть общей совокупности или создает группировки, делит информацию по группам на основании каких-либо признаков;
  • определении абсолютной и относительной статистической величины; абсолютная величина придает данным количественные характеристики в индивидуальном порядке, в независимости от других данных; относительные величины описывают одни объекты или признаки относительно других;
  • метода выборки – использовании при анализе не всех данных, а только их части, отобранной по определенным правилам (выборка может быть случайной, стратифицированной, кластерной и квотной);
  • корреляционного и регрессионного анализа - выявляет взаимосвязи данных и причины, по которым данные зависят друг от друга, определяет силу этой зависимости;
  • метода динамических рядов - отслеживает силу, интенсивность и частоту изменений объектов и явлений; позволяет оценить данные во времени и дает возможность прогнозирования явлений.

Программное обеспечение для статистического исследования

Статистические исследования могут проводить маркетологи-аналитики:

Для качественного анализа статистических данных необходимо либо обладать знаниями математической статистики, либо использовать отчетно-аналитическую программу, либо не заниматься этим. Европейские компании давно осознали пользу такого анализа, поэтому либо нанимают хороших аналитиков с математическим образованием, либо устанавливают профессиональное программное обеспечение для аналитиков-маркетологов. Ежедневный анализ в этих компаниях помогает им правильно организовывать закупку товаров, их хранение и логистику, корректировать количество персонала и их рабочие графики.

Решения для автоматизации анализа данных позволяют работать с ними аналитикам-маркетологам. Сегодня есть решения, доступные даже небольшим компаниям, такие как Tableau. Их преимущества по сравнению с анализом, проведенным исключительно человеком:

  • невысокая стоимость внедрения (от 2000 рублей в месяц – на февраль 2018 года),
  • современное графическое представление анализа,
  • возможность мгновенно переходить от одного, более полного отчета, к другому, более детальному.

Хотите узнать, как провести анализ и сделать отчеты быстро?

Получить обучающее видео

Достаточно подробно изложены в отечественной литературе. В практике российских предприятий, между тем, используются только некоторые из них. Рассмотрим далее некоторые методы статистической обработки.

Общие сведения

В практике отечественных предприятий распространены преимущественно статистические методы контроля . Если говорить о регулировании технологического процесса, то оно отмечается крайне редко. Применение статистических методов предусматривает, что на предприятии формируется группа из специалистов, которые имеют соответствующую квалификацию.

Значение

Согласно требованиям ИСО сер. 9000, поставщику необходимо определить необходимость в статистических методах, которые применяются в процессе разработки, регулирования и проверки возможностей производственного процесса и характеристики изделий. Используемые приемы базируются на теории вероятностей и математических расчетах. Статистические методы анализа данных могут внедряться на любом этапе жизненного цикла изделия. Они обеспечивают оценку и учет степени неоднородности продукции либо вариабельности ее свойств относительно установленных номиналов или требуемых значений, а также изменчивости процесса ее создания. Статистические методы - это приемы, посредством которых можно с заданной точностью и достоверностью судить о состоянии явлений, которые исследуются. Они позволяют спрогнозировать те или иные проблемы, выработать оптимальные решения на основе изученной фактической информации, тенденциях и закономерностях.

Направления использования

Основные области, в которых широко распространены статистические методы, - это :


Практика развитых стран

Статистические методы - это база, обеспечивающая создание продукции с высокими потребительскими характеристиками. Эти приемы широко используются в промышленно развитых государствах. Статистические методы - это, по сути, гаранты получения потребителями продукции, соответствующей установленным требованиям. Эффект их использования доказан практикой промышленных предприятий Японии. Именно они способствовали достижению высочайшего производственного уровня в этой стране. Многолетний опыт зарубежных стран показывает, насколько эффективны эти приемы. В частности, известно, что компания Hewlelt Packard, применяя статистические методы, смогла снизить в одном из случаев количество брака за месяц с 9 000 до 45 ед.

Сложности внедрения

В отечественной практике существует ряд препятствий, не позволяющих использовать статистические методы изучения показателей. Сложности возникают вследствие:


Разработка программы

Необходимо сказать, что определение потребности в тех или иных статистических методах в сфере качества, выбор, освоение конкретных приемов является довольно сложной и длительной работой для любого отечественного предприятия. Для эффективного ее осуществления целесообразно разработать специальную долговременную программу. В ней следует предусмотреть формирование службы, в задачи которой будет входить организация и методическое руководство применения статистических методов. В рамках программы нужно предусмотреть оснащение соответствующими техническими средствами, обучение специалистов, определить состав производственных задач, которые должны решаться с помощью выбранных приемов. Освоение рекомендуется начать с использования самых простых подходов. К примеру, можно использовать известные элементарные производством. Впоследствии целесообразно перейти к другим приемам. Например, это может быть анализ дисперсии, выборочная обработка информации, регулирование процессов, планирование факторного исследования и экспериментов и пр.

Классификация

К статистическим методам экономического анализа относятся разные приемы. Стоит сказать, их насчитывается довольно много. Однако ведущий специалист в сфере менеджмента качества в Японии К. Исикава рекомендует использовать семь основных методов:

  1. Диаграммы Парето.
  2. Группировка сведений по общим признакам.
  3. Контрольные карты.
  4. Причинно-следственные диаграммы.
  5. Гистограммы.
  6. Контрольные листки.
  7. Диаграммы разброса.

Руководствуясь собственным опытом в сфере менеджмента, Исикава утверждает, что 95% всех вопросов и проблем на предприятии можно решить, используя эти семь подходов.

Диаграмма Парето

Этот базируется на определенном соотношении. Оно было названо "принципом Парето". В соответствии с ним, из 20% причин появляется 80% следствий. в наглядной и понятной форме показывает относительное влияние каждого обстоятельства на общую проблему в убывающем порядке. Это воздействие можно исследовать на количестве потерь, дефектов, спровоцированных каждой причиной. Относительное влияние иллюстрируется с помощью столбиков, накопленное воздействие факторов посредством кумулятивной прямой.

Причинно-следственная диаграмма

На ней исследуемую проблему условно изображают в форме горизонтальной прямой стрелки, а условия и факторы, косвенно либо прямо влияющие на нее, - в виде наклонных. При построении следует учитывать даже незначительные на первый взгляд обстоятельства. Это обуславливается тем, что на практике достаточно часто бывают случаи, в которых решение задачи обеспечивается исключением нескольких, кажущихся несущественными, факторов. Причины, которые влияют на основные обстоятельства (первого и следующих порядков) изображают на диаграмме горизонтальными короткими стрелками. Детализированная схема будет иметь форму скелета рыбы.

Группировка сведений

Этот экономико-статистический метод используется для упорядочения множества показателей, которые были получены при оценке и измерении одного или нескольких параметров объекта. Как правило, такая информация представлена в форме неупорядоченной последовательности значений. Это могут быть линейные размеры заготовки, температура плавления, твердость материала, количество дефектов и так далее. На основе такой системы сложно делать выводы о свойствах изделия либо процессах его создания. Упорядочивание осуществляется с помощью линейных графиков. Они наглядно показывают изменения наблюдаемых параметров в течение определенного периода.

Контрольный листок

Как правило, он представлен в виде таблицы распределения частот вхождения измеряемых величин параметров объекта в соответствующие промежутки. Контрольные листки составляются в зависимости от поставленной цели исследования. Диапазон значений показателей разделяется на одинаковые интервалы. Их число выбирают обычно равное квадратному корню из количества выполненных измерений. Бланк должен быть простым, чтобы исключить проблемы при заполнении, прочтении, проверке.

Гистограмма

Она представлена в форме ступенчатого многоугольника. Он наглядно иллюстрирует распределение показателей измерений. Диапазон установленных величин разбивается на равные промежутки, которые откладывают по оси абсцисс. К каждому интервалу строится прямоугольник. Его высота равна частоте вхождения величины в данный промежуток.

Диаграммы разброса

Они используются при проверке гипотезы о взаимосвязи двух переменных величин. Модель строится следующим образом. На оси абсцисс откладывают величину одного параметра, ординат - другого показателя. В результате на графике появляется точка. Данные действия повторяются для всех значений переменных. При наличии взаимосвязи поле корреляции вытянуто, и направление не будет совпадать с направленностью оси ординат. Если зависимость отсутствует, оно параллельно одной из осей или будет иметь форму круга.

Контрольные карты

Они используются при оценке процесса в течение конкретного периода. Формирование контрольных карт базируется на следующих положениях:

  1. Все процессы отклоняются от заданных параметров с течением времени.
  2. Нестабильный ход явления не изменяются случайно. Неслучайными выступают отклонения, выходящие за границы предполагаемых пределов.
  3. Отдельные изменения могут быть спрогнозированы.
  4. Стабильный процесс может случайно отклоняться и в предполагаемых границах.

Использование в практике российских предприятий

Следует сказать, что отечественный и зарубежный опыт показывает, что наиболее эффективным статистическим методом оценки стабильности и точности оборудования и технологических процессов выступает составление контрольных карт. Этот способ используется также при регулировании производственных потенциальных мощностей. При построении карт необходимо правильно выбрать исследуемый параметр. Рекомендуется отдавать предпочтение тем показателям, которые непосредственно относятся к назначению изделия, могут быть легко измерены и на которые можно оказать воздействие посредством регулирования процесса. Если такой выбор затруднителен или не оправдан, можно выполнить оценку величин, коррелированных (взаимосвязанных) с контролируемым параметром.

Нюансы

Если измерение показателей с точностью, требуемой для составления карт по количественному критерию, экономически или технически невозможно, используют альтернативный признак. С ним связаны такие термины, как "брак" и "дефект". Под последним понимают каждое обособленное несоответствие изделия установленным требованиям. Браком называют продукцию, предоставление которой не допускается потребителям, в связи с наличием в ней дефектов.

Особенности

У каждого типа карт есть своя специфика. Ее необходимо принимать во внимание при их выборе для конкретного случая. Карты по количественному критерию считаются более чувствительными к изменениям процесса, чем те, в которых используется альтернативный признак. Однако при этом первые более трудоемки. Их используют для:

  1. Отладки процесса.
  2. Оценки возможностей внедрения технологии.
  3. Проверки точности работы оборудования.
  4. Определения допусков.
  5. Сопоставления нескольких допустимых способов создания продукта.

Дополнительно

Если разладка процесса отличается смещением контролируемого параметра, необходимо использовать Х-карты. Если имеет место увеличение рассеяния значений, выбирать нужно R или S-модели. Необходимо, однако, учитывать ряд особенностей. В частности, использование S-карт позволит точнее и быстрее установить разладку процесса, чем R-модели при одинаковых Вместе с тем, построение последних не требует выполнения сложных расчетов.

Заключение

В экономике позволяют исследовать факторы, которые обнаруживаются в ходе качественной оценки, в пространстве и динамике. С их помощью можно выполнять прогнозные расчеты. К статистическим методам экономическая анализа не относят способы оценки причинно-следственных связей хозяйственных процессов и событий, выявления перспективных и неиспользованных резервов повышения результативности деятельности. Другими словами, в число рассмотренных подходов не включаются факторные приемы.