PDA

Просмотр полной версии : Статистическая обработка данных


Longenery
13.07.2014, 23:53
Напрочь, просто напрочь выветрилось из головы все по мат.методам за два года после окончания! :( Просидела выходные с учебником, теперь полная каша в голове.

Коллеги, может быть кто-нибудь подскажет, каким образом лучше смотреть влияние социально-психологического климата на выручку по отдельным магазинам и климата на уровень текучки персонала? У меня уже все смешалось: Манна-Уитни, корреляционно-регрессионный анализ... :cranky:

LeoChpr
14.07.2014, 09:00
Определитесь сначала, что будите проверять: связь или различия?

IRA2001
14.07.2014, 11:19
Longenery, Связь "спк-финансовые показатели-текучесть" можно посчитать корреляционным или факторным.
Если магазины хотите пошукать, то тут попроще и результативнее хи-квадрат будет.
Правда понять не могу, в чем практический смысл таких замеров :confused: и как спк помониторить (еще и в магазинах :laugh:)

Longenery
14.07.2014, 21:44
Определитесь сначала, что будите проверять: связь или различия?
Связь.
Да, Манна-Уитни здесь не подходит.


Longenery, Связь "спк-финансовые показатели-текучесть" можно посчитать корреляционным или факторным.
Если магазины хотите пошукать, то тут попроще и результативнее хи-квадрат будет.
Правда понять не могу, в чем практический смысл таких замеров :confused: и как спк помониторить (еще и в магазинах :laugh:)
Для корреляционного должно быть не менее 30 человек в выборке, для факторного - от 50, насколько я помню. У нас в каждом магазине по 10-20 человек (максимум).
Плюс корреляционный просто показывает связь, но она может быть недостоверной же. Помню, на лекциях был комичный пример положительной связи между длиной стопы и уровнем интеллекта.
И, в любом случае, я не могу понять, какой коэффициент корреляции выбрать. У меня ощущение, что подходят все - и Пирсона, и Спирмана, и Кендалла. :facepalm:

Добавлено через 2 минуты
Если магазины хотите пошукать, то тут попроще и результативнее хи-квадрат будет.
Вооот, я как раз сейчас в тему с этим вопросом зашла: подойдет ли хи-квадрат.
Спасибо!

Правда понять не могу, в чем практический смысл таких замеров :confused: и как спк помониторить (еще и в магазинах :laugh:)
Практический смысл в том, чтобы отслеживать связь комфорта людей на работе с эффективностью их труда. И вторая связка - между комфортом-дискомфортом и желанием уйти из компании.

Спасибо!

IRA2001
14.07.2014, 21:52
Longenery, А затея прикладная или чисто исследовательская?

Добавлено через 1 минуту
Кстати, спирмен отлично работает на малых выборках

Longenery
14.07.2014, 22:12
IRA2001, прикладная-исследовательская. :)
Все-таки корреляционный анализ рекомендуете? Хорошо, еще почитаю про Спирмена. Спасибо.

А Хи-квадрат на двух выборках считается? Я вот читаю сейчас про него и понимаю, что там должно быть три выборки. То есть нужно смотреть связь спк-выручки-текучки, а не спк-выручки и спк-текучки.
Или я что-то опять туплю?

IRA2001
14.07.2014, 22:29
Longenery, Хи-квадрат работает при сравнении двух и более выборок. Но он всего лишь покажет различия между магазинами...
В плане связи тут картинка интереснее будет )))
Делала как-то для одной сетки анализ - психология в продажах менее весома, чем объективные параметры: средний чек, конверсия, число постоянных клиентов, число сделок и т.д. Это корреляты показателей продаж (оборотка и рентабельность).
По текучести коррелятами вылезли ЗП (естественно!), график работы (что-то со стабильностью связанное), сроки выплаты ЗП и т.д.
В-общем, при влиянии на ключевые корреляты продажи повысить можно)))

Longenery
14.07.2014, 22:32
IRA2001,
а через какой мат.метод Вы делали такой анализ?

Средний чек, число клиентов и число сделок могут иметь корневой причиной хороший климат же. Ну, могут и не иметь, конечно. :) Надо проверить.

Hogfather
14.07.2014, 23:13
1. Нужна рабочая гипотеза, перед тем как собирать данные
2. Нужно провести разведочный анализ данных (http://r-analytics.blogspot.ru/search/label/%D1%80%D0%B0%D0%B7%D0%B2%D0%B5%D0%B4%D0%BE%D1%87%D 0%BD%D1%8B%D0%B9%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8% D0%B7%20%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85).
3. После этого определяются с методами исследования.

Longenery
14.07.2014, 23:42
Hogfather, прежде всего, конечно, спасибо!
По пунктам:
1. Гипотеза в том, что связь между спк и выручкой, а также спк и текучкой есть.
2. Разведочный анализ данных, как процедура предварительной оценки имеющихся у нас данных (я правильно понимаю смысл разведочного анализа?), не проводилась, так как это очень сложно. Я тут назначение Манна-Уитни перепутала, какие там матричные или парные диаграммы рассеяния.
3. "После этого определяются с методами исследования." - Главный вопрос поста - а без п.2 разве никак определиться с методами нельзя????? Мы не проводили разведочный анализ, когда я училась.
Что будет, если его не проводить? Высокий риск неправильного подбора метода?
Обязательно ли проводить всё: выявление избыточного количества нулевых знвчений, коллинеарности, проверку нормальности распределений, выбросов, однородности групповых дисперсий и т.д.?
Очень надеюсь на ответы на все вопросы.

Hogfather
15.07.2014, 00:18
1. Скорее всего, вы сравниваете не одинаковость распределения выборок, а одинаковость средних, поэтому Вам нужен дисперсионный анализ (One way ANOVA в статистических пакетах). Но тогда подразумевается, что данные в выборке распределены нормально. Если данные распределены неизвестно как, то, как вариант, экспресс-тест Тьюки, хотя это и некошерно. Регрессионный анализ, как альтернатива ANOVA, годится, в принципе, он достаточно робастен, но не резиновый. Поэтому выбросы и нормальность распределения я бы посмотрел на графике в любом случае.
2. Разведочный анализ данных, в основном, инструмент быстрой визуализации, чтобы понять, с чем имеешь дело и не заниматься ерундой.
3. Не обязательно проводить всё, особенно если не знаешь зачем. Важно понять что за данные на входе, потому как "мусор на входе - мусор на выходе" (GIGO)
4. Меня смущает "оценка климата". Методически правильно бы сперва еще протестировать систему измерений (MSA). Поскольку подозреваю, что это некая порядковая квалиметрическая шкала, то каппа-статистика в помощь.

sum
15.07.2014, 11:14
1. Гипотеза в том, что связь между спк и выручкой, а также спк и текучкой есть.
моё скромное мнение: есть такая связь или нет - не принципиально важно, если вы попробуете оценить чувствительность выручки к изменению спк, вы увидите, что увеличение выручки будет незначительно, и скорее всего не перекроет затрат на соответствующие мероприятия
то же самое вам скажет любой руководитель в сфере торговли (только другими словами), такие вещи имеют большее значение в услугах (в т.ч. финансовых) и даже на производстве, в торговле наоборот принято экономить на подобных вещах, посмотрите на розничные сети - чем крупнее компания, тем нещаднее в ней наяривают продавцов (менеджеров)
вижу, что исследование развивается в психологическом ключе и тут, вероятно, это актуально, но в среде экономистов одобрения не ждите))

Longenery
15.07.2014, 21:53
1. ... Поэтому выбросы и нормальность распределения я бы посмотрел на графике в любом случае.
А если нормальности не будет, то что делать?
И нормальность можно проверить через критерий Колмагорова-Смирнова? Просто то, что здесь (http://r-analytics.blogspot.ru/2012/06/blog-post_14.html) описано (R-функции hist(), базовая функция qqnorm()), я никогда не делала. Или просто напрочь забыла. Мне нужно максимально простое ВСЁ.

И еще хочу уточнить, нормально проверять можно по всем магазинам сразу или требуется по каждому отдельно, если я смотрю связь по отдельным магазинам?


Если я в итоге все-таки на коэф.корреляции Спирмена остановлюсь, то нормально, это же не будет ошибкой выбора метода стат.обработки?




2. Разведочный анализ данных, в основном, инструмент быстрой визуализации, чтобы понять, с чем имеешь дело и не заниматься ерундой.
Ничего себе быстрой!

3. Не обязательно проводить всё, особенно если не знаешь зачем. Важно понять что за данные на входе, потому как "мусор на входе - мусор на выходе" (GIGO)
Спасибо!

4. Меня смущает "оценка климата". Методически правильно бы сперва еще протестировать систему измерений (MSA). Поскольку подозреваю, что это некая порядковая квалиметрическая шкала, то каппа-статистика в помощь.
У меня не мной сформированные опросники, а проверенные тесты на соц-пс.климат. Ну, там, типа всем известного Михалюк-Шалыто.
Тогда не нужно же MSA?

Добавлено через 15 минут
моё скромное мнение: есть такая связь или нет - не принципиально важно, если вы попробуете оценить чувствительность выручки к изменению спк, вы увидите, что увеличение выручки будет незначительно, и скорее всего не перекроет затрат на соответствующие мероприятия
Британские ученые доказали германские медики утверждают, что неблагоприятная рабочая атмосфера представляет собой проблему номер один, 79% служащих Германии страдают от этого больше, чем от груза ответственности, поточной системы и страха оказаться без работы вместе взятых.
А это, вроде как логично, что не может не сказываться на качестве обслуживания клиентов.
И еще читала, что на производстве плохой спк понижает производительность на 20% (да, я видела, Вы тоже про производство указывали). Но в торговле такая тенденция тоже явно должна быть.


то же самое вам скажет любой руководитель в сфере торговли (только другими словами), такие вещи имеют большее значение в услугах (в т.ч. финансовых) и даже на производстве, в торговле наоборот принято экономить на подобных вещах, посмотрите на розничные сети - чем крупнее компания, тем нещаднее в ней наяривают продавцов (менеджеров)
вижу, что исследование развивается в психологическом ключе и тут, вероятно, это актуально, но в среде экономистов одобрения не ждите))
Большое спасибо за Ваши замечания-предположения. Но в этих магазинах обслуживание идет не за прилавком, а на уровне консультации, что ближе к оказанию услуг. Качество сервиса и является ключевым конкурентным преимуществом. Соответственно, самочувствие продавцов-консультантов на рабоче важно.

Hogfather
15.07.2014, 23:21
А если нормальности не будет, то что делать?
Трансформировать данные, например, преобразование Бокса-Кокса.

И нормальность можно проверить через критерий Колмагорова-Смирнова?
Можно. Но в большинстве случаев вы получите отрицательный результат. Гистограмма и график квантилей в помощь. Если глистограмма более-менее симметричная, а график квантилей похож на прямую линию, то и забейте.

И еще хочу уточнить, нормально проверять можно по всем магазинам сразу или требуется по каждому отдельно, если я смотрю связь по отдельным магазинам?
Диаграмма размахов в помощь.

Тогда не нужно же MSA?
Нет. Но не забываем, что валидность даже самого лучшего теста не превышает 70%.

Да и вообще, Вы меня навели на мысли. Отпишусь в личку.

Longenery
15.07.2014, 23:49
Hogfather, большое спасибо!