Статистика [Архив] - Портал аспирантов

PDA

Просмотр полной версии : Статистика

poison1983

22.05.2012, 17:10

kravets

22.05.2012, 17:15

Alextiger

22.05.2012, 17:15

Каким методом доказать
никаким. маленькая выборка

poison1983

22.05.2012, 17:20

никаким. маленькая выборка

Благодарю за ответ. Это не реальная выборка, а просто пример. Если выборка большая, то как это сделать?

badalek

22.05.2012, 17:30

У меня такая проблема. Есть группа больных. Мне надо оценить влияние факторов риска на летальность. Например 40 пациентов из 70 имели фактор риска женский пол, 15 из них умерло. Каким методом доказать, что женский пол значимо увеличивает летальность и как это сделать. Заранее благодарю!
Вообще - система многофакторная и сложная, это не детали с погрешностями и без них из двух партий выбирать, чтобы потом оценить качество работы двух станков. Здесь факторы и вид болезни (а также наличие других диагнозов, которые чаще всего есть), и возраст пациента, и его чувствительность к лекарственным препаратам, и длительность болезни... и мн.мн. другие. В этом смысле два подмножества к(ж)=40 и к(м)=30 действительно весьма небольная выборка.

В этом отношении, с одной стороны, необходимо учесть другие факторы риска, а с другой стороны проконсультироваться у медиков, занимающихся проблемой, как отметил выше kravets.

Rendido

22.05.2012, 17:30

Сходите на http://forum.disser.ru/ - там есть отдельный раздел по статистике.
Еще здесь (http://www.y10k.ru/books/detail6002.html) почитать можно.

-DOCTOR-

22.05.2012, 17:42

Благодарю за ответ. Это не реальная выборка, а просто пример. Если выборка большая, то как это сделать?

Пример неудачный, поскольку мне на ум приходят как минимум три варианта статистического анализа, а kravets'у наверное и того больше.

Alextiger

22.05.2012, 17:44

Это не реальная выборка, а просто пример. Если выборка большая, то как это сделать?
большая может оказаться недостаточной. Это вообще у вас должен быть первый шаг - определить минимальную репрезентативную выборку. Это может быть и 5000 чел., в зависимости от разных факторов.

fazotron

23.05.2012, 07:04

Непараметрические методы. Обычный хи-квадрат и то подойдет: две группы с разным частотным распределением признака

MinSdraV

05.06.2015, 12:58

Добрый день!

Хотел обратиться за советом по статистике и, дабы не создавать новую тему, пишу здесь. Небольшая предыстория: статистика в универе по различным причинам прошла мимо меня, в аспирантуре никаких обязательных курсов не было; за неделю поднимал статистику с нуля, успел нахватать вершков так, чтобы была возможность ставить вопросы более или менее конкретно; эксперимент проведен, данные собраны, исходя из логических соображений о возможности сравнить конкретные ряды данных и вывести закономерности (требования к выборке, которые могут возникать с учетом последующего статистического анализа изначально не учитывались, поэтому возможна неадекватность задач возможностям статистического анализа). С диссером тяну уже долго, а надо семью кормить, т.е. времени мало, в правильности выбора стат критериев не очень уверен. В связи с этим вопрос:

Суть конкретной задачи такова: нужно оценить технику бега на лыжах (ее автоматизацию). Для этого с каждым спортсменом проведено по 2 забега (один - обычный, второй - в условиях, обеспечивающих протекание самого бега на лыжах на автопилоте). Техника в обоих забегах оценивалась двумя экспертами по 10-ти бальной шкале (всего 7 параметров: вынос палок, выход на опорную ногу и т.д.). Т.е. для каждого спортсмена есть по 14 оценок (по 7 от каждого эксперта) за первый забег и за второй.

Теперь, как я понимаю, во-первых, нужно оценить значимость корреляции между оценками 1-ого и 2-ого эксперта, чтобы доказать, что они не с потолка взяты. Распределение скорее всего не нормальное. Значит вычисляем корреляцию по Спирмену?

Во-вторых, нужно определить значимость или незначимость различий между оценками за 1-ый и 2-ой забег для каждого спортсмена индивидуально. Т.е. я могу попарно противопоставить друг другу 14 оценок. Как понимаю, речь о 2-х связных выборках (оценки для одного и того же спортсмена), и должен бы подойти Т-критерий Вилкинсона. НО: данный критерий (подобно критерию знаков) учитывает направленность сдвига, а мне важно только его наличие. Т.е. даже если в "автоматическом" забеге бал за технику может как снижаться, так и повышаться, но и то и другое будет говорить только о различиях в технике при ее автоматическом и сознательном контроле (не важно, имеют ли различия направленность в лучшую или худшую сторону, важно, что они есть). В целом, Т-критерий вроде бы работает, но там, где сдвиги будут разнонаправленным, подозреваю, что он будет уже неинформативен для моих задач.

И, наконец, последнее: можно ли как-нибудь определить значимость различий по каждому из 7 показателей техники в отдельности? Или для этого необходимо наращивать количество статистического материала (напр., брать от каждого эксперта не по одной, о по несколько оценок за каждый показатель)? Возможность такого наращивания, в принципе, есть, т.к. лыжи - циклический вид спорта, и можно просто взять дополнительные циклы на анализ, вопрос: сколько оценок за каждый показатель нужно добавить, если сейчас имеется по 2 за каждый забег. Однако жалко дальше морочить головы людям, т.к. в общей сложности проставлено уже порядка 1000 оценок (2 эксперта * 2 забега * 7 показателей * примерно 50 спортсменов). Любая дополнительная оценка умножает их общее количество. Поэтому вопрос следующий: есть ли возможность уловить, что, скажем, одна из оценок за первый забег не отличается значимо от оставшихся 13, тогда как противопоставленная ей оценка за второй забег имеет значимые отличия от остальных оценок в своей группе. Можно ли на этом основании заявлять, что противопоставленные оценки значимо отличаются друг от друга? Если да, то каким методом можно это оценить?

Очень благодарен за любую помощь!