Портал аспирантов

Портал аспирантов (http://www.aspirantura.spb.ru/forum/index.php)
-   Диссертация (http://www.aspirantura.spb.ru/forum/forumdisplay.php?f=111)
-   -   Статистика (http://www.aspirantura.spb.ru/forum/showthread.php?t=9742)

poison1983 22.05.2012 17:10

Статистика
 
У меня такая проблема. Есть группа больных. Мне надо оценить влияние факторов риска на летальность. Например 40 пациентов из 70 имели фактор риска женский пол, 15 из них умерло. Каким методом доказать, что женский пол значимо увеличивает летальность и как это сделать. Заранее благодарю!

kravets 22.05.2012 17:15

Цитата:

Сообщение от poison1983 (Сообщение 247145)
У меня такая проблема. Есть группа больных. Мне надо оценить влияние факторов риска на летальность. Например 40 пациентов из 70 имели фактор риска женский пол, 15 из них умерло. Каким методом доказать, что женский пол значимо увеличивает летальность и как это сделать. Заранее благодарю!

Сходите на http://forum.disser.ru/ - там есть отдельный раздел по статистике.

Alextiger 22.05.2012 17:15

Цитата:

Сообщение от poison1983 (Сообщение 247145)
Каким методом доказать

никаким. маленькая выборка

poison1983 22.05.2012 17:20

Цитата:

Сообщение от Alextiger (Сообщение 247149)
никаким. маленькая выборка

Благодарю за ответ. Это не реальная выборка, а просто пример. Если выборка большая, то как это сделать?

badalek 22.05.2012 17:30

Цитата:

Сообщение от poison1983 (Сообщение 247145)
У меня такая проблема. Есть группа больных. Мне надо оценить влияние факторов риска на летальность. Например 40 пациентов из 70 имели фактор риска женский пол, 15 из них умерло. Каким методом доказать, что женский пол значимо увеличивает летальность и как это сделать. Заранее благодарю!

Вообще - система многофакторная и сложная, это не детали с погрешностями и без них из двух партий выбирать, чтобы потом оценить качество работы двух станков. Здесь факторы и вид болезни (а также наличие других диагнозов, которые чаще всего есть), и возраст пациента, и его чувствительность к лекарственным препаратам, и длительность болезни... и мн.мн. другие. В этом смысле два подмножества к(ж)=40 и к(м)=30 действительно весьма небольная выборка.

В этом отношении, с одной стороны, необходимо учесть другие факторы риска, а с другой стороны проконсультироваться у медиков, занимающихся проблемой, как отметил выше kravets.

Rendido 22.05.2012 17:30

Цитата:

Сообщение от kravets (Сообщение 247148)
Сходите на http://forum.disser.ru/ - там есть отдельный раздел по статистике.

Еще здесь почитать можно.

-DOCTOR- 22.05.2012 17:42

Цитата:

Сообщение от poison1983 (Сообщение 247151)
Благодарю за ответ. Это не реальная выборка, а просто пример. Если выборка большая, то как это сделать?

Пример неудачный, поскольку мне на ум приходят как минимум три варианта статистического анализа, а kravets'у наверное и того больше.

Alextiger 22.05.2012 17:44

Цитата:

Сообщение от poison1983 (Сообщение 247151)
Это не реальная выборка, а просто пример. Если выборка большая, то как это сделать?

большая может оказаться недостаточной. Это вообще у вас должен быть первый шаг - определить минимальную репрезентативную выборку. Это может быть и 5000 чел., в зависимости от разных факторов.

fazotron 23.05.2012 07:04

Непараметрические методы. Обычный хи-квадрат и то подойдет: две группы с разным частотным распределением признака

MinSdraV 05.06.2015 12:58

Добрый день!

Хотел обратиться за советом по статистике и, дабы не создавать новую тему, пишу здесь. Небольшая предыстория: статистика в универе по различным причинам прошла мимо меня, в аспирантуре никаких обязательных курсов не было; за неделю поднимал статистику с нуля, успел нахватать вершков так, чтобы была возможность ставить вопросы более или менее конкретно; эксперимент проведен, данные собраны, исходя из логических соображений о возможности сравнить конкретные ряды данных и вывести закономерности (требования к выборке, которые могут возникать с учетом последующего статистического анализа изначально не учитывались, поэтому возможна неадекватность задач возможностям статистического анализа). С диссером тяну уже долго, а надо семью кормить, т.е. времени мало, в правильности выбора стат критериев не очень уверен. В связи с этим вопрос:

Суть конкретной задачи такова: нужно оценить технику бега на лыжах (ее автоматизацию). Для этого с каждым спортсменом проведено по 2 забега (один - обычный, второй - в условиях, обеспечивающих протекание самого бега на лыжах на автопилоте). Техника в обоих забегах оценивалась двумя экспертами по 10-ти бальной шкале (всего 7 параметров: вынос палок, выход на опорную ногу и т.д.). Т.е. для каждого спортсмена есть по 14 оценок (по 7 от каждого эксперта) за первый забег и за второй.

Теперь, как я понимаю, во-первых, нужно оценить значимость корреляции между оценками 1-ого и 2-ого эксперта, чтобы доказать, что они не с потолка взяты. Распределение скорее всего не нормальное. Значит вычисляем корреляцию по Спирмену?

Во-вторых, нужно определить значимость или незначимость различий между оценками за 1-ый и 2-ой забег для каждого спортсмена индивидуально. Т.е. я могу попарно противопоставить друг другу 14 оценок. Как понимаю, речь о 2-х связных выборках (оценки для одного и того же спортсмена), и должен бы подойти Т-критерий Вилкинсона. НО: данный критерий (подобно критерию знаков) учитывает направленность сдвига, а мне важно только его наличие. Т.е. даже если в "автоматическом" забеге бал за технику может как снижаться, так и повышаться, но и то и другое будет говорить только о различиях в технике при ее автоматическом и сознательном контроле (не важно, имеют ли различия направленность в лучшую или худшую сторону, важно, что они есть). В целом, Т-критерий вроде бы работает, но там, где сдвиги будут разнонаправленным, подозреваю, что он будет уже неинформативен для моих задач.

И, наконец, последнее: можно ли как-нибудь определить значимость различий по каждому из 7 показателей техники в отдельности? Или для этого необходимо наращивать количество статистического материала (напр., брать от каждого эксперта не по одной, о по несколько оценок за каждый показатель)? Возможность такого наращивания, в принципе, есть, т.к. лыжи - циклический вид спорта, и можно просто взять дополнительные циклы на анализ, вопрос: сколько оценок за каждый показатель нужно добавить, если сейчас имеется по 2 за каждый забег. Однако жалко дальше морочить головы людям, т.к. в общей сложности проставлено уже порядка 1000 оценок (2 эксперта * 2 забега * 7 показателей * примерно 50 спортсменов). Любая дополнительная оценка умножает их общее количество. Поэтому вопрос следующий: есть ли возможность уловить, что, скажем, одна из оценок за первый забег не отличается значимо от оставшихся 13, тогда как противопоставленная ей оценка за второй забег имеет значимые отличия от остальных оценок в своей группе. Можно ли на этом основании заявлять, что противопоставленные оценки значимо отличаются друг от друга? Если да, то каким методом можно это оценить?

Очень благодарен за любую помощь!


Текущее время: 13:45. Часовой пояс GMT +3.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2025, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2025, «Аспирантура. Портал аспирантов»