|
08.11.2013, 08:58 | #41 | ||
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
Цитата:
Итак, вернемся к нашим баранам. Собственно, решение задачи основано на знании формулы Бернулли и понимания биноминального распределения. Функция вероятности для биноминального распределения в R имеет вид dbinom(x, size, prob, log = FALSE), остальные связанные функции: pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE) - функция распределения qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE) - квантили распределения rbinom(n, size, prob) - генерация случайного числа, распределенного по данному закону где, соответственно: size - число попыток, prob - вероятность удачного исхода Поэтому задачу: Цитата:
Код:
> sum(dbinom(31:45, 45, 0.25)) [1] 7.527228e-10 > 1-pbinom(30, 45, 0.25) [1] 7.527228e-10 =1-БИНОМ.РАСП(30;45;0,25;ИСТИНА) и имеем результат 7,52723E-10 Вооружившись этими немудреными знаниями приступаем к задаче. Здесь у нас существуют возможные варианты исходов от 0 до 90, но поскольку веса у каждого блока в тесте разные, проще прогнать все варианты в цикле и учесть число возможных перестановок, а также вероятность совместного события. Поскольку в данном случае события независимые, то вероятности перемножаем. По сути, мы решаем ту же задачу, только слегка усложненную. Код:
> # Инициируем переменные > P<-0 # Переменная для подсчета куммулятивной суммы, как увидим дальше, она лишняя. Просто для явности подсчетов для решения задачи > Z<-data.frame(X=0:90,y=rep(0,91)) # Здесь мы будем накапливать вероятности для исходо теста 0:90 > for(i in 0:15) for (j in 0:15) for(k in 0:15) { # Перебираем возможные варианты для каждой части теста + Z$y[i+2*j+3*k+1]<-Z$y[i+2*j+3*k+1]+dbinom(i,15,0.25)*dbinom(j,15,0.25)*dbinom(k,15,0.25) # считаем вероятность куммулятивно для точки + if(i+2*j+3*k>=61) P<-P+dbinom(i,15,0.25)*dbinom(j,15,0.25)*dbinom(k,15,0.25) # считаем для точки + } > Z$cdf<-cumsum(Z$y) > cat("Ответ на задачу составляет: ",P) Ответ на задачу составляет: 1.73944e-08 > oldpar<-par(mfrow=c(2,1)) > plot(Z$y~Z$X,main="Функция вероятности f(x)",xlab="x",ylab="f(x)",pch=19,cex=0.8,col="blue") > points(Z$y[62:91]~Z$X[62:91],cex=0.9,col="red",pch=19) > text(70,0.02,expression(sum(f[i],i==61,90)==1.73944 %*% 10^{-8})) > plot(Z$cdf~Z$X,main="Рапределения F(x)",xlab="x",ylab="f(x)",pch=19,cex=0.8,col="blue") > abline(h=Z$cdf[61],v=60,col="darkgrey",lty=2) > points(Z$cdf[61]~Z$X[61],cex=0.9,col="red",pch=19) > par(oldpar) > # Собственно, как и было сказано выше, вероятности также можно посчитать как: > 1-Z$cdf[61] # 1-F(60); 61, а не 60, потому как нумерация в массиве начинается с 1 [1] 1.73944e-08 > sum(Z$y[62:91]) # sum(f(t),t = 61...90) [1] 1.73944e-08 Обращаю внимание, что функции дискретны, поэтому рисовать их сплошной линией -- фигня и моветон. Последний раз редактировалось Hogfather; 09.11.2013 в 21:31. |
||
---------
DNF is not an option
|
|||
Реклама | |
|
09.11.2013, 05:45 | #42 |
Gold Member
Регистрация: 07.10.2011
Сообщений: 1,772
|
о так вот вы куда ушли с решением !
пик и есть нужный нам процент? |
09.11.2013, 11:08 | #43 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
Раз есть вопросы, значит график неудачный. Перерисовал.
Итак, пик на верхнем графике соответствует 22 баллам со значением вероятности 6.315466e-02 или 6%. Т.е. случайно в 6% случаев можно ответить на 22 балла. Вообще, верхний график показывает вероятности набрать случайным образом баллы от 0 до 90. Поэтому, если нам надо посчитать вероятность не менее 61, мы складываем вероятности набрать 61,62, ... , 90 баллов (точки выделены красным) и получаем нужный нам ответ 1.73944e-08. Нижний график показывает куммулятивную сумму вероятностей, т.е. в точке 60 (красная точка) он равен сумме вероятностей набрать баллы от 0 до 60, иными словами, значение в каждой точке показывает вероятность набрать не более заданного количества баллов. Для того, чтобы найти вероятность набрать более чем заданное количество баллов (в нашем случае 60, потому как 61>60 и по условиям задачи оно входит в вопрос), учитывая, что сумма всех вероятностей равна 1, имеем 1-F(60)=1.73944e-08 |
---------
DNF is not an option
|
|
09.11.2013, 20:39 | #44 |
Gold Member
Регистрация: 07.10.2011
Сообщений: 1,772
|
таким образом вероятнее всего будет набрать в случае случайного тыка баллов около 20, что не является проходным
а вопрос задачи был о 31 балле. распределение говорит что это три процента правильно? |
09.11.2013, 20:41 | #45 |
Gold Member
Регистрация: 08.04.2012
Адрес: Воронеж
Сообщений: 2,046
|
|
---------
Грамотей-опричникъ
Сварщик я не настоящий, а сюда просто пописать зашел |
|
09.11.2013, 20:42 | #46 |
Gold Member
Регистрация: 07.10.2011
Сообщений: 1,772
|
|
09.11.2013, 20:45 | #47 | |
Gold Member
Регистрация: 08.04.2012
Адрес: Воронеж
Сообщений: 2,046
|
_Tatyana_, почему врет? Просто вероятность методом тыка правильно ответить на 61 балл уже мала и понижается с увеличением количества правильных вопросов. Объяснение тут:
Цитата:
|
|
---------
Грамотей-опричникъ
Сварщик я не настоящий, а сюда просто пописать зашел |
||
09.11.2013, 20:54 | #48 | |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
Цитата:
Поскольку люди путаются, я подправил свой постинг. 2. Вы совершенно правы, для 31 балла примерно 3% на графике. |
|
---------
DNF is not an option
|
||
09.11.2013, 21:19 | #49 | |
Gold Member
Регистрация: 07.10.2011
Сообщений: 1,772
|
Цитата:
|
|
06.12.2013, 12:14 | #50 |
Platinum Member
Регистрация: 22.07.2010
Адрес: Санкт-Петербург
Сообщений: 3,304
|
Немного о книгах по R
Купил себе сегодня справочник. Толковый, рекомендую. Поставил на Kindle и на смартфон. Всегда под рукой. В книге рассматривается 100 статистических тестов (оглавление доступно по ссылке), также есть в начале предметный указатель по проверяемым гипотезам. У каждого теста описана нулевая гипотеза, требования к выборке, интерпретация результатов. Даются ссылки на последние работы в разных областях, в которых эти тесты упомянуты. 5 из 5 Отличная книжка. Есть всё, что нужно и даже больше, её уже разок упоминал выше. 5 из 5 Книжка послабее, есть некая сумбурность в подаче материала, но как основа очень неплохо. 5 из 5. |
---------
DNF is not an option
|
|