Так, тут проскакивала интересная мысль про корреляцию между числом полицейских на 100000 человек и уровнем убийств. Ссылки на исходники выше. Две таблицы совместил. Получились следующие данные
Данные
Код:
> MyData
Police Rate
1 401.000 2.4
2 278.000 1.3
3 558.000 5.5
4 217.000 1.0
5 326.000 0.6
6 83.000 2.7
7 497.000 11.3
8 373.000 1.7
9 415.000 41.4
10 729.000 12.3
11 418.000 14.5
12 282.000 21.0
13 1.076 0.5
14 403.000 2.0
15 428.000 3.4
16 202.000 1.6
17 625.000 8.4
18 182.000 3.7
19 120.000 1.0
20 323.000 31.4
21 66.000 12.2
22 337.000 10.0
23 466.000 1.4
24 678.000 1.7
25 385.000 1.7
26 245.000 0.9
27 709.000 22.1
28 376.000 25.0
29 262.000 18.2
30 360.000 69.2
31 237.000 5.2
32 143.000 2.2
33 232.000 2.8
34 356.000 1.1
35 82.000 0.4
36 94.000 15.7
37 452.000 1.5
38 818.000 11.5
39 298.000 0.8
40 100.000 22.5
41 118.000 6.9
42 393.000 0.2
43 333.000 1.3
44 211.000 0.3
45 117.000 3.5
46 243.000 8.1
47 80.000 3.0
48 339.000 2.1
49 417.000 0.9
50 297.000 40.9
51 197.000 0.4
52 404.000 1.8
53 81.000 20.1
54 442.000 7.3
55 504.000 2.2
56 195.000 3.1
57 116.000 35.2
58 249.000 2.8
59 108.000 10.1
60 325.000 6.6
61 331.000 0.6
62 737.000 0.7
63 370.000 2.3
64 48.000 8.0
65 397.000 1.0
66 366.000 23.7
67 839.000 3.5
68 154.000 10.2
69 800.000 9.8
70 225.000 2.8
71 328.000 1.1
72 247.000 0.9
73 58.000 3.8
74 205.000 12.2
75 222.000 0.6
76 333.000 21.6
77 207.000 7.8
78 105.000 13.0
79 352.000 10.3
80 261.000 1.1
81 462.000 1.2
82 280.000 2.0
83 546.000 10.2
84 899.000 38.2
85 557.000 25.2
86 633.000 22.9
87 257.000 1.1
88 631.000 1.2
89 752.000 0.3
90 268.000 1.5
91 390.000 0.7
92 301.000 3.7
93 198.000 1.5
94 317.000 31.8
95 438.000 3.6
96 511.000 0.8
97 351.000 12.9
98 208.000 1.0
99 224.000 0.7
100 344.000 4.8
101 491.000 3.3
102 413.000 1.0
103 72.000 10.9
104 529.000 35.2
105 307.000 1.2
106 256.000 4.7
107 813.000 5.9
108 277.000 0.9
109 401.000 14.3
Как обычно, проводим экспресс-анализ, видим, что распределение для уровня убийств смещено влево, делаем логарифмическое преобразование, потом строим диаграмму рассеяния. Россию отдельно выделяем красной точкой на диаграмме.
Код:
> oldpar<-par(mfrow=c(2,2))
> hist(MyData$Police)
> hist(MyData$Rate)
> hist(log10(MyData$Rate))
> plot(log10(Rate)~Police,data=MyData)
> points(546,log10(10.2),pch=19,col="red")
В принципе, видно на глаз, что связь незначимая. Но можно и проверить.
Код:
> summary(lm0<-lm(log10(Rate)~Police,data=MyData))
Call:
lm(formula = log10(Rate) ~ Police, data = MyData)
Residuals:
Min 1Q Median 3Q Max
-1.279 -0.501 -0.059 0.497 1.269
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.4673177 0.1145735 4.079 8.74e-05 ***
Police 0.0002878 0.0002901 0.992 0.323
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5904 on 107 degrees of freedom
Multiple R-squared: 0.009111, Adjusted R-squared: -0.0001495
F-statistic: 0.9839 on 1 and 107 DF, p-value: 0.3235
Вывод: корреляционной зависимости между числом убийств на душу населения в стране и числом полицейских на душу населения не выявлено.