Asi to bude tím, že jsem takřka celý svůj život strávil na vesnici, ale vždy, když přijedu do Ostravy, jímá mě takový zvláštní pocit. Jakoby se ve vzduchu neustále vznášel jakýsi neklid, nějaké zvláštní napětí. Občas to nezůstane jen u pocitu a doslova do 5 minut, co jen vystoupím z auta, už si mě vyhlídne jakýsi “pouliční živel”, aby mě obratem socknul o pár korun. No, každopádně mě napadlo, což takhle si mé obavy z návštěv větších měst statisticky ověřit, když už jsem se ostatně v poslední době začal zajímat o jazyk R?
Popis dat
Data jsem čerpal ze stránky https://www.mapakriminality.cz/, kde si konkrétně srovnáme Ostravu s Prahou a Brnem. Aby bylo srovnání relevantní, přišlo mi jako rozumné vzít údaj počtu “kriminálních činů” a podělit ho počtem obyvatel města. Celkem se jedná o 95 údajů za cca posledních 10 let (do roku 2020) měřených pro každý měsíc.
> describe(mesta * 1000)
vars n mean sd median trimmed mad min max range skew kurtosis se
MŘP OSTRAVA 1 95 3.05 0.85 2.80 3.01 0.59 1.32 4.90 3.57 0.55 -0.38 0.09
KŘP HL. M. PRAHY 2 95 3.90 0.94 3.63 3.87 0.82 1.87 6.01 4.14 0.39 -0.56 0.10
MŘ BRNO 3 95 2.63 0.58 2.55 2.59 0.51 1.26 4.16 2.90 0.62 0.19 0.06
Když na všech vzorcích provedu Shapirův-Wilkův test, ve všech případech nulovou hypotézu, že data mají normální rozdělení, zamítáme. Nicméně jelikož máme počet měření větší než 30, tak by to nemělo vadit a můžeme rovnou provést t-test.
Ostrava vs. Praha
> t.test(df$`MŘP OSTRAVA`, df$`KŘP HL. M. PRAHY`)
Welch Two Sample t-test
data: df$`MŘP OSTRAVA` and df$`KŘP HL. M. PRAHY`
t = -6.5025, df = 186.22, p-value = 7.061e-10
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.0011058821 -0.0005910513
sample estimates:
mean of x mean of y
0.003054296 0.003902763
Pro Ostravu nám vychází průměrně 3,1 kriminálních činů na 1000 obyvatel, kdežto pro Prahu 3,9. Jelikož je p-value pod 0,05, můžeme hypotézu rovnosti obou průměrů zamítnout a tedy Ostrava je na tom lépe než Praha.
Ostrava vs. Brno
Čistě pro srovnání by bylo zajímavé Ostravu porovnat také s Brnem, kde jsem se obecně, co se bezpečí týče, cítil lépe a to i přesto, že v Brně žije obyvatel o něco více.
> t.test(df$`MŘP OSTRAVA`, df$`MŘ BRNO`)
Welch Two Sample t-test
data: df$`MŘP OSTRAVA` and df$`MŘ BRNO`
t = 3.9804, df = 165.34, p-value = 0.0001028
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.0002124069 0.0006305334
sample estimates:
mean of x mean of y
0.003054296 0.002632826
Zde nám u Brna vychází průměr 2,6 kriminálních činů na 1000 obyvatel, a jelikož je p-value taktéž pod 0,05, můžeme vyvodit, že kriminalita v Brně je skutečně statisticky významně nižší, než v Ostravě.
Závěr
Pokud zrovna váháte, do kterého z těchto 3 měst se přestěhovat a je-li vaší prioritou bezpečí, volte Brno, ale co mi a Jarkovi Nohavicovi žádná statistika nevyvrátí, je že Ostrava je zkrátka kraj “razovity” 🙂 .
A aby to nebylo tak fádní, tak se mi dokonce i podařilo vměstnat 3 histogramy do jednoho grafu:

Doplnění
Až po dopsání tohoto článku mě ještě napadlo vyhotovit srovnání územních oborů pro celou ČR, např. abychom si mohli udělat představu, která města jsou na tom s kriminalitou zcela nejhůře a při pohledu na tento graf mi vychází, že z pohledu kriminality na 1000 obyvatel jsou Praha s Ostravou v závěsu na samém vrcholu.

Pingback:Pijí ostravští swingaři více než ne-ostravští? - Světýlkův blog