Shrneme-li, obecně je-li distribuce dat vychýlena doleva, je střední hodnota menší než medián, což je často méně než režim. Pokud je rozložení dat vychýleno doprava, je režim často menší než medián, což je menší než průměr.
Proč je medián méně ovlivněn zkreslenými údaji?
Proč je medián méně ovlivněn zkreslenými údaji než průměr? Jakmile se však data stanou zkreslenými, střední hodnota ztratí schopnost poskytovat nejlepší centrální umístění pro data, protože zkreslená data je odtahují od typické hodnoty.
Proč je lepší medián pro zkreslená data?
U distribucí, které mají odlehlé hodnoty nebo jsou zkreslené, je medián často preferovanou mírou centrální tendence, protože medián je odolnější vůči odlehlým hodnotám než průměr… Všimněte si, že střední hodnota je tažena ve směru šikmosti (tj. ve směru ocasu).
Při zkosení doprava je střední hodnota medián?
U vpravo zkoseného rozdělení je průměr obvykle větší než medián Všimněte si také, že konec rozdělení na pravé (kladné) straně je delší než na levá strana. Z krabicového a whisker diagramu také můžeme vidět, že medián je blíže prvnímu kvartilu než třetímu kvartilu.
Jak šikmost ovlivňuje data?
Efekty šikmosti
Pokud je v datech příliš mnoho zkreslení, pak mnoho statistických modelů nefunguje, ale proč. Takže ve zkreslených datech může koncová oblast působit jako odlehlá hodnota pro statistický model a víme, že odlehlé hodnoty nepříznivě ovlivňují výkon modelu, zejména modely založené na regresi.