Normalizace je dobré použít, když víte, že distribuce vašich dat nedodržuje Gaussovo rozložení. … Standardizace na druhé straně může být užitečná v případech, kdy data sledují Gaussovo rozdělení.
Mám použít normalizaci nebo standardizaci?
Normalizace je užitečná, když vaše data mají různá měřítka a algoritmus, který používáte, nevytváří předpoklady o distribuci vašich dat, jako jsou k-nejbližší sousedé a umělé neuronové sítě. Standardizace předpokládá, že vaše data mají Gaussovu distribuci (zvonová křivka).
Je standardizace stejná jako normalizace?
V obchodním světě „normalizace“obvykle znamená, že rozsah hodnot je „normalizován na hodnotu od 0.0 až 1,0 . „Standardizace“obvykle znamená, že rozsah hodnot je „standardizován“, aby bylo možné měřit, o kolik standardních odchylek je hodnota od svého průměru.
Je vždy dobré normalizovat data?
Normalizací ve skutečnosti zahazujete některé informace o datech, jako jsou absolutní maximální a minimální hodnoty. Takže, neexistuje žádné orientační pravidlo. Jak řekli jiní, normalizace není vždy použitelná; např. z praktického hlediska.
Kdy byste neměli normalizovat data?
Několik dobrých důvodů, proč nenormalizovat
- Připojení jsou drahá. Normalizace databáze často zahrnuje vytvoření velkého množství tabulek. …
- Normalizovaný design je obtížný. …
- Rychlý a špinavý by měl být rychlý a špinavý. …
- Pokud používáte databázi NoSQL, tradiční normalizace není žádoucí.