logo

Nominalni proti ordinalnim podatkom

Podatkovna znanost se vrti okoli obdelave in analize podatkov z uporabo različnih orodij in tehnik. V današnjem svetu, ki temelji na podatkih, naletimo na vrste podatkov, od katerih je vsaka potrebna obdelava in razlaga. Za pravilno analizo podatkov in statistično interpretacijo je pomembno razumeti različne vrste podatkov. Vrsta podatkov določa ustrezne statistične metode in operacije, ki jih je treba uporabiti. Različni tipi podatkov potrebujejo različne metode analize in razlage, da lahko pridejo do pomembnih zaključkov. V tem članku bomo raziskali koncept podatkov, njihov pomen in primere iz resničnega sveta ter vas vodili skozi načine dela z njimi.

Ravni merjenja

Pred analizo nabora podatkov je ključnega pomena ugotoviti vrsto podatkov, ki jih vsebuje. Na srečo je mogoče vse podatke združiti v eno od štirih kategorij: nominalne, ordinalne, intervalne ali razmerne podatke. Čeprav jih pogosto imenujemo tipi podatkov, gre dejansko za različne ravni merjenja. Raven merjenja odraža natančnost, s katero je bila spremenljivka kvantificirana, in določa metode, ki jih je mogoče uporabiti za pridobivanje vpogledov iz podatkov.



Štiri kategorije podatkov ni vedno enostavno razlikovati in namesto tega pripadajo hierarhiji, pri čemer vsaka raven nadgrajuje prejšnjo.

1

Obstajajo štiri vrste podatkov: kategorični, ki jih lahko nadalje razdelimo na nominalne in ordinalne, ter numerični, ki jih lahko razdelimo še na intervalne in razmerne. Nominalna in ordinalna lestvica sta relativno nenatančni, zato ju je lažje analizirati, vendar ponujata manj natančne vpoglede. Po drugi strani pa so lestvice intervalov in razmerij bolj zapletene in jih je težko analizirati, vendar imajo potencial, da zagotovijo veliko bogatejše vpoglede.



  • Nominalni podatki – Nominalni podatki so osnovni tip podatkov, ki kategorizira podatke z označevanjem ali poimenovanjem vrednosti, kot so spol, barva dlake ali vrste živali. Nima nobene hierarhije.
  • Vrstni podatki – Redni podatki vključujejo razvrščanje podatkov na podlagi ranga, kot je socialni status, v kategorije, kot so 'premožni', 'srednji dohodki' ali 'revni'. Vendar med temi kategorijami ni določenih intervalov.
  • Intervalni podatki – Intervalni podatki so način organiziranja in primerjave podatkov, ki vključuje izmerjene intervale. Temperaturne lestvice, kot sta Celzija ali Fahrenheita, so dobri primeri intervalnih podatkov. Vendar intervalni podatki nimajo prave ničle, kar pomeni, da lahko meritev ničle še vedno predstavlja merljivo mero (na primer nič stopinj Celzija, kar je le še ena točka na lestvici in dejansko ne pomeni, da ni prisotne temperature) .
  • Podatki o razmerju – Najbolj zapletena raven merjenja so podatki o razmerju. Podobno kot intervalni podatki kategorizira in razporeja podatke z uporabo izmerjenih intervalov. Toda za razliko od intervalnih podatkov podatki o razmerju vključujejo pravo ničlo. Ko je spremenljivka enaka nič, te spremenljivke ni. Glavna ilustracija podatkov o razmerju je meritev višine, ki ne more biti negativna.

Kaj so nominalni podatki?

Kategorični podatki, znani tudi kot nominalni podatki, so ključna vrsta informacij, ki se uporabljajo na različnih področjih, kot so raziskave, statistika in analiza podatkov. Sestavljen je iz kategorij ali oznak, ki pomagajo pri razvrščanju in urejanju podatkov. Bistvena značilnost kategoričnih podatkov je, da nimajo nikakršnega inherentnega vrstnega reda ali razvrščanja med svojimi kategorijami. Namesto tega so te kategorije ločene, ločene in se med seboj izključujejo.

2

Na primer, nominalni podatki se uporabljajo za razvrščanje informacij v različne oznake ali kategorije brez naravnega vrstnega reda ali razvrščanja. Te oznake ali kategorije so predstavljene z imeni ali izrazi in med njimi ni naravnega vrstnega reda ali razvrstitve. Nominalni podatki so uporabni za kvalitativno razvrščanje in organizacijo informacij, kar raziskovalcem in analitikom omogoča združevanje podatkovnih točk na podlagi specifičnih atributov ali značilnosti, ne da bi nakazovali kakršna koli številčna razmerja.



  • Kategorije barv oči, kot sta modra ali zelena, predstavljajo nominalne podatke. Vsaka kategorija je ločena, brez vrstnega reda ali razvrstitve.
  • Znamke pametnih telefonov, kot sta iPhone ali Samsung, so nominalni podatki. Med blagovnimi znamkami ni hierarhije.
  • Načini prevoza, kot sta avto ali kolo, so nominalni podatki. So diskretne kategorije brez inherentnega reda.

Značilnosti nominalnih podatkov

  • Podatki, ki so razvrščeni kot nominalni, so sestavljeni iz kategorij, ki so popolnoma ločene in se med seboj razlikujejo.
  • Podatki, ki spadajo v nominalno kategorijo, se razlikujejo po opisnih oznakah in ne po številčni ali kvantitativni vrednosti
  • Nominalnih podatkov ni mogoče hierarhično razvrstiti ali razvrstiti, saj nobena kategorija ni nadrejena ali nižja od druge.

Primer

Tukaj je nekaj primerov, kako se nominalni podatki uporabljajo za razvrščanje in kategorizacijo informacij v različne in neurejene kategorije:

1. Barve avtomobila: Barve avtomobilov so nominalni podatki z jasnimi kategorijami, vendar brez lastnega vrstnega reda ali razvrstitve. Vsak avto spada v eno barvno kategorijo, brez kakršne koli logične ali številčne povezave med barvami.

2. Vrste sadja: Kategorije sadja v košarici so nominalne. Vsako sadje pripada določeni kategoriji brez hierarhije ali reda. Vse kategorije so različne in diskretne.

3. Filmski žanri: Filmski žanri so nominalni podatki, saj ni razvrstitve med kategorijami, kot sta akcija ali komedija. Vsak žanr je edinstven, vendar samo na podlagi teh podatkov ne moremo reči, ali je eden boljši od drugega.

Kaj so ordinalni podatki?

Ordinalni podatki so oblika kvalitativnih podatkov, ki razvrščajo spremenljivke v opisne kategorije. Zanj je značilno, da so kategorije, ki jih uporablja, razvrščene na nekakšni hierarhični lestvici, na primer od višje do nizke. Ordinalni podatki so druga najbolj zapletena vrsta meritev, takoj za nominalnimi podatki. Čeprav so bolj zapleteni kot nominalni podatki, ki nimajo kakršnega koli inherentnega reda, so še vedno relativno poenostavljeni.

3

Vrstni podatki so na primer vrsta podatkov, ki se uporabljajo za kategorizacijo postavk s smiselno hierarhijo ali vrstnim redom. Te kategorije nam pomagajo primerjati in rangirati različne dosežke, položaje ali uspešnost učencev, tudi če intervali med njimi niso enaki. Redni podatki so uporabni za razumevanje urejenih izbir ali preferenc in za ocenjevanje relativnih razlik.

  • Šolske ocene: Ocene, kot so A, B, C, so redni podatki, razvrščeni po dosežkih, vendar se intervali med njimi razlikujejo.
  • Raven izobrazbe: stopnje, kot so srednja šola, diploma, magisterij, so redni podatki, razvrščeni po izobrazbi, vendar se vrzeli med stopnjami razlikujejo.
  • Raven delovne dobe: ravni delovnih mest, kot so vstopna, srednja, višja, so zaporedni podatki, ki kažejo na hierarhijo, vendar se vrzel razlikuje glede na delovno mesto in panogo.

Značilnosti ordinalnih podatkov

  • Redni podatki spadajo v kategorijo neštevilskih in kategoričnih podatkov, vendar lahko še vedno uporabljajo številske vrednosti kot oznake.
  • Vrstni podatki so vedno razvrščeni v hierarhiji (od tod tudi ime 'ordinalni').
  • Redni podatki so lahko razvrščeni, vendar njihove vrednosti niso enakomerno porazdeljene.
  • Z ordinalnimi podatki lahko izračunate porazdelitev frekvence, način, mediano in obseg spremenljivk.

Primer

Tukaj je nekaj primerov, kako se ordinalni podatki uporabljajo v poljih in domenah:

1. Izobrazbene ravni: Redni podatki se običajno uporabljajo za predstavitev ravni izobrazbe, kot so šola, diploma, magisterij in doktorat. Te ravni imajo vrstni red.

2. Ocene zadovoljstva strank: Druga uporaba podatkov je v anketah o zadovoljstvu strank. Te raziskave pogosto zahtevajo od anketirancev, da ocenijo svoje izkušnje na lestvici od slabih do odličnih.

3. Ekonomski razredi: razrede, vključno s srednjim razredom in višjim razredom, je mogoče razvrstiti kot redne podatke glede na njihovo uvrstitev.

Ti primeri prikazujejo načine, na katere se ordinalni podatki uporabljajo v poljih in domenah.

Nominalni v primerjavi z navadnimi podatki

Značilnosti

Nominalni podatki

Vrstni podatki

Narava kategorij

Izrazito in diskretno

Diskretno in razločno

Vrstni red/razvrstitev

Ni inherentnega reda

Ima jasen vrstni red ali razvrstitev

Številske vrednosti

Ni smiselnih številskih vrednosti

Ni smiselnih številskih vrednosti

Tehnike analize

Štetje frekvenc, odstotki, palični grafikoni

Razvrščanje, mediana, neparametrični testi, urejeni palični grafikoni, ordinalna regresija

Primer

Barve, spol, vrste živali

string.compareto c#

Šolske ocene, stopnja izobrazbe, delovna doba

Tolmačenje

Uporablja se za razvrščanje in združevanje glede na kategorijo

Uporablja se za ocenjevanje urejenih preferenc, hierarhije ali uvrstitev