Koja je razlika između matrice i podatkovnog okvira?


Odgovor 1:

I okviri podataka i matrice su dvodimenzionalne strukture podataka. Općenito, okviri podataka mogu sadržavati više vrsta podataka (numerički, znak, faktor, itd.), Dok matrice mogu sadržavati samo jednu vrstu podataka.

Ovdje postoji još jedno pitanje: Koja je razlika između matrice i podatkovnog okvira u R ?. Međutim, postoje i neke pogreške u odgovorima. Konačni izvor istine dostupan je u R dokumentaciji, dostupan je tako da upišete matricu u svoju konzolu ili idete na R: Matrice.

U R, okviri podataka obično se mogu prenijeti u oblik matrice. To možete učiniti pozivanjem as.matrix na podatkovnom okviru; ovo će stvoriti matricu bacajući sve elemente u vašem podatkovnom okviru u uobičajenu vrstu podataka. Ovdje je ponovljiv primjer koji možete izvoditi na bilo kojoj R konzoli:

> glava (warpbreaks) prekida napetost vune 1 26 AL 2 30 AL 3 54 AL 4 25 AL 5 70 AL 6 52 AL> as.matrix (glava (warpbreaks)) probija napetost vune 1 "26" "A" "L" 2 "30" "A" "L" 3 "54" "A" "L" 4 "25" "A" "L" 5 "70" "A" "L" 6 "52" "A" "L"

Također, stupci u matrici zapravo ne moraju imati isti broj unosa. Može izazvati neočekivane efekte ako ne znate što radite, ali tehnički je u redu.

> matrica (1: 5, nrow = 2) [, 1] [, 2] [, 3] [1,] 1 3 5 [2,] 2 4 1 Upozorenje: U matrici (1: 5, nrow = 2 ): duljina podataka [5] nije podupno ili višestruko od broja redova [2]

Postoje i statistički procesi koji su mogući samo s matricama, tj. Matricom. Mnoge metode zahtijevaju numeričke podatke u matričnom formatu, pa često moramo pretvoriti ne numeričke podatke u matricu modela. Imam još jedan odgovor o tome kako napraviti tu transformaciju: Kako stvoriti dizajnersku matricu u R ?. Mnoge "moderne" metode u R obavljaju ovu pretvorbu automatski, npr. Linearna regresija djeluje sasvim u redu s podatkovnim okvirima. Međutim, na drugim jezicima to nije uvijek točno - sjećam se da je Matlab bio posebno škrto potreban za matricu modela.