Hvordan oppsummert data tomt i en ggplot2 i R

 En veldig nyttig funksjon i ggplot2 utvalget av funksjoner for å oppsummere dine R data i plottet. Dette betyr at du ofte ikke trenger å forhånds oppsummere dine data. For eksempel mengden av barene i et histogram viser hvor mange observasjoner av noe hva du putter inn din informasjon.

 Den statistiske oversikt for dette er å telle observasjonene. Statistikere refererer til denne prosessen som binning, og standard stat for geom_bar er stat_bin.

 Analogt til måten hver stat geom har en tilsvarende standard, har hver stat en standard geom.

 Så, trygler dette spørsmålet: Hvordan bestemmer du om du vil bruke en geom eller en stat? I prinsippet spiller det ingen rolle om du velger geom eller den første stat. I praksis vil imidlertid ofte intuitivt starte med noen form for tomt første - med andre ord, gir en geom. Hvis du ønsker å legge et lag av statistisk oversikt, bruk en stat.

 I denne tomten, bruker de samme dataene til å først gjøre et spredningsdiagram med geom_point og deretter lagt til en jevn linje med stat_smooth.

 Ta en titt på noen praktiske eksempler på bruk av statistiske funksjoner.

 Stat Beskrivelse Standard Geom stat_bin Teller antall observasjoner i baking. geom_bar stat_smooth Oppretter en jevn linje. geom_line stat_sum Legger verdier. geom_point stat_identity Sammendrag ikke. Plutselig data som det er. geom_point stat_boxplot Gir en oversikt over data for en boks-og-whisker plot. geom_boxplot Hvordan bin data i ggplot2

 Du har allerede sett hvordan stat_bin bruk for å oppsummere dine data i hyllene, fordi dette er standard stat av geom_bar. Dette betyr at for å fremstille de følgende to linjer med kode identiske plott:

 > Ggplot) + geom_bar
 > Ggplot) + stat_bin

 Hvordan R data i ggplot2 glatt

 Den ggplot2 pakken også gjør det veldig enkelt å lage regresjonslinjer gjennom dine data. Du bruker stat_smooth funksjon for å lage denne type linje.

 Det interessante ting om stat_smooth er at bruk av lokale regresjon er en standard. R har en rekke funksjoner som kan gjøre dette, men ggplot2 brukte løss funksjon for lokal regresjon. Dette betyr at hvis du ønsker å lage en lineær regresjonsmodell skal fortelle deg stat_smooth å bruke en annen funksjon jevnt. Dette gjøres ved fremgangsmåten argument.

 For å bruke en jevnere, illustrerer start ved å opprette et punktplott av arbeidsledighet i Longley datasettet:

 > Ggplot) + geom_point

 Deretter legge til en jevnere. Dette er så enkelt som å legge stat_smooth til din linje med kode.

 > Ggplot) +
 + + Stat_smooth Geom_point

 Til slutt, forteller stat_smooth å bruke en lineær regresjonsmodell. Du kan gjøre dette ved å legge argumentet method = "lm".


 > Ggplot) +
 + + Stat_smooth Geom_point

 Hvordan fortelle ggplot2 å la dine data unsummarized

 Noen ganger ggplot2 ikke vil at du skal oppsummere dataene i plottet. Dette skjer vanligvis når dataene allerede oppsummert på forhånd eller når hver linje av dine data, må du være slått av separat. I disse tilfellene, vil du fortelle ggplot2 å gjøre noe i det hele tatt, og den stat å gjøre dette på er stat_identity.

(0)
(0)
Kommentarer - 0
Ingen kommentarer

Legg en kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tegn igjen: 3000
captcha