Video: Statistical Programming with R by Connor Harris 2025
Du må holde maskinens læringsmål i tankene når du velger en R-distribusjon. R er en kombinasjon av et miljø og et språk. Det er en form for S-programmeringsspråket, som John Chambers opprinnelig opprettet på Bell Laboratories for å gjøre det enklere å jobbe med statistikk. Rick Becker og Allan Wilks til slutt også lagt til S programmeringsspråk. Målet med R-språket er å omdanne ideer til programvare raskt og enkelt.
Med andre ord er R et språk utviklet for å hjelpe noen som ikke har mye programmeringserfaring, opprette kode uten en stor læringskurve.
R er et gratis nedlastbart produkt som kan kjøre mest S-kode uten endring; I motsetning må du betale for S. R er et godt valg. Du kan lese mer om R generelt.
Du ønsker ikke å lage feiende generaliseringer om språkene som brukes til maskinlæring. Både R og Python er populære språk av forskjellige grunner. Artikler som "I datavitenskap, R-språket svelger Python" synes i utgangspunktet å si at R blir mer populært av en eller annen grunn. Forfatteren klokt tilbake fra denne setningen ved å påpeke at R er best brukt til statistiske formål, og Python er et bedre generelt språk.
De beste utviklerne har alltid et utvalg av programmeringsverktøy i verktøybeltene for å gjøre oppgavene enklere. Språk adresser utvikler behov, så du må bruke riktig språk for jobben. Tross alt blir alle språk til slutt maskinkode som en prosessor forstår - et språk som få utviklere forstår lenger, fordi programmeringsspråk på høyt nivå gjør utviklingen enklere.
Du kan få en grunnleggende kopi av R fra CRAN-området (Comprehensive R Archive Network). Nettstedet inneholder både kildekoden versjoner og kompilerte versjoner av R-distribusjonen for ulike plattformer. Med mindre du planlegger å lage dine egne endringer i den grunnleggende R-støtten eller ønsker å dykke inn i hvordan R fungerer, får du den kompilerte versjonen alltid bedre. Hvis du bruker RStudio, som foreslått i neste avsnitt, må du også laste ned og installere en kopi av R.
Du kan bruke Desktop versjonen av RStudio for å gjøre oppgaven med å jobbe med R enda enklere. Dette produktet er en gratis nedlasting, og du kan hente den i Linux (Debian / Ubuntu, RedHat / CentOS og SUSE Linux), Mac og Windows versjoner.
Du kan prøve andre R-distribusjoner hvis du finner ut at du ikke liker RStudio. De vanligste alternative fordelingene er Statet, Red-R (også tilgjengelig ved Beslutningsstatistikk.com), og Rattle. Alle er gode produkter, men RStudio ser ut til å ha det sterkeste resultatet og er det enkleste produktet å bruke. Du kan lese diskusjoner om de forskjellige valgene.
