Introduzione alla programmazione statistica con R

Sommario
R è un linguaggio di programmazione statistica, è gratuito e open source. Viene utilizzato principalmente per le operazioni di estrazione dei dati o statistica, tutto questo con l'obiettivo di creare applicazioni per l'analisi di grandi quantità di dati.
L'interfaccia della riga di comando di R All'inizio può essere un po' intimidatorio, ma questo viene messo in ombra dopo aver apprezzato il potere e le possibilità che il linguaggio ci offre di condividere e riprodurre l'analisi delle informazioni.
R Può essere scaricato gratuitamente per tutte le piattaforme gratuite esistenti oggi, abbiamo la possibilità di installarlo in finestre, Linux e persino Mac.
Ai fini di questo tutorial useremo la versione per finestre che possiamo trovare nella pagina ufficiale del progetto al seguente link. Dopo il download e l'installazione avremo la nostra copia funzionale di R, se lo eseguiamo avremo la schermata iniziale di R che dovrebbe assomigliare a questo:

R Ci consente di lavorare con i dati in modo rapido ed efficace, tuttavia la sua interfaccia predefinita non è perfetta per questo compito. Uno dei problemi è che tutto si apre in finestre separate rendendo difficile il lavoro e anche l'interfaccia della riga di comando non è la stessa in tutti i sistemi operativi.
Sebbene ci siano molte interfacce per risolvere questo problema, in questo tutorial useremo RStudio che è disponibile per tutte le piattaforme, ma è importante ricordare che è necessario avere R installato prima dell'installazione, per ottenere la versione di finestre andiamo al seguente link e scarichiamo la versione corrispondente.
Dopo l'installazione eseguiamo RStudio e dovremmo vedere l'interfaccia principale:

RStudio ci dà l'organizzazione di tutte le finestre di R all'interno di un unico pannello e inoltre ci dà accesso a funzioni che possono essere difficili da trovare, oltre a questo possiamo citare altri vantaggi aggiuntivi:
  • Dividiamo il nostro lavoro in Progetti dove ognuno di questi avrà la sua directory di lavoro, cronologia e file di origine.
  • Integrazione con GitHub.
  • Consente di memorizzare una storia graficamente.
  • Puoi esportare la grafica in diversi formati e dimensioni.
  • Ci permette di completare il codice con il tasto tabulare.
  • Puoi creare grafici interattivi grazie a determinati pacchetti.
Come vediamo RStudio è un modo piuttosto ottimale per lavorare con RTuttavia, ci sono altre soluzioni sul mercato, spetta a ogni persona indagare su queste e valutare se si adattano meglio alle esigenze di ogni persona.
Ci sono diversi modi per lavorare con R dove la prima cosa che affronteremo è il R consoleNonostante il fatto che non possiamo memorizzare il lavoro svolto qui, è abbastanza utile testare alcune funzioni e iniziare a prendere confidenza con il linguaggio.
Lavorare con la console è abbastanza semplice, inseriamo un comando e poi R ce ne dà l'output, proviamo una semplice operazione di addizione come la seguente:
> 10 + 7

noi spingiamo accedere e automaticamente R Nella riga seguente ci dà la risposta alla nostra operazione:

Come possiamo vedere nell'immagine la prima riga contiene il comando con la nostra operazione, è importante ricordare che R non richiede l'uso del punto e virgola per terminare la riga o qualsiasi altro operatore di terminazione. Possiamo vedere nella seconda riga prima della risposta il [1] questo indica il modo in cui R esegue operazioni aritmetiche e sta usando vettore, quello indica l'indice del primo elemento del vettore, dove possiamo evidenziare che molti altri linguaggi gestiscono gli indici da zero ma R lo fa da uno.
Come accennato in precedenza, la console è abbastanza utile ma non è il massimo con cui lavorare, principalmente perché non ha la possibilità di memorizzare i nostri comandi e la possibilità di inserire un solo comando alla volta, succede qualcosa di simile con Pitone, ma non dovremmo preoccuparci poiché RStudio ci dà il finestra dello script situato nella parte superiore della nostra console, se non lo troviamo, andiamo su File> Nuovo file> Script R o premere Maiusc + Comando + N.
Fondamentalmente uno script R è un testo semplice con l'estensione .R. Per vedere come funziona possiamo ricreare la nostra operazione aritmetica dall'esempio precedente creando un nuovo script e aggiungendo diverse righe di comando aggiuntive, vediamo:
 Stampa 10 + 7 1:50 ("Hello World") 

UN Script R puoi eseguire riga per riga con l'opzione che abbiamo nel menu in alto chiamato Correre e vedremo l'output dello stesso nella console, vediamo la risposta per ogni riga del nostro script:

Come possiamo vedere la prima riga ci dà il risultato che abbiamo ottenuto in precedenza, la seconda riga crea una lista di numeri da 1 a 50 dove il numero tra parentesi è il primo indice per quella riga e infine abbiamo l'impressione del classico Ciao mondo.
Dopo aver visto i modi in cui possiamo lavorare con il linguaggio, passeremo a concetti più teorici per capire meglio cosa abbiamo a disposizione nel linguaggio per lavorare ed eseguire i nostri progetti.
Come in tutti i linguaggi di programmazione, variabili sono uno degli aspetti più importanti, per crearli in R Abbiamo solo bisogno di scriverne il nome senza definirne il tipo. Noi usiamo il operatore di assegnazione per dare il valore alla variabile.
ImportantePossiamo assegnare il valore di una variabile con il segno di uguale ma questa è una cattiva pratica in R, per eseguire l'assegnazione corretta, utilizzare l'operatore <-.
Vediamo come si assegna un valore a una variabile e poi si stampa:
 x <- 58 x 

Possiamo anche assegnare più valori alle nostre variabili con la funzione concatena:
y <- c (5, 2, 11, 28, 17)

Se eseguiamo l'esempio vedremo nel pannello di destra come abbiamo il valore di X e l'elenco numerico assegnato a :

INGRANDIRE

Inoltre, per eliminare una variabile dall'area di lavoro, non ci resta che utilizzare la funzione rm, possiamo anche pulire l'intero spazio di lavoro, vediamo come lo facciamo:
 rm (x) rm (lista = ls ()) 

Con la prima riga eliminiamo la variabile e con la seconda riga tutto lo spazio.
Nel linguaggio abbiamo quattro strutture dati, che sono riconosciute da R:
Vettore dei cartoni animatiUn vettore è un array unidimensionale in cui tutti i dati presenti in esso devono essere dello stesso tipo, intero, char, ecc., inoltre è importante notare che questo è l'oggetto dati di base in R.
Array e matriciUna matrice è simile a un vettore in cui i dati devono essere dello stesso tipo, tuttavia la matrice ha due dimensioni e le informazioni sono organizzate in righe e colonne. L'array è simile all'array ma può avere più di due dimensioni.
Frame di datiIl data frame è un insieme di vettori della stessa lunghezza, è simile alla matrice ma la particolarità di questo tipo di struttura è che possono essere di tipo misto, dove i vettori possono anche avere dei nomi.
ElenchiIl tipo più generico di struttura in R, un elenco è una raccolta di elementi di qualsiasi classe, lunghezza o struttura, possiamo anche avere altri elenchi.
Ulteriore, R Ha diverse funzioni che ci permettono di convertire un tipo di struttura in un altro, vediamo:
come.vettore ()Questa funzione consente di convertire le matrici in vettori unidimensionali.
come.matrice ()È possibile convertire le strutture di dati in un array.
as.data.frame ()È possibile convertire strutture di dati in frame di dati.
come.lista ()È possibile convertire le strutture di dati in elenchi.
Uno dei punti di forza di R è che puoi aggiungere pacchetti che ci permettono di estendere le funzionalità del linguaggio. In altre lingue questi plugin sono disponibili nelle librerie ma in R la libreria è il luogo in cui sono archiviati tutti i pacchetti.
Il pacchi di R possono provenire da due posti diversi, alcuni vengono con R per impostazione predefinita, ma non sono attivi e altri possono essere trovati nei repository online.
Per vedere i pacchetti attualmente installati o caricati possiamo eseguire le seguenti funzioni:
 biblioteca () cerca () 

La funzione biblioteca () ci porta un elenco dei pacchetti attualmente installati, vediamo una parte di ciò che ci viene lanciato quando eseguiamo questa riga:

La funzione ricerca () Ci mostra invece da console i pacchetti che sono attualmente caricati, vediamo nell'immagine seguente quali pacchetti abbiamo caricato:

Inoltre, per installare i pacchetti possiamo farlo in diversi modi, il primo è attraverso l'opzione nel menu in alto Strumenti> Installa pacchetti e poi abbiamo tramite le funzioni del linguaggio, quest'ultimo è quello che raccomandiamo poiché può così far parte del nostro script.
Per installare un pacchetto che usiamo install.packages, dopo questo dobbiamo includerlo, possiamo usare biblioteca o richiedere Per questo però è meglio usare quest'ultimo per evitare confusione con l'ambito delle funzioni, vediamo come installiamo e includiamo il pacchetto ggplot2:
 install.packages ("ggplot2") richiedono ("ggplot2") 

Infine per eliminare un pacchetto che possiamo usare rimuovi.pacchetti, vediamo come si usa:
remove.packages ("ggplot2")

Con questo concludiamo questo tutorial, con il quale abbiamo già un'idea di come lavorare R, oltre ad aver chiarito punti come variabili e strutture dati, aspetti essenziali che dobbiamo conoscere per poter sfruttare appieno questo linguaggio potente ed efficace.Ti è piaciuto e hai aiutato questo Tutorial?Puoi premiare l'autore premendo questo pulsante per dargli un punto positivo

Aiuterete lo sviluppo del sito, condividere la pagina con i tuoi amici

wave wave wave wave wave