Come installare il database Cassandra su CentOS 7

I database sono un elemento fondamentale quando si lavora con grandi quantità di dati grazie alla loro dinamicità, gerarchia, impostazione dei parametri e semplicità di gestione.

Oggi abbiamo la possibilità di selezionare vari database come MySQL, MariaDB, ecc, e ognuno ha i suoi vantaggi e le sue impostazioni in base al numero di utenti e parametri su cui lavorare, ma oggi parleremo di uno in particolare chiamato Cassandra la che può essere molto utile quando si lavora con un database e per questo utilizzeremo CentOS 7.

Cos'è Cassandra?Cassandra è un database open source progettato per la scalabilità e l'elevata disponibilità senza compromettere le prestazioni complessive del sistema.

Cassandra ha fattori come la scalabilità lineare e la tolleranza ai guasti nell'hardware di base o nell'infrastruttura cloud che la rendono la piattaforma perfetta per i dati mission-critical. Il supporto di Cassandra per la replica su più data center è il migliore della categoria, garantendo una latenza inferiore per gli utenti e migliorando i livelli di prestazioni complessive.

Cassandra è un database che supporta la replica locale e la replica di più data center per ridondanza, failover e ripristino di emergenza.

Caratteristiche CassandraAlcune delle sue caratteristiche sono:

  • Disponibilità: Il database Cassandra è riconosciuto per la sua affidabilità al punto che è utilizzato da più di 1000 aziende in tutto il mondo, tra le quali possiamo evidenziare Instagram, GitHub, Netflix, con cui possiamo utilizzare Cassandra con piena fiducia.
  • Tolleranza ai guasti: Un punto critico in qualsiasi database è la disponibilità delle informazioni e in questo aspetto Cassandra ha un'ampia tolleranza ai guasti, in cui siamo tutti esposti a soffrire, consentendo a tutti i dati memorizzati in esso di avere la capacità di essere automaticamente replicati in altri nodi, garantendone sia l'integrità che la disponibilità. Inoltre, quando un nodo presenta un qualche tipo di errore, può essere sostituito senza la necessità di disattivare il database, il che influisce sull'operatività e sulla produttività degli utenti.
  • Performance: Un punto a favore di Cassandra sono le sue elevate prestazioni attraverso le quali è possibile passare ad un livello superiore rispetto alle piattaforme NoSQL già note sia a livello gestionale che applicativo.
  • Decentralizzato: Un'altra caratteristica che spicca in Cassandra è la sua amministrazione decentralizzata grazie alla quale ogni nodo coinvolto nel database è unico, evitando così massicci guasti.
  • Scalabile: un punto da considerare in un database è la sua capacità di scalabilità poiché ciò consente che man mano che l'azienda cresce il database non è limitato nella sua azione, ecco perché Cassandra è una delle migliori opzioni Poiché, secondo le sue statistiche, ha il capacità di supportare fino a più di 2000 nodi, più di 400 TB di dati e circa 1 miliardo o più di richieste ogni giorno, il che garantisce la sua ampia portata.
  • Durevole: Un altro aspetto da tenere in considerazione quando si seleziona il database con cui lavorare è la sua capacità di durabilità, questo implica che il database deve avere la capacità di consentire ai dati critici di rimanere sempre disponibili indipendentemente dal tipo di guasto che si verifica, ciò garantisce la gestione ottimale e corretta di ogni dato ivi archiviato.
  • Opzioni di controllo: con il database Cassandra abbiamo varie opzioni di amministrazione come la replica sincrona o asincrona, in caso di utilizzo dell'opzione di gestione asincrona avremo un database che supporta funzioni aggiuntive come Hinted Handoff e Read Repair per espandere le sue capacità di usabilità.
Ora vedremo come installare Cassandra su CentOS 7.

1. Aggiorna il sistema e installa Java su CentOS 7

Passo 1
Il primo passo da compiere è aggiornare il sistema operativo, questo può essere fatto eseguendo il seguente comando:

 sudo yum update -y
Passo 2
Cassandra è scritto in Java, quindi sarà necessario installare Java su CentOS 7 eseguendo il seguente comando:
 sudo yum install java -y

Passaggio 3
Possiamo verificare la versione Java installata eseguendo il seguente comando:

 sudo java -version

2. Installa Cassandra su CentOS 7

Passo 1
Per impostazione predefinita, il database Cassandra non è disponibile nel repository predefinito di CentOS 7 per questo motivo sarà necessario aggiungere i repository ufficiali di Apache Software Foundation a CentOS 7, e ciò si ottiene creando il file cassandra.repo all'interno della directory /etc/yum.repos.d come segue:

 sudo nano /etc/yum.repos.d/cassandra.repo 
Passo 2
In questo nuovo file creato aggiungeremo quanto segue:
 [cassandra] name = DataStax Repo per Apache Cassandra baseurl = http://rpm.datastax.com/community enabled = 1 gpgcheck = 0

Passaggio 3
Salviamo le modifiche utilizzando la combinazione di tasti

Ctrl + O

e usciamo dall'editor usando i tasti

Ctrl + X

Passaggio 4
Ora, sarà necessario aggiornare i pacchetti nel repository eseguendo quanto segue:

 sudo yum update -y
Passaggio 5
Ora possiamo installare Cassandra eseguendo il seguente comando:
 sudo yum install dsc20 -y

INGRANDIRE

Passaggio 6
Una volta scaricato e installato vedremo quanto segue:

INGRANDIRE

Passaggio 7
Una volta installata Cassandra, procediamo con l'esecuzione dei seguenti comandi:

 sudo systemctl start cassandra (Avvia il servizio Cassandra) sudo systemctl enable cassandra (Abilita il servizio Cassandra all'avvio del sistema)

INGRANDIRE

Passaggio 8
Infine, possiamo vedere lo stato di Cassandra eseguendo il seguente comando:

 sudo systemctl status cassandra

INGRANDIRE

3. Connetti e verifica il Cluster Cassandra su CenTOS 7

Passo 1
A questo punto Cassandra sta funzionando, quindi andremo a verificare e connettere il Cluster Cassandra, per questo, prima di tutto, verificheremo lo stato del Cluster Cassandra con il seguente comando:

 stato sudo nodetool

Passo 2
Possiamo vedere che lo stato della connessione del cluster è corretto. A questo punto Solvetic vuole aggiungere un punto di soluzione perché in molte occasioni durante l'esecuzione di questo comando viene visualizzato il seguente errore:

 Errore: Impossibile connettersi a '127.0.0.1:7199': Connessione rifiutata (Cassandra) 
Passaggio 3
Per risolvere questo errore e accedere correttamente dobbiamo andare alla seguente directory utilizzando l'editor desiderato:
 sudo nano /etc/cassandra/default.conf/cassandra-env.sh 
Passaggio 4
Lì dobbiamo individuare la seguente riga:
 JVM_OPTS = "$ JVM_OPTS -Djava.rmi.server.hostname = 
Passaggio 5
L'aspetto dovrebbe essere simile al testo seguente:
 # aggiungi questo se hai problemi di connessione: # JVM_OPTS = ”$ JVM_OPTS -Djava.rmi.server.hostname =”
Passaggio 6
Lì dobbiamo decommentare la seconda riga e sostituire la riga del nome pubblico con l'indirizzo IP 127.0.0.1:

Passaggio 7
Salviamo le modifiche utilizzando la seguente combinazione di tasti:

Ctrl + O

Lasciamo l'editor utilizzando:

Ctrl + X

Passaggio 8
Procediamo a riavviare il servizio eseguendo quanto segue:

 systemctl riavvia cassandra 
Passaggio 9
In alcuni casi si consiglia di riavviare il computer, in questo modo correggeremo questo errore.
Ora possiamo connetterci al cluster Cassandra eseguendo il seguente comando:
 cqlsh

Passaggio 10
Possiamo vedere la rispettiva connessione per iniziare a lavorare su questo database. Per uscire useremo il termine

 Uscita
In questo modo abbiamo visto come installare e accedere a Cassandra in CentOS 7.

wave wave wave wave wave