La gestione dei database Linux è un'attività che richiede la disponibilità delle migliori utilità che combinano prestazioni, sicurezza, scalabilità e compatibilità con altre app o componenti aggiuntivi. Per questo motivo, se lavoriamo su database, cercheremo sempre che questa piattaforma in cui inseriamo e gestiamo i dati ci offra questo e altro, ecco perché è stato sviluppato Apache Cassandra e in Solvetic spiegheremo cos'è, a cosa serve i principali vantaggi sono e come possiamo installarlo in Ubuntu 20.04.
Cos'è Apache Cassandra?Apache Cassandra è stato sviluppato come un gestore di database che ci offre aspetti chiave come scalabilità e alta disponibilità, ma con prestazioni adeguate indipendentemente dalle dimensioni dei database con cui lavorare.
Apache Cassandra offre la replica dei dati su più data center offrendo non solo disponibilità ma una latenza molto più bassa.
Ha un'architettura distribuita, ovvero consente di gestire grandi volumi di dati con replica dinamica, motivo per cui le repliche vengono archiviate in più nodi di un cluster aggiungendo una migliore tolleranza ai guasti.
Funzioni di Apache CassandraApache Cassandra è stato creato come database NoSQL open source, ci offre un modello di archiviazione coerente, motivo per cui Apache Cassandra è ideale per ambienti in cui aspetti come:
- Query mirate a chiavi partizionate
- Replica completa del database multi-master
- Disponibilità globale con bassa latenza
- Aumento delle prestazioni lineari di ciascun processore
- Schema flessibile
Componenti Apache CassandraApache Cassandra integra Cassandra Query Language (CQL), questo è un linguaggio identico a SQL con il quale possiamo creare e aggiornare lo schema del database e accedere ai dati, questo è composto da aspetti come:
- Keyspace: definiscono il modo in cui viene replicato un set di dati.
- Partizione: questa opzione indica dove saranno le righe di Apache Cassandra nella chiave primaria.
- Tabella: si occupa di definire lo schema scritto per una raccolta di partizioni.
- Riga: ospitano un insieme di colonne identificate da una chiave primaria.
- Colonna: si riferisce a un singolo dato con un tipo associato a una riga.
I parametri di configurazione di Apache Cassandra sono configurati direttamente nel file cassandra.yaml.
Caratteristiche di Apache CassandraAlcune delle nuove funzionalità di Apache Cassandra sono:
- Supporto Java 11
- Gestione del tavolo virtuale
- Registro completo delle query
- Utilizzo di Nodetool per abilitare l'audit trail
- Visualizzazione dei registri di controllo
- Messaggistica interna migliorata
- Streaming migliorato
- Trasmissione copia zero
- La replica transitoria supporta EACH_QUORUM e altro
Sistemi Apache CassandraApacha Cassandra può essere installato sui seguenti sistemi:
- Ubuntu dal 16.04 al 20.04
- CentOS e RedHat Enterprise Linux (RHEL) inclusi 6.6, 7.7 e 8
- Amazon Linux AMI 2016.09 tramite Linux 2
- Debian 8, 9 e 10
- SUSE Enterprise Linux 12
Vediamo come installare Apache Cassandra su Ubuntu 20.04.
1. Installa Apache Cassandra su Ubuntu 20.04
Passo 1
Prima di tutto, dobbiamo convalidare la versione Java poiché OpenJDK consente ad Apache Cassandra di funzionare senza problemi, per convalidare ciò eseguiamo:
java -versione
INGRANDIRE
Passo 2
Installiamo OpenJDK 8 con il seguente comando:
sudo apt install openjdk-8-jdk
INGRANDIRE
Passaggio 3
Inseriamo la lettera S per confermare il download e l'installazione. Quindi possiamo eseguire nuovamente "java -version" per verificare la versione utilizzata di Java.
:
INGRANDIRE
Passaggio 4
Con OpenJDK installato in Ubuntu 20.04 possiamo installare Apache Cassandra, per prima cosa installeremo il pacchetto "apt-transport-https" con il seguente comando, questo permette l'accesso ai repository tramite il protocollo HTTP:
sudo apt install apt-transport-https
INGRANDIRE
Passaggio 5
Ora importeremo la chiave GPG con il seguente comando:
wget -q -O - https://www.apache.org/dist/cassandra/KEYS | sudo apt-key add -
INGRANDIRE
Passaggio 6
Aggiungiamo il repository Apache Cassandra al file di sistema:
sudo sh -c 'echo "deb http: //www.apache.or … assandra / debian 311x main">
/etc/apt/sources.list.d/cassandra.list '
INGRANDIRE
Passaggio 7
Aggiorniamo il sistema in modo che i repository vengano aggiornati in caso di novità:
sudo apt update
INGRANDIRE
Passaggio 8
dopodiché installiamo il database Cassandra:
sudo apt install cassandra
INGRANDIRE
Passaggio 9
Inseriamo la lettera S per completare il processo:
INGRANDIRE
Passaggio 10
Apache Cassandra si avvierà automaticamente e possiamo convalidare il suo stato con il seguente comando:
sudo systemctl status cassandra
INGRANDIRE
Passaggio 11
Ora possiamo convalidare lo stato del nodo con il seguente comando. Questo ci permette di vedere lo stato del nodo di Cassandra.
stato sudo nodetool
INGRANDIRE
Passaggio 12
Accediamo ad Apache Cassandra con il seguente comando:
cqlsh
INGRANDIRE
2. Configura Apache Cassandra su Ubuntu 20.04
In Cassandra, i file di configurazione si trovano nella directory /etc/cassandra e i dati sono archiviati nella directory /var/lib/cassandra, tutte le opzioni di avvio sono disponibili per essere modificate nel file /etc/default/cassandra.
Passo 1
Quando accediamo possiamo vedere che il nome predefinito del cluster è 'Test Cluster', per modificarlo accediamo ad Apache Cassandra con "cqlsh" e quindi inseriamo quanto segue:
UPDATE system.local SET cluster_name = 'Cluster Solvetico' WHERE KEY = 'local';
Passo 2
Poi siamo usciti con
USCITA;
INGRANDIRE
Passaggio 3
Accediamo al file di configurazione utilizzando l'editor desiderato:
sudo nano /etc/cassandra/cassandra.yamlPassaggio 4
Vedremo quanto segue:
INGRANDIRE
Passaggio 5
Lì andiamo alla riga "cluster_name" e inseriamo il nome che abbiamo assegnato in precedenza:
INGRANDIRE
Passaggio 6
Salviamo le modifiche utilizzando la seguente combinazione di tasti:
Ctrl + O
Lasciamo l'editor utilizzando:
Ctrl + X
Passaggio 7
Quando si accede nuovamente ad Apache Cassandra, vedremo il nuovo nome del cluster:
INGRANDIRE
Con Solvetic hai imparato a installare e configurare Apache Cassandra per gestire i dati in modo molto più completo.