Cassandra Opplæring for nybegynnere: Lær på 3 dager

Hva er Apache Cassandra?

Cassandra er et distribuert databasestyringssystem designet for å håndtere et høyt volum av strukturerte data på tvers av vareservere.

Cassandra håndterer den enorme datamengden med sin distribuerte arkitektur. Data plasseres på forskjellige maskiner med mer enn én replikeringsfaktor som gir høy tilgjengelighet og ingen enkelt feilpunkt.

På bildet nedenfor er sirkler Cassandra noder og linjer mellom sirklene viser distribuert arkitektur, mens klienten sender data til noden.

Cassandra Databaseopplæring for nybegynnere: Lær på 3 dager

Cassandra pensum

Introduksjon

👉 Lesspå 1 Install Cassandra - Hvordan laste ned og installere Cassandra on Windows
👉 Lesspå 2 Cassandra Architecture & replikeringsfaktorstrategi — En omfattende veiledning
👉 Lesspå 3 Cassandra Datamodell — Lær med et enkelt eksempel

Avanserte ting

👉 Lesspå 1 Cassandra Tasterom — Opprett, endre og slipp nøkkelrom inn Cassandra med eksempel
👉 Lesspå 2 Cassandra Bord – Opprett, endre, slipp og avkort (med eksempel)
👉 Lesspå 3 Cassandra Spørringsspråk (CQL) - Sett inn i, oppdater, slett (eksempel)
👉 Lesspå 4 Opprett og slipp INDEX inn Cassandra — Lær med eksempel
👉 Lesspå 5 Cassandra CQL-datatyper og datautløp ved bruk av TTL — Lær med eksempel
👉 Lesspå 6 Cassandra Samling — Sett, Liste, Kart med eksempel
👉 Lesspå 7 Cassandra Cluster Oppsett - Cluster Oppsett på flere noder
👉 Lesspå 8 Installasjon av DataStax DevCenter & OpsCenter — En trinn-for-trinn-veiledning
👉 Lesspå 9 Cassandra Sikkerhet — Opprett bruker og autentisering med JMX

Må vite!

👉 Lesspå 1 Cassandra intervjuspørsmål – Topp 23 Cassandra Intervju spørsmål og svar
👉 Lesspå 2 Cassandra Veiledning PDF — Last ned Cassandra Veiledning pdf for nybegynnere

Cassandra Historie

  • Cassandra ble først utviklet på Facebook for innbokssøk.
  • Facebook åpnet den i juli 2008.
  • Apache inkubator godtatt Cassandra i mars 2009.
  • Cassandra er et prosjekt på toppnivå Apache siden 2010. februar.
  • Den nyeste versjonen av Apache Cassandra er 3.2.1.

La oss først forstå hva NoSQL-database er.

Nosql Cassandra Database

NoSQL-databaser kalles "Ikke bare SQL" eller "Ikke-relasjonelle" databaser. NoSQL-databaser lagrer og henter andre data enn tabellrelasjoner som relasjonsdatabaser.

NoSQL-databaser inkluderer MongoDB, HBase og Cassandra.

Det er følgende egenskaper for NoSQL-databaser.

  • Design enkelhet
  • Horisontal skalering
  • Høy tilgjengelighet

Datastrukturer brukt i Cassandra er mer spesifisert enn datastrukturer som brukes i relasjonsdatabaser. Cassandra datastrukturer er raskere enn relasjonsdatabasestrukturer.

NoSQL-databaser brukes i økende grad i Big Data og sanntids webapplikasjoner. NoSQL-databaser kalles noen ganger ikke bare SQL dvs. de kan støtte SQL-lignende spørrespråk.

Nosql Cassandra Database vs relasjonelle databaser

Her er forskjellene mellom relasjonsdatabaser og NoSQL-databaser i tabellformat.

Relasjonsdatabase NoSQL-database
Håndterer data som kommer i lav hastighet Håndterer data som kommer i høy hastighet
Data kommer fra ett eller få steder Data kommer fra mange steder
Håndterer strukturerte data Håndterer strukturerte ustrukturerte og semistrukturerte data.
Støtter komplekse transaksjoner (med sammenføyninger) Støtter enkle transaksjoner
enkelt feilpunkt med failover Ikke noe eneste feil punkt
Håndterer data i moderat volum. Håndterer data i svært høyt volum
Sentraliserte distribusjoner Desentraliserte distribusjoner
Transaksjoner skrevet på ett sted Transaksjon skrevet på mange steder
Gir leseskalerbarhet Gir både lese- og skriveskalerbarhet
Utplassert på vertikal måte Utplassert på horisontal måte

Apache Cassandra Egenskaper

Det er følgende funksjoner som Cassandra gir.

  • Massivt skalerbar Archilære: Cassandra har et mesterløst design hvor alle noder er på samme nivå som gir enkel betjening og enkel utskalering.
  • Mesterløs Archilære: Data kan skrives og leses på hvilken som helst node.
  • Lineær skala ytelse: Etter hvert som flere noder legges til, vil ytelsen til Cassandra øker.
  • No Single point of failure: Cassandra replikerer data på forskjellige noder som sikrer at det ikke er et enkelt feilpunkt.
  • Feiloppdaging og gjenoppretting: Mislykkede noder kan enkelt gjenopprettes og gjenopprettes.
  • Fleksibel og dynamisk datamodell: Støtter datatyper med rask skriving og lesing.
  • Data beskyttelse: Data er beskyttet med commit-loggdesign og innebygd sikkerhet som sikkerhetskopierings- og gjenopprettingsmekanismer.
  • Justerbar datakonsistens: Støtte for sterk datakonsistens på tvers av distribuert arkitektur.
  • Multi Data Center Replikering: Cassandra gir funksjon for å replikere data på tvers av flere datasenter.
  • Datakomprimering: Cassandra kan komprimere opptil 80 % data uten overhead.
  • Cassandra Spørringsspråk: Cassandra gir spørringsspråk som ligner på SQL-språk. Det gjør det veldig enkelt for utviklere av relasjonsdatabaser å flytte fra relasjonsdatabase til Cassandra.

Cassandra Brukssaker/applikasjon

Cassandra er en ikke-relasjonell database som kan brukes til ulike typer applikasjoner. Her er noen brukstilfeller hvor Cassandra bør foretrekkes.

  • MeldingerCassandra er en flott database for selskapene som leverer Mobil telefoner og meldingstjenester. Disse selskapene har en enorm mengde data, så Cassandra er best for dem.
  • Internet of things-applikasjonCassandra er en flott database for applikasjoner der data kommer med svært høy hastighet fra forskjellige enheter eller sensorer.
  • Produktkataloger og butikkapperCassandra brukes av mange forhandlere for holdbar handlekurvbeskyttelse og rask inn- og utmating av produktkataloger.
  • Social Media Analytics og anbefalingsmotorCassandra er en flott database for mange nettselskaper og sosiale medier-leverandører for analyse og anbefaling til sine kunder.