Apache Cassandra

Schulung / Webinar

Die Cassandra Datenbank garantiert eine hohe Verfügbarkeit und Skalierbarkeit. Für die Menge der verwalteten Daten gibt es kein Limit, selbst Datenbanken in Terra- oder Petabyte Größe sind möglich. Der Zugriff erfolgt über die SQL ähnliche CQL Sprache. Ferner kann der Grad der Konsistenz bei Cassandra selbst bestimmt werden.

Nach der Teilnahme am Kurs wirst du über fundierte Cassandra Kenntnisse verfügen und in der Lage sein, Cassandra im Cluster zu installieren, zu betreiben, Datenbanken zu modellieren und diese in Projekten zu nutzen.

NoSQL & BigData Grundlagen

  • Die drei Vs von Big Data: Volume, Velocity & Variety
  • Wo liegen die Grenzen des relationalen Modells?
  • Das CAP Theorem

Cassandra Architektur

  • Das Dynamo Paper und die Umsetzung in Cassandra: Consistent Hashing, Gossip, Hinted Handoff, ...
  • Der Unterschied zwischen Replikation und Partitioning
  • Tunable Consistency für Schreiben und Lesen
  • Wo liegen die Vorteile von Cassandra und welche Einschränkungen gibt es?

Arbeiten mit CQL

  • Das cqlsh Werkzeug
  • Unterschiede und Gemeinsamkeiten zu SQL
  • SELECT, INSERT, DELETE und UPDATE

Datenmodellierung für Apache Cassandra

  • Keyspace, Table & Column
  • Auswahl des Partitionkey und Clusteringkeys
  • Effizienz von Abfragen: Wie bekomme ich schnell eine Antwort
  • Modellieren ohne Relationen
  • Optimierung des Datenmodells für spezielle Anwendungen
  • Verwendung eines Index

Clustering

  • Was verwendet man am besten für eine Cassandra Installation? Physikalische Rechner, virtuelle Maschinen oder Container?
  • Installation und Betrieb eines Cassandra Clusters
  • Hinzufügen und Entfernen von Knoten
  • Aufbau eines Cassandra Clusters auf Amazon AWS
  • Verteilung über mehrere Racks und Datacenter
  • Einstellungen für die Produktion
  • Überwachen eines Clusters

Anwendungsentwicklung mit Cassandra

  • Zugriff mit Java
  • Schreiben von Skripten mit dem Python Driver
  • Batching

Praxis

  • Für welche Aufgaben eignet sich Cassandra?
  • Performanz Tuning

Zielgruppe

Administratoren, Entwickler, Softwarearchitekten, Analysten, Data Science Specialists

Vorkenntnisse

Für den Besuch des Seminars sind keine Apache Cassandra Kenntnisse notwendig. Datenbank und SQL-Grundkenntnisse werden vorausgesetzt. Java und Python Wissen ist nicht notwendig.

Deine Vorteile

  • Du kannst die Einsatzfelder und den Nutzen von NoSQL Datenbanken und Cassandra für konkrete Projekte beurteilen.
  • Du lernst die Prinzipien und die Architektur von Cassandra kennen.
  • Lernst die Datenmodellierung für Cassandra
  • Du lernst einen Cassandra Cluster zu installieren, zu konfigurieren und zu betreiben

Dauer

2 Tage

Kursunterlage

Handouts aller in der Schulung präsentierten Folien sowie ein Skript mit detailierten Übungen.

Apache Software Foundation