מה זה Cassandra?
Cassandra היא מערכת ניהול מסדי נתונים מבוזרת בקוד פתוח, שפותחה במקור על ידי Facebook וכעת נתמכת ומנוהלת על ידי קרן Apache Software Foundation. המסד נתונים נבנה כדי לטפל בכמויות עצומות של מידע ומתקדם במידה רבה בכיוונים של סקלאביליות וזמינות גבוהה, דבר המאפשר לו לטפל בלחץ גבוה של בקשות ושל שמירה/איחזור מידע. המערכת נוצרה כדי לענות על דרישות של פלטפורמות גדולות בעולם הדיגיטלי, המשתמשות במידע באופן אינטנסיבי כמו רשתות חברתיות, שירותי ענן, ניתוח נתונים בזמן אמת ועוד.
המבנה של Cassandra מבוסס על ארכיטקטורת תשתית מבוזרת, שבה כל שרת (node) במערכת הוא זהה ויכול לבצע את אותן הפעולות. מכאן נובעת היתרון הגדול של Cassandra - היא יכולה להתרחב בצורה אופקית (Horizontally) כמעט ללא מגבלה ממשית. כתוצאה מכך, אפשר להוסיף עוד ועוד שרתים כדי לשפר את הביצועים ולטפל בעומס מידע ללא כל צורך באיפוס מחדש של המסד נתונים.
עוד מאפיין עיקרי של Cassandra הוא העקביות ברמה גבוהה זמינות גבוהה ויכולת התאמה לתקלה. המשמעות היא שכל המידע שנשמר במערכת עובד בצורה שיש רפליקציה של המידע שנשמר במספר נקודות שונות. אם אחד השרתים נופל, המידע אינו מאבד ונשאר נגיש כלל בזכות שרתים אחרים שמחזיקים עותקים של אותם הנתונים. Cassandra גם תומכת במודלים שונים של עקביות, בהתאם לצורכי היישום, מה שמאפשר להגמיש את השימוש במערכת בהתאם לדרישות המיוחדות.
למשתמשים במערכת ניתנת האפשרות לשלוט על פרמטרים כגון consistency level, המאפשר לשלוט על מספר ההעתקים שהמערכת צריכה לאמת לפני שתגובה נשלחת ללקוח. כמו כן, התשתית שימושית במיוחד לאפליקציות שהן write-heavy, כלומר כאלה שדורשות המון פעולות כתיבה, כמו רשתות חברתיות שרושמות אינספור לייקים, סטטוסים, תגובות ועוד.
בזכות תכונות אלו ועוד, Cassandra הפכה לאחת המערכות הפופולריות ביותר בעולם המסדי נתונים המבוזרים, ונמצאת בשימוש בחברות גדולות מאד כמו Netflix, Apple ו- eBay, תוך כדי שהיא מהווה פתרון אמין מצד אחד וגמיש מאד מצד שני. בסופו של דבר, ההצלחה נובעת מהיכולת לענות על דרישות ה- Big Data הגדלות והולכות, ופתרון נוח להתמודד עם כמויות עצומות של נתונים בצורה יעילה.