בחודש הבא אנחנו משיקים דלת.
אני מסיים עכשיו חודש שני בתפקיד כאן באינפינידט. לפני שבועיים השקנו סופית (GA) את גרסת מערכת ההפעלה שלנו 3.0.10 ובחודש הבא אנחנו משיקים דלת. אנחנו אחת מחברות האחסון הכי מגניבות בעולם וכולם עושים כאן עניין מדלת. דלת. דלת יפה, עם מסך מגע שמוטמע בה ומציג מדדים שונים מתוך מערכת האחסון עצמה אבל, דלת. סך הכל דלת.
נראה בעצם שמהכל עושים כאן עניין. זה חלק מהתרבות הארגונית של החברה. זו חברה נרגשת ומתרגשת. כל דבר כאן הוא אירוע, כל דבר כאן מתוכנן וכל דבר כאן נבדק, לעומק, ושוב נבדק, לעומק, כן, גם הדלת. זה כנראה חלק ממה שמאפשר לנו להיות חברה כל כך מצליחה. זה חלק ממה שמאפשר לנו להיות חברה רווחית בשוק שבו חברות קטנות נמכרות או מפסידות מאות מיליוני דולרים בשנה כדי לרכוש לעצמן נתח שוק. זה חלק ממה שמאפשר לנו, כנגד כל האנליסטים שאמרו לנו שלא נוכל למכור שום דבר לחברות המגה-אנטרפריז ושבלי פתרון All Flash אין לנו מה לחפש בשוק, למכור, הרבה ובגדול, לחברות הכי גדולות בעולם כמו British Telecom ולנצח שוב ושוב, גם במבדקי ביצועים ראש בראש, את מוצרי ה All Flash שמסביבנו.
מצגת ה Over View הגנרית שלנו מתחילה בשקף שכולל גם תמונה של מייסד החברה, משה ינאי. התמונה מייצגת קבוצה של אנשים שהולכת ביחד כבר הרבה שנים ובפעם השלישית בונה ביחד חברת אחסון. יש כאן מאות שנות נסיון מצטברות ובשבועות הראשונים זה מאד מרגש, יש לי תואר בהיסטוריה והתקדמתי יפה עד עכשיו כי אני מדבר ברור ומרשים גם כשאני לא יודע על מה מדובר והנה אני משחק סנוקר עם האיש שכתב את אלגוריתם ה FAST auto tier של EMC.
אז למי שלא יודע ורוצה סקירה כללית על מה בכלל אנחנו עושים כאן באינפינידט, אנחנו חברת תוכנה המייצרת את מערכת האחסון הכי מתקדמת בעולם, לדעתנו. הקורא החד והחריף שואל את עצמו עכשיו למה אני כותב שאנחנו חברת תוכנה אם הרגע השקנו דלת והאם הכוונה היא ל software defined door והתשובה היא שלמעשה הדלת היא רכיב החומרה היחיד שאנחנו מתכננים ומייצרים בעצמנו, שאר רכיבי החומרה במערכת האחסון שלנו, InfiniBox, הם מוצרי מדף שאנחנו בוחרים, מרכיבים ובודקים תחת אינטגרציה מאד מחמירה (ממוצע של שלושה שבועות בדיקות אינטגרציה מלאות תחת עומס לכל מערכת שיוצאת מהמחסנים שלנו).
מערכת ה InfiniBox מתוכננת לעמוד בכלל הדרישות של לקוח High End ממערכת אחסון מרכזית מודרנית. אנחנו עומדים ברמת זמינות של שבע תשיעיות לכלל המערכת (חומרה ותוכנה ביחד) וכל הרכיבים שלנו בנויים בתצורת N+2 ככה שאנחנו יודעים לתת שירות גם בנפילה של שתי סוללות, שני בקרים, שני דיסקים, שני פורטים… אנחנו מספקים מענה לכלל הפרוטוקולים הנפוצים בעולם האחסון (FCP, iSCSI, NFS, Main Frame, SMB, Object למרות שבשביל הגילוי הנאות השניים האחרונים אינם עדיין GA), ונותנים בראש למערכות All Flash ברמת הביצועים שהמערכת שלנו מספקת למרות שרישמית אנחנו מערכת היברידית ונפח האחסון שלנו מבוסס כולו על NL-SAS. מיד אכתוב קצת על איך אנחנו עושים את זה אבל זה זמן טוב להגיד שאנחנו שמים את הכסף שלנו איפה שהפה שלנו, כמאמר האמריקאים, והשבוע השקנו את הקמפיין שלנו שנקרא faster than all flash. אנחנו קוראים ללקוחות להזמין אותנו לתחרות ביצועים ראש בראש מול מערכות All Flash תחת עומסי עבודה אמיתיים ואם נפסיד, נתרום 10,000 דולר לארגון צדקה על פי בחירתו של הלקוח.
אז בוא נדבר קצת ביצועים. בכתיבה אין הרבה קסמים, כמו ברוב מערכות האחסון הקיימות היום, אם לא בכולן, כלל הכתיבות מתבצעות ל RAM שהוא רכיב האחסון הכי מהיר, המדיה הכי מהירה, ולאחר שאנחנו מרפלקים את הכתיבות בין שני רכיבי RAM אנחנו מספקים Ack לשרתים. את הרפליקציה אנחנו מבצעים ב RDMA על גבי Infiniband ככה שהרפליקציה מאד מהירה ולכן גם התגובה לכתיבות מאד מהירה. 135GB RAM מוקצים ל write cache במערכת ועוד 135 לרפליקציה של הכתיבות כלומר 270GB write cache לעומת למשל סה"כ 64GB לזוג בקרי A700 של NetApp ככה שזה כמעט לא משנה מה קצב הכתיבה של האפליקציות אל מערכת האחסון, יש לנו מספיק מקום פנוי לקלוט עוד ועוד כתיבות.
עכשיו מתחיל החלק האומנותי כי כאן מתחיל השוני האמיתי בין מערכת Infinibox ומערכות מתחרות. כמות הזיכרון הגדולה מאפשרת לנו לקחת את הזמן בהורדה של המידע לדיסקים, יש לנו זמן לתכנן ולחשב מה הולך לאן. זה אומר שמידע שמזוהה אצלנו כמידע "חם" נשאר לא דחוס ונגיש ב read cache, המידע החם גם יתוייג ככזה ברמת ה metadata כדי שנדע להתיחס אליו ככזה ואם המידע חם זה אומר שגם קוראים אותו ולכן בלוקים שאנחנו מזהים שיש אליהם כבר גישות קריאה קרובות, ייכתבו בצורה רציפה, Sequential, קרובה ככה שגם בקריאה מאוחרת יותר יהיה קל לגשת אליהם ביחד ותהליך הכתיבה לדיסקים עצמו יתבצע לכלל קבוצות ה Raid הוירטואלית על גבי כלל 480 הדיסקים במערכת.
בקריאה אנו מספקים עד 103TB של SSD לטובת Read Cache ואם תחשבו על זה, אז למרות שמדובר במערכת היברידית, מדובר על סדרי גודל של All Flash, כמה פעמים דיברתם עם יצרן All Flash על 200TB של נפח מידע והוא הציע למכור לכם 50TB של נפח פיזי ולספק את השאר באמצעות טכנולוגיות Efficiency? בשימוש במספר גדול של אלגוריתמים שונים ל Pre-Fetch אנחנו מאכלסים את ה Cache שלנו באופן מיטבי ומסוגלים להגיע עד ל 4MB של מידע שאנחנו צופים שהלקוח צריך עבור כל קריאה שהוא ביצע לעומת למשל 1MB מקסימום במערכות VMAX. אנחנו בוחנים בזמן אמת ובאופן אוטומטי את יעילות האלגוריתם שבו עשינו שימוש ואם הוא לא יעיל נסמן את זה לעצמנו ונפעיל אלגוריתם אחר, ככה אנחנו מגיעים גם למהירויות של All Flash בקריאה והממוצע שלנו מסביב לעולם עומד על בסביבות 95% Cache Hit. אם כתבנו את המידע לא יעיל אל הדיסקים מנגנוני ה Pre-Fetch צריכים לעבוד קשה יותר ולכן קיים גם מנגנון שמבצע סידור מחדש של המידע ככה שהגישה הבאה אל הדיסקים תהיה יעילה יותר.
בפוסט הבא אכתוב על מבנה ה InfiniRaid אבל נראה לי שזה מספיק להפעם, מה שרציתי להדגיש זה עניין הביצועים ובעצם אני מקווה שהעברתי את הנקודה העיקרית שלמרות שהפתרון שלנו הוא פתרון היברידי, יש לנו יותר חומרה מהירה מאשר בהרבה פתרונות All Flash וזו גם הסיבה שאנחנו מצהירים בלי להסס על כאלו מספרים גבוהים.
שלכם תמיד,
ניר מליק
מחשבה אחת על “יש לנו דלת חדשה”