אובייקטים, אובייקטים בכל מקום!

אני מאד גאה בפוסט הישן הזה, לטעמי הצלחתי לא רע לשלב את ההיסטוריה של האולימפיאדה, פלישות הברברים, ראשית ימי הנצרות וטכנולוגיות אחסון נתונים.

אני חוזר אליו כי הוא נוגע באיזון וגם בפערים בין טכנולוגיות אחסון מהירות ואיטיות והזכרתי בו אחסון מבוסס אובייקטים כחלופה לדיסקים איטיים וזולים ועל זה רציתי לדבר הפעם כי אני חושב שקיים פער שהולך ונסגר אבל עדיין קיים בין מה שהטכנולוגיה מאפשרת לנו לעשות עם אחסון מבוסס אובייקטים ובין איך שאנחנו תופסים את הפתרון הזה, Object Storage, כשכבת אחסון זולה ואיטית.

אני חושב שפסיכולוגית, תפיסתית, הרבה מאיתנו רואים באחסון מבוסס אובייקטים, Object Storage, אחסון איטי וזול שמיועד בעיקר לארכוב או גיבוי, לאחסון מידע שהגישה אליו נדירה יחסית ובאופן כללי דרישת הביצועים לשליפת המידע הנדירה הזו נמוכה מאד.

התפיסה הזו כנראה נכונה במקרים רבים ובגלל שהיא נכונה היא גם מכתיבה את סוג התשתית שאנחנו נוהגים לחפש לפתרונות אלו, בעולם האובג'קט לדעתי הרבה יותר מאשר בעולמות הקבצים או הבלוקים, הכסף מדבר והוא דוחף את התקציבים המושקעים למטה מה שדוחף גם את הביצועים למטה וחוזר חלילה.

במפגש בין התפיסה הזו המקובלת לעולמות האובייקטים ובין יישומים מודרניים כמו עולמות ה AI או ה Big Data נוצר חיכוך, אלו עולמות של ביצועים, של שליפת מידע, של יצירת עותקים ומיקבול תהליכים והתפיסה הישנה לא מספקת את הסחורה.

יש משהו בשירות האובייקטים של Nutanix שאני לומד עליו, כמו על כלל הפתרונות והשירותים של החברה, בימים אלו, שנראה לי מאזן נכון בין הישן והחדש. ראשית בגלל הפלטפורמה עצמה, שימוש בפלטפורמה של נוטניקס מאפשר לבחור את יצרנית החומרה באופן מאד גמיש ולהתאים את מפרט החומרה לצורך, נשתמש ב NL-SAS למערכות ארכוב או ב NVMe למערכות אימון AI או נשלב SSD כדי להאיץ את פעולות המטה-דאטה שלנו.

מעל הפלטפורמה, השימוש באחסון S3 כשירות מאפשר לנו לצרוך שירות אחסון מבוסס אובייקטים על גבי הפלטפורמה שלנו בלי להתעסק זמן רב בהטמעה של מוצר S3, הפלטפורמה תגדיר עבורנו את כל הרכיבים הנדרשים, משירות איזון העומסים דרך ה API front end דרך שירותי ה Meta Data ובדיוק כמו שאר רכיבי הפלטפורמה גם כאן הכל שריד והכל יכול לגדול לינארית ביחד עם הנפח ועומס העבודה שלנו.

אנחנו מרוויחים כאן את כל שירותי ניהול וייעול המידע של נוטניקס, דברים מאד לא נפוצים בעולם האובג'קט כמו Compression, או סנפשוטים. למעשה אנחנו מרווחים באמצעות מינוף הסנפשוטים כאן פעולה שנקראת Fast Copy ובאמצעותה לקצר מאד פעולות של MAPR, במקום לחייב פעולות של Copy and Delete אנחנו פשוט ממנפים פעולות מטה-דאטה על בסיס הפויינטרים של הסנפשוטים.

Select הוא פיצ'ר מגניב נוסף שמאפשר למנועי Query לקצר תהליכי מיון וגישה למידע, במקומות בהם נדרשת כמות גדולה של אובייקטים לגישה, אפשר לאגד את כל רשימת האובייקטים הנדרשת לAPI request יחיד במקום מאות אלפי או עשרות אלפי בקשות.

מתחת לפיצ'רים האלו יש מנגנונים של Predictive reads שמתבססים על intelligent caching על מנת לוודא שהמידע שלנו מוזרם למעלה כמה שיותר מהר וכמובן ה Data Locality שמוודא שמנועי ה metadata ניגשים למידע שלהם באופן מקומי ויעיל ולא על גבי הרשת.

כל אלו ביחד מבטיחים זמני תגובה סופר מהירים שנמדדים בעולם האובג'קט כ TTFB או Time to First Byte. השילוב הזה גם מבטיח את אותה איכות ביצועים גם במקומות בהם נעשה שימוש באובייקטים גדולים וגם במקומות בהם נאספים אובייקטים קטנים ככה שאנחנו יודעים להראות ביצועים גם ב throughput מאד גדול וגם בכמות פעולות put/get שנמדדות באלפים בשניה.

הפתרון כולל כמובן גם את כל מה שנהוג לצפות מפתרונות אובג'קט בימינו כמו Cloud Tiering, הצפנת מידע ברמת FIPS140-2 או WORM ברמת SEC17, יכולת legal hold, מנוע life cycle management  גמיש וכל מני מטעמים כאלו.

משהו קצת פחות נפוץ שהזכרתי למשל בהקשר ל Caringo זו האפשרות לגשת לאותו מידע גם כקבצים ולא רק כאובייקטים. יכולת מאד שימושית למשל בעולמות של הוספת מנוע אנליטיקה מודרני בסביבות ייצור מסורתיות, כל עולמות ניהול קווי היצור למשל שבהם המידע נאסף מהבקרים בפורמט NFS אבל אנחנו רוצים לאסוף ולנתח אותו בdata lake המודרני שלנו.

טוב, זה יצא יותר טכני ובלי תמונות הפעם, מקווה שתסלחו לי, השתדלתי לא למרוח סתם, אשמח לשמוע מה דעתכם.

שלכם כרגיל,

ניר מליק

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת /  לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת /  לשנות )

מתחבר ל-%s