מפריז הביתה

לפני שלוש שנים וקצת, סיפרתי לכם כאן על ההחלטה לעזוב את We-Ankor ולהתחיל תפקיד חדש בחברת אינפינידט. זה היה פוסט ריגשי, הוא דיבר על הטיול שלנו לצרפת, ההחלטה שלנו להתחתן ועל איך בכלל הגעתי לעבוד באנקור, עוד לפני שהיתה We-Ankor.

לא מזמן, סיפרתי לכם גם שבתוך סערת הקורונה יצאתי לחל"ת מאינפינידט וזה הזמן לעדכן אתכם על שינוי סטטוס נוסף. זו פעם שניה שיש לי הכבוד להכנס לנעלים הגדולות של טל שפסה, בפעם הקודמת הוא עזב את אנקור ואני הפכתי שם ראש צוות פריסייל והפעם טל יוצא להרפתקאה חדש בגוגל ואני הצטרפתי לחברת קמינריו כ Senior Solutions Architect ואני חוזר לעבוד עם חברי הטוב ארתור קיסלנסקי.

הסיפור ההוא היה מלא טיסות, הוא התחיל בטיסה לפריז ונגמר בטיסה להודו והיה רק ההתחלה של תקופה עמוסה בטיסות להודו, קוריאה, סינגפור, הפיליפינים, יפן ואוסטרליה ובשינוי קיצוני, הפרק הזה בסיפור מסתיים בבית.

במהלך החל"ת, בשיא ההסגר שנכפה על כולנו, רואיינתי על ידי חברת CloudShare  לבלוג שלהם. הכרתי אותם כלקוח בתקופת אינפינידט וכבר יצא לי להתראיין עבורם למחקר פנימי שלהם וככה יצא שהם רצו לשמוע ממני על הנסיון שלי בעבודה מרוחקת הרי, כשעובדים מול אסיה, חלק ניכר מהעבודה מתבצע מרחוק ובחברות מתפתחות, כשמקימים צוותים מקומיים קטנים, הם בדרך כלל מתחילים לעבוד מהבית עד שהפעילות גדולה ומבוססת מספיק כדי להצדיק משרדים.

https://www.cloudshare.com/blog/the-big-share-a-qa-with-technical-sales-leader-and-remote-veteran-nir-malik

מפה לשם, עד שהראיון נערך והפרסום עוצב ואושר, הוא התפרסם כשכבר כולנו כאן בשוק הישראלי התחלנו לחזור לשגרה ואני כבר התחלתי לעבוד בקמינריו. הזמן טס כשמסתגרים. בכל מקרה, מזל שיש לי נסיון בעבודה מהבית כי עכשיו, באופן רשמי, אני עובד מהבית, זו הפעם הראשונה שיש לי Home Office רשמי. מזל שאישתי עבדה מהבית בתקופת הקורונה והבת שלי למדה באמצעות זום והיתה לי הזדמנות לחשוב על דברים שצריך לשנות בחדר המחשב כדי שיהפוך באמת מקום נעים לעבוד ולא חצי מחסן כמו שהיה עד לא מזמן.

את קמינריו הזכרתי כאן בבלוג רק בחטף בעבר, החברה בדיוק עשתה שינוי במודל המכירה שלה והפרידה את מכירות התוכנה, ליבת הפעילות של החברה, ממכירות החומרה. לא ידעתי את זה אז כמובן, כמשקיף מהצד, אבל זה היה בעצם צעד ראשון בתוך שינוי די גדול. קמיריו קיימת מ 2008 והיתה מהחלוצות של עולם ה All Flash ולפני שנתיים בערך פיתחה גם פתרון המבוסס על הדור הבא של מערכות האחסון, מערכות All NVME ובעצם ביישום של הטכנולוגיה הזו היה הזרז לצעד הבא בשינוי.

זוכרים שסיפרתי לכם לא מזמן שביקרתי במעבדה של סיגייט? אז באחת השיחות שניהלתי שם במהלך הביקור, דיברנו על NVME ואני עניתי כמו איש סטורג' קלאסי, שמערכות NVME הן מערכות יקרות מדי כדי להיות רלוונטיות ללקוחות והם בעצם דיברו על משהו אחר, הם דיברו על הפרוטוקול NVMEoF. זה היה קצת שיח חרשים אבל מסתבר ששיחה דומה התרחשה בקמינריו לפני שנתיים. אחד החסרונות של מערכות מבוססות תקשורת SAS הוא הקשר הישיר בין הבקרים למדיה.

SAS זה בעצם ראשי תיבות של Serial Attached SCSI והפרוטוקול הזו הוא המקשר בקשר point to point בין יחידות המחשוב שלנו לדיסקים. אחד הדברים המתאפשרים לנו עם זה להציג את אותה המדיה לכמה יחידות מחשוב ובכך לנתק את הקשר הישיר ביניהם. עכשיו ניתן לנתק את הקשר הגורדי הזה ובכך לאפשר הרבה יותר גמישות במבנה מערכת האחסון, ניתן להגדיל את המערכת בנפח אחסון (scale up) או בכוח מחשוב (scale out) באופן הרבה יותר גמיש מאי פעם. אם מערכות scale out קלאסיות מחייבות להגדיל גם את נפח האחסון לצד כוח המחשוב ויחידות האחסון מקושרות פיזית ליחידות מחשוב ספציפיות, עכשיו אפשר נגיד לחבר שמונה יחידות מחשוב לאותה יחידת אחסון.

ההפרדה בין חומרה לתוכנה בצד המכירתי וההפרדה בין המחשוב לאחסון בצד בטכנולוגי, הקפיצה את קמינריו לשלב הבא באבולוציה שלה, שלב הענן, וכאן, אני מצטרף לתמונה. היום אנחנו יודעים למכור ללקוח Cloud Native, פתרון אחסון מבוסס ענן, על AWS, GCP ועל מיקרוסופט אז'ור, לנתק עבורם את הקשר שקיים בפלטפורמות האלו באופן מובנה, בין נפח אחסון לביצועים ובין ביצועי אחסון לביצועי מחשוב, ועל ידי כך לחסוך להם כסף, לשפר להם ביצועים ולתת להם עוד כמה יכולות שחסרות להם היום או קיימות בצורה בסיסית יותר כמו מנגנון יעיל של סנפשוטים וכו'.

תישארו איתי, מבטיח להמשיך ולחלוק ומקווה שיהיה לכם מעניין למרות שמעכשיו אני עובד מהבית, אין יותר שיפודים אקזוטיים ביפן או טיסות מעל אפגניסטן.

שלכם כמו תמיד,

ניר מליק

שי אגסי, אחסון מבוסס פלאש ותותחים גרמניים

 רכבים אוטונומיים ומערכות אחסון מבוססות Flash

במסגרת תפקידי כאיש פריסייל בספקית האינטרנט 012, השתתפתי בכתיבת מענה למכרז תקשורת עבור חברה חדשה ומהפכנית בתחום הרכב, שבאותם ימים הייתה הבטחה גדולה בתחומה, בטר-פלייס. זה היה מכרז מרתק ובמסגרתו נחשפתי לאתגרים של פריסה ארצית של תחנות טעינה, ניהול ציי רכב, ניטור מערכות הרכב בזמן אמת או בהבזקים קצרים והזרמת תוכן בחזרה אל הרכבים. היזם שמאחורי החברה, שי אגסי, הבטיח מהפכה אמיתית בתחום הרכב, הצליח לרתום לפרויקט תמיכה של מדינות כמו ממשלת יפן שהתגייסה לתמוך בפיילוט של מוניות חשמליות בטוקיו, בנקים גדולים ואת חברת רנו העולמית שהייתה היצרנית הבלעדית של מכוניות בטר-פלייס.

לצערי החברה קרסה שנה אחת בלבד אחרי שהחלה לספק מכוניות ללקוחות פרטיים. האמנתי בחזון אותו הוביל אגסי. כולנו חכמים בדיעבד ונראה שחלקים מהמודל בו בחר אגסי, כמו חיוב טעינה בעמדות החברה בלבד ובחירה ברכב נטול סקס-אפיל לחלוטין, הביאו לכישלון וזאת בניגוד למשל להצלחה היחסית של חברת טסלה של אלון מאסק.

הפרק האחרון של הפודקסאט המצוין של הדסק הכלכלי של תאגיד השידור "כאן" עוסק בטכנולוגיה בעולם הרכב והוא זה שהזכיר לי את בטר-פלייס, בפרק מתראיין שי אגסי ובטר-פלייס שלו מוזכרת כמה פעמים במהלך הדיון. השאלה המרכזית בה עוסק אמסטרדמסקי שהנחה את הפרק היא האם בקרוב נפסיק בכלל לרכוש מכוניות פרטיות? האם הבשלת הטכנולוגיה של רכבים אוטונומיים, ידידותיים לסביבה, ביחד עם התרחבות מודל הצריכה השיתופי בסגנון אובר או ליפט תביא לכך שבקרוב פשוט לא נרצה להחזיק רכב משלנו? הדוברים בפרק בטוחים שכן. בסופו של דבר, נאמר פרק, בעתיד הקרוב מאד, שלוש, חמש או עשר שנים, לא נרכוש מכוניות פרטיות, ילדינו לא ילמדו לנהוג בעצמם ושוק הרכב יעבור תהליך מאד מואץ של התגבשות למספר מאד נמוך, ארבע או חמש, יצרניות ענק שיחלקו ביניהן את השוק.

הנקודה האחרונה, התגבשות השוק למספר קטן של יצרניות ענק, הוא הקישור שלי חזרה אל עולם התוכן שלנו כאן, עולם ה IT. לאחרונה, במסגרת דיון פנימי על השוק כולו, חבר שלי, עופר טל, שלח קישור לרשימה של מעל 100 יצרניות All Flash Storage ובמסגרת המאמר שהכיל את הרשימה, יש גם קישור לרשימה עתיקה של לא פחות מ 172 יצרניות SSD. 172 יצרניות SSD לעומת שלוש עד שבע יצרניות דיסקים, תלוי לרשימה של מי מאמינים. למעלה ממאה חברות מייצרות רק או גם מערכות All Flash.

ברור שלא לכולן יש עתיד. ברור כי על רוב היצרניות הקטנות, אלו המתמחות ב All Flash ואלו שמייצרות "גם" All Flash, על רובן לא שמעתם ולא תשמעו. גם המצליחות יחסית, מתקשות לייצר רווח, Pure היא אחת החברות המצליחות בעולם ה All Flash והיא מדווחת על הפסד של 41.6 מיליון דולר ברבעון האחרון וזה עוד שיפור מהפסד של 78.8 מיליון דולר ברבעון המקביל בשנה שעברה.

מה מייחד כל אחת מאותן מאה פלוס חברות All Flash? האמת היא פשוטה ואת רובן לא מייחד שום דבר וזו הסיבה שרובן תעלמנה. לחלקן יש משהו מיוחד, NetApp למשל מקדמת די בהצלחה את חזון ה DataFabric שלה ומערכות ה All Flash הן רק חלק מהמכלול שם. לנימבל, שנרכשה על ידי HPE, היה ה InfoSite, מערכת האנליטיקה המתקדמת שלה. השורה התחתונה, מי שמתמקד במדיה, בחומרה מהירה, פשוט מיישר קו עם העדר.

הערת אגב על זמינות ותשיעיות

בימים הקרובים אמור להתפרסם whitepaper חדש של IDC שמדבר על החשיבות של זמינות מערכות ברמה גבוה ומציין אותנו לטובה כיצרן היחיד שמתחייב לרמת זמינות של שבע תשיעיות.

כמאמר המשוררת, התשעיות לא מעניינות אף אחד אם הלקוח לא מרוצה אבל אני לא מודאג, יש לנו עוד כמה דברים מגניבים מעבר לרמת זמינות המערכת.

nines dont matter

https://www.zazzle.com/nines_dont_matter_t_shirt-235118578582589495

הערת אגב לגבי חמש תשיעיות, מי שעושה חיפוש על המושג five nines יכול ליפול גם על תותחים גרמניים ממלחמת העולם הראשונה, תותחים בקוטר 15 סנטימטר או 5.9 אינטש. לפי ויקיפדיה תותחים אלו, כמו תותחים גרמנים אחרים מאותה תקופה, הוטבעו במילים Ultima Ratio Regum, בתרגום חופשי מלטינית – הטיעון האחרון של המלך. ככל הנראה מסורת שהתחיל המלך לואי הארבעה עשר לציין שהמלחמה היא המשך הוויכוח.

By Kadin2048 (Own work) [GFDL (http://www.gnu.org/copyleft/fdl.html), CC-BY-SA-3.0 (http://creativecommons.org/licenses/by-sa/3.0/) or CC BY-SA 2.5 (https://creativecommons.org/licenses/by-sa/2.5)%5D, via Wikimedia Commons

מילה על אבטחת מידע לסיום

הידיעה הבאה הכניסה בי יאוש מסוים, איש ה NSA הורשע בבית המשפט על פי הודעתו. מידע מסווג שלקח הביתה, נגנב על ידי שירותי המודיעין הרוסים תוך שימוש בתוכנת האנטי-וירוס של קספרסקי שהותקנה על המחשב שלו. למה זה מכניס בי ייאוש? כי כמו שנכתב כבר בבלוג שלי כאן וכאן, חינוך עובדים להתנהגות מודעת הוא חלק משמעותי במערך אבטחת המידע של הארגון ואם אפילו עובדי NSA לוקחים חומר מסווג הביתה סם כך, מה יגידו אזובי הקיר?

זה הכל להפעם,

אשמח לשמוע מה דעתכם!

שלכם,

ניר מליק

 

How to PoC, Cisco UCS M5 and some other stuff

How to PoC

אז, שוב נסעתי להודו בשבוע שעבר, אחרי שכבר חלקתי אתכם קצת חוויות מהנסיעה הקודמת, הפעם אני רוצה לדבר קצת על הצד הטכני של התפקיד שלי. הנסיעה הקודמת כללה בעיקר פגישות עם לקוחות והפעם המטרה העיקרית של הנסיעה היתה ביצוע PoC אצל לקוח פוטנציאלי.

תהליך PoC הוא תהליך רב שלבי שמתחיל עוד הרבה לפני שנפגישם בפועל באתר הלקוח. האתגר הראשון הוא האתגר הלוגיסטי, המערכת אותה מדגימים ללקוח צריכה להגיע שלמה ותקינה אל אתר הלקוח, אם אתה מדגים תוכנה זה קצת פחות מאתגר, אם אתה מדגים מערכת ששוקלת מעל טון והיא צריכה להגיע לצד השני של העולם זה יכול להיות מאד מורכב. אם אתה עובד כמוני מול השוק ההודי וצריך לשלוח מכונה ענקית באמצע עונת המונסון, קח הרבה אויר כי הרבה מאד הולכים להשתבש בדרך עד שתזכה לראות את אישור המסירה של המכונה.

תהליך מקביל שחייב להתרחש לפני הגעה לאתר הלקוח הוא תהליך תיאום הציפיות. יש לנהל מספר שיחות עם הלקוח וללוות את השיחות האלו במסמכים, לפני שמישהו נכנס לרכב או עולה על מטוס, חייבים להבין מה הלקוח מצפה לראות, האם הציפיות שלו מציאותיות ומה נדרש על מנת לעמוד בציפיות אלו. הצוות שלי ואני משתמשים בטמפלט די מסודר על פיו אנחנו עובדים, אנחנו תמיד שולחים את הטמפלט הזה מראש ללקוח כדי שיאשר שתכנית הPoC נראית לו הולמת את צרכיו והוא כמובן גם יכול להוריד או להוסיף דברים לפי צרכיו. בכל שימוש בטמפלט חשוב לנקות אותו לפני שליחה ללקוח, אין צורך בעמוד שלם של בדיקות openstack אם הלקוח לא מתכוון לבדוק את זה.

תהליך תיאום הציפיות צריך להיות דו-כיווני ולפעמים מדלגים בטעות על התובנה הזו, חשוב מאד שהלקוח ידע מה מצופה ממנו ויאשר שהוא, הצוות שלו וסביבת העבודה שלו יהיו מוכנים לפעולה. הפעם לא היה לחץ גדול מדי של לוחות זמנים אבל יש פעמים בהם המתנה של שעתיים לפתיחת פורטים ב firewall יכולה להיות מאד מעצבנת. גם כאן אנחנו משתמשים בטמפלט מתעדכן של מה נדרש מהלקוח, הרשאות, פורטים, תקשורת פנימה אל חדר השרתים והחוצה אל המשרד לעדכונים, הרשאות כנסיה פיזית אל חדר השרתים להדגמת יכולת שרידות וכו'.

ביצוע הליך ה PoC עצמו מצריך קצת ידע טכני, קצת "מכירתיות" (salesmanship) וקצת מחשבה מהירה על קצות האצבעות כי כשצריך גם להתגבר על פערי שפה ותרבות ולא רק על האתגר הטכני עצמו, לפעמים נוצרת אי-ודאות, לא תמיד ברור מה בדיוק מתרחש עכשיו, למה עושים משהו עכשיו או למה לא עושים כלום כבר כמה דקות, נדרשת מידה יפה של רגישות כדי לאזן בין הרצון לשמור על רוח חיובית ואווירה טובה לבין הרצון באמת לקדם את תכנית ה PoC אל סופה המוצלח.

תהליך ה PoC הוא חלק מתהליך המכירה ולכן מאד חשוב לתעד את מה שנעשה כדי להציג את התוצאות גם להנהלה הבכירה יותר שלא תמיד תהיה מעורבת ישירות ב PoC, יש לוודא עם הלקוח שהוא מבין מה רואים בכל שלב ולהדגיש במה זה שונה ממה שהוא עשה עד היום או במה זה שונה ממה שהמתחרים יכולים להראות לו, גם בשלב הזה רוח חיובית, התלהבות ו"מכירתיות" מאד יכולים לעזור להעביר את המסר, אני אפילו לפעמים אומר ללקוח משהו בסגנון "זה בסדר להראות שאתה מתלהב, מה שאני מראה לך די מגניב", זה לא חייב להיות הניסוח המדויק ולא בכל מערכת יחסים זה מתאים אבל הכיוון אליו אני מנסה להוליך את השיחה עם הלקוח הוא כיוון של חוויה משותפת, לפעמים זה עובד וכשזה עובד זה הופך גם התהליך העסקי וגם את החוויה הרגעית למוצלחים יותר, אחרי הכל מי רוצה לבלות 3 ימי עם זרים מוחלטים בשתיקה מביכה?

העיצה האחרונה בנושא להפעם היא ההכנה ברמה האישית, חובה לנסות בעצמך במעבדה כל דבר שאתה מתכנן לעשות אצל הלקוח כדי לדעת איך נראית התוצאה הרצויה ולנסות, אם אפשר, גם לתת מענה אם מקבלים תוצאה אחרת. כדאי מאד להביא איתך כל מה שאולי יהיה נחוץ ל PoC מוצלח, אני הבאתי איתי הפעם גם מפתח שוודי כי אמרו לי שאולי יהיה צורך להזיז את המכונה מחדר שרתים אחד לשני. הבאתי גם שני סטים של מתאמי חשמל, כבל RJ45, טושים מחיקים, מתאם VGA-HDMI, דיסק קשיח נייד, דיסק-און-קי ומחברת. אלו דברים שבכל מקרה כדאי שיהיו בתיק אבל אם אתה נוסע במיוחד להודו כדי להדגים משהו, כדאי מאד שיהיה לך כל מה שאתה צריך בשביל להדגים אותו. על הדרך הכנתי גם על המחשב שלי עותק של כל תוכנה ו virtual appliance שיש לנו שחשבתי שנזקק לו וגם הורדתי מראש חלק ניכר מהתיעוד שחשבתי שיהיה בו צורך (ומצאתי עצמי עושה השלמות תוך כדי כי לא חשבתי על הכל )

לא לשכוח גם להנות, גם לעבוד במשרד של מישהו אחר יכולה להיות חוויה מעניינת, ללכת איתו לאכול צהרים בחדר האוכל של העובדים, לראות איך נראה תור לצ'אי בשעה 4 בבניין של 6000 עובדים הפעם הראשונה, לקנא בהם שיש להם דוכן של מיצים מפירות טריים ושכוס מיץ אננס טרי עולה פחות ממה שעולה כאן ובכן, כמעט כל דבר.

 

Cisco UCS M5

Cisco הציגה לא מזמן את דור 5 של השרתים שלה, שרתי ה UCS. השרתים החדשים תומכים בסדרת המעבדים החדשה של Intel, Scalable Processors או בקיצור SP, מספקים תמיכה בכמות כפולה של RAM לעומת דגמים מקבילים בדור הקודם וכן תמיכה בכמות גדולה יותר של מאיצים גרפיים כולל תמיכה בשני כרטיסי Nvidia בשרת הלהב הכי פופולרי, B200. הדור החדש כולל כרגע שני שרתי להב ושלושה שרתי Rackmount.

במקביל הוצג דור חדש למערכת הניהול, UCS director 6.5, שכולל מעבר לתמיכה בדור השרתים החדש גם שדרוג ביכולות האוטומציה לפריסה של פתרונות flexpod אוטומציה של תהליכים בסביבות hyper-flex.

הערת שוליים חשובה שתשמח מאד הרבה מאד אנשי פריסייל שמוכרים שרתים באופן כללי: הדור החדש של מעבדי אינטל כולל יותר ערוצים ופחות רמות כלומר, אם הדור הנוכחי כלל עבור כל מעבד 4 ערוצים (Channel) וכל ערוץ תמך בעד 3 רמות (Rank), הדור החדש כולל 6 ערוצים עם שתי רמות. כמות רכיבי הזיכרון הכללית נשמרת (12), ההנחתה במהירות כאשר משתמשים בכמות גדולה של רכיבי זיכרון יורדת וסה"כ צריך להתעדכן בכללי האכלוס החדשים כדי שלא למכור בטעות ללקוחות כמות רכיבים לא נתמכות. אם אתם דומים לי אז תזדקקו לכמה וכמה קונפיגורציות עד שהמספרים החדשים יבואו לכם באופן טבעי.

intel 6 channel and rank

בשולי החדשות

Gartner 2017 Magic Quadrant for Solid-State Arrays

Gartner פרסמו לא מזמן את הדירוג שלהם למערכי אחסון מבוססי Flash, טיפה מוזר לראות את ריבוע הקסם כל כך עמוס הרי לא יכול להיות שכל מי שמשחק בקטגוריה הוא גם מוביל בקטגוריה, או שמשהו שתהליך הבדיקה דורש ריענון או שמערכי All Flash הפכו עד כדי כך Commodity שכל מי שנוגע בהם מצליח. אני מהמר על אופציה א'. עוד מעניין היה לראות בריבוע ה visionaries שTegile מדורגים טיפה יותר גבוה מטינטרי שהנפיקו בבורסה בניו-יורק לאחרונה. אמנם ההנפקה של טינטרי היתה קצת נמוכה אבל לא ידעתי שהחברים בטג'ייל עוד בכלל בביזנס אז הנה, כל יום לומדים משהו חדש.

MQ Graphic 7 17 17.jpg.imgo

 

 

Google Cloud Transfer Appliance

בשנים של איחור, אחרי שAWS מספקים גם Appliance בשם Snowball וגם את המגה-משאית שלהם Snowmobile, גם גוגל מצטרפים עם מארזי דיסקים מוקשחים המספקים עד 100TB במארז של 1U או 480TB במארז של 2U  (נפחים לפני דחיסה), המיועדים לאפשר ללקוחות העתקה של נפחי מידע גדולים מאתר הלקוח אל שירות הענן של גוגל בלי המורכבות והעלויות של הגירה על גבי קווי התקשורת.

 

Mellanox Spectrum-2

הולי שמולי, החברים ביקנעם היו כנראה מאד עסוקים בחודשים האחרונים והנה הם יוצאים בהכרזה על סדרת מתגי Ethernt חדשה שתומכת במהירויות 200 וגם 400 ג'יגה לשניה, רוב הלקוחות בארץ לדעתי עוד לא עברו ל 10Gb ואני מהמר גם שרוב הפורטים בעולם עוד לא עברו הסבה והנה זו כבר טכנולוגיה של פעם, די מדהים.

 

 זה הכל להפעם חברים,

אשמח לשמוע הערות והארות

שלכם תמיד,

ניר מליק

WannaCry and Dell EMC world

It my party and i'll #WannaCry if I want to

מתקפת הסייבר הענקית בסופ"ש האחרון הזכירה לי סיפור על חברת תיירות ישראלית גדולה שהיתה בזמנו לקוחה שלי. בשבוע שלפני פסח כלומר באחד השבועות הכי עמוסים בעולם התיירות הישראלי, הוצפנו מספר תיקיות בארגון בעקבות חדירה של כופרה לארגון (ransomware) ובין התיקיות המוצפנות היתה תיקיה אחת חשובה במיוחד לפעילות הארגון ואנשי הIT היו תחת לחץ נוראי למצוא פתרון מהיר לבעיה.

השתלשלות האירועים תישמע מוכרת להרבה מאד אנשי IT, לחברה היה פתרון גיבוי מיושן שלא נבדק כמו שצריך כי הוא התבסס על NDMP ושחזור מדגמי של NDMP  הוא לא תענוג גדול, מערכת האחסון שלהם עמדה בפני שדרוג ולא נשאר להם מקום כדי לשמור עומק משמעותי של snapshots, כמו גופי IT רבים בעולם הם עבדו קשה עם מעט מאד כוח אדם ולא היה להם זמן לכתוב נהלים ולתרגל "מקרים ותגובות" לאירועים סייבר שונים כי הם היו עסוקים עד מעל לראש בחיי היום-יום, בקיצור, לא היה שם שום דבר מיוחד, הם היו גוף IT סטנדרטי.

ביום האירוע, מרוב לחץ, במקום לבצע שחזור מתוך snapshot כלומר, במקום להציג את snapshot הצידה ולהעתיק מתוכו את המידע הנדרש, הם ביצעו revert to snap לעותק הנקי היחיד שהיה להם. התהליך היה פשוט ונוח, לקח להם שעה להחליט לבצע את זה וחצי דקה לבצע את זה בפועל וזהו, הם חזרו חצי יום אחורה בזמן לתיקיה נקיה מווירוסים והכל עבד ואושר גדול ו… הם לא מצאו את patient zero, הם לא ניתקו את התחנות המזוהמות מהרשת, התיקייה הקריטית הוצפנה מחדש ועכשיו בלי גיבוי תקין ובלי סנפשוט לחזור אליו, לא הייתה להם שום ברירה אחרת מלבד לשלם את דמי הכופר.  אמא שלי היתה אומרת "היה שמח".

כמו שאני מדגיש לא פעם כשאני כותב על נושאי אבטחת מידע, זה לא תחום ההתמחות שלי אבל יש כמה דגשים שכל איש תשתיות אמור להכיר:

  1. יש להקפיד ולעדכן את כלל המערכות באופן קבוע
  2. יש לגבות ולבדוק את תקינות הגיבוי
  3. יש לחנך את העובדים שלנו
  4. יש לכתוב נהלי חירום ולתרגל אותם באופן קבוע

כמובן שזה המקום להשוויץ שבמערכות Infinidat אפשר להריץ 100,000 snapshots בלי לפגוע בביצועים וכמעט בלי לצרוך נפח וכל אחד מהסנפשוטים ניתן להפוך ל read/write ככה שאפשר ליצור עומק מאד משמעותי של נקודות שחזור אפשריות וממש אין צורך לבצע revert ולוותר עליהן במקרה שחזור.

DellEMC world

בשבוע שעבר נערך כנס Dell EMC world השנתי בוגאס, לראשונה במתכונת המאוחדת לאחר הרכישה הענקית. אלו ההכרזות המרכזיות בעולם האחסון ולטעמי יותר מעניין מה לא נכלל בהן מאשר מה שכן.

VMAX – הוכרזה גרסאת High-End חדשה, 950F, שאמורה לספק שדרוג ביצועים משמעותי בעיקר בגלל שימוש במעבדים עדכניים יותר ותוספת זיכרון. מעניין לציין שנעדרה כל התיחסות לדגמי VMAX שאינם מבוססי All Flash, לאן הם נעלמו מהרדאר? DellEMC  טוענים כאן ל6 תשעיות זמינות ו the register מזכירים נכון שאנחנו באינפינידט כבר מזמן מדברים על 7 תשעיות אז כולכם מוזמנים לבדוק אותנו במבחן השוואתי.

XtremeIO – גם כאן כלול שדרוג חומרה שמספק שיפור ביצועים אבל נסיגה מוחלטת מהכרזת יכולות NAS ובשעה טובה הוכרזה יכולת מובנית לרפליקציה אבל וזה אבל גדול, זו הכרזה על יכולת עתידית כלומר גם עכשיו אחרי ההכרזה הזו לקוחות XtremeIO צריכים כלי חיצוני לרפליקציה. Xterme היו מהחלוצים בעולם ה All Flash  , מהחלוצים לספר לנו עד כמה מערכות All Flash יותר יעילות ממערכות היברידיות אבל אם יורדים לפרטים הקטנים אז העיסק נעשה קצת יותר מורכב, בשביל לקיים קלאסטר מלא של 8 בריקים צריך זו מתגי אינפיניבנד אז זו לא מערכת זולה ופשוטה במיוחד, בשביל לספק 2.8PB של נפח אחסון, בקלאסטר מלא של 8 בריקים, הם צריכים להתבסס על יחס של 3:1 וגם צורכים כפול מכמות חשמל שצורכת מערכת מלאה של אינפינידט שמספקת 2.8PB לפני דחיסה אז מה בדיוק כל כך יעיל וזול כאן? שימו לב שלא מדובר כאן על סתם FUD או לכלוך כי אני עובד אצל יצרן מתחרה אלא הכל אחד לאחד מדף המוצר שלהם עצמם

Isilon – גם בגזרה זו אין רבולוציה אלא אבולוציה, שוב מדובר על שיפור ביצועים, בעיקר באמצעות שדרוגי חומרה וגם כאן אין למשל איזכור לנסיגה מיכולות ה iSCSI.

Unity – מרגיש כמו תקליט שבור, שוב שדרוג חומרה קל בגרסאות All Flash בלי שינוי משמעותי בתוכנה. העובדה שעדיין, ב 2017, בדור רביעי של מערכות "unified" עדיין ניתן לבצע דחיסה רק לשירותי קבצים ולא לשירות Block מזכירה לנו כי בקרביים, ה Unity עדיין נשענת על ארכיטקטורה נפרדת של קלריון וסלרה לשירותים השונים, האריזה נוצצת והולכת ומתהדקת מדור לדור אבל זו עדיין לא באמת מערכת Unified  אלא רק "Unified" או כמו שאבי דיכטר קורא לזה, מערכת "יעני" Unified.

Faster Than All Flash

אם אתם זוכרים אז בפעם הקודמת סיפרתי לכם על מבצע ה Faster Than All Flash שלנו שבו אנחנו מציעים ללקוחות לבחון אותנו בשטח, בתנאי אמת, עם real live hand grenades ולהציב אותנו ראש בראש מול מוצרי All Flash, במידה ולא נעמוד בתחרות ולא נספק ביצועים טובים מהם תחת עומסי עבודה אמיתיים ולא איזה בנצ'מארק סינטטי, אנחנו נתרום 10,000$ לארגון צדקה לבחירתו של הלקוח.

מי שרוצה מוזמן להקשיב לבריאן סטובר שלנו מדבר על העובדה של All Flash הוא לא הפתרון היחיד לאתגרי האחסון שלכם ולמה אנחנו חושבים שהפתרון שלנו יותר נכון:

זה הכל להפעם חברים,

בפעם הבאה סיכום של IDC storage transformation בפרנקפורט, סיכום של VeeamON בניו אורלינס ומסלול טיול מומלץ בטרנסילבניה (לא צוחק!)

שלכם,

ניר מליק

יש לנו דלת חדשה

בחודש הבא אנחנו משיקים דלת.

door

אני מסיים עכשיו חודש שני בתפקיד כאן באינפינידט. לפני שבועיים השקנו סופית (GA) את גרסת מערכת ההפעלה שלנו 3.0.10 ובחודש הבא אנחנו משיקים דלת. אנחנו אחת מחברות האחסון הכי מגניבות בעולם וכולם עושים כאן עניין מדלת. דלת. דלת יפה, עם מסך מגע שמוטמע בה ומציג מדדים שונים מתוך מערכת האחסון עצמה אבל, דלת. סך הכל דלת.

נראה בעצם שמהכל עושים כאן עניין. זה חלק מהתרבות הארגונית של החברה. זו חברה נרגשת ומתרגשת. כל דבר כאן הוא אירוע, כל דבר כאן מתוכנן וכל דבר כאן נבדק, לעומק, ושוב נבדק, לעומק, כן, גם הדלת. זה כנראה חלק ממה שמאפשר לנו להיות חברה כל כך מצליחה. זה חלק ממה שמאפשר לנו להיות חברה רווחית בשוק שבו חברות קטנות נמכרות או מפסידות מאות מיליוני דולרים בשנה כדי לרכוש לעצמן נתח שוק. זה חלק ממה שמאפשר לנו, כנגד כל האנליסטים שאמרו לנו שלא נוכל למכור שום דבר לחברות המגה-אנטרפריז ושבלי פתרון All Flash אין לנו מה לחפש בשוק, למכור, הרבה ובגדול, לחברות הכי גדולות בעולם כמו British Telecom ולנצח שוב ושוב, גם במבדקי ביצועים ראש בראש, את מוצרי ה All Flash שמסביבנו.

מצגת ה Over View הגנרית שלנו מתחילה בשקף שכולל גם תמונה של מייסד החברה, משה ינאי. התמונה מייצגת קבוצה של אנשים שהולכת ביחד כבר הרבה שנים ובפעם השלישית בונה ביחד חברת אחסון. יש כאן מאות שנות נסיון מצטברות ובשבועות הראשונים זה מאד מרגש, יש לי תואר בהיסטוריה והתקדמתי יפה עד עכשיו כי אני מדבר ברור ומרשים גם כשאני לא יודע על מה מדובר והנה אני משחק סנוקר עם האיש שכתב את אלגוריתם ה FAST auto tier של EMC.

אז למי שלא יודע ורוצה סקירה כללית על מה בכלל אנחנו עושים כאן באינפינידט,  אנחנו חברת תוכנה המייצרת את מערכת האחסון הכי מתקדמת בעולם, לדעתנו. הקורא החד והחריף שואל את עצמו עכשיו למה אני כותב שאנחנו חברת תוכנה אם הרגע השקנו דלת והאם הכוונה היא ל software defined door והתשובה היא שלמעשה הדלת היא רכיב החומרה היחיד שאנחנו מתכננים ומייצרים בעצמנו, שאר רכיבי החומרה במערכת האחסון שלנו, InfiniBox, הם מוצרי מדף שאנחנו בוחרים, מרכיבים ובודקים תחת אינטגרציה מאד מחמירה (ממוצע של שלושה שבועות בדיקות אינטגרציה מלאות תחת עומס לכל מערכת שיוצאת מהמחסנים שלנו).

מערכת ה InfiniBox מתוכננת לעמוד בכלל הדרישות של לקוח High End ממערכת אחסון מרכזית מודרנית. אנחנו עומדים ברמת זמינות של שבע תשיעיות לכלל המערכת (חומרה ותוכנה ביחד) וכל הרכיבים שלנו בנויים בתצורת N+2 ככה שאנחנו יודעים לתת שירות גם בנפילה של שתי סוללות, שני בקרים, שני דיסקים, שני פורטים… אנחנו מספקים מענה לכלל הפרוטוקולים הנפוצים בעולם האחסון (FCP, iSCSI, NFS, Main Frame, SMB, Object למרות שבשביל הגילוי הנאות השניים האחרונים אינם עדיין GA), ונותנים בראש למערכות All Flash ברמת הביצועים שהמערכת שלנו מספקת למרות שרישמית אנחנו מערכת היברידית ונפח האחסון שלנו מבוסס כולו על NL-SAS.  מיד אכתוב קצת על איך אנחנו עושים את זה אבל זה זמן טוב להגיד שאנחנו שמים את הכסף שלנו איפה שהפה שלנו, כמאמר האמריקאים, והשבוע השקנו את הקמפיין שלנו שנקרא faster than all flash. אנחנו קוראים ללקוחות להזמין אותנו לתחרות ביצועים ראש בראש מול מערכות All Flash תחת עומסי עבודה אמיתיים ואם נפסיד, נתרום 10,000 דולר לארגון צדקה על פי בחירתו של הלקוח.

AFA_Shareables_Twitter_3

אז בוא נדבר קצת ביצועים. בכתיבה אין הרבה קסמים, כמו ברוב מערכות האחסון הקיימות היום, אם לא בכולן, כלל הכתיבות מתבצעות ל RAM שהוא רכיב האחסון הכי מהיר, המדיה הכי מהירה, ולאחר שאנחנו מרפלקים את הכתיבות בין שני רכיבי RAM  אנחנו מספקים Ack לשרתים. את הרפליקציה אנחנו מבצעים ב RDMA על גבי Infiniband ככה שהרפליקציה מאד מהירה ולכן גם התגובה לכתיבות מאד מהירה. 135GB RAM  מוקצים ל write cache במערכת ועוד 135 לרפליקציה של הכתיבות כלומר 270GB write cache לעומת למשל סה"כ 64GB לזוג בקרי A700 של NetApp ככה שזה כמעט לא משנה מה קצב הכתיבה של האפליקציות אל מערכת האחסון, יש לנו מספיק מקום פנוי לקלוט עוד ועוד כתיבות.

עכשיו מתחיל החלק האומנותי כי כאן מתחיל השוני האמיתי בין מערכת Infinibox ומערכות מתחרות. כמות הזיכרון הגדולה מאפשרת לנו לקחת את הזמן בהורדה של המידע לדיסקים, יש לנו זמן לתכנן ולחשב מה הולך לאן. זה אומר שמידע שמזוהה אצלנו כמידע "חם" נשאר לא דחוס ונגיש ב read cache, המידע החם גם יתוייג ככזה ברמת ה metadata כדי שנדע להתיחס אליו ככזה ואם המידע חם זה אומר שגם קוראים אותו ולכן בלוקים שאנחנו מזהים שיש אליהם כבר גישות קריאה קרובות, ייכתבו בצורה רציפה, Sequential, קרובה ככה שגם בקריאה מאוחרת יותר יהיה קל לגשת אליהם ביחד ותהליך הכתיבה לדיסקים עצמו יתבצע לכלל קבוצות ה Raid הוירטואלית על גבי כלל 480 הדיסקים במערכת.

בקריאה אנו מספקים עד 103TB של SSD לטובת Read Cache ואם תחשבו על זה, אז למרות שמדובר במערכת היברידית, מדובר על סדרי גודל של All Flash, כמה פעמים דיברתם עם יצרן All Flash על 200TB של נפח מידע והוא הציע למכור לכם 50TB של נפח פיזי ולספק את השאר באמצעות טכנולוגיות Efficiency? בשימוש במספר גדול של אלגוריתמים שונים ל Pre-Fetch אנחנו מאכלסים את ה Cache שלנו באופן מיטבי ומסוגלים להגיע עד ל 4MB של מידע שאנחנו צופים שהלקוח צריך עבור כל קריאה שהוא ביצע לעומת למשל 1MB מקסימום במערכות VMAX. אנחנו בוחנים בזמן אמת ובאופן אוטומטי את יעילות האלגוריתם שבו עשינו שימוש ואם הוא לא יעיל נסמן את זה לעצמנו ונפעיל אלגוריתם אחר, ככה אנחנו מגיעים גם למהירויות של All Flash בקריאה והממוצע שלנו מסביב לעולם עומד על בסביבות 95% Cache Hit. אם כתבנו את המידע לא יעיל אל הדיסקים מנגנוני ה Pre-Fetch צריכים לעבוד קשה יותר ולכן קיים גם מנגנון שמבצע סידור מחדש של המידע ככה שהגישה הבאה אל הדיסקים תהיה יעילה יותר.

בפוסט הבא אכתוב על מבנה ה InfiniRaid אבל נראה לי שזה מספיק להפעם, מה שרציתי להדגיש זה עניין הביצועים ובעצם אני מקווה שהעברתי את הנקודה העיקרית שלמרות שהפתרון שלנו הוא פתרון היברידי, יש לנו יותר חומרה מהירה מאשר בהרבה פתרונות All Flash וזו גם הסיבה שאנחנו מצהירים בלי להסס על כאלו מספרים גבוהים.

שלכם תמיד,

ניר מליק

מערכות קטנות (פיזית) וסקסיות, דגמים חדשים של NetApp All Flash

הבטחתי ולכן אקיים, פוסט תמציתי, תכליתי ובלי שיעור היסטוריה!

בשבוע שעבר הושקה באופן רשמי מערכת ה NetApp All Flash FAS A200 הסקסית והנה היא כאן לפניכם

בחזית 24 דיסקים SSD ומאחור שני בקרים, 8 פורטים 10/16Gb ועוד 2 פורטים 10Gb יעודיים לקישוריות קלאסטר.

a200-back

המערכת תומכת בגידול עד 144 דיסקים עבור זוג בקרים יחיד ותמיכה בתצורת Scale-Out בת 8 בקרים. אם נזכרים בדיסקים של 1.44MB אז זה ממש מרשים לחשוב על 24 דיסקים של 15.3TB או 1PB  אפקטיבי במארז של 2U !

a200-front

בנוסף, כדי לעשות עוד קצת שרירים, הושקה השבוע אחות למערכת ה High End, מערכת ה A700, קוראים לה A700s והיא מספקת את אותם ביצועים אבל בלי כל כרטיסי ההרחבה והמארז הענק ככה שמי שצריך רק את העוצמה אבל בלי כל הגמישות הזו, מערכת ה A700s מגיעה בתצורת 4U וכולל גם היא 2 בקרים מאחור עם 24 דיסקים בחזית.

עדיין קשה לקרוא למכונה הזו מכונה קטנה, 8 חריצי PCIe, פורטים מובנים של 40GbE ו 32Gb FCP, טרה של RAM…מסחרר!

עכשיו, אם עוצרים לחשוב, מצרפים את השקת המכונות החדשות האלו לפוסט הקודם שדיבר על Fabric Pool והפוטנציאל כאן הוא אין סופי, מערכת All Flash שמספקת, נגיד, אם נהיה שמרנים, 1PB effective capacity במארז פצפון של 2U, משלחת כמה מאות אלפי IOps בזמני תגובה של חצי מילי-שניה בכל השרתים והשירותים, ודוחפת החוצה ל S3 את כל הבלוקים הקרים שלה, מה שמתקבל כאן זה נפח אינסופי של All Flash בחסות ה DataFabric! מוצפן, דחוס, מדודפ, מנוהל ממיקום מרכזי, מתרפלק למערכות אחרות, מתממשק אל כל מנועי האוטומציה והאורקסטרציה, תומך באופן מלא בכל ההייפרויזורים והקונטיינרים ועונה בכל הפרוטוקולים הנפוצים, זו ארמדה שלמה במארז של 2U, מקסימום 4U. לאף מתחרה בשוק אין כלים כאלו, פשוט אין. חלק אומרים שיש להם אבל פשוט אין.

אגב למי שדאג, השבוע הוכרזה ONTAP 9.1 RC2 ככה שנראה שההשקה הרשמית של 9.1 כבר מעבר לפינה. אחד החידושים בהכרזה הזו נמצא בצד השני של הקשת, אם אמרתי שיש מערכות חדשות שהן קטנות וסקסיות אז RC2 מאפשר מהצד השני בריון אחד שקט, מדף הדיסקים החדש DS460C המכיל 60 דיסקים בגודל 3.5" LFF במארז של 4U עם קישוריות 12Gb SAS.

תחת גרסאת מערכת ההפעלה הנדרשת, המדף נתמך בכל המערכות מסדרה 8000 ומעלה. talk about density!

שלכם תמיד,

ניר מליק

אולימפיאדה, ברברים ועננים – NetApp Fabric Pool

אולימפיאדה, ברברים ועננים – NetApp Fabric Pool

בתחילת המאה השמינית לפני הספירה החלו תושבי ערי-המדינה ביוון העתיקה להיפגש כל ארבע שנים לחגיגה של תחרויות ספורטיביות באזור אולימפיה בחצי האי פלופונס. למשך ימי התחרות היה מוכרז "שלום אולימפי" כדי להבטיח את שלומם של המתחרים והשתתפותם של נציגי כל היוונים. למרות גלגולים שונים, נשאר מנהג זה בתוקף גם לאחר ירידתה של יוון ועלייתה של האימפריה הרומית ורק בסוף המאה הרביעית לספירה, הקיסר דיאוקלטיאנוס אסר על המשחקים, שהוקדשו במקור לאל זאוס, כחלק ממאמצי הקיסר להשליט את הנצרות באימפריה הרומית. המשחקים האולימפיים חודשו רק ב 1896 במשחקי אתונה ובמשחקי סטוקהולם הושק ענף אולימפי חדש, קרב עשר, ששורשיו בקרב חמש המקורי באולימפיאדה היוונית העתיקה.

קרב עשר כולל, כמובן, עשרה ענפי ספורט והתחרות נמשכת בדרך כלל יומיים רצופים, ביום הראשון תחרויות מהירות וכוח מתפרץ וביום השני טכניקה וסיבולת. באותה אולימפיאדה בה הושק הענף, סטוקהולם, הכריז מלך שבדיה, המלך גוסטב החמישי, על הזוכה הראשון בקרב עשר, ג'ים טורפ, כאתלט הטוב בעולם. השילוב בין ריצה קצרה לארוכה, כוח מתפרץ וסיבולת, כושר אירובי וכושר אנאירובי, הוא המכתיר מלכים בקצה העליון של היכולת האנושית.

מערכות אחסון מודרניות חיות היום גם הן על האיזון בין הקצוות, בין דיסקים גדולים מאד המסתובבים באיטיות ודיסקים קטנים מאד מהירים. העולם בו אנו חיים נשלט על ידי שתי אימפריות ישנות, אימפריית ה SAS שדגלה תמיד בביצועים על חשבון נפחים ואימפריית ה SATA שדגלה בנפחים על חשבון ביצועים. מבחינה היסטורית, אנחנו נמצאים עמוק בימיה האחרונים של האימפריה הראשונה, הברברים של ה SSD עומדים על חומות אימפריית ה SAS וברור שיימי האימפריה ספורים. כאיש ימי הביניים תמיד צחקתי שאם המסמכים המקוריים נכתבו באנגלית אז זו לא היסטוריה אלא רכילות, חוק פרטי זה תקף גם לגבי האימפריה השניה כנראה. נכון, עוד קצת מוקדם להספיד לגמרי את אימפריית ה SATA אבל לא מוגזם לשער כי הפשיטות של שבטי הענן גורמים גם למנהיגי אימפריה זו לרעוד מאחורי ביצורי ה helium encased drives וה shingled drives  . העלויות הנמוכות לשימוש באחסון אובייקטים S3 ואף יותר מכך Glacier הופכות מיום ליום גם את השימוש בדיסקים מסוג SATA לפחות הגיוני, בטח לשימושים כמו גיבוי או ארכוב. נכון לעכשיו, תחילת דצמבר 2016, עלות טרה אחד S3 בשירות AWS הוא כ 31$ לחודש ועלות טרה אחד בשירות Glacier הוא כ 11.5$ לחודש והמחירים כל הזמן יורדים.

אחד מסודות ההצלחה של כל אחת מהאימפריות הגדולות בהיסטוריה היה תמיד היכולת להתפתח ולהתאים את האימפריה לזמנים המשתנים, פרגמטיות שכזו היתה מאפיין של האימפריה הרומית, האימפריה העותומנית ואפילו הצלחתה של הנצרות במאות הראשונות לספירה מיוחסת לפרגמטיות שהנהיג השליח פאולוס. NetApp מוכיחה בשנתיים האחרונות שהיא אימפריה פרגמטית. סל המוצרים האטרקטיבי, ביחד עם תפיסת הפעלה כוללת – מארג המידע או ה Data Fabric, מספקים מענה למרבית אתגרי המידע בעולם המחשוב היום, מערכות אחודות מובילות בעולם ה All Flash, מערכות SAN לסביבות high density, מערכות SolidFire לניהול אחסון במודל ענן, פתרונות לגיבוי חכם אל הענן, פתרונות מבוססי תוכנה בלבד software defined, מערכות וירטואליות לסביבות ענן, כלים להגירה בין פתרונות NFS מקומיים לשירות אובייקט בענן, NetApp היא אתלט קרב עשר מדהים – כוח מתפרץ וגם סיבולת לטווח ארוך, מהירות וגם טכניקה, ליצרן הזה יש מענה מוביל והוא חלק ממארג שלם של כלים ולא מענה נקודתי או חלקי.

יכולת חדשה שמדגישה את השילוב הזה בין היכולות והדיסציפלינות היא יכולת ה Fabric Pool החדשה שנחשפה לאחרונה בכנס ה Insight, התייחסתי אליה בקצרה באחד הפוסטים הקודמים ועכשיו אני רוצה להרחיב עליה קצת. יכולת זו שתהיה זמינה בקרוב, מאפשרת להשתמש בו זמנית בשני כלים משני קצוות הקשת, מחד, לאמץ את הברברים של ה SSD ולהשתמש במערכת עתירת ביצועים מובילה על מנת לספק מאות אלפי IOps בזמני תגובה הנמדדים כיום במיקרו-שניות ומאידך, על פי מסורת שבטי הענן, להכיר בעובדה שבסופו של יום, מרבית המידע בארגון אינו מידע "חם" כלומר, חלק ניכר מהמידע שאנחנו מחזיקים הוא מידע שלא משתמשים בו ולהעביר באופן אוטומטי ושקוף את המידע ה"קר" אל שכבת אחסון משנית מבוססת פרוטוקול S3, אחסון אובייקטים סטנדרטי בין אם בוחרים ליישם שכבה משנית זו על ידי פתרון מקומי כמו NetApp StorageGrid או פתרון מרוחק כמו AWS S3.

פשוט כך, ללא צורך לשנות שום דבר מצד ה front-end, ללא הגבלה על פרוטוקול הגישה, ללא כל צורך בשינוי מצד האפליקציות או הרגלי המשתמשים, באופן שקוף לחלוטין, מערכת האחסון תנהל לעצמה את עדכוני ה Meta-Data ותדע להעביר בלוקים קרים אל הענן כך שמחד מערכות הארגון יקבלו שירות ברמה של All Flash ומאידך לא נהיה חייבים לשמור את כל המידע על דיסקים יקרים. בואו נרחיב לגבי השקיפות הזו: אחד הפקטורים המשמעותיים במערכות All Flash הוא חסכון בנפח האחסון, יכולת ה Fabric Pool שקופה לחלוטין לטכנולוגיות ה Efficiency המובנות ב All Flash FAS, כל החיסכון שמתקבל בשימוש ב in-line De-Duplication, In-Line Compression ו in-Line Compaction נשמר, המערכת מודעת לחסכון ושומרת עליו גם במעבר הבלוקים הקרים לענן. אותה שקיפות נכונה גם ליכולת ה Volume Encryption שנשמרת, אין ביצוע Decrypt כאשר מעבירים מידע ויתר מזאת ניתן כמובן לבצע הצפנה על הצפנה ולהצפין את הבלוקים גם במנגנון המובנה ב StorageGrid  למשל או יכולת ההצפנה של S3.

fabric-pool

מבחינה מעשית, כל מה שנדרש לעשות זה להגדיר קישור אל AWS ואז יש שני דברים להגדיר מצד מערכת האחסון, עבור אילו Volume'ים אנחנו רוצים להפעיל את יכולת ה Fabric Pool ואם אנחנו רוצים להפעיל אותה עבור כלל המידע ב Volume או רק על הסנפשוטים. נשמע פשוט? אכן פשוט. אפשר להפנות כמה מערכות אחסון אל אותו מנוי S3 וכמובן שהפתרון נתמך גם בשימוש ביכולת multi-node scale-out כלומר גם כאשר מערכת ה All Flash FAS שלנו כוללת יותר מזוג בקרים אחד, הפתרון נתמך, עובד ושקוף.

which-volume

כמו כל יכולת אחרת, ממשקי הניהול המשופרים הכלולים במערכות FAS החל מ ONTAP 9 כוללים את היכולת להראות באופן פשוט וברור מה אחוז המידע שהמערכת מגדירה כמידע "קר" וכך לקבל את ההחלטות מתי ואיך להתחיל את התהליך.

report

אני יודע שערבבתי כאן כל מיני דימויים אבל הי, ככה זה בעולם של פלטפורמות ניהול מידע רחבות בניגוד לעולם של מוצרים ספציפיים, מי שימשיך להתרכז במוצד אחד בודד שעושה משהו נקודתי, טקטי, יעלם, גם אם המוצר הנקודתי, הטקטי שלו, מאד מוצלח.

מי שרוצה ללמוד עוד קצת היסטוריה מוזמן לפנות לפודקאסט המדהים של דן קרלין ומי שרוצה לקרוא עוד קצת על Fabric Pool מוזמן לקרוא את הפוסט הבא של ג'ף בקסטר

כמו תמיד אשמח לשמוע מה דעתכם על הפוסט, על Fabric Pool ועל החיים

שלכם,

ניר מליק

*הערה – כן, אני יודע שכבר יש דיסקי SSD יותר גדולים מדסיקי NL-SAS אבל התמחור שלהם משאיר אותם עדיין קצת פחות רלונטיים עבור מרבית הלקוחות בישראל

New NetApp Software & Flash Systems are here, have a look!

אתמול נפתח בלאס-וגאס כנס ה Insight השנתי של NetApp, הכנס הטכני הראשי של היצרן ואחיו הגדול של הכנס שיתקיים בברלין בנובמבר.

במהלך אירוע הפתיחה הוכרזו החידושים המרכזיים במערכת ההפעלה החדשה ONTAP 9.1 וכן הושקה סדרה חדשה של חומרה, בקרים ומדפים, לקו מוצרי ה FAS וה All Flash FAS. כזכור NetApp היתה היצרן הראשון להכריז תמיכה בדיסקים מסוג 15.3TB SSD ועכשיו מוכרזת תמיכה מלאה בקישוריות 40GbE, 32Gb FC וקישוריות 12Gb SAS וזאת על מנת לאפשר את ניצול כלל המשאבים שהסוסים החדשים יודעים לספק.

מיד אסקור חלק מהחידושים שמציגה מערכת ההפעלה החדשה ONTAP 9.1 אבל ראשית אני רוצה להפנות את תשומת לבכם לעובדה שכלל יש מערכת הפעלה כזו, זה שינוי אדיר בקצב עדכוני התוכנה של היצרן והוא מצביע על השינוי המהותי שעוברת NetApp בזמן האחרון. השנה הוכרזו כבר ONTAP 9, Elements Florin וכן SANtricity 3.0, משהו טוב עובר על מחלקות הפיתוח של NetApp וציפור לחשה לי שיש עוד חידושים מאד משמעותיים בקנה להמשך השנה.

חידוש מעניין ראשון הוא יכולת ה Flex Groups שמחליפה את טכנולוגית ה infini-vol. הטכנולוגיה החדשה מרחיבה באופן משמעותי את היכולת לספק file system ענק לניצול כמות גדולה של בקרים ונפח אחסון ותומכת מעכשיו ב 20PB  של מידע וארבע מאות מיליארד קבצים, בתמיכה מובנית ב NFS  וכן SMB מדובר במפלצת Scale-Out לעולמות עיבוד, ניתוח, ניטור וריצוף גנטי.

החל מגרסא זו קיימת תמיכה מלאה גם ב Cloud ONTAP על גבי סביבות Azure בנוסף לתמיכה הקיימת בסביבות AWS והחידוש הכי מעניין בעולם הענן הוא התמיכה של מערכות ה All Flash בביצוע Cloud Tiering כלומר העברה אוטומטית של מידע "קר" ל S3! כזכור כתבתי בעבר שתפישת ה Data Fabric היא לא רק חזון או מסר שיווקי והחידוש הזה הוא צעד ענק להוכחה שצדקתי.

חידוש נוסף הוא יכולת הצפנת מידע תוכנתית ברמת Volume. כזכור ההכרזה הקודמת, ONTAP 9 כללה מנגנון מובנה לניהול מפתחות הצפנה. שימוש במנגנון זה מאפשר כיום לבחור בין הצפנה חומרתית עם דיסקים יעודיים להצפנת תוכנתית המובנית במערכת.

סדרת בקרי ה FAS החדשה כוללת שלושה דגמים, FAS 2600, FAS 8200 וספינת הדגל החדשה FAS9000.

ה FAS 9000 מציגה תפיסה חדשה לגבי מבנה פיזי של בקרי מערכת אחסון המזכירה מארזים של שרתי להב, שני מודולי הבקרים אינם כוללים רכיבי תקשורת כך שניתן יהיה להחליפם בקלות רבה יותר בעת הצורך והמארז כולל 10 חריצי הרחבה לכל בקר. זוג בקרים יחיד מדגם זה מסוגל לתמוך בנפח אדיר של 14PB והמשמעות היא יכולת גידול לקלאסטר של 172PB  בשימוש ביכולת ה Scale-Out של ONTAP. המבנה המודולרי מאפשר גם הרחבה או החלפה של רכיבי ה NVRAM בעת הצורך וכולל חריצים יעודיים לרכיבי NVMe SSD לשימוש ככרטיסי האצה, שדרוג של Flash Cache  המוכר והאהוב.

fas9000

דגם ה"ביניים" הוא FAS 8200 שיכלול 256GB RAM וכל בקר יגיע באופן מובנה עם 1TB NVMe וביחד עם Flash Pool המערכת תתמוך ב 48TB של SSD Cache. זוג בקרים יחיד יתמוך בנפח אחסון של עד 4.8PB ומקסימום של 57PB בשימוש ביכולות Scale-Out. דגם זה כולל הכפלה של כמות ליבות העיבוד לעומת FAS 8040, דגם ה mid-range בסדרה הקודמת ובהשוואה לאותו הדגם המערכת כוללת פי 4 יותר זיכרון RAM!

מערכות ה FAS 2600  יחליפו את מערכות ה FAS 2500 ויכללו גם הן באופן מובנה 1TB NVMe להאצת ביצועים. מערכות אלו יוצעו בשני תתי דגם, FAS 2620 שתכיל באופן מובנה דיסקים בגודל פיזי של 3.5 אינטש ו FAS 2650 שתכיל באופן מובנה דיסקים בגודל פיזי של 2.5 אינטש. סדרה זו כוללת הכפלה של משאבים לעומת הסדרה הקודמת ובכלל זה כמות ה RAM בבקרים וכמות ה NVRAM והכפלה פי 3! של כמות ליבות העיבוד. הגידול בכמות הפורטים המובנים מאפשרת שימוש בפורטים מסוג 10Gb לקישוריות קלאסטר ועדיין לספק 4 פורטי UTA בכל בקר לתקשורת אל השרתים. סידרת Entry Level שמספקת 100,000 IOps או 5Gb זה לא רע הא?!

שני דגמים חדשים בסדרת מוצרי ה All Flash  הם ה A700 שתתבסס על המבנה של FAS900 ותכיל 1TB RAM וה A300 שתתבסס על המבנה של FAS8200 ותכיל 256GB RAM. שילוש של בקרים אלו, דיסקי SSD  בלבד ותמיכה בכרטיסי התקשורת החדשים תאפשר לרדת לעולמות ה micro second בזמני התגובה וכל מה שנשאר ללקוחות זה להניח תשתית שתהיה מסוגלת למשוך (ולמשוך, ולמשוך) משאבים.

במסגרת השקת סדרת הבקרים החדשה הוכרזו גם דגמי מדפים חדשים על מנת לתמוך במהירות קישור של 12Gb SAS וגם בתחום זה צפויות הכרזות נוספות בקרוב.

ONTAP 9 is here

הבוקר הושקה הגרסא החדשה של מערכת ההפעלה ONTAP, חידוש מספר 1 ברשימה הוא שאין יותר Clustered Data ONTAP אלא רק שם אחד, ONTAP!

יש הרבה חידושים בגרסא זו אשתדל לכסות את כל מה שאני מכיר, לא לפי סדר חשיבות

נתחיל בחידושים בתחום יכולות של מערכת ההפעלה עצמה:

אחרי שנים רבות עם טכנולוגית RaidDP המגינה מפני אובדן מידע גם בנפילה של 2 דיסקים באותו Raid Group, כוללת ONTAP 9 גם יכולת הגנה מפני 3 דיסקים באותו Raid Group. יכולת חדשה זו נקראת Raid TEC. במקור התכוונו לקרוא לזה Raid TP אבל אז נזכרו במשמעות TP בסלנג אמריקאי והחליטו לוותר (סיפור אמיתי!)

הצורך העיקרי עליו עונה טכנולוגיה זו הוא הגידול בנפחי דיסקי SATA, כיום נפוצים בתעשיה דיסקים בנפחי 6TB וכן 8TB ובקרוב יושקו דיסקים בנפח 10TB. נפילה של דיסק איטי כל כך גורמת כמובן למשך זמן rebuild ארוך ומטרת Raid TEC להמשיך ולהגן על המידע ברמה גבוה גם במהלך זמן rebuild ארוך כל כך. שימוש ביכולת Raid TEC מאפשר הגדלה משמעותית של גדלי Raid Group שהוגבלו בשימוש בדיסקים גדולים אלו.

לצד יכולת זו נמשכת ההשקעה הגדולה בתוכנה לבדיקת תקינות הדיסקים על מנת לצפות מראש ולמנוע נפילה של דיסק כלומר שיפור היכולת להעתיק את המידע אל דיסק Spare ולהוציא דיסק לא תקין משירות לפני שהוא נופל ומתעורר הצורך ב rebuild  (העתקה פשוטה ומהירה יותר מ rebuild כמובן)

המעבר מ Raid DP אל Raid TEC ניתן לביצוע ללא השבתה ואם לא חורגים מגודל Raid Group ניתן גם לבטל את המעבר ולחזור אל Raid DP.

חידוש משמעותי נוסף ולדעתי מרגש מאד הוא הטמעה של יכולת חדשה בתחום חסכון בנפח האחסון, Data Compaction!

יכולת זו הינה יכולת משלימה ל Data Compression ומיעלת את התהליך, לאחר ביצוע הדחיסה יכולים להווצר בלוקים המכילים חלל ריק. יכולת Compaction.  מאחדת בלוקים אלו על מנת

המשמעות היא שיפור נוסף של יכולת חסכון המידע הכללית במערכת היות וכלל הטכנולוגיות עובדות ביחד, המידע נדחס ולאחר מכן מצומצם.

compactionבתחום החומרה, החל מגרסא זו נתמכים דיסקים מסוג 15TB SSD במערכות אחסון All Flash FAS AFF. מדף DS2246 סטנדרטי תומך כמובן ב 24 דיסיקם מסוג זה וביחד עם יחס חסכון נפח בסיסי של 1:4 המשמות היא 360 נפח Raw במדף של 2U ונפח ישים של מעל 1PB ! לא רע (למעשה אלו דיסקים של 16TB עם right size של 15.3 אבל לא צריך להיות קטנוניים)

חידוש נחמד בתחום הניהול נקרא בשם הפשוט והברור Headroom. מדובר ביכולת מובנית במערכת האחסון עצמה לדווח על "כמה נשאר" כמה עוד ביצועים המערכת מסוגלת לספק וכמה עוד אפשר לגדול לפני שניתקל בבעיית ביצועים.

יכולת שהיתה בעבר וחוזרת בגרסא זו היא יכולת Snap Lock ליישום יכולת נעילה של מידע WORM

פתרונות Metro Cluster הורחבו בגרסא זו לתמיכה ב 8 בקרים והוחזרה היכולת לבחור איזה מידע ירופלק ואיזה ישאר מקומי ויקבל רמת שרידות נמוכה יותר.

בפוסט מאוחר יותר ארחיב לגבי חידושים בתחום תהליכי הטמעת המערכות, אני עוד לומד אותם בעצמי והם כוללים הרבה אוטומציה וקיצור זמנים מהקופסא אל סביבת הייצור כמו כן אעדכן לגבי גרסאות חדשות להטמעה על גבי תשתית וירטואליזציה ברוח Data Fabric עליה כתבתי בפוסט הקודם.

בינתיים מוזמנים לשמוע סקירה מצויינת של החברים ב Tech ONTAP

שלכם,

ניר מליק

NetApp Data Fabric – מה זה ולמה זה

Tartan Fabric

שתי המגמות העיקריות בעולם תשתיות המחשוב הן מחשוב ענן ומערכות אחסון מבוססות פלאש.

במובנים רבים, מגמות אלו הינן מגמות משלימות העונות על צרכים שונים. בעוד מערכת אחסון מבוססת פלאש תספק ביצועים גבוהים וזמני תגובה קצרים במיוד עבור שרתים מקומיים, שירות ענן המוגדר ומנוהל נכון יספק מענה עבור משתמשים מרוחקים שזמני התגובה בתוך חדר השרתים פחות רלונטיים עבורם, משתמש המגיע אל חדר השרתים על גבי קו אינטרנט של 120ms לא יהנה מהעובדה שמערכת האחסון עונה ב 1ms.

בדיוק כאן, בשילוב הזה בין קרוב ורחוק, איטי ומהיר, באה לידי ביטוי תפיסת ה Data Fabric אותה מציגה NetApp. המידע הארגוני נשאר מידע ארגוני בין אם הוא מאוחסן על גבי מערכת האחסון המהירה והיקרה ביותר בחדר השרתים של הארגון ובין אם הוא מאוחסן על גבי שכבת האחסון הזולה והאיטית ביותר שניתן לרכוש מספק הענן הציבורי, כל הכללים הארגוניים, כל הרגולציה הנדרשת, כל המדיניות אותה אנו שואפים לאכוף נשארים בתוקף.

  NetApp Data Fabric היא החזון וסט הכלים לאחסון, לגבות, לנהל, להניע ולהגיש את המידע הארגוני היכן ומתי שהוא נדרש ללא תלות במיקום הגיאוגרפי או בתשתית הפיזית בה אנו משתמשים.

הדוגמה הראשונה ליישום חזון זה היא מערכת ההפעלה ONTAP עצמה. כיום ניתן ליישם מערכת הפעלה זו על גבי מערכות אחסון פיזיות שנרכשות מ NetApp, NetApp FASוכן על גבי  Virtual Appliance המוטמע על גבי שרתים וירטואליים  אבל היא ניתןנת להטמעה גם ליד הענן הציבורי (NetApp NPS) ועל גבי הענן הציבורי (Cloud ONTAP)(ONTAP EDGE).

לא משנה איך אנו בוחרים ליישם את מערכת ההפעלה ONTAP , כלל היכולות זמינות, De-duplication, Compression, application aware snap shots, replication, backup וכו' ובלב החזון נמצאת מערכת ניהול מרכזית בשם OnCommand Cloud Manager המאפשר לנהל את מערכות היחסים בין המערכות השונות באופן קל ונוח. ערכת ניהול זו, אגב, הינה פיתוח ישראלי של צוות הפיתוח של NetApp בתל אביב, כבוד כחול-לבן!

cloud manager

דוגמא נוספת היא היכולת המובנית במערכות SolidFire לבצע גיבוי אל מערכות אחסון נתונים מבוססות אובייקטים.

המשמעות היא שמערכת האחסון מתממשקת ישירות על שכבת S3, מבצעת גיבויים אליה ומבצעת ממנה שחזורים, שכבת אחסון זו יכולה להיות מקומית כדוגמת NetApp StorageGRID או חיצונית כדגומת שירות אמזון.

solidcloud

חזון ה Data Fabric הינו הליך בהתהוות, הוא אינו מושלם עדיין, אך הוא מספק הצצה ליישום אמיתי ומלא יותר של תפיסת הפעלה חדשה, הוא מגשר על החסמים ליישום Hybrid Cloud .בארגונים רבים ובכל רגע אנו מתקדמים עוד שלב בתהליך

בימים הקרובים צפויות הכרזות מאד מרגשות הן מ NetApp והן מחברת הבת SolidFire, חלק השארו קשובים, יש לי תחושה ש ה Data Fabric עומד להתרחב מאד