זמינות, ביצועים, גיוסים ורכישות עצובות

זמינות

בפוסט הקודם דיברנו על Data Mobility כאחד המאפיינים של Neutrix Cloud והשבוע אפשר לדבר על מאפיין נוסף, Availability.

מערכות האחסון של Infinidat מספקות רמת זמינות של שבע תשיעיות המתורגמות לפחות משלוש שניות (3.16 אם רוצים לדייק) של השבתה לא מתוכננת בשנה. זה שיפור מאסיבי לעומת סטנדרט של חמש תשיעיות (5.26 דקות של השבתה בלתי מתוכננת) שמספקים מרבית המתחרים בדוק האחסון היום ובטח שמדובר בקפיצה לעומת ארבע תשיעיות (52.6 שעות) שמספקים ספקי הענן הגדולים.

היות ופתרון Neutrix מבוסס בעצם על אותה טכנולוגיה הרי שגם לשירות הזה אנחנו מספקים את אותה רמת זמינות ייחודית.

*מי שרוצה לקרוא עוד על תשיעיות וזמינות מוזמן לקריאה נוספת בוויקיפדיה

מעבר לרמת הזמינות המשופרת של תשתית האחסון, פתרון Neutrix  מסוגל גם לסייע בשיפור הזמינות של שכבת ה Compute. להלן צילום מסך שגם אותו כבר הראיתי לכם בפוסט הקודם, שימו לב למשל ל SLA של Azure לגבי זמינות שכבת ה Compute, הם מתחייבים לרמה של מתחת לארבע תשתיות:

azure sla

אבל אם שכבת האחסון שלכם מבוססת Neutrix, אתם מסוגלים להשתמש בו זמנית בשירותי המחשוב של AWS, Azure וגוגל, כן בו זמנית! זה אומר שאם יש בעיה עם תשתית המחשוב של אחד מהם, אתם מסוגלים להמשיך ולספק שירות ללקוחות שלכם!

neutrix sfd16

עכשיו יש ביניכם כאלו שאולי עדיין לא מבינים מה הטעם בכל זה אבל רק אתמול קיבלנו תזכורת לכך שהענן הוא לא קסם ולא חף מאתגרים, אמזון הגדולים בעצמם קרסו אתמול בפתיחת יום המכירות השנתי שלהם Amazon Prime Day באירוע שיצור להם נזק כספי ישיר בגלל כל הלקוחות הפרטיים שלא מצליחים לקנות את כל מה שהם רצו לקנות ויותר מזה נזק תדמיתי ונזק כספי עקיף מכל הלקוחות העסקיים שגדל הסיכוי שילכו את המתחרים.

amazon cnet

amazon twitter

amazon verge

לא מדובר באירוע חד פעמי או מקרה קיצון, לפני שנתיים למשל הושבת אזור Sydney של AWS בעקבות סערה חריפה שפקדה את דרום מזרח אוסטרליה ויש אפילו רשימה של 7 ההשבתות הגדולות

aws zednet

אגב התמונה של Neutrix היא צילום מסך מתוך מצגת שהעביר אריק קולברג שלנו במסגרת Storage FIeld Day 16 ואתם מוזמנים לצפות בה כאן אם אתם רוצים ללמוד עוד קצת על Neutrix

וסתם ככה כדרך אגב במסגרת SFD 16 בריאן קרמודי שלנו העביר מצגת עם neural Cache ואפשר לראות כאן מה חושב ריי לוקזי על היכולת שלנו לספק מעל 90% מה REad IOPS שלנו מתוך ה Cache

ביצועים או יש ביצועים ויש ביצועים

חברת NetApp שחררה לאחרונה תוצאות SPC-1 מאד מרשימות עבור מערכות ה A800 שלה.

בדו"ח שניתן לקרוא במלואו כאן, מספרת החברה כי הצליחו להגיע ל 2.4 מיליון פעולות בשנייה מה שמעמיד אותם במקום הרביעי אי פעם אחרי 3 מערכות של Huawei. מדובר בהישג טכנולוגי מאד מרשים עבור חברה שבעבר אמרו עליה שפספסה את רכבת ה All Flash אבל אני רוצה לשאול כאן, עד כמה ההישג הזה רלוונטי בכלל ללקוחות?

שימו לב למבנה המערכת. 12 בקרים של הסדרה הכי גבוה של היצרן בשביל לדחוף סה"כ 273 טרה ברוטו עם רמת ניצולת של 66% בלבד כלומר 182 טרה או 15 טרה לבקר. מכירים הרבה אפליקציות בחיים האמתיים שדורשות ארכיטקטורה כל כך מוזרה? שמסוגלות לחיות בכזו סביבה בכלל? מה גם שבשביל לקבל את הביצועים האלו היה צורך לכבות Inline Dedup, לכבות Aggr level Dedup ולא לבצע Snapshots בכלל.

netapp cluster spc-1

עכשיו אל תבינו לא נכון, אני חנון וכמו חנונים אחרים אני אוהב גם תרגילי תיאוריה, יש משהו אלגנטי בלהריץ מערכת עד הקצה התיאורטי שלה בתנאי מעבדה ולראות מה היא יודעת לעשות  ומצד שני יש כאן תחושה של מבדקי פליטת המזהמים של VW, הלקוח בקונה גולף דיזל בחיים לא יקבל את התוצאות ש VW הציגו במעבדה, הרכב על הכביש פשוט מתנהג אחרת. אגב אני ממליץ בחום על הפרק הראשון של הסדרה Dirty Money שעוסק בדיוק בפרשה הזו של VW.

זו אגב הסיבה שאנחנו משתדלים להשתמש רק ב workload אמיתי של לקוחות כחלק מאתגר ה Faster Then All Flash שלנו עליו סיפרתי לכם כאן וכאן. בסופו של דבר, מרבית מערכות האחסון בעולם לא משרתות איזה כלי בדיקות כמו VDbench אלא מערכת אמיתית כמו MS-SQL, אורקל או SAP HANA וזה אמור להיות הרבה יותר מעניין עבור לקוחות מאשר מה תיאורטית המכונה היתה עושה במעבדה בתנאים אידיאליים. החיים לא אידיאליים.

גם איגוד SNIA מסכים איתנו כנראה כי הם עובדים על תקן חדש שאמור לדמות עומסים אמיתיים יותר מהחיים כדי לבצע benchmark מקובל על כולם אבל עם ערך ישיר יותר למקבלי ההחלטות

* אני בכוונה כותב פעולות בשניה ולא IOPS כי פעולות SPC-1 הן לא IO טהור אלא מנסות לדמות טרנזקציה הכוללת כמה IO בכל טרנזקציה. אחרת אפשר היה לשאול מה בעצם כל כך מרשים ב 200K IOPS  לכל בקר בימינו

גיוסים

בשבוע שעבר הייתי בקוריאה וביציאה מהמטוס פגשתי את אילן ודותן מחברת SQream. הייתי עפוץ לגמרי מהטיסה ולקח לי שניה לזהות אותם, סליחה אילן ודותן!

למי שלא מכיר SQream מייצרים Database מבוסס GPU  ככה שהשאילתות רצות על כמה אלפי ליבות ולא רק על 24 או 48 או כמה ליבות שיש ל CPU של השרת. הקונץ היפה הוא שמדובר ב Database העונה לשפת SQL סטנדרטית ככה שלא צריך ללמד DBA זקנים טריקים חדשים (כן כן SQL זו שפה ולא רק מוצר של מיקרוסופט מי היה מאמין).

בשדה התעופה בדרך הביתה פגשתי אותם שוב והיה לנו קצת יותר זמן לקשקש (אתם חייבים לי בירה!) ואז גיליתי ש SQream השלימה לא מזמן סיבוב גיוס מאליבבה שהשקיעה 24 מליון דולר בחברה בסדרה B. כל הכבוד חברים המשיכו ככה!

רכישות עצובות

בפוסט שנקרא there is no I in team סיפרתי לכם ש Tintri עומדת בפני פשיטת רגל ואכן בשבוע שעבר זה קרה, החברה הודיעה על סגירת פעילות וDDN הודיעו שהחלו משא ומתן לרכישת נכסי החברה. זה צעד מעניין מצד DDN כי אין להם מוצר שמתחרה בקטגוריה של production storage ויש כאן פוטנציאל להקפיץ אותם אל תוך הטבלה של הקטגוריה הזו אבל מצד שני גם בשיא כוחה טינרטי הייתה שחקן נישה קטן ועכשיו DDN צריכה לשחק בשוק חדש ולא מוכר לה עם מוצר שגורר אחריו שם בעייתי. ימים יגידו אם אכן הם ישלימו את הרכישה והאם היא השתלמה להם.

זה הכל להפעם,

כרגיל אשמח לשמוע מה דעתכם, אז תכתבו!

בונוס למצטיינים – באחת התמונות יש טעות, בין המזהים נכונה תוגרל תמונה שלי אוכל סרטן כבוש בסיאול

*ההשתתפות אסורה על ליאור קמרט שגילה לי את הטעות במקור

ניר מליק

מודעות פרסומת

Data mobility – Mark Watney, Homeland security and Dolores Abernathy

בטיסה האחרונה הביתה ראיתי , בפעם המאה, את הסרט "להציל את מארק וואטני" או בשמו המקורי, The Martian. אחד הסרטים האהובים עלי. אחד האתגרים העומדים בפני הבוטנאי התותח התקוע על מאדים ואנשי NASA על כדור הארץ הוא נושא התקשורת.

עם 32 דקות דיליי בתקשורת ויכולת לענות על שאלות כן ולא בלבד, כמות המידע שניתן להעביר ולצבור קטנה מאד.

rurecieving

קרדיט תמלול

בשבוע שעבר אכלתי צהרים עם חבר שסיפר לי על מערכת די מדהימה לזיהוי ואיתור בני אדם. אחד האתגרים במבנה המערכת הוא הצורך להעלות תמונה מהמצלמה אל שלושה שירותי ענן שונים לניתוח ועיבוד ולהחזיר את התוצרים אל עמדת הבקרה בתוך פחות משתי דקות.  כתבתי פוסט נפרד עם איזה 600 מילים על המערכת הזו ואז נרדמתי תוך כדי אז מחקתי את הפוסט, חבל לשעמם אתכם עד כדי כך.

השבוע אני במרתון של העונה השנייה של ווסטוורלד. לדעתי הסדרה היא יצירת מופת ואני מאד מקווה שהיא לא תלך לאיבוד כמו שקרה לסדרה אבודים בזמנו. פתאום, באמצע פרק 4, זה קפץ לי לראש, הקשר בין מט דיימון, זיהוי פנים ודולורס היפה. צוות ה IT של דלוס לא דאגו לגיבוי Off Site כמו שצריך ובעצם כל עלילת העונה השנייה מתאפשרת רק בגלל שהם דחפו את כל המידע הקריטי שלהם אל הראש של אבא של דולורס, Old man Peter Abernathy, זו הסיבה היחידה שבעצם QA לא מכסחים את כל האתר בכוח (מעניין שדווקא QA הם כוח השיטור והאכיפה).

אחד האתגרים הכי גדולים בעולם ה IT היום הוא Data Mobility. הפיזיקה ולמעשה גם הגיאוגרפיה עדיין מערימות קשיים על היכול להזיז מידע בין נקודת היצירה שלו, נקודת העיבוד שלו ונקודת הצריכה שלו. בעולם ה IoT יש ניסיון להעביר לפחות חלק ממשימות העיבוד אל הקצה, אל המצלמות\רגשים עצמם כדי להתגבר על הצורך להעביר מידע מעשרות, מאות ולפעמים אלפי נקודות קצה אל מערכת מרכזית. בעולם מחשוב הענן לעומת זאת, הבעיה של Data Mobility הפתיעה חלק מהמשתמשים. נראה שבראשית ימי הענן אף אחד לא חשב שיום אחד יהיה צורך לצאת מהענן או לעבור בין ענן אחד לשני או אפילו, כמו שהזכרתי בנוגע למערכת זיהוי הפנים, לבצע תהליך שכולל שלושה ספקי ענן שונים בו זמנית.

כשאנחנו מתחברים אל מערכת הניהול שלנו באמזון למשל, אנחנו יכולים להקים כמה עשרות שרתים כמה קליקים של עכבר. בעולמות של קונטיינרים אנחנו יודעים להרים כמה אלפי קונטיינרים בכמה שורות פקודה. מחשוב, Compute, בענן זה בדרך כלל באמת קל וזריז כמו שמספרים לנו. אבל מידע זה אחרת. כמה זמן ייקח להעביר 10 טרה אל הסביבה שהקמת באמזון? כמה זמן ייקח להעביר 100 טרה? כמה זמן ייקח להעביר פטה? כמה יעלה לכם להעביר 350 טרה מאמזון אל גוגל? כמה יעלה לכם להעביר 200 טרה מאז'ור אל חדר השרתים שלכם בחזרה? אתם יודעים בכלל איך לעשות זה?

INFINIDAT Neutrix

פתרון Neutrix שהשקנו לא מזמן מגשר על חלק מהפערים האלו, מדובר על תשתיות שלנו, בבעלות וניהול שלנו, המקושרות בקווי תקשורת מהירים ישירות אל תשתיות המחשוב של אמזון, גוגל ומיקרוסופט. אנחנו מאפשרים ללקוחות להשתמש כלי הרפליקציה המובנים במערכות האחסון שלנו כדי להזיז מידע מחדר השרתים אל הענן ובחזרה ומרגע שהמידע נמצא על גבי התשתית שלנו, ניתן להציג אותו אל תשתית המחשוב של ספק הענן שבחרנו וגם ליותר מתשתית מחשוב אחת בו זמנית.

בגלל שמדובר בתשתית שלנו, אנחנו עדיין מסוגלים להבטיח ללקוחות זמינות ברמה של שבע תשיעיות לעומת ה SLA המגוחך שספקיות הענן מציעות באופן מובנה. שימו לב למשל שב AWS לא מבטיחים מעל רמת זמינות של 4 תשיעיות:

AWS SLA

ואותו הדבר גם ב Azure:

azure sla

בנוסף, אנחנו מספקים ביצועים טובים יותר מכל דיסק SSD שספקית הענן מציעה. קחו למשל שוב את אמזון שמבטיחה שבתנאים טובים עם רוח גבית דיסקים ברמת שירות SSD io1 יקבלו Latency של מילי שניות בודדות, אלו זמני תגובה מאד מרשימים עבור מערכות מבוססות דיסקים של לפני 5 שנים ולא למערכות SSD ברמה הכי גבוה שיש.

aws latency

בשורה התחתונה אנחנו גם מציעים את כל זה בעלות חודשית נמוכה יותר ממה שמשלמים עבור דיסק SSD בענן ככה שהלקוח מקבל הרבה הרבה יותר ומשלם פחות. דברו איתי!

אני יודע שזה לא הפוסט הכי מצחיק שיצא לי עד עכשיו אז למי שיבקש יפה אשלח כפיצוי סרטון שלי רוקד על הבר בקלאב-מד גרגולימאנו מסגרת טיול אנפינידט ישראל בשבוע שעבר, יאסו!

grego

שלכם כרגיל,

ניר מליק

 

There is no I in Team

There is no I in Team

מדי פעם אני ממליץ כאן על בלוגים ופודקאסטים מעניינים בתחום ה IT והפעם אני קצת חורג ממליץ על פודקאסט מסוג אחר. Revisionist History הוא פודקאסט של מלקולם גלאדוול שעוסק בדרך כלל בפיקנטריה, באירועים קטנים בהיסטוריה ולמעשה אפילו לא ב"ממש" היסטוריה, כמו למשל הפרק שעוסק בצ'יפס של מקדונלדס והשינוי שחל בו מאז שמקדונלדס עבור לשמן מהצומח, פרק שנקרא "מקדונלדס שברו לי את הלב".

הפרק שאני מאזין לו עכשיו, לא מופיע באתר אבל כן זמין דרך ה RRS של אפליקצית הפודקסטים האהובה עלי podcast addict. זהו פרק בונוס ובעצם הוא לא ממש פרק של הפודקאסט אלא הקלטה של שיחה בין גלאדוול ובין אדם גראנט ובגלל שהפרק הזה לא זמין באתר, אני מצרף כאן לינק לקטע מתוך הרצאה אחרת של אדם גראנט כי בקטע הזה הוא מדבר בדיוק על הנושא שאותו רציתי להעלות כאן.

תריצו את הקטע ותחזרו לקרוא:

יש כאן נקודה מעניינת ששווה מחשבה גם אם היישום שלה לא בהכרח יעיל. כוכבים לא יכולים לשמר את ההצלחה בלי הצוות שסביבם. קח סוחר וול-סטריט מצליח, מנצח מוכשר, קברניט מטוס ותיק ותעביר אותם לחברה אחרת ובניגוד למה שמצפים לראות, הביצועים שלהם יצנחו דרמטית. גם מנתח שביצע את אותו הניתוח שלוש מאות פעם בבית חולים אחד, לא יבצע אותו באותה רמת הצלחה בבית חולים אחר כי אין סביבו את אותו הצוות שהתאמן איתו ביחד, שצופה את הצעדים שלו, שמשלים אותו, שבאופן טבעי וחלק מחפה עליו בנקודות החלשות שלו.

גראנט וגוגל השתעשעו תקופה מסוימת ברעיון להעביר את נקודת הפוקוס מהעובד אל הצוות כלומר למדוד את הצוות, לקדם ולתגמל את הצוות ולפטר את הצוות במידת הצורך. מהר מאד הרעיון הזה נזנח, ברמה הפרקטית הרי גם ככה קשה לשבץ עובדים למשמרות כשהם יחידים אז כיחידה אורגנית? ומה לעשות בסוף גם בתוך הצוות המעולה והמלוכד יש עובדים טובים יותר וטובים פחות וכאלו שרוצים להשאר וכאלו שרוצים להתקדם וכאלו ש וכאלו ש וכאלו ש…

אבל הפואנטה מעניינת, הפואנטה של גם הכוכבים הגדולים ביותר לא מסוגלים לעשות שום דבר לבד ולקבוצת NBA לוקח 4 שנים עד שהגרעין מתגבש לרמה של קבוצה המתמודדת על האליפות היא פואנטה מעניינת שכדאי לשים אליה לב כשמנהלים אנשים. אין לי עוד הרבה מה להגיד על זה כי עוד חושב על זה בעצמי אבל זה נראה לי מספיק מעניין כדי לחלוק כבר עכשיו.

_ עריכה _

מצאתי את הפרק המלא שמופיע פשוט בפודקסט של אדם גראנט :

https://open.spotify.com/episode/6gINYJEVjWwvZ0V90yxvtX

 

 

בעיה מטרידה בוורד

יש לי בעיה מציקה ב Word שאשמח לקבל עיצות לגביה. בכל פעם שאני פותח קובץ וורד, אני מקבל את ההודעה הבאה:

fa5168c4-0522-43c0-a4f6-bc7176cf4690

 

וורד נתקע למשך לפחות שלושים שניות עד שהוא מתייאש למצוא עדכונים לטמפלט ורק אז אפשר להמשיך כרגיל. כן, ניסיתי גם ללחוץ על ביטול כמובן, במיקרוסופט כמו במיקרוסופט גם הביטול לוקח כמה שניות ארוכות. ניסיתי גם למחוק את ה default template. זה ממש מעצבן! בין הפותרים נכונה יוגרל מאזין שלא ענה נכון!

_ עריכה _

תודה לאלכס!

מצאתי את ה Add-In שהטריף אותי והסרתי אותו ובא לציון גואל!

addin

 

בכל אופן טיפה חדשות IT

נראה ש Recover Point של Dell EMC זה מסננת אחת גדולה ולאחרונה התגדלו לא פחות משש פרצות אבטחה שונות כולל סיסמאות מובנות בקוד, אפשרות להעברת סיסמאות ללא הצפנה ויכולת להשלטת על מערכת ההפעלה מתחת לאפליקציה.

השבוע אנחנו מתבשרים ש Tintri שוב על סף פשיטת רגל ובלי הזרמה של מזומנים לא יוכלו להמשיך לפעול מעבר לסוף חודש יוני. סיפור קצת עצוב כי מעולם לא שמעתי מילה אחת רעה על הטכנולוגיה שלהם בשוק משופע רכילות והשמצות. נראה שמדובר באופן גורף בניהול כושל מאד שהוחלף לאחר פשיטת הרגל הקודמת בצוות ניהול כושל אחר (או ספקולנטים שרצו רק לחלוב מה שיצליחו מהמשקיעים?)

Pure הוציאו את הדו"ח הפיננסי הרבעוני שלהם ושוב הם מראים הפסד של 64 מליון דולר ברבעון הראשון של השנה מה שלא מונע מהם להכריז על הכוונה לגייס עוד 500 עובדים. מחד אני מבין את האמירה שלהם שצמחיה חשובה יותר מרווחיות ומאידך מדובר על הפסדים עצומים שוב ושוב ושוב, כמה זמן חברה יכולה להתקיים ככה בעצם? זה כמו קבלן ישראלי קטן שחי מהלוואה להלוואה אבל נוהג במרצדס?

נו טוב זה מספיק להיום, בפעם הבאה אכתוב על Neutrix כמו שהבטחתי

דברו אלי אם יש לכם תובנות על בעיית הוורד שהצגתי

ניר מליק

 

RPO Zero from downunder

RPO Zero from downunder

הפוסט הקודם נכתב מיפן, התחנה הראשונה בסיבוב של שבועיים שכללו את טוקיו, סידני, מלבורן ובריסביין. הנסיעה כולה תוכננה סביב כנס גרטנר בסידני (השם המלא של האירוע הוא IT Infrastructure, Operations Management and Data Center Summit אבל אף אחד לא משתמש בו) במסגרתו הרציתי על הפתרונות החדשים שהשקנו לאחרונה ביניהם דגם חדש למערכת האחסון הראשית שלנו, F6212 המספקת מעל 4PB נטו בארון אחד, מערכת ייעודית לגיבוי, אותה הזכרתי בקצרה בפוסט קודם אבל מאז הוכרזה רשמית וקיבלה את השם InfiniGuard, פתרון אחסון סמוך-ענן שנקרא Neutrix שאפרט עליו בפעם הבאה והפתרון עליו אני רוצה לפרט קצת היום, פתרון רפליקציה המספק RPO-0 ללא תלות במרחק או רוחב פס בשם InfiniSync.

 

אני רוצה להרחיב דווקא על הפתרון הזה כי הוא היה הכוכב בשיחות עם שותפים ולקוחות ביפן ובאוסטרליה, הגיאוגרפיה הייחודית של יפן (שרשרת איים געשיים על שבר טקטוני) ושל אוסטרליה (מרחקים אדירים) גורמים לפתרון ייחודי זה להיות סופר רלוונטי בניגוד למדינות אירופה כמו למשל לגרמניה בן התשתיות איכותיות וזולות והמרחקים קצרים באופן יחסי.

RPO או Recovery Point Objective מגדיר את הנקודה בזמן אליה אנחנו מוכנים לחזור במקרה של כשל או במילים אחרות, כמה מידע אנחנו מוכנים לאבד במקרה כשל. עבור מרבית הארגונים בעולם, אובדן כלל המידע הנוצר בשעה האחרונה, יום עבודה אחרון, אפילו אולי השבוע האחרון יסתכם בכאב ראש ואולי באובדן עסקה או לקוח אבל בדרך כלל לא יעמיד את המשך קיומו של הארגון כגוף עסקי מתפקד בסכנה. ישנם ארגונים אחרים, לעומת זאת, בהם אובדן מידע יגרום לנזק כה נרחב עד כי המשך קיומו של העסק כעסק חי יעמוד בסכנה. זה יכול להיות נזק ישיר, נזק עקיף ועכשיו ערב כניסת GDPR לתוקף יותר מתמיד, נזק רגולטורי.

ארגונים אלו, בדרך כלל בנקים, חברות ביטוח, בתי חולים וכו' משקיעים הון עתק על מנת לוודא שכלל המידע המאוחסן אצלם מגובה ומאוחסן באופן שריד וחלק ניכר מהם משקיעים בתשתיות הנדרשות על מנת ליישם רפליקציה סינכרונית על מנת לוודא שכל בלוק ובלוק שנכתב על המערכות שלהם מרופלק באופן מידי גם אל מערכת נוספת או בדרך כלל אל אתר נוסף על מנת להגן על המידע הארגוני גם במקרה של אסון סביבתי גדול.

רפליקציה סינכרונית היא יכולת מובנית במרבית פתרונות האחסון בעולם היום אבל כל פתרונות הרפליקציה הסינכרונית נתקלים באותה בעיה בדיוק, הגיאוגרפיה. ברפליקציה סינכרונית, השרת שמבצע את הכתיבה אל מערכת האחסון מקבל ממנה אישור על הכתיבה רק לאחר סנכרון המידע גם אל המערכת המרוחקת ולפיכך, ככל שהמערכת המרוחקת אכן רחוקה יותר, פיזית, כך זמן התגובה לאישור הכתיבה לשרת עולה ולכן פתרונות רפליקציה סינכרונית מוגבלים במרחק בין האתרים וככלל אצבע מחשבים  על כל 100 קילומטר של מרחק פיזי יש להוסיף 1ms לזמן התגובה.

המגבלה הזו, מגבלת המרחק הפיזי, גרמה לארגונים להתפשר על רמת ההגנה או לחלופין ליצור טופולוגיות יקרות ומורכבות של שלושה אתרים, טופולוגיות שזכו לשם הכללי Bunker site. בטופולוגיה זו, מחזיק הלקוח שלושה אתרים, אתר ראשי, אתר משני קרוב יחסית אליו מתבצעת רפליקציה סינכרונית ואתר DR אמיתי, מרוחק, אליו מתבצעת רפליקציה א-סינכרונית. טופולוגיה זו מספקת הגנה על המידע בעלות כספית אדירה ומורכבות טכנית רבה.

פתרון InfiniSync בא לגשר על הפער בין הפשטות היחסית של רפליקציה א-סינכרונית ורמת ההגנה של רפליקציה סינכרונית. הוא בא להחליף את הצורף ב Bunker site ולאפשר ללקוח לבצע רפליקציה א-סינכרונית בלבד אל האתר המרוחק מבלי לוותר על רמת ההגנה.

מה שעשינו זה לבנות מערכת על בסיס העקרונות של קופסא שחורה, כמו במטוסים, מערכת מחשוב מוקשחת הכוללת דיסקים מקומיים מבוססי SSD, סוללה פנימית, אנטנת Wi-Fi ומודם סלולרי עצמאי. המערכת בנויה בתוך קופסא קשיחה העמידה, עטופה בציפוי מבודד המגן מפני אש וחום ומוכלת בתוך כלוב המגן מפני רעידות. המערכת נבדקה ומאושרת לעמידה בעומס משקל של 2.2 טון, אש ישירה בטמפרטורה של 945 מעלות מעל שעה, חום ישיר בטמפרטורה של 260 מעלות מעל חמש שעות, נפילה מגובה 5 מטר, רעידות של 50Hz ו 1.6G, אטומה למים בעומק עד 3 מטרים ואפילו חסינה מפני חדירה של מוט חודר (תמיד בסרטי אסונות מישהו משתפד על עמוד במקרה של רעידת אדמה או תאונה).

 

Showdown_in_Mega_City_Trinity_Death

הטופולוגיה של הפתרון עצמה היא מאד פשוטה, בין שתי מערכות האחסון של הלקוח מתבצעת רק רפליקציה א-סינכרונית ככה שאין שום תלות במרחק בין האתרים ואפילו איכות קו הרפליקציה יכולה להיות נמוכה. במקביל לביצוע הרפליקציה הא-סינכרונית מתבצעת רפליקציה סינכרונית של הדלתא בלבד אל מערכת ה InfiniSync. רק מידע שעדיין לא רופלק אל האתר המרוחק נכתב גם אל המערכת המקומית על גבי קו תקשורת מקומי אל דיסק SSD ככה שסה"כ אנחנו מוסיפים פחות מ 0.3 מילי שניות.

היות ומערכת ה InfiniSync מכילה סוללה משלה, מקושרת לרשת התקשורת המקומית וגם מסוגלת לתקשר על גבי שני סוגי תקשורת נוספים, אנו מגינים על המידע שטרם רופלק גם במקרה של אסון מתגלגל, כלומר אם נגיד נפל קו התקשורת אבל חדר השרתים עדיין תקין ועדיין מתבצעות כתיבות אל המערכת הראשית, אנחנו ממשיכים להגן על המידע החדש עד שקו התקשורת יחזור לתפקוד וניתן יהיה לרפלק את המידע החוצה מהאתר כמו שצריך. אם לאחר כמה זמן גם נופל החשמל בחדר השרתים, אנחנו ממשיכים לשדר את המידע על גבי התקשורת הסלולרית למרות שקווי התקשורת, ציוד התקשורת המקומית, השרתים וכו' כבר לא פעילים, ואפילו אם האסון הסביבתי חמור וגם רשת הסלולר לא קיימת יותר, המידע עדיין מוגן ומחכה עד שנהיה מסוגלים להעביר קווי תקשורת חליפיים או אפילו לקחת את הקופסא עצמה למקום אחר לשדר את המידע לאתר ה DR.

ininisync

בשורה התחתונה, לא משנה מה קרה, מאובדן קו תקשורת ועד רעידת אדמה באתר הראשי, המידע של הלקוח מוגן עד הבלוק האחרון גם אם לא בוצעה עדין רפליקציה אחרונה אל האתר המרוחק. אין היום אף פתרון כזה בשוק וללקוחות ישראלים תחת איום טילים, לקוחות קוריאנים תחת איום דומה (שנראה שהולך ונחלש), לקוחות בנוי-זילנד שחוששים מרעידות אדמה, יפנים שחוששים מצונאמי וכו' הפתרון הזה מציע דרך אחרת להגן על המידע באופן הרבה יותר פשוט, טכנית, והרבה יותר זול מכל דבר אחר שהיה זמין עבורם עד היום.

דבר אחד שצריך לשים לב אליו הוא זמן ההתאוששות, RTO. InfiniSync מספק הגנה לרמה של RPO-0 אבל RTO זה סיפור אחר. כל עסק צריך להיות מודע להשלכות של זמן ההתאוששות על התהליכים שלו, האם יש הגיון בהתאוששות מהירה אם המידע לא מלא ועדכני עד הסוף? האם האפליקציות יודעות להעלות לאוויר ולהשלים את המידע בשלב מאוחר יותר?

העלות הכספית והמורכבות הטכנולוגית של השילוב בין RTO-0 ל- RPO-0 על פני מרחק גיאוגרפי רב הם בדרך כלל בלתי סבירים לרוב מוחלט אם לא כל הארגונים.

ארגונים צריכים לחשוב על האיזון בין השניים ולשים את הדגש איפה שנכון. אינפינידט היא ספק מערכות האחסון היחיד שיש לו פתרונות לכל צורך ארגוני.

 

שלכם,

ניר מליק

 

 

vSphere 6.7, don't say Thank You, Eat Ass.

VMware vSphere 6.7

אז לא כתבתי כבר יותר מחודש שזו ההפסקה הכי ארוכה מאז שהתחלתי לכתוב כאן והרגשתי קצת יבש ושאיבדתי את הקול שלי אבל אז פתאום VMware הכריזו על vSphere 6.7 וחשבתי לעצמי שהופה הנה יש הזדמנות לכתוב לכם קצת. לצערי נראה לי שיצאה להם הכרזה מאד פרווה, היות ואנחנו כבר שנה וחצי אחרי ההשקה של vSphere 6.5 ציפיתי למשהו קצת יותר סקסי.

אל תבינו אותי לא נכון, יש כל מני חידושים ושיפורים מעניינים אבל, מכירים את זה שבסדרה שאתם אוהבים יש פרק שהוא חלבי לגמרי שרק משאיר כל מני קצוות פתוחים ובדיעבד הבנתם שזה רק פרק שמכין את היסדות לאיזה פרק פיצוץ אחר כך? אז נראה לי שזה מה שהם עשו כאן.

חידוש אחד שכן מצא חן בעיני הוא השילוש של vrealize Oprations אל תוך ה vCenter.

זוכרים שרק בפוסט האחרון כתבתי לכם על ה management pack שלנו עבור vROPs? אז עכשיו בגרסא 6.7 ניתן לקבל את הדו"חות של vROPs בתוך ה vCenter. נכון, רק חלק מהדו"חות אבל הרבה יותר נוח לעבוד מול כלי אחד ורק מדי פעם להזדקק בעצם לעבור לכלי המלא בחלון נפרד לניתוח יותר מעמיק.

יכולת נוספת שנראית לי חשובה היא היכולת לשלוט בהגדרות EVC עבור כל מכונה וירטואלית בנפרד.

נזכיר רגע על מה מדובר כי בדרך כלל רק הפריסייל שבקהל זוכרים לבדוק את זה בכלל, יכולת EVC או Enhanced vMotion Capability בעצם איפשרה vMotion של שרתי וירטואליים בין הוסטים בעלי מעבדים מדורות שונים על ידי רידוד יכולות המעבדים למכנה המשותף הנמוך.

עבור מרבית הקהל הפוטנציאלי מדובר רק על יכולת גמישה יותר למיגרציות מקלאסטרים בעלי מעבדים ישנים לקלאסטרים בעלי מעבדים חדשים אבל  עבור מספר קטן של לקוחות שצריכים EVC על מנת לעבוד בקלאסטר מעורב אבל עדיין צריכים איזה פיצ'ר ספציפי של המעבדים החדשים יותר הכלי הזה יענה על הצורך. מובן שצריך לוותר על גמישות מסוימת במקום אחר והשרתים הוירטואליים עבורם תופעל היכולת יהיו מסוגלים לדלק רק בין השרתים החדשים יותר בלאסטר ולא על כולו.

שיפור נוסף שבאמת באמת נראה יותר כמו הכנה לעתיד מאשר יכולת ריאלית לשימוש מיידי בא לידי ביטוי בתמיכה החדשה של RDMA או remote direct memory access.

השימוש ב RDMA מאפשר זמני תגובה אולטרה מהירים בתקשורת בין שרתים שכן שרת אחד בעצם מקבל גישה ישירה לכתיבה על ה RAM של שרת אחר.

יש עוד ראשי תיבות שצריך להכיר – RoCE או RDMA over Converged Ethernet שכן על מנת לתמוך ב RDMA השרתים צריכים לתמוך ה RoCE. באופן כללי כתיבה משרת אחד מדלקת על ה IO stack ומתבצע ישירות ל RAM של שרת אחר.

אצלנו ב Infinidat ככה אנחנו מיישמים הגנה על כתיבות, כל write IO מרופלק באמצעות RDMA על גבי Infiniband.

אני לא בטוח במאה אחוז כמה יכולת זו רלוונטית עבור שרתים וירטואליים כי התקשורת בין הוסטים די מלוכלכת ורועשת  מה גם שכרגע, אם אני לא טועה, עבור אותם שרתים שעושים שימוש ב RDMA אין תמיכה בו זמנית ב vMotion. אני מאד מקווה שאני לא מטעה את הקהל הקדוש שלי כאן כי אני לא מוצא את הרפרנס בו קראתי את זה לראשונה.

יש עוד כל מני שיפורים ושדרוגים אבל כאמור לא משהו מהפכני לדעתי, קצת כמו השקה של iPhone חדש. כלומר כן, תומכים עכשיו גם ביותר משאבים בשרתים מוגני FT אבל האם זו מהפכה? כנראה שלא.

איציק רייך מ ExtremeIO כתב פוסט יפה על החידושים ב UNMAP

כמו כן מצאתי את הפוסט הזה שמתאר איך להתגבר על המגבלות בשדרוג ל 6.7 במידה ויש לכם מעבדים ישנים שלא נתמכים רשמית.

הוסט הזה מתייחס ספציפית לשרתי Dell R710 אבל אלא אם אני מפספס משהו אז הוא רלוונטי גם לשרתים אחרים.

בדיוק כמו שכתוב בפוסט עצמו, זה שאפשר לא אומר חלילה שכדאי ובטח לא אומר שנתמך, ולכן אני מצטרף אל כותב הפוסט בהמלצה לבצע את התהליך רק לסביבות מעבדה וכו' על מנת שלא להסתכן בהרצה של סביבות ייצור בלי תמיכה רשמית של היצרן.

*** עריכה ***

מצאתי עוד משהו שאולי יכול להיות מעניין עם תיאור מאד מעמיק ומפורט כאן בבלוג של וויליאם לאם.

בסביבות VDI קיימת יכולת לבצע Instant Clone ועכשיו יכולת זו נפתחת באופן מסודר גם לסביבות שרתים וירטואליים.

אני לא בטוח במאה אחוז כמה זה רלוונטי לסביבות פיתוח ובדיקות כמו שהם חושבים שזה, בעולם שכבר מכיר פתרונות שמשלבים שכפול סביבות מהיר על בסיס Snapshot מצד מערכות האחסון או בכלל פתרונות שלא נזקקים לשכפול שרתים בכלל כמו סביבות Container אבל  עדיין זו יכולת nice to have שכדאי לזכור שקיימת.

אל נא תאמר לי ביי ביי, אמור רק להתראות

Matt Watts מחברת NetApp כתב פוסט מעניין בבלוג הפרטי שלו, watts-innovating.com שנקרא  Stop ending with a Thank You?

אני מקווה שהלינק עובד תקין, אני כותב הפעם מיפן ויש איזו בעיה עם הDNS כאן, בכל מקרה זו הסיבה שכתבתי גם את השם המלא של הבלוג וגם של הפוסט כדי שתוכלו לחפש בעצמכם.

באופן בסיסי, לא מדובר באיזה פוסט ארוך ומלא פנינים מעמיקות של חכמת חיים אבל הוא מתמקד בעיצה אחת פושט להבנה ולישום. נניח ואתם מכינים מצגת לכנס או סתם לפגישה חשובה עם הלקוח, למה אתם תמיד מסיימים עם שקף "תודה" או "שאלות?"

הרי זה לא מה שאתם רוצים שהלקוח יזכור, הרי זה לא מה שאתם רוצים שהקהל יעשה, יש לכם מסר להעביר ויש לכם איזה action item שאתם רוצים להניע את השומעים לקראתו לא? אז סיימו בזה. זה יבדל אתכם מכל מצגת אחרת שהלקוח ראה באותו יום ויגביר את הסיכוי שלכם לתוח דיאלוג אמיתי לגבי ה PoC או פגישת המשך או דיון תקציבי או מה שזה לא יהיה שאתם רוצים בשביל הבא שלכם. תגידו תודה בהצלחה כי באמת תודה לכולכם שהקשבתם…ועכשיו תגידו מה אתם רוצים שהקהל שלכם יעשה.

לכו תאכלו תחת

אגב יפן, אכלנו הערב ארוחת ערב טעימה מאד אבל לטעמי לא משביעה אז אחר כך הלכנו גם לשתות בירה במקום נחמד, סגנון קליל כזה, שותים בעמידה מעל ארגזים, והזמנתי כמה שיפודונים כדי למלא את הבטן כמו שצריך. כשהגענו לא ידעתי שהמקום מתמחה רק בחלקי בשר מוזרים (שימו לב לתפריט)

זו פעם ראשונה שלי כאן בטוקיו ואני די הרפתקן באוכל מטבעי אז אמרתי למלצר פשוט להבי לי מה שנראה לו מתאים.

השיפוד התחתון ביותר הוא שיפוד מעי וזה שמעליו הוא שיפוד קיבה שניה ככה שאם מישהוא שולח אתכם יום אחד "לך תאכל תחת" אז תדעו שתחת זה טעים אבל צמיגי וקיבה זה ממש לא טעים. שלא תגידו שלא לומדם שום דבר בבלוג הזה!

WhatsApp Image 2018-04-24 at 17.05.54

מסיים הפעם בהזמנה למשוב, תכתבו לי מה דעתכם על מה שאני עושה כאן בשבילכם, זה חשוב לי!

ניר מליק

רכבת הרים, חומרה תוכנה ואכזבה

כל שנה מתחילה בסימן שאלה

ואוו כמה מהר עברה השנה הזו. רק לפני שנה סיפרתי לכם על פריז, חתונות, החלטות והמעבר מווי אנקור לאינפינידט וגם את הפוסט הזה אני כותב לכם, שוב, מהודו. איזו שנה זו היתה. עברתי מקום עבודה, עברנו דירה, נולד לנו ילד שני, קיבלתי תואר חדש וצוות לנהל, פשוט רכבת הרים!

רציתי לכבוד הפוסט הזה גם לספר לכם שקיבלתי לראשונה את התואר vExpert אבל לצערי זה לא נכון ונדחיתי בבושת פנים! נו שויין, מפרגן שוב לחברים נתנאל בן שושן ואורי אביטן שזכו לתואר שוב ואיתם איציק רייך, ליאור קמרט שעובר לארה"ב ושאר קבוצת הישראלים המגניבים המייצגים אותנו בכבוד בעולם!

1yr

Caringo – תוכנה זה קשה

רכבת ההרים אילצה אותי לאחרונה לחזור לימי האינטגרציה וניהול הפרויקטים שלי. במסגרת פרויקט ביפן אפיינתי שרתים ומתגים, נסעתי למחסנים, חיברתי כבלים, צעקתי על ספקים ותזמנתי טיסה של מהנדסים משני קצוות עולם (ליטרלי שני קצוות עולם, טוקיו וטקסס במקרה שלנו).

חלק מהפתרון חייב גישה לאותו המידע בו זמנית בצורת קבצים (NFS+SMB) ובצורת אובייקטים (S3 compatible) ולכן הפתרון שלנו כלל שת"פ עם החברים מקרינגו.

Caringo SWARM הוא פתרון software defined storage המספק מערכת אחסון אובייקטים די מגניבה, הפתרון סקלבילי, מאפשר כמובן להגדיר מדיניות erasure coding ברורה, מאפשר הכלת מדיניות worm לשימור מידע בהתאם למדיניות הארגון ומספק ממשק ניהול ודיווח ברורים ונוחים.

SWARM NFS הוא תוסף המאפשר גישה לאותו מידע המאוחסן כאובייקטים גם כקבצי NFS. גישה משמעותה גם קריאה וגם כתיבה בזמן אמת ללא צורך להכפלת המידע.

Caringo Drive הוא תוסף פשוט המאפשר גישה בפרוטקול SMB שנראה ומתנהג פשוט כמו תיקיית רשת לסביבת חלונות, למשתמש הקצה זה נראה כמו תיקיה רגילה לגמרי.

פתרונות כמו קרינגו מאפשרים הרבה מאד גמישות תפעולית אבל התקנה של פתרון SDS נקי יכולה להיות די מאתגרת, הליך ה sizing לא טריויאלי ויש הרבה מאד חלקים שונים להתקין ולוודא שכל החלקים מנגנים ביחד באופן חלק

מצד שני – חומרה זה גם קשה

לאחרונה התבשרנו שחברת קמינריו עוברת למודל של חומרה בלבד או יותר נכון מודל משולב משולב כי קמינריו תספק את תוכנה כאשר את החומרה תספק Tech Data. בערך באותו זמן חברת E8, גם היא יצרנית ישראלית, צעירה וקטנה יותר, הכריזה כי תתחיל למכור את הפתרונות שלה במודל תוכנה בלבד אך תחייב רכישה של שרתים בתצורות מוגדרות מראש, בדומה ל VSAN Ready Nodes.

Dell EMC הכריזה על מהלך הפוך עבור פתרונות ScaleIO ומעכשיו ניתן לרכוש את המוצר, שהיה עד לא מזמן מוצר תוכנה בלבד, רק על גבי שרתי Dell כחלק מפתרונות VxRAck FLEX.

נראה לי שהדברים מחזקים ההיגיון בבחירה שעשינו אנחנו באינפינידט, חומרה זה קשה אבל גם תוכנה זה לא פיקניק ולכן אנחנו מייצרים רק את התוכנה אבל מספקים ללקוח פתרון אחוד בו אנחנו כבר בחרנו, רכשנו, הטמענו ובדקנו את החומרה ככה שכל מה שהלקוח צריך לעשות זה לחבר חשמל ותקשורת ולעבוד.

Management pack for VMware VROPS

לפני כמה חודשים סיפרתי לכם על ה Plug-In שלנו ל VMware vRealize Log Insight והיום אני רוצה לספר לכם על ה Management Pack החדש שלנו עבור VMware vRealize Operations. גם הכלי החדש הזה כמובן זמין ללקוחות ללא עלות נוספת מאתר התמיכה שלנו וללא מגבלות על כמות מערכות או נפחים.

vRealize Operations או VROPs, הוא הכלי של VMware לניטור ובקרה של סביבת IT. ככל שעולים ברמת הרישוי, עולים ברמת הבקרה מניטור התשתית אל רמת השרתים הווירטואליים והאפליקציות. יצרנים רבים מספקים חבילות ניהול ורובם גובים עבורן הון קטן. התאמת חבילת ניהול שכזו למוצרים דורשת ידע והתמחות ונוצר שוק חיצוני של שחקנים כמו Blue Medora שמוכרים חבילות עבור יצרנים אחרים ותלוי בהסכם עם היצרן הספציפי החבילות יכולות להיות מוכרות רשמית על ידי היצרן או שלא מוכרות רשמית אלא רק עובדות.

בכל מקרה, מה ש VROPs רוצה לספק לנו זה הקללה המוכרת של single pane of glass לניטור כל מה שיש לנו, ה Management Packs השונות מאפשרות לנו לקשר את הפלטפורמה גם למארזי שרתי להב או מתגי SAN וכו'.

ההתקנה מאד פשוטה כי החבילה מדברת ישירות עם ה API שלנו בלי שום צורך בקונפיגורציה או כלים נוספים וכללנו מספיק מסכים מובנים כדי להתחיל לעבוד ולהפיק תועלת בלי שום קסטומיזציה נוספת (אפשר לייצר דוחות נוספים אבל לא חייבים).

קהילה

מדי פעם אני מציק וקורא לכולכם לתמוך בקהילה (כאן למשל) ולכן אני שמח לחלוק ולעדכן שמצאתי עוד בלוג IT בעברית. הבלוג http://virtual.sites.co.il/ מתגאה בתואר בלוג הוירטואליזציה העברי הראשון והוא מנוהל על ידי קבוצה הכוללת את מיכאל מליז'ונק (עוד אחד מה vExpert אבל לא אני לא מתמרמר ולא מתבאס בכלל!), יניב ויינברג ובן חגי. בקרו בבלוג שלהם ותהנו.

זה הכל להפעם,

שלכם,

ניר מליק

 

blogging with MS-Word using 2FA

 My dear friend Michael Cade has recently published a post describing how easy it is to post content directly from MS-Word to WordPress

Now i have posted on my Blog a short addition to his post, describing how to do that if you are using 2FA. WordPress allows for creating a dedicated application password for just this use-case

Apparently some internet users can't read Hebrew so my original post wasn't very helpful to Michel's audience therefore i'm reposting the relevant part of my post in English

Please note this is only relevant if you are using WordPress.com, not if you are self hosting. if anyone knows what is the process for setting this up self hosting WordPress please let me know and i will add it to the post

And onwards to the explanation itself

When logged into your account click on the little avatar icon

and then choose Security


Under Security go to the Two-Step Authentication tab

and click on Add new Application Password


that's it, you're done, you now have a dedicated application password you can use with Word, or any other application you may need to add, working around the need for 2FA

 

This is my first English post on a Hebrew blog so i'm having some technical issues, for example there is no (.) at the end of each sentence, i hope we can work past that and still be friends

 

Thank you everyone

Nir