קייס סטאדי – תקלה 3

תקלה

עוד בעיה פשוטה, שבמבט ראשון לא ברור מאיפה מגיעה הבעיה, אבל שמפעילים Wireshark הבעיה פשוטה מאוד לפתרון

מבנה הרשת (החלק הרלבנטי לתקלה)

הרשת בנויה משרת Database בכתובת 172.30.0.10, כאשר Clients ניגשים אליו ב- MS – Terminal Server שכתובתו 172.30.0.22. ה- Clients  ניגשים מסניפים מרוחקים, כאשר שרת ה- DB ושרת ה- Terminal נמצאים על אותו הרשת המקומית.

מה הייתה הבעיה:

הבעיה הייתה שבהעברה של מערכת קיימת לשרתים חדשים עם מערכות הפעלה Windows חדשות, ה- Clients מתחברים לשרת ה- Terminal, מקבלים את חלון ההתחברות ל- Database אבל לא מצליחים להתחבר.

תהליך הפתרון

  1. שלב ראשון – בדיקות סטנדרטיות.
    1. בדיקת זמינות של השרתים – Ping פשוט מכולם לכולם רואים שתקשורת קיימת.
    2. בדיקת עומסים על המתגים – רואים שעל המבואות של שני השרתים יש עומס גבוהה של כמה עשרות Mbps. כאן עולה השאלה הראשונה – אם לא מצליחים להתחבר, אז מאיפה העומס???
  2. שלב שני – מפעילים Wireshark על שרת ה- Terminal. למה דווקא עליו? כי ממנו אני רואה גם את ה- Clients שמתחברים אליו, וגם את החיבור שלו ל- DB Server.
  • מה שרואים מיידית, והוספתי עמודה של “Time delta from previous displayed packet” כדי שיהיה יותר ברור:
  • זמנים בין Packets על ה-TCP Stream שפילטרתי הם של עשרות µSec, כלומר כל כמה עשרות מיקרו שניות נשלחים Packets הלוך-חזור (SMB Request-Response). לא הגיוני לשרת שמקבל עשרות עד מאוד בקשורת לשנייה (במקרים קיצוניים).
  • גם כאשר אני משתמש ב- IO Graph כדי לבדוק את העומס על השרת (עם פילטר על ה- TCP Stream), אני רואה עומס של כ- 50Mbps (*הערה בסוף המאמר)

  • ולפתרון: כשמסתכלים לתוך ה- Packet, רואים שב- SMB Read Request שרת הטרמינל מנסה לגשת לקובץ magic\ini2_terminal.ini ולא מצליח.
  • הסיבה לכך יכולה להיות מיפוי של מיקום הקובץ (מה שבאמת היה חסר) או הרשאות גישה לספריה.
  • הגדרות קצרות של מנהל הרשת והכל הסתדר.

ולהערה קצרה:

בגרף ה- IO שראינו בדוגמא אנחנו רואים Peak של כ- 50Mbps אבל זה נתון לא מדוייק, והסיבה לכך היא ש- Wireshark מראה בחלון זה את הממוצע של שניה (האינטרוול שמופיע במרכז החלון למעטה) – כל נקודה בגרף היא ממוצע של השנייה מהנקודה והלאה. כך למשל, הערך בזמן של Second 12 הוא הממוצע בין שניות 12 ל- 13.

בהקלטת מידע תחת עומס, אפשר להוריד את הרזולוציה עד ל- 1mSec, ונקבל שהעומסים הרגעיים היו בוהים בהרבה (יש להכפיל את המספר על ציר ה- Y ב- 1000 כי הוא מראה Bits/1mS):