رضا اردانه
۲۶ فروردین ۱۳۹۹

متریک های مانیتورینگ در یک نگاه

۱ دیدگاه
مقاله آموزشی
امتیاز دهید

همانطور که میدانید به منظور انجام فرآیند عیب یابی در محیط مجازی می بایست با Metric های اندازه گیری در بخش های مختلف آشنا باشیم تا در صورت مواجه شدن با شرایط نامطلوب و بررسی این Metric ها اقدامات لازم را انجام دهید.

به صورت کلی در محیط مجازی شما در 4 دسته بندی زیر می توانید Metric های متعددی را بررسی نمایید:

  • شبکه مجازی
  • فضای ذخیره سازی
  • پردازنده
  • حافظه اصلی

این Metric ها بر اساس نوع خود هر کدام بیانگر موضوع خاصی می باشند که هم می توان در خروجی دستور esxtop آنها را مشاهده کرد و هم می توان از طریق ابزار قدرتمند vROPs اقدام به بررسی آنها کرد. با توجه به اینکه عنوان این Metric ها در دو بخش ذکر شده، یعنی خروجی دستور esxtop و سامانه vROPs متفاوت می باشد، در جدول زیر Mapping بین این Metric ها را می توانید مشاهده نمایید.

Metrics Tree

بخش پردازنده:

  • متریک USED معرف میزان مصرف پردازنده توسط یک Process که می تواند یک ماشین مجازی باشد.
  • متریک RDY یکی از مهمترین متریک های این بخش است که بیانگر مدت زمان انتظار یک ماشین مجازی به منظور تخصیص منابع پردازشی به آن توسط Hypervisor است. در واقع این کلمه بیان کننده این است که ماشین مجازی آماده دریافت منابع است ولی منابع پردازشی هنوز به صورت کامل آزاد نشده است تا در اختیار آن ماشین مجازی قرار داده شود. علت اصلی این موضوع افزایش بی رویه تعداد vCPU ها روی تمام ماشین های مجازی درون یک هاست می باشد. باید توجه داشته باشید که CPU Oversubscription Ratio در همه شرایط باید رعایت شود.
  • متریک CSTP یا Co-Stop بیانگر کاهش کارآیی ماشین مجازی از منظر پردازنده است. در صورتیکه این مقدار رو به افزایش باشد بدین معناست که وضعیت Schedule کردن پردازنده ها توسط CPU Scheduler با مشکل مواجه شده است و ماشین های مجازی به شدت افت کارآیی از خود نشان خواهند داد.
  • متریک SWPWT بیانگر این است که ماشین مجازی در انتظار بارگذاری دیتای SWAP شده روی دیسک جهت انجام فرآیند پردازشی قرار دارد. علت اصلی این موضوع تخصیص بیش از حد Memory به ماشین های مجازی است.
  • بخش MLMTD بیانگر رسیدن به سقف محدودیت اعمال شده برای یک ماشین مجازی می باشد. بدین معنا که در صورت محدود کردن میزان استفاده پردازنده یک ماشین مجازی ممکن است با شرایطی روبرو شوید که ماشین مجازی به سقف مصرف خود برسد و نیاز بیشتری را طلب کند. در این صورت این متریک برای آن ماشین مجازی افزایش می یابد.

بخش حافظه اصلی:

  • مقدار N%L بیانگر این موضوع است که یک ماشین مجازی دارای حافظه اصلی بیش از آنچیزی است که در هر NUMA Node قرار داده شده است. در نتیجه در بازه زمانی های مختلف بخشی از حافظه اصلی برای این ماشین مجازی توسط RDMA تامین خواهد شد. به طور مثال شما هاستی با 128 گیگابایت حافظه اصلی و دو پردازنده دارید اما ماشینی ایجاد کرده اید که 192 گیگابایت حافظه اصلی به آن تخصیص داده اید. در این صورت با تقسیم حافظه به دو بخش مساوی، هر بخش بیش از میزان یک NUMA Node حافظه اصلی خواهد داشت.
  • بخش MCTLSZ مربوط به فرآیند Ballooning می شود. این فرآیند در این مقاله به صورت جداگانه توضیح داده شده است.
  • بخش MCTLTGT به میزان Memory که Balloon شده است اشاره دارد.
  • بخش SWR/S در صورتیکه بالاتر از 0 باشد بدین معناست که هاست در حال خواندن از vSWP می باشد. دلیل این امر نیز می تواند تخصیص بیش از حد حافظه به ماشین های مجازی باشد.
  • بخش SWW/S معادل SWR اما از منظر نوشتن می باشد. یعنی هاست در حال نوشتن بر روی vSWP می باشد.
  • بخش ZIP/s بدین معناست که State فعلی هاست در حالت Low می باشد و هاست اقدام به فشرده سازی اطلاعات درون Memory کرده است. دلیل این امر نیز تخصیص بیش از حد حافظه اصلی به ماشین های مجازی است.
  • بخش UNZIP/s بیانگر این است که هاست در حال خارج کردن اطلاعات فشرده شده در حافظه اصلی به منظور استفاده از آنها می باشد.

بخش فضای ذخیره سازی:

  • گزینه CMDS/s بیانگر مجموع کل IO هایی است که در یک ثانیه در حال تولید می باشد. این گزینه شامل تمام IO های سیستم می شود.
  • گزینه DAVG مربوط به میزان تاخیر در پاسخگویی توسط دنیای بیرون از محیط مجازی شما می باشد. به طور مثال ممکن است تاخیر پاسخگویی بر روی Array شما باشد. مقدار این گزینه توسط هاست ESXi به اصطلاح Measure می شود.
  • گزینه KAVG مربوط به Storage Kernel هاست ESXi می باشد. در نتیجه تاخیر در این بخش به معنای وجود اشکال درون ESXi می باشد. به طور مثال ممکن است با فرآیند queuing مواجه شده باشید. مقدار این گزینه توسط هاست ESXi به اصطلاح Calculate می شود.
  • گزینه GAVG مربوط به میزان تاخیر در پاسخگویی در سطح سیستم عامل مجازی می باشد. علت این امر معمولا به دلیل عدم انتخاب صحیح SCSI Controller مناسب و یا تخصیص تعداد بالایی دیسک به یک کنترلر می باشد. اما دلایل درون سیستم عامل مانند رفتار اپلیکیشن ها نیز می تواند در این بخش تاثیر گذار باشد. مقدار این گزینه توسط هاست ESXi به اصطلاح Measure می شود.
  • گزینه QAVG در واقع بخشی از KAVG می باشد. بیانگر مدت زمانی است که درخواست های IO درون KAVG به اصطلاح Queue می شوند. مقدار این گزینه توسط هاست ESXi به اصطلاح Calculate می شود.
  • گزینه AQLEN بیانگر حداکثر میزان Queue بر روی Storage Adapter است که بر روی هاست شما پشتیبانی می شود. این بخش منطبق با پیکربندی است که شما برای Adapter خود در نظر گرفته اید.

بخش شبکه:

  • گزینه PKTTX/s میزان بسته هایی است که در یک ثانیه توسط ماشین مجازی شما ارسال شده است.
  • گزینه PKTRX/s میزان بسته هایی است که در یک ثانیه توسط ماشین مجازی شما دریافت شده است.
  • گزینه MbTX/s میزان پهنای باند ارسالی است که در یک ثانیه توسط ماشین مجازی شما اشغال شده است.
  • گزینه MbRX/s میزان پهنای باند دریافتی است که در یک ثانیه توسط ماشین مجازی شما اشغال شده است.
  • گزینه DRPTX/s میزان بسته های ارسالی است که در یک ثانیه به ازای ماشین مجازی شما از دست رفته است. علت این امر سرباز زیادی است که بر روی شبکه شما وجود دارد.
  • گزینه DRPRX/s میزان بسته های دریافتی است که در یک ثانیه به ازای ماشین مجازی شما از دست رفته است. علت این امر سرباز زیادی است که بر روی شبکه شما وجود دارد.
امتیاز دهید

یک پاسخ به “متریک های مانیتورینگ در یک نگاه”

  1. mohammad.farhangmehr گفت:

    عالی بود ، ممنونم 👏

دیدگاهتان را بنویسید