هفته گذشته به تفصیل راجع به خدمات ابری تیم‌یار، نسخه ۴ ERP تیم‌یار و قابلیت‌های این نسخه، صحبت کردیم.

نسخه ۴ ERP تیم‌یار که قرار است تا پایان آذرماه ۱۳۹۹ ارائه شود، از قابلیت (HA) در سرویس ابری خود به طور کامل استفاده کرده است.

امکان توزیع  ماژول‌های تیم‌یار بر روی سرورهای مختلف به منظور ایجاد (HA)، قابلیتی است که  می‌توان چند سرور برای تیم‌یار داشت و درخواست‌ها را به سمت آن‌ها توزیع کرد و در صورت عدم دسترسی به یکی از سرور‌های تیم‌یار، سرور دیگر پاسخ درخواست کاربر را می‌هد.

در این خبر قصد داریم به طور کامل درباره HA (High Availability) صحبت کنیم.

 

تعرفه‌های تیم‌یار ابری

یک دستگاه برای high available بودن، باید بتواند هنگام بروز مشکل، در سریع‌ترین زمان ممکن آن را شناسایی کند و اگر یک سرویس به هر دلیل از دسترس خارج شود، برای آن جایگزینی داشته باشد و تا زمان رفع مشکل به درخواست‌های کاربران پاسخ بدهد.

“(HA)” شامل دو دوره زمانی است: یک سرویس تا چه زمانی در دسترس است؟ و چه مقدار زمان برای پاسخگویی به درخواست‌های کاربر از سوی سیستم، مورد نیاز است؟ (HA)، آن دسته از سیستم‌های هستند که سطح بالایی از عملکرد عملیاتی و کیفیت را در طی یک بازه زمانی، ارائه می‌دهند.

هنگام اندازه گیری میزان دسترسی، عوامل مختلفی مورد بررسی قرار می‌گیرند که شامل زمان ریکاوری و دوره‌های نگهداری برنامه ریزی شده و غیر برنامه ریزی شده است.

به طور معمول، میزان دسترسی به عنوان درصدی از زمان کار تعریف شده توسط (SLA) بیان می‌شود. نمره ۱۰۰ درصد، سیستمی را توصیف می‌کند که هرگز قطع نمی‌شود.

کلاسترهای (HA)، رایانه‌هایی هستند که از برنامه‌های مهم پشتیبانی می‌کنند. به طور ویژه، این کلاسترها به طور قابل اعتماد در کنار هم کار می‌کنند تا از خرابی سیستم جلوگیری شود.

برای کاهش قطعی و خرابی، ضروری است که برای وقایع غیر منتظره‌ای که می‌تواند منجر به خرابی سرورها شود، آماده بود. سیستم‌های (HA)، تأثیر قطعی‌ها را به حداقل می‌رسانند و اغلب می‌توانند به طور خودکار خرابی قطعات یا حتی سرور را بازیابی کنند.

برای دستیابی به (HA)، ابتدا باید نقاط منفرد (SPOF) موجود در زیرساخت سیستم عامل را شناسایی و از بین برده شود. مرحله‌ی بعد، هر نقطه‌ای که باعث ایجاد وقفه مهم در سرویس می‌شود ، باید حذف شود.

برای (HA)، چه تجهیزات سیستمی مورد نیاز است؟

مؤلفه‌های مختلفی برای (HA) در عمل، وجود دارد که باید با دقت مورد توجه قرار گیرد. بیش از اجرای نرم افزار، (HA) به عواملی نیاز دارد، ازجمله:

  • محیطی: اگر همه سرورهای شما در همان منطقه جغرافیایی قرار گرفته‌اند ، شرایط محیطی مانند زلزله یا سیل می‌تواند کل سیستم شما را خراب کند. داشتن سرورهای اضافی در دیتا سنترهای مختلف و مناطق جغرافیایی باعث افزایش اطمینان می‌شود.
  • سخت افزاری: سرورهای (HA) باید نسبت به قطع برق و خرابی سخت افزار، از جمله هارد دیسک ها و رابط‌های شبکه، مقاومت کنند.
  1. دو پاور به صورت Redundant , Hot Plug وجود داشته باشد
  2. هاردها Raid 1,5,6,10 و Hot Plug باشند
  3. دو کارت شبکه به صورت Load Balance وجود داشته باشد
  4. استفاده از UPS و ژنراتور برای تامین برق در زمان قطعی برق 

در نظر گرفتن این موارد به HA کمک می‌کند تا درصورت خرابی یکی از آنها مشکلی در ادامه فعالیت سرور به وجود نیاید.

  • نرم افزاری: تمامی اجزا نرم افزار, از جمعه سیستم عامل, Web Server , DB Server , Application Server ,… باید برای خرابی‌های غیر منتظره و یا درخواست‌های زیاد آمادگی جایگزینی (Master ,Salve) و توزیع ترافیک (Load Balance) برنامه ریزی شده باشند.
  • داده‌ها: از بین رفتن داده‌ها و عدم همخوانی داده‌ها، می‌تواند توسط چندین عامل ایجاد شود، و فقط به خرابی هارد دیسک محدود نمی‌شود. سیستم‌های (HA)، نیاز به Replication , Backup دارند تا در صورت از بین رفتن اطلاعات امکان بازیابی آنها وجود داشته باشد.
  • شبکه: قطع برنامه ریزی نشده شبکه، بیانگر یک نقطه شکست محتمل دیگر، برای سیستم‌های (HA) است. این مهم است که برای خرابی‌های احتمالی، استراتژی افزونگی شبکه برای جایگزینی وجود داشته باشد.

 

 

(HA) زیر مجموعه مهمی از مهندسی اطمینان است، که به این موضوع، که یک سیستم یا مؤلفه از عملکرد عملیاتی بالایی در یک دوره زمانی معین برخوردار باشد، تمرکز دارد. در نگاه اول، اجرای آن ممکن است کاملاً پیچیده به نظر برسد. با این حال، این می‌تواند مزایای فوق العاده‌ای را برای سیستم‌هایی که نیاز به افزایش قابلیت اطمینان دارند به همراه آورد.

چگونه می‌توان زمان خرابی را محاسبه کرد؟

اندازه گیری خرابی برای هر مؤلفه‌ای که ممکن است بر عملکرد صحیح بخشی از سیستم یا کل سیستم تأثیر داشته باشد، ضروری است. مدت زمانی که صرف تعمیر و نگهداری سیستم می‌شود را می‌توان جزو زمان در دسترسی نبودن سیستم محاسبه کرد. چنین خرابی‌های برنامه ریزی شده، باعث متوقف شدن کسب و کار می‌شوند، بنابراین باید هنگام پیاده سازی سرویس به آنها توجه داشت .

چگونه می‌توان درصد زمان کار (HA) را محاسبه کرد؟

در مدت زمان معینی، یک سیستم خاص، در حالت عملیاتی باقی می‌ماند (معمولا در بازه زمانی یک سال)، اندازه گیری می‌شود. این اندازه گیری به صورت درصدی بیان می‌شود.

توجه داشته باشید که زمان کار لزوماً با دسترسی یکسان نیست. یک سیستم ممکن است در حال اجرا و کار باشد، اما در دسترس کاربران نباشد. دلایل این امر ممکن است به توازن شبکه یا بار، مربوط باشد.

زمان کار معمولاً با درجه بندی دسترسی پنج ۹ بیان می‌شود. (در صنعت رایانه، هدف چالش برانگیز “پنج نه” یا ۹۹.۹۹۹ درصد است – به طور متوسط خرابی سالیانه پنج دقیقه.)

درجه “یک نه” به این معنی است که دسترسی مطمئن ۹۰ درصد است. امروزه، بیشتر سازمان‌ها و کسب و کارها نیاز به داشتن حداقل “سه نه”، یعنی ۹۹.۹ درصد از دسترسی را دارند.

کسب و کارها به دسترسی‌های مختلفی نیاز دارند. آن دسته از کسب و کارهایی که باید در طول شبانه روز عملیات داشته باشند، هدف “پنج نه”، یا ۹۹.۹۹۹ درصد از زمان کار را خواهند داشت. به نظر می‌رسد که ۰.۱ درصد تفاوت زیادی را ایجاد نمی‌کند. با این حال، وقتی این کار را به ساعت‌ها و دقیقه‌ها تبدیل می‌کنید، تعداد قابل توجهی است.

برای دیدن حداکثر خرابی در هر سال به جدول زیر توجه کنید:

 

 

طبق اطلاعات داده شده در جدول بالا ، تفاوت بین ۹۹ درصد و ۹۹.۹ درصد، مقدار قابل توجهی است.

توجه داشته باشید که این سنجش بر اساس تعداد روز در سال می‌باشد، نه بر اساس ساعت یا دقیقه. هر آن چه مقیاس یا میزان (HA) افزایش یابد، هزینه خدمات، نیز افزایش می‌یابد.

در مجموع برای راه اندازی و استفاده از چنین قابلیتی، زمان و هزینه بسیاری برای راه اندازی، نگهداری و تعمیر سخت افزارها و نرم افزارها، مورد نیاز است.

شرکت تیم‌یار نیز با ارائه این قابلیت، سعی در بستر سازی صحیح و ارائه کامل تیم‌یار ابری در سطح ملی و بین المللی را دارد.

توسعه مدیریت هوشمند یکپارچه کسب و کار
تعرفه‌های تیم‌یار ابری