محیطهای کسب و کار از سیستمهای فیزیکی ثابت و قابل پیشبینی قدیمی، به یک محیط دائما در حال تغییر تبدیل شدهاند و همین موضوع باعث میشود که زیرساختها و عملیات فناوری اطلاعات روزبهروز بزرگتر و پیچیدهتر شوند. به همین دلیل، مدیریت حجم وسیع دادهها و فرایندهای توسعه به صورت دستی میتواند استرسزا و حتی غیرممکن باشد. اینجاست که AIOps، هوش مصنوعی را با زیرساخت و عملیات IT ترکیب میکند تا با سادهسازی فرایندها، از اتلاف زمان و منابع جلوگیری کند.
البته کاربرد این فناوری، محدود به بهینهسازی فرایندها نیست. AIOps با استفاده از یادگیری ماشین و کلان داده، تمام ابعاد عملیات فناوری اطلاعات را تغییر میدهد. در این مقاله از بلاگ آسا میخواهیم بیشتر با این تعریف آشنا شویم. با ما همراه باشید تا همه چیز را در مورد AIOps و نقش آن در توسعه نرمافزار بخوانید.
AIOps چیست؟
AIOps مخفف عبارت Artificial Intelligence for IT Operations و به معنی «هوش مصنوعی در عملیات فناوری اطلاعات» است. در واقع AIOps، روشی برای استفاده از تکنولوژیهای هوش مصنوعی (AI) مانند پردازش زبان طبیعی (NLP) و یادگیری ماشین برای پشتیبانی، سادهسازی و بهبود فرایندهای رایج فناوری اطلاعات است.
علاوه بر این AIOps، فرایندهای اتوماسیون عملیات فناوری اطلاعات، شناسایی هوشمند الگوها، فرایندهای توسعه، تقویت همکاری در وظایف مشترک و حل مسائل فناوری اطلاعات را بهینه و ساده میکند. این فناوری کاربردی حتی در زمینه مدیریت خدمات، مدیریت عملکرد و مدیریت رویداد برای بهبود مستمر عملیات IT هم به کسب و کارها کمک میکند.
ساختار و اجزای اصلی AIOps
برای اینکه درک بهتری از نقش هوش مصنوعی در عملیات فناوری اطلاعات داشته باشید، اجازه دهید AIOps را به برخی از اجزای ضروری آن تقسیم کنیم. Big Data و Machine Learning دو عنصر اصلی در AIOps هستند که در ادامه نگاهی کاملتر به هر یک از آنها خواهیم داشت.
۱. کلان داده (Big Data)
یکی از عملکردهای اصلی AIOps، ترکیب مقادیر زیادی از دادههای بزرگ و متنوع یا همان Big Data است. کلان داده به مجموعه دادههای پیچیده و بزرگی گفته میشود که نمیتوانیم با استفاده از نرمافزارها و متدهای سنتی پردازش داده آنها را تحلیل کنیم. AIOps به Big Data نیاز دارد تا از آن برای کشف الگوها، شناسایی روندها یا تعیین علل ریشهای استفاده کند. بنابراین میتوانیم بگوییم که بدون استفاده از پلتفرمهای Big Data، اجرای AIOps غیرممکن خواهد بود.
۲. یادگیری ماشین (Machine Learning)
دومین و در عین حال مهمترین بخش AIOps، یادگیری ماشین است. یادگیری ماشین بر مطالعه رفتار انسان و تکرار آن رفتارها با استفاده از الگوریتمها و دادهها متمرکز است. بعد از اینکه اطلاعات مورد نیاز توسط Big Data آماده شد، یادگیری ماشین شروع به تجزیه و تحلیل دادهها میکند. ML با قدرت فوقالعاده خود در تجزیه و تحلیل دادهها، به پلتفرمهای AIOps کمک میکند تا الگوها، ناهنجاریها و علل ریشهای را شناسایی کند. یادگیری ماشین همچنین اقدامات مورد نیاز، بینشها و پیشبینیها را در مقیاس و در طول زمان به پرسنل IT ارائه میدهد.
AIOps چگونه کار میکند؟
همانطور که گفته شد AIOps از فناوریهای تحلیلی پیشرفته مانند یادگیری ماشین برای خودکارسازی و بهینهسازی فرایندهای عملیات فناوری اطلاعات و از بیگ دیتا برای جمعآوری اطلاعات استفاده میکند.
اما اگر بخواهیم مراحل و نحوه کار AIOps را توضیح دهیم، باید به مراحل زیر اشاره کنیم:
- جمعآوری دادهها: پلتفرمهای AIOps اطلاعات را از منابع مختلفی از جمله گزارشهای برنامه، رویدادها (events)، دادههای پیکربندی، معیارهای عملکرد و ترافیک شبکه جمعآوری میکنند. این دادههای بسیار بزرگ میتوانند مانند پایگاههای داده ساختاریافته،یا مانند پستهای شبکههای اجتماعی بدون ساختار باشند.
- تحلیل دادهها: دادههای جمعآوریشده در مرحله قبل، با استفاده از الگوریتمهای یادگیری ماشین مانند تشخیص ناهنجاری (Anomaly Detection)، تشخیص الگو و تجزیه و تحلیل پیشگویانه پردازش میشوند. این مرحله تضمین میکند که دادههای مهم از نویز و دادههای پرت جدا شوند.
- استنتاج و تحلیل علل ریشهای: AIOps تجزیه و تحلیل علت ریشهای را برای پیدا کردن منشاء مشکلات انجام میدهد. تیمهای عملیات فناوری اطلاعات میتوانند با بررسی ریشههای مشکلات فعلی، از تکرار مشکلات در آینده جلوگیری کنند.
- همکاری: زمانی که تجزیه و تحلیل کامل شد، AIOps اطلاعات را به تیمها و افراد مربوطه ارائه میدهد تا با همکاری هم، روند توسعه را بهبود دهد. دستهبندی و ارائه صحیح اطلاعات و وظایف به تیمهای متخصص، باعث تعامل هدفمند افراد و تیمها با یکدیگر و در نهایت، باعث کاهش زمان توسعه و رفع ایرادات و افزایش بهرهوری میشود.
- اصلاح خودکار: اتوماسیون یا خودکارسازی یکی از مهمترین ابزارهایی است که هوش مصنوعی در اختیار تیمهای فناوری اطلاعات قرار میدهد. AIOps میتواند مشکلات را به طور خودکار برطرف کند، به طور قابل توجهی فرایندهای دستی را کاهش و سرعت واکنش به حادثه را افزایش دهد. به عنوان مثال، AIOps قادر است تا مقیاسبندی منابع، راهاندازی مجدد یک سرویس یا اجرای اسکریپتهای از پیش تعریفشده برای رفع مشکلات را به صورت خودکار انجام دهد.
کاربردهای مهم AIOps
احتمالا در هنگام خواندن نحوه کار AIOps در بخش قبل، متوجه چند مورد از استفادههای AIOps شدهاید. موارد استفاده از فناوری در هر شرکت و حوزهای با توجه به نیازمندیهای آن حوزه، میتواند متفاوت باشد. در این قسمت بعضی از کاربردهای مهم AIOps در یک محیط IT را بررسی میکنیم.
تشخیص ناهنجاری
زمانی که یک عیب یا ناهنجاری در سیستم به وجود میآید، تیمهای DevOps دست بهکار میشوند تا عیوب و ناهنجاریها را در زیرساختهای خود تشخیص دهند و به سرعت آنها را رفع کنند. در بسیاری از مواقع، این باگها بعد از عرضه محصول شناسایی میشوند و پیدا کردن دستی این ناهنجاری ممکن است زمانبر باشد؛ در نتیجه روی تجربه مشتری تاثیر بدی خواهد داشت.
اینجاست که اولین کارکرد AIOps خود را نشان میدهد و از هوش مصنوعی، یادگیری ماشین و یادگیری عمیق برای مقایسه عملکرد فعلی (لحظهای) با تجزیه و تحلیلهای گذشته استفاده میکند تا ناهنجاریهای سیستم را شناسایی کند.
بررسی علل ریشهای
همه ما میدانیم که حل ریشهای یک مشکل بهتر از برطرف کردن سطحی آن است. AIOps میتواند رویدادها را جمعآوری و مرتبط کند و سپس از مدلهای استنتاج یادگیری ماشین و جداسازی رویدادهای مرتبط استفاده کند تا علت اصلی مشکلات شناسایی شود.
منظور از مرتبطسازی رویدادها (Event correlation) این است که ببینیم چه اعمالی، چه نتایجی دارند و چه سلسله فرایندهایی باعث بروز یک مشکل میشوند. بنابراین AIOps میتواند مسائل احتمالی را پیشبینی کند و به سرعت تجزیه و تحلیل علت ریشهای را انجام دهد تا از وقوع مشکلات جلوگیری کند.
همبستگی رویداد
تیمهای توسعه هر روز با سیلی از هشدارها روبرو میشوند، اما تنها تعداد انگشتشماری از این هشدارها واقعا اهمیت دارند. بررسی تمام این هشدارها توسعهدهندگان را خسته میکند و ممکن است باعث نادیده گرفتن هشدارهای مهم و تاثیرگذار بر عملکرد سیستم شود.
AIOps این هشدارها را جمعآوری میکند، آنها را برای یافتن روابط بین دادهها تجزیه و تحلیل و در تعداد کمتری از اعلانها گروهبندی میکند. در این حالت، با اطمینان به مسائل و هشدارهای مهم رسیدگی خواهد شد.
اتوماسیون
پیشتر گفتیم که اتوماسیون یا خودکارسازی یکی از مهمترین کارکردهای هوش مصنوعی است. برای درک بهتر این موضوع باید یادآوری کنیم که در هنگام استفاده از ابزارهای مانیتورینگ قدیمی، ابتدا نیاز بود اطلاعات به صورت دستی از منابع مختلف جمعآوری شود تا امکان تجزیه و تحلیل، عیبیابی و رفع خطا وجود داشته باشد.
AIOps میتواند بخش عمدهای از فرایند را با خودکارسازی به عهده بگیرد و به دلیل تواناییهایش در جمعآوری و همبستگی دادهها، سرعت و دقت را تا حد زیادی افزایش دهد. این فناوری میتواند تمام فرایندهای عملیات IT یک سازمان را خودکار کند، از جمله:
- جمعآوری همه گزارشها، معیارها، پیکربندیها، پیامها و … برای جستجو، مرتبطسازی، اعلام هشدار و گزارش در چندین سرور
- جمعآوری، جستجو و مرتبط کردن دادههای کانتینر با سایر دادههای زیرساخت برای خدمات، نظارت و گزارشدهی بهتر
- نظارت بر عملکرد، استفاده و در دسترس بودن زیرساختهای ابری
- نظارت بر ذخیرهسازی و عملکرد برنامه در استفاده از منابع و زمان پاسخ سرور
اینها تنها مثالهای کوچکی هستند که AIOps میتواند با خودکاریسازی به بهینهسازی عملیات IT کمک کند.
تفاوت domain-agnostic و domain-centric در AIOps
زمان توسعه یا خرید ابزارهای AIOps، احتمالا با دو برچسب Domain-agnostic و domain-centric روبهرو خواهید شد. Domain-centric به معنای دامنه-محور و Domain-agnostic به معنای بدون دامنه است.
AIOps دامنه-محور یا domain-centric
راهحل دامنه-محور، روی حل مشکلات در یک حوزه (Domain) واحد و خاص متمرکز است. از آنجایی که ابزارهای دامنهمحور بر یک دامنه خاص متمرکز میشوند، پیچیدگی کمتری دارند و میتوانند برای سازمانهایی که در حوزه خاص و محدودی فعالیت میکنند، سودمند باشند.
مدلهای دامنهمحور از دانش و تخصص خاص هر دامنه برای دستیابی به دقت بیشتر در پیشبینیها و توصیهها استفاده میکنند. به عبارتی، مدلهای دامنه-محور راهحلهای مناسبتر، دقیقتر و مرتبطتری با صنعت یا نیازهای خاص سازمانی ارائه میدهند.
AIOps بدون دامنه یا domain-agnostic
بر خلاف مدلهای دامنه-محور AIOps، راهحلهای بدون دامنه میتوانند همزمان برای حل مشکلات در چند حوزه (دامنه) استفاده شوند. این مدل، مجموعه دادههای گسترده و متنوع را از حوزههای مختلف جمعآوری میکند تا به سازمان در توسعه استراتژیهای اصلی آن کمک کند.
مدلهای بدون دامنه، دادهها را از تمام ابزارهای نظارتی (لاگها، دادههای رویداد، معیارهای عملکرد، گزارش عملکرد و …) میگیرند و با مرتبط کردن این دادها، سعی میکنند دید جامعتری از سراسر سیستم به شما ارائه دهند. بنابراین میتوان گفت که پلتفرمهای AIOps بدون دامنه، مقیاسپذیر و انعطافپذیرتر و برای سازمانهایی با زیرساختهای ناهمگن و موارد استفاده چندگانه مناسبترند.
کدام شرکتهای معروف از AIOps استفاده میکنند؟
تقریبا تمام برندها و شرکتهای بزرگ دنیا از فناوری AIOps استفاده میکنند و حتی با توجه به نیازهای خود، آن را به صورت اختصاصی توسعه میدهند. پلتفرم پخش آنلاین فیلم و سریال نتفلیکس، کاملا به AIOps متکی است تا از تحویل بیوقفه محتوا به میلیونها مشترک خود در سراسر جهان اطمینان حاصل کند. AIOps به نتفلیکس کمک میکند تا الگوهای ترافیک و علاقهمندی را پیشبینی کند، محتوای اختصاصی را برای هر کاربر شخصیسازی کند و سطح بالایی از رضایت مشتری را به دست آورد.
لینکدین بزرگترین پلتفرم شبکهسازی حرفهای جهان است که از AIOps برای بهینهسازی زیرساختهای فناوری اطلاعات و ارائه تجربیات شخصیسازی شده به کاربر استفاده میکند. لینکدین با کمک الگوریتمهای یادگیری ماشین میتواند محتوا را برای کاربران شخصیسازی کند، نتایج جستجو را بهبود و تعامل کاربر را افزایش دهد. AIOps همچنین به لینکدین در تشخیص ناهنجاریها در رفتار کاربر، شناسایی گلوگاههای عملکردی و بهینهسازی تخصیص منابع برای پاسخگویی به تقاضای رو به رشد کاربران، کمک میکند.
همانطور که مشخص است، AIOps به سازمانها کمک میکند عملیات فناوری اطلاعات خود را به بهترین شکل توسعه دهند و تجربه مشتریان و کاربران خود را بهبود ببخشند.
سخن آخر از AIOps
احتمالا هیجانانگیزترین بخش فناوری AIOps اتوماسیون است که امکان خودکارسازی وظایف ساده و پیچیده را فراهم میکند و تنها نظارت بر فعالیتها به عهده شما خواهد بود. این امکان باعث بهبود کارایی و بهرهوری تیم عملیات IT میشود و با کاهش کارهای دستی، استفاده از منابع و هزینهها را کاهش میدهد. AIOps همچنین با استفاده از هوش مصنوعی (AI) به سازمان شما کمک میکند تا اشکالات عملکردی بالقوه در نرمافزارتان را تشخیص دهید و برطرف کنید. همه اینها بهبود تجربه مشتری را در پی دارد و به رشد بهتر و سریعتر سازمان شما کمک میکند.
منابع:
دیدگاهتان را بنویسید