خانه / اخبار تکنولوژی / Fara-7B مایکروسافت AI عامل‌محور را به رایانه‌های شخصی می‌آورد

Fara-7B مایکروسافت AI عامل‌محور را به رایانه‌های شخصی می‌آورد

Fara-7B مایکروسافت AI عامل‌محور را به رایانه‌های شخصی می‌آورد

نویسنده:

انتشار:

به‌روزرسانی:

تعداد نظرات: 0

زمان مطالعه: 3 دقیقه
👀 خبر در یک نگاه:

مدل Fara-7B می‌تواند محتوای بصری روی صفحه را تفسیر کند و وظایف را مستقیما روی دستگاه خودکارسازی کند. همچنین برای سازمان‌ها یک جایگزین مقرون‌به‌صرفه‌تر نسبت به عامل‌های هوش‌مصنوعی وابسته به فضای ابری فراهم کند.

مایکروسافت با Fara-7B، یک مدل فشرده برای عامل‌های کاربری رایانه (CUA)، هوش‌مصنوعی عامل‌محور را عمیق‌تر وارد رایانه‌های شخصی می‌کند. این مدل می‌تواند وظایف پیچیده را به‌طور کامل روی خود دستگاه خودکارسازی کند.

💡 Fara-7B اسکرین‌شات‌ها را پردازش می‌کند و عناصر روی صفحه را در سطح پیکسل تفسیر می‌کند

چرا Fara-7B

این نسخه آزمایشی برای دریافت بازخورد ارائه شده است. Fara-7B به سازمان‌ها نشان می‌دهد که عامل‌های هوش مصنوعی چطور می‌توانند گردش‌کارهای حساس را بدون ارسال داده به فضای ابری انجام دهند. مدل باید این کار را درحالی‌ انجام دهد که همچنان در پیمایش رابط کاربری واقعی با مدل‌های بزرگ‌تری مثل GPT-4o برابری کند یا بهتر عمل کند.

مایکروسافت در یک پست وبلاگی نوشت:

«برخلاف مدل‌های گفتگومحور سنتی که فقط پاسخ متنی تولید می‌کنند، مدل‌های عامل کاربری رایانه (CUA) مثل Fara-7B از رابط‌های رایانه‌ای -مانند ماوس و کیبورد- برای انجام وظایف به‌جای کاربر استفاده می‌کنند. Fara-7B با تنها ۷ میلیارد پارامتر، در رده اندازه خودش، به عملکردی در حد بهترین‌های صنعت می‌رسد. همچنین با سیستم‌های عامل‌محور بزرگ‌تر و پرمصرف‌تری که به چندین مدل عظیم و پرهزینه متکی‌اند، رقابت می‌کند.»

Fara-7B چطور کار می‌کند؟

💡 Fara-7B پیش از ارسال ایمیل متوقف می‌شود و از کاربر تایید می‌گیرد

Fara-7B اسکرین‌شات‌ها را پردازش می‌کند و عناصر روی صفحه را در سطح پیکسل تفسیر می‌کند. این قابلیت به مدل امکان می‌دهد حتی وقتی کد داخلی پیچیده است یا در دسترس نیست، رابط‌ها را پیمایش کند.

در بنچمارک‌های داخلی، Fara-7B در آزمون WebVoyager، به نرخ موفقیت ۷۳.۵ درصد رسید و زمانی که هر دو به‌عنوان عامل‌های کاربری رایانه ارزیابی شدند، از GPT-4o بهتر عمل کرد.

مایکروسافت گفت:

«این مدل معمولا وظایف را با تعداد قدم‌های بسیار کمتر نسبت به سیستم‌های 7B نسل قبل تمام می‌کند؛ این موضوع می‌تواند به خودکارسازی سریع‌تر و قابل‌پیش‌بینی‌تر روی دسکتاپ منجر شود.»

امنیت با Critical Points

مایکروسافت همچنین یک سازوکار ایمنی به نام «نقاط حساس» (Critical Points) در این مدل تعبیه کرده که عامل را مجبور می‌کند پیش از انجام اقدامات غیرقابل‌برگشت -مثل ارسال ایمیل یا انجام تراکنش‌های مالی- متوقف شود و از کاربر تایید بگیرد.

مرحله گذار به مدل‌های محلی

تحلیل‌گران می‌گویند حرکت به‌سمت مدل‌های جمع‌وجور و محلی مثل Fara-7B، بازتاب‌دهنده تغییر بزرگ‌تری در معماری هوش‌مصنوعی سازمانی است.

سیستم‌های ابری همچنان برای استدلال‌هایی در مقیاس بزرگ و جست‌وجوی سراسری سازمانی غالب هستند اما بسیاری از گردش‌کارهای روزمره در شرکت‌ها، مثل جابه‌جایی داده بین اپلیکیشن‌های داخلی روی یک لپ‌تاپ هستند؛ جایی که داده نمی‌تواند از دستگاه خارج شود.

پریک جاین (Pareekh Jain)، مدیرعامل Pareekh Consulting، گفت:

«این مدل‌ها سه مشکل بزرگ هوش‌مصنوعی ابری را حل می‌کنند: هزینه محاسبات، خروج داده از دستگاه و زمان تاخیر. بیشتر کارهای سازمانی بین اپ‌های داخلی روی یک لپ‌تاپ انجام می‌شود و یک عامل محلی برای این شرایط بسیار مناسب‌تر است.»

چارلی دای (Charlie Dai)، نایب‌رئیس و تحلیل‌گر ارشد فورستر، گفت:

«Fara-7B نشان می‌دهد که با سرعت گرفتن پذیرش هوش‌مصنوعی عامل‌محور در سازمان‌ها، عامل‌های سبک و مقیم دستگاه اهمیت بیشتری پیدا خواهند کرد. برای سازمان‌ها، این موضوع نشانه یک تمرکززدایی تدریجی در بارهای کاری هوش‌مصنوعی است؛ کاهش وابستگی به زیرساخت‌های هایپرسکیل، درحالی‌که نیازمند راهبردهای تازه‌ای برای حکمرانی در مدیریت چرخه‌ عمر مدل‌هاست.»

اهمیت مدل‌های محلی

💡 با نگه‌داشتن داده روی دستگاه با مدل‌های محلی، اطلاعات در معرض سیستم‌های بیرونی قرار نمی‌گیرد

به‌گفته تولیکا شیل (Tulika Sheel)، معاون ارشد Kadence International، این روند همچنین بازتاب‌دهنده حرکت گسترده‌تری به‌سمت معماری‌های ترکیبی هوش‌مصنوعی است؛ جایی که عامل‌های محلی گردش‌کارهای حساس به حریم خصوصی را انجام می‌دهند و سیستم‌های ابری همچنان مقیاس را فراهم می‌کنند.

با نگه‌داشتن داده روی دستگاه و کاهش وابستگی به محاسبات در مقیاس بزرگ، عامل‌های کوچک روی دستگاه راهکاری عملی برای خودکارسازی وظایف حساس یا تکراری دسکتاپ فراهم می‌کنند، بدون اینکه اطلاعات در معرض سیستم‌های بیرونی قرار گیرد.

اجرایی بودن و چالش‌ها

عامل‌های مبتنی بر سطح پیکسل، سازگاری گسترده‌تری ارائه می‌دهند زیرا می‌توانند بدون نیاز به یکپارچه‌سازی سفارشی روی بسیاری از اپلیکیشن‌ها کار کنند اما ریسک‌های عملیاتی نیز به همراه دارند. جین (Jain) این رویکرد را به نسخه‌ای تقویت‌شده با هوش مصنوعی از خودکارسازی فرایند رباتیک تشبیه کرد؛ جایی که عامل با تقلید از ورودی‌های موس و کیبورد، داده‌ها را بین سیستم‌ها منتقل می‌کند.

منبع: infoworld.com

فرصت‌های شغلی

ایجاد محیطی با ارزش های انسانی، توسعه محصولات مالی کارامد برای میلیون ها کاربر و استفاده از فناوری های به روز از مواردی هستند که در آسا به آن ها می بالیم. اگر هم مسیرمان هستید، رزومه تان را برایمان ارسال کنید.

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *