| 👀 خبر در یک نگاه:
مدل Fara-7B میتواند محتوای بصری روی صفحه را تفسیر کند و وظایف را مستقیما روی دستگاه خودکارسازی کند. همچنین برای سازمانها یک جایگزین مقرونبهصرفهتر نسبت به عاملهای هوشمصنوعی وابسته به فضای ابری فراهم کند. |
مایکروسافت با Fara-7B، یک مدل فشرده برای عاملهای کاربری رایانه (CUA)، هوشمصنوعی عاملمحور را عمیقتر وارد رایانههای شخصی میکند. این مدل میتواند وظایف پیچیده را بهطور کامل روی خود دستگاه خودکارسازی کند.
| 💡 Fara-7B اسکرینشاتها را پردازش میکند و عناصر روی صفحه را در سطح پیکسل تفسیر میکند |
چرا Fara-7B
این نسخه آزمایشی برای دریافت بازخورد ارائه شده است. Fara-7B به سازمانها نشان میدهد که عاملهای هوش مصنوعی چطور میتوانند گردشکارهای حساس را بدون ارسال داده به فضای ابری انجام دهند. مدل باید این کار را درحالی انجام دهد که همچنان در پیمایش رابط کاربری واقعی با مدلهای بزرگتری مثل GPT-4o برابری کند یا بهتر عمل کند.
مایکروسافت در یک پست وبلاگی نوشت:
«برخلاف مدلهای گفتگومحور سنتی که فقط پاسخ متنی تولید میکنند، مدلهای عامل کاربری رایانه (CUA) مثل Fara-7B از رابطهای رایانهای -مانند ماوس و کیبورد- برای انجام وظایف بهجای کاربر استفاده میکنند. Fara-7B با تنها ۷ میلیارد پارامتر، در رده اندازه خودش، به عملکردی در حد بهترینهای صنعت میرسد. همچنین با سیستمهای عاملمحور بزرگتر و پرمصرفتری که به چندین مدل عظیم و پرهزینه متکیاند، رقابت میکند.»
Fara-7B چطور کار میکند؟
| 💡 Fara-7B پیش از ارسال ایمیل متوقف میشود و از کاربر تایید میگیرد |
Fara-7B اسکرینشاتها را پردازش میکند و عناصر روی صفحه را در سطح پیکسل تفسیر میکند. این قابلیت به مدل امکان میدهد حتی وقتی کد داخلی پیچیده است یا در دسترس نیست، رابطها را پیمایش کند.
در بنچمارکهای داخلی، Fara-7B در آزمون WebVoyager، به نرخ موفقیت ۷۳.۵ درصد رسید و زمانی که هر دو بهعنوان عاملهای کاربری رایانه ارزیابی شدند، از GPT-4o بهتر عمل کرد.
مایکروسافت گفت:
«این مدل معمولا وظایف را با تعداد قدمهای بسیار کمتر نسبت به سیستمهای 7B نسل قبل تمام میکند؛ این موضوع میتواند به خودکارسازی سریعتر و قابلپیشبینیتر روی دسکتاپ منجر شود.»
امنیت با Critical Points
مایکروسافت همچنین یک سازوکار ایمنی به نام «نقاط حساس» (Critical Points) در این مدل تعبیه کرده که عامل را مجبور میکند پیش از انجام اقدامات غیرقابلبرگشت -مثل ارسال ایمیل یا انجام تراکنشهای مالی- متوقف شود و از کاربر تایید بگیرد.
مرحله گذار به مدلهای محلی
تحلیلگران میگویند حرکت بهسمت مدلهای جمعوجور و محلی مثل Fara-7B، بازتابدهنده تغییر بزرگتری در معماری هوشمصنوعی سازمانی است.
سیستمهای ابری همچنان برای استدلالهایی در مقیاس بزرگ و جستوجوی سراسری سازمانی غالب هستند اما بسیاری از گردشکارهای روزمره در شرکتها، مثل جابهجایی داده بین اپلیکیشنهای داخلی روی یک لپتاپ هستند؛ جایی که داده نمیتواند از دستگاه خارج شود.
پریک جاین (Pareekh Jain)، مدیرعامل Pareekh Consulting، گفت:
«این مدلها سه مشکل بزرگ هوشمصنوعی ابری را حل میکنند: هزینه محاسبات، خروج داده از دستگاه و زمان تاخیر. بیشتر کارهای سازمانی بین اپهای داخلی روی یک لپتاپ انجام میشود و یک عامل محلی برای این شرایط بسیار مناسبتر است.»
چارلی دای (Charlie Dai)، نایبرئیس و تحلیلگر ارشد فورستر، گفت:
«Fara-7B نشان میدهد که با سرعت گرفتن پذیرش هوشمصنوعی عاملمحور در سازمانها، عاملهای سبک و مقیم دستگاه اهمیت بیشتری پیدا خواهند کرد. برای سازمانها، این موضوع نشانه یک تمرکززدایی تدریجی در بارهای کاری هوشمصنوعی است؛ کاهش وابستگی به زیرساختهای هایپرسکیل، درحالیکه نیازمند راهبردهای تازهای برای حکمرانی در مدیریت چرخه عمر مدلهاست.»
اهمیت مدلهای محلی
| 💡 با نگهداشتن داده روی دستگاه با مدلهای محلی، اطلاعات در معرض سیستمهای بیرونی قرار نمیگیرد |
بهگفته تولیکا شیل (Tulika Sheel)، معاون ارشد Kadence International، این روند همچنین بازتابدهنده حرکت گستردهتری بهسمت معماریهای ترکیبی هوشمصنوعی است؛ جایی که عاملهای محلی گردشکارهای حساس به حریم خصوصی را انجام میدهند و سیستمهای ابری همچنان مقیاس را فراهم میکنند.
با نگهداشتن داده روی دستگاه و کاهش وابستگی به محاسبات در مقیاس بزرگ، عاملهای کوچک روی دستگاه راهکاری عملی برای خودکارسازی وظایف حساس یا تکراری دسکتاپ فراهم میکنند، بدون اینکه اطلاعات در معرض سیستمهای بیرونی قرار گیرد.
اجرایی بودن و چالشها
عاملهای مبتنی بر سطح پیکسل، سازگاری گستردهتری ارائه میدهند زیرا میتوانند بدون نیاز به یکپارچهسازی سفارشی روی بسیاری از اپلیکیشنها کار کنند اما ریسکهای عملیاتی نیز به همراه دارند. جین (Jain) این رویکرد را به نسخهای تقویتشده با هوش مصنوعی از خودکارسازی فرایند رباتیک تشبیه کرد؛ جایی که عامل با تقلید از ورودیهای موس و کیبورد، دادهها را بین سیستمها منتقل میکند.
منبع: infoworld.com




دیدگاهتان را بنویسید