👀 خبر در یک نگاه:
xAI از مدل جدید Grok Code Fast 1 رونمایی کرد؛ مدلی ویژه کدنویسی عاملمحور با معماری اختصاصی، دادههای آموزشی واقعی و سرعت بالا. این مدل با پشتیبانی از زبانهای مختلف، یکپارچگی با ابزارها و IDEها و توان پردازش متون طولانی، توسعهدهندگان را در رفع باگ، ایجاد پروژه و بهرهوری بیشتر یاری میدهد. |
xAI مدل grok-code-fast-1 را معرفی کرده است؛ مدلی که بهطور خاص برای جریانهای کاری کدنویسی عاملمحور توسعه یافته است. معماری این مدل از پایه طراحی شده و مجموعه داده آموزش اولیه آن شامل دادههای مرتبط با برنامهنویسی و مجموعه داده پس از آموزش نیز از پولریکوئستهای واقعی و وظایف عملی کدنویسی گرفته شده است.
این مدل برای استفاده از دستورات ابزارهایی مانند grep، عملیات ترمینال و ویرایش فایل بهینهسازی شده و قرار است بهطور روان با محیطهای کدنویسی و IDEها یکپارچه شود. همچنین از تکنیکهای سروینگ و کش کردن اعلانها برای بهبود سرعت پاسخگویی استفاده میکند که طبق گزارشها، نرخ موفقیت کش در جریانهای کاری شرکای xAI بالای ۹۰ درصد است. (در بیشتر از ۹۰٪ موارد، مدل به جای پردازش دوباره، از حافظه ذخیرهشده برای پاسخ سریعتر استفاده کرده است.)
این مدل از چندین زبان برنامهنویسی از جمله TypeScript، Python، Java، Rust، ++C و Go پشتیبانی میکند. هدف آن مدیریت طیف گستردهای از وظایف روزمره توسعهدهندگان است؛ از ایجاد چارچوب اولیه پروژه و پرسوجو از کدبیس گرفته تا رفع دقیق باگها با حداقل نظارت.
عملکرد این مدل روی بنچمارک SWE-Bench-Verified اندازهگیری شد که در آن با استفاده از مجموعه ارزیابی داخلی xAI امتیاز ۷۰.۸ درصد به دست آورد. فراتر از بنچمارکها، xAI همچنین ارزیابیهای انسانی و سنجشهای خودکار را برای هدایت توسعه به کار گرفته و تمرکز را بر کاربردپذیری در دنیای واقعی گذاشته است.
برای پشتیبانی از تعامل سریع، مدل از یک پنجره متنی با ظرفیت ۲۵۶ هزار توکن استفاده میکند که امکان پردازش کدبیسهای بزرگتر را در متن فراهم میسازد. درونیترین ساختار آن معماری mixture-of-experts با حدود ۳۱۴ میلیارد پارامتر است که برای ایجاد تعادل بین سرعت و توانایی کدنویسی طراحی شده است. در استفاده عملی، توان عملیاتی آن حدود ۹۲ توکن در ثانیه است و این امکان را میدهد که در طول جلسات توسعه، تعامل روان حفظ شود.
در مقایسه با سایر مدلهای زبانی بزرگ متمرکز بر کدنویسی، grok-code-fast-1 تاکید بیشتری بر سرعت هماهنگی و یکپارچگی با ابزارها دارد تا دقت حداکثری در بنچمارکها. برای مثال، o1-mini از OpenAI و Claude Sonnet 3.5 از Anthropic در برخی وظایف دقت بالاتری در استدلال یا کدنویسی گزارش میدهند، اما به سطح بهینهسازی کش اعلانها یا توان عملیاتی این مدل نمیرسند. طراحی mixture-of-experts این مدل از نظر معماری بیشتر به Gemini 1.5 Pro گوگل دیپمایند شباهت دارد، هرچند بهطور خاص برای گردشکارهای توسعه نرمافزار سازگار شده است.
واکنشهای جامعه بیشتر بر سرعت اجرای Grok Code Fast 1 تمرکز داشت. اریک جیانگ (Eric Jiang)، توسعهدهنده نرمافزار، نوشت:
«چند هفته گذشته از این مدل بهعنوان ابزار اصلی روزانهام استفاده کردهام و سرعت آن تفاوت چشمگیری در بهرهوری من ایجاد کرده است. استفاده از آن واقعا لذتبخش است!»
دیگر کاربران بیشتر به موارد استفاده و دسترسپذیری اشاره کردند و درباره اینکه Grok Code Fast 1 چطور میتواند در توسعه روزمره جا بگیرد بحث کردند. پرسشها بیشتر بر یکپارچهسازی با ویرایشگرهای کدنویسی و ابزارهای خط فرمان متمرکز بود.
جاناتان پارا (Jonathan Parra)، توسعهدهنده نرمافزار، گفت:
«عالیه، مدتیه دنبال چنین چیزی بودم، ولی برای رقابت با Claude Code به یک CLI نیاز داره.»
دسترسی به grok-code-fast-1 برای مدت محدود و بدون هزینه از طریق برخی شرکای راهاندازی مانند GitHub Copilot، Cursor، Cline، Roo Code، Kilo Code، opencode و Windsurf فراهم است. xAI اعلام کرده که بهروزرسانیهای مدل را بهطور مداوم منتشر خواهد کرد و اشاره کرده است که یک نسخه جدید با ورودی چندوجهی، استفاده همزمان از ابزارها و طول متن توسعهیافته هماکنون در حال آموزش است.
منبع: infoq.com
دیدگاهتان را بنویسید