| 👀 خبر در یک نگاه:
OpenAI مدل GPT-5-Codex را روانه بازار کرد؛ نسخهای از GPT-5 که مخصوص ریفکتور کدهای پیچیده و ریویو کد در سطوح مولتی-فایل طراحی شده است. این مدل میتواند بیش از هفت ساعت، بدون دخالت انسان کار کند و در سرویس ابری Codex به عنوان گزینه پیشفرض فعال است. |
اوپنایآی مدل GPT-5-Codex را منتشر کرد؛ نسخهای از GPT-5 که برای وظایف پیچیده مهندسی نرمافزار مثل بازآرایی گسترده کد و گردشکارهای پیشرفته بازبینی کد بهینه شده است. این مدل بهطور ویژه برای Codex CLI، افزونه IDE و محیط ابری طراحی شده و میتواند بیش از هفت ساعت، بدون نیاز به دخالت انسانی کار کند و راهحلهای قابل اجرا ارائه دهد.
GPT-5-Codex اکنون بهعنوان پیشفرض در سرویس ابری Codex فعال است و در هر جایی که توسعهدهندگان از Codex استفاده میکنند، در دسترس قرار دارد.
Adaptive Reasoning
یکی از ویژگیهای کلیدی GPT-5-Codex، استدلال تطبیقی (Adaptive Reasoning) است که زمان پردازش را بر اساس پیچیدگی وظیفه تنظیم میکند. این مدل هم از حالت تعاملی برای همکاری با توسعهدهندگان در کارهای کوچک و مشخص پشتیبانی میکند و هم میتواند بهطور مداوم روی بازآراییهای گسترده کار کند.
اوپنایآی میگوید اگرچه در تعاملات چتمحور، پاسخها سریعتر هستند اما مدل میتواند چرخههای بیشتری صرف وظایف بزرگتر با تغییرات مولتی-فایل کند.
دادهها چه میگویند؟
دادههای استفاده کارکنان اوپنایآی نشان میدهد که GPT-5-Codex در تخصیص محاسبات کارآمدتر عمل میکند. در ۱۰٪ از سادهترین درخواستها، این مدل ۹۳٬۷٪ توکن کمتری نسبت به GPT-5 مصرف کرده است. در مقابل، در ۱۰٪ از پیچیدهترین درخواستها، تلاش بیشتری صرف کرده و تقریبا دو برابر زمان بیشتری را برای استدلال، ویرایش، تست و تکرار اختصاص داده است.
عملکرد مدل در بنچمارکها
در ارزیابیهای مستقیم وظایف بازآرایی کد، GPT-5-Codex دقت بالاتری نسبت به GPT-5 به دست آورد. این مدل در سناریوهایی که به تغییرات سیستماتیک و چندمرحلهای در سراسر کدبیس نیاز داشتند، به دقت ۵۱.۳٪ رسید؛ در حالیکه GPT-5 تنها ۳۳.۹٪ دقت داشت. یکی از بنچمارکها شامل یک Pull Request در مخزن Gitea بود که نیازمند عبور دادن یک متغیر کانتکست از چندین لایه اپلیکیشن بود و ۲۳۲ فایل با بیش از ۳۵۰۰ خط کد را دربر میگرفت.
مدل فراتر از بازآرایی کد، برای تقویت جریانهای بازبینی کد نیز آموزش دیده است. GPT-5-Codex میتواند در ریپازیتوریها حرکت کند، دیپندنسیها را تحلیل کند و تستها را اجرا کند تا درستی تغییرات را بررسی کند. اوپنایآی گزارش داده که در ارزیابی روی کامیتهای اخیر محبوبترین پروژههای متنباز، GPT-5-Codex کامنتهایی تولید کرده که دقیقتر و ارزشمندتر بوده، نویز کمتری داشته و مسائل مهم را برجسته کرده است.
یادگیری تقویتی روی وظایف واقعی
این مدل با استفاده از یادگیری تقویتی روی وظایف واقعی کدنویسی آموزش دیده است؛ وظایفی مثل ساخت کامل پروژهها از ابتدا، افزودن قابلیتها و تستها، دیباگ و بازآراییهای گسترده. اوپنایآی میگوید این روش به هماهنگی رفتار مدل با سبکهای رایج کدنویسی و قراردادهای Pull Request کمک میکند. همچنین میتواند دستورالعملهای خاص هر پروژه را دنبال کند (که در فایل AGENTS.md تعریف میشود).
برای دسترسی توسعهدهندگان، GPT-5-Codex از طریق CLI و افزونه IDE ارائه شده است. اوپنایآی این مدل را برای سناریوهای کدنویسی عاملمحور (Agentic Coding) پیشنهاد میکند. دسترسی از طریق کلید API برای CLI هم در نسخههای بعدی ارائه خواهد شد.
اوپنایآی نمونههایی از استفاده اولیه توسط تیمهای مهندسی را برجسته کرده است:
- آرون وانگ (Aaron Wang)، مهندس ارشد نرمافزار در Duolingo گفت:
«Codex در بنچمارک بازبینی کد پایتون بکاند ما بهترین عملکرد را داشت. تنها مدلی بود که مشکلات سازگاری عقبرو را تشخیص داد و بهطور مداوم باگهای سختی را پیدا کرد که سایر باتها نادیده گرفته بودند.»
- یک لید تکنیکال در Cisco Meraki، گفت:
«باید کدی متعلق به تیم دیگری را برای یک انتشار فیچر بهروزرسانی میکردم. با Codex، ریفکتور و تولید تستها را برونسپاری کردم و روی اولویتهای دیگر تمرکز داشتم. این مدل کدی با کیفیت بالا و کاملا تستشده تولید کرد که توانستم سریع تحویل بدهم و فیچر طبق برنامه منتشر شد بدون اینکه ریسکی اضافه شود.»
منبع: infoq.com




دیدگاهتان را بنویسید