اوپن‌ای‌آی GPT-5-Codex را برای بازسازی پیچیده کد و بررسی کد معرفی کرد

زمان مطالعه: 3 دقیقه

👀 خبر در یک نگاه:

OpenAI مدل GPT-5-Codex را روانه بازار کرد؛ نسخه‌ای از GPT-5 که مخصوص ری‌فکتور کدهای پیچیده و ریویو کد در سطوح مولتی-فایل طراحی شده است. این مدل می‌تواند بیش از هفت ساعت، بدون دخالت انسان کار کند و در سرویس ابری Codex به عنوان گزینه پیش‌فرض فعال است.

اوپن‌ای‌آی مدل GPT-5-Codex را منتشر کرد؛ نسخه‌ای از GPT-5 که برای وظایف پیچیده مهندسی نرم‌افزار مثل بازآرایی گسترده کد و گردش‌کارهای پیشرفته بازبینی کد بهینه شده است. این مدل به‌طور ویژه برای Codex CLI، افزونه IDE و محیط ابری طراحی شده و می‌تواند بیش از هفت ساعت، بدون نیاز به دخالت انسانی کار کند و راه‌حل‌های قابل اجرا ارائه دهد.

GPT-5-Codex اکنون به‌عنوان پیش‌فرض در سرویس ابری Codex فعال است و در هر جایی که توسعه‌دهندگان از Codex استفاده می‌کنند، در دسترس قرار دارد.

Adaptive Reasoning

یکی از ویژگی‌های کلیدی GPT-5-Codex، استدلال تطبیقی (Adaptive Reasoning) است که زمان پردازش را بر اساس پیچیدگی وظیفه تنظیم می‌کند. این مدل هم از حالت تعاملی برای همکاری با توسعه‌دهندگان در کارهای کوچک و مشخص پشتیبانی می‌کند و هم می‌تواند به‌طور مداوم روی بازآرایی‌های گسترده کار کند.

اوپن‌ای‌آی می‌گوید اگرچه در تعاملات چت‌محور، پاسخ‌ها سریع‌تر هستند اما مدل می‌تواند چرخه‌های بیشتری صرف وظایف بزرگ‌تر با تغییرات مولتی-فایل کند.

داده‌ها چه می‌گویند؟

داده‌های استفاده کارکنان اوپن‌ای‌آی نشان می‌دهد که GPT-5-Codex در تخصیص محاسبات کارآمدتر عمل می‌کند. در ۱۰٪ از ساده‌ترین درخواست‌ها، این مدل ۹۳٬۷٪ توکن کمتری نسبت به GPT-5 مصرف کرده است. در مقابل، در ۱۰٪ از پیچیده‌ترین درخواست‌ها، تلاش بیشتری صرف کرده و تقریبا دو برابر زمان بیشتری را برای استدلال، ویرایش، تست و تکرار اختصاص داده است.

عملکرد مدل در بنچ‌مارک‌ها

در ارزیابی‌های مستقیم وظایف بازآرایی کد، GPT-5-Codex دقت بالاتری نسبت به GPT-5 به دست آورد. این مدل در سناریوهایی که به تغییرات سیستماتیک و چندمرحله‌ای در سراسر کدبیس نیاز داشتند، به دقت ۵۱.۳٪ رسید؛ در حالی‌که GPT-5 تنها ۳۳.۹٪ دقت داشت. یکی از بنچمارک‌ها شامل یک Pull Request در مخزن Gitea بود که نیازمند عبور دادن یک متغیر کانتکست از چندین لایه اپلیکیشن بود و ۲۳۲ فایل با بیش از ۳۵۰۰ خط کد را دربر می‌گرفت.

مدل فراتر از بازآرایی کد، برای تقویت جریان‌های بازبینی کد نیز آموزش دیده است. GPT-5-Codex می‌تواند در ریپازیتوری‌ها حرکت کند، دیپندنسی‌ها را تحلیل کند و تست‌ها را اجرا کند تا درستی تغییرات را بررسی کند. اوپن‌ای‌آی گزارش داده که در ارزیابی روی کامیت‌های اخیر محبوب‌ترین پروژه‌های متن‌باز، GPT-5-Codex کامنت‌هایی تولید کرده که دقیق‌تر و ارزشمندتر بوده، نویز کمتری داشته و مسائل مهم را برجسته کرده است.

یادگیری تقویتی روی وظایف واقعی

این مدل با استفاده از یادگیری تقویتی روی وظایف واقعی کدنویسی آموزش دیده است؛ وظایفی مثل ساخت کامل پروژه‌ها از ابتدا، افزودن قابلیت‌ها و تست‌ها، دیباگ و بازآرایی‌های گسترده. اوپن‌ای‌آی می‌گوید این روش به هماهنگی رفتار مدل با سبک‌های رایج کدنویسی و قراردادهای Pull Request کمک می‌کند. همچنین می‌تواند دستورالعمل‌های خاص هر پروژه را دنبال کند (که در فایل AGENTS.md تعریف می‌شود).

برای دسترسی توسعه‌دهندگان، GPT-5-Codex از طریق CLI و افزونه IDE ارائه شده است. اوپن‌ای‌آی این مدل را برای سناریوهای کدنویسی عامل‌محور (Agentic Coding) پیشنهاد می‌کند. دسترسی از طریق کلید API برای CLI هم در نسخه‌های بعدی ارائه خواهد شد.

اوپن‌ای‌آی نمونه‌هایی از استفاده اولیه توسط تیم‌های مهندسی را برجسته کرده است:

آرون وانگ (Aaron Wang)، مهندس ارشد نرم‌افزار در Duolingo گفت:

«Codex در بنچمارک بازبینی کد پایتون بک‌اند ما بهترین عملکرد را داشت. تنها مدلی بود که مشکلات سازگاری عقب‌رو را تشخیص داد و به‌طور مداوم باگ‌های سختی را پیدا کرد که سایر بات‌ها نادیده گرفته بودند.»

یک لید تکنیکال در Cisco Meraki، گفت:

«باید کدی متعلق به تیم دیگری را برای یک انتشار فیچر به‌روزرسانی می‌کردم. با Codex، ریفکتور و تولید تست‌ها را برون‌سپاری کردم و روی اولویت‌های دیگر تمرکز داشتم. این مدل کدی با کیفیت بالا و کاملا تست‌شده تولید کرد که توانستم سریع تحویل بدهم و فیچر طبق برنامه منتشر شد بدون اینکه ریسکی اضافه شود.»

منبع: infoq.com

اوپن‌ای‌آی GPT-5-Codex را برای بازسازی پیچیده کد و بررسی کد معرفی کرد

Adaptive Reasoning

داده‌ها چه می‌گویند؟

عملکرد مدل در بنچ‌مارک‌ها

یادگیری تقویتی روی وظایف واقعی

دیدگاه‌ها

دیدگاهتان را بنویسید لغو پاسخ

اوپن‌ای‌آی GPT-5-Codex را برای بازسازی پیچیده کد و بررسی کد معرفی کرد

Adaptive Reasoning

داده‌ها چه می‌گویند؟

عملکرد مدل در بنچ‌مارک‌ها

یادگیری تقویتی روی وظایف واقعی

مطالب مرتبط

دیدگاه‌ها

دیدگاهتان را بنویسید لغو پاسخ