در دنیای هوش مصنوعی، یکی از مفاهیمی که کمتر دربارهاش صحبت میشود اما نقش مهمی در دقت پاسخها دارد، «تاریخ بهروزرسانی مدل» است. این تاریخ در واقع نشان میدهد تا چه زمانی دادهها و اطلاعات به مدل یاد داده شدهاند. به زبان ساده، هر مدل هوش مصنوعی مانند ChatGPT یا Claude تا یک نقطه زمانی مشخص از اینترنت و منابع آموزشی تغذیه شده و بعد از آن دیگر دانشی به شکل مستقیم به آن اضافه نشده است. بنابراین اگر از مدلی سوالی درباره رویدادهای جدید یا فناوریهای پس از آن تاریخ بپرسید، ممکن است نتواند پاسخ دقیقی بدهد.
در این مقاله بررسی میکنیم که مفهوم «تاریخ بهروزرسانی مدل» دقیقا چیست، چرا وجود آن ضروری است و چگونه میتواند بر عملکرد مدلهای زبانی اثر بگذارد. سپس نگاهی خواهیم داشت به تاریخهای بهروزرسانی مدلهای مهمی مانند GPT، Claude، Gemini و Llama و در ادامه توضیح میدهیم چگونه میتوان محدودیت این تاریخ را با ابزارهایی مثل جستوجوی وب یا روشهای تکمیلی برطرف کرد.
تاریخ بهروزرسانی مدل چیست؟

«تاریخ بهروزرسانی مدل» یا همان Knowledge Cut-off Date در مدلهای OpenAI به تاریخی اشاره دارد که تا آن زمان، دادههای آموزشی برای ساخت مدل جمعآوری و پردازش شدهاند. به بیان دیگر، مدل تا آن نقطه از زمان با انبوهی از متنها، کتابها، مقالات و دادههای آنلاین آموزش دیده و پس از آن، دیگر اطلاعات جدیدی به دانش پایهاش اضافه نشده است. بنابراین هر رویداد یا تغییری که بعد از این تاریخ اتفاق افتاده باشد، در حافظهی آموزشی مدل وجود ندارد.
دلیل وجود چنین محدودیتی فنی است: آموزش یک مدل زبانی در مقیاس OpenAI فرایندی زمانبر و پرهزینه است که در بازههای مشخص انجام میشود. شرکت OpenAI پس از اتمام هر مرحله آموزش، نسخه جدید مدل را منتشر میکند اما این نسخه الزاما به معنی دسترسی مدل به دادههای لحظهای نیست. به همین خاطر، وقتی در پاسخها از عباراتی مانند «my knowledge cutoff is June 2024» استفاده میشود، مدل در واقع دارد به کاربر اعلام میکند که دانشش تا همان زمان بهروزرسانی شده و درباره اتفاقات پس از آن ممکن است فقط حدس بزند.
برای درک سادهتر، تصور کنید ChatGPT مانند دایرهالمعارفی است که آخرین ویرایش آن در ژوئن ۲۰۲۴ چاپ شده است. این نسخه، هرچند میتواند دربارهی هزاران موضوع تا آن تاریخ توضیح دهد اما اگر از آن دربارهی تغییرات اخیر در محصولات OpenAI یا پیشرفتهای بعد از آن تاریخ بپرسید، اطلاعاتش ناقص یا حتی اشتباه خواهد بود. این ویژگی نه نقص، بلکه بخشی طبیعی از فرایند آموزش و انتشار مدلهای OpenAI است.
چرا تاریخ بهروزرسانی مدل اهمیت دارد؟
تاریخ بهروزرسانی مدل در واقع تعیینکنندهی مرز دانش ChatGPT است. دانستن این تاریخ به کاربران کمک میکند تا تشخیص دهند اطلاعاتی که مدل ارائه میدهد تا چه حد قابل اعتماد و بهروز است. اگر مثلا تاریخ بهروزرسانی GPT-4 تا ژوئن ۲۰۲۴ باشد، این یعنی مدل از رویدادها، فناوریها و تغییراتی که بعد از آن تاریخ اتفاق افتادهاند، آگاهی مستقیمی ندارد. بنابراین پرسشهایی درباره محصولات تازه OpenAI، نسخههای جدید سیستمعاملها، یا روندهای بازار فناوری ممکن است با پاسخهای قدیمی یا نادقیق روبهرو شود.
اهمیت این موضوع فقط برای کاربران عادی نیست؛ توسعهدهندگان هم هنگام استفاده از APIهای OpenAI باید به این تاریخ توجه کنند. اگر برنامهای طراحی میکنند که باید اطلاعات روز را تحلیل کند (مثلا پایش اخبار یا دادههای مالی) لازم است بدانند مدل به خودی خود به اینترنت دسترسی ندارد و تنها تا تاریخ مشخصی آموزش دیده است. در چنین شرایطی معمولا از روشهایی مثل «جستوجوی وب» یا «بازیابی داده از منابع بیرونی (RAG)» برای جبران این محدودیت استفاده میشود.
از طرف دیگر، دانستن تاریخ بهروزرسانی باعث میشود کاربران بتوانند بین نسخههای مختلف مدل انتخاب دقیقتری داشته باشند. برای مثال، GPT-3.5 دانشی تا سال ۲۰۲۱ دارد، در حالی که GPT-4-turbo تا ژوئن ۲۰۲۴ آموزش دیده است. این تفاوت در بسیاری از موضوعات، بهویژه در حوزههای فناوری و پژوهشهای جدید، بهطور مستقیم بر کیفیت پاسخها تاثیر میگذارد. به همین دلیل، OpenAI در مستندات رسمی خود همواره این تاریخ را اعلام میکند تا کاربران بدانند با چه سطحی از دانش مواجهاند.
تاریخ بهروزرسانی مدلهای OpenAI
جدول زیر فهرستی از مدلهای مختلف OpenAI و تاریخ بهروزرسانی دانش هر کدام (Knowledge Cut-off) را نشان میدهد.
| مدل OpenAI | تاریخ بهروزرسانی (Knowledge Cut-off) | توضیحات / نکات مهم |
| GPT-1 | ۲۰۱۸.۱۰ | اولین نسخهها، عملاً کمتر کاربرد عمومی داشتهاند |
| GPT-2 | ۲۰۱۹.۱۱ | – |
| GPT-3 | ۲۰۲۰.۱۰ | – |
| GPT-3.5* | ۲۰۲۱.۰۹ | – |
| GPT-4* | ۲۰۲۱.۰۹ | مشابه GPT-3.5، برای پایه مدل |
| GPT-4 (۱۱۰۶-preview) | ۲۰۲۳.۰۴ | نسخهای که در پیشنمایش منتشر شده |
| GPT-4 (vision-preview) | ۲۰۲۳.۰۴ | نسخهای از GPT-4 با توانایی دیداری |
| GPT-4 (۰۱۲۵-preview) | ۲۰۲۳.۱۲ | یکی از پیشنمایشهای منتشر شده |
| GPT-4-turbo (2024-04-09) | ۲۰۲۳.۱۲ | – |
| GPT-4o (۲۰۲۴-۰۵-۱۳) | ۲۰۲۳.۱۰ | نسخه «چندوجهی / همهجانبه» (omni) |
| GPT-4o mini (۲۰۲۴-۰۷-۱۸) | ۲۰۲۳.۱۰ | – |
| GPT-4o realtime preview | ۲۰۲۴.۱۰.۰۱ (preview) | نسخه پیشنمایشی با قابلیت realtime |
| GPT-4o Realtime (gpt-4o-realtime-preview-2024-12-17) | ۲۰۲۳.۰۹.۳۰ | – |
| GPT-4.1 | ۲۰۲۴.۰۶.۰۱ | – |
| GPT-4.1-mini | ۲۰۲۴.۰۶.۰۱ | – |
| o1-preview (2024-09-12) | ۲۰۲۳.۱۰ | نسخه اولیه o1 |
| o1-mini (2024-09-۱۲) | ۲۰۲۳.۱۰ | نسخه مینی o1 |
| o1 | ۲۰۲۳.۱۰.۰۱ | نسخه نهایی o1 |
| o1-pro | ۲۰۲۳.۱۰.۰۱ | نسخه حرفهای o1 |
| o3 | ۲۰۲۴.۰۶.۰۱ | نسخهی o3 |
| o3-mini | ۲۰۲۳.۱۰.۰۱ | نسخه مینی o3 |
| o3-pro | ۲۰۲۴.۰۶.۰۱ | نسخه حرفهای o3 |
| o4-mini | ۲۰۲۴.۰۶.۰۱ | نسخه مینی o4 |
| GPT-5 | ۲۰۲۴.۱۰.۰۱ | – |
| GPT-5 Chat | ۲۰۲۴.۰۹.۳۰ | – |
| GPT-5 mini | ۲۰۲۴.۰۵.۳۱ | نسخه مینی آن |
| GPT-5 nano | ۲۰۲۴.۰۵.۳۱ | نسخه نانو آن |
روشهای دسترسی به اطلاعات جدید در مدلهای OpenAI
با وجود اینکه مدلهای OpenAI تا تاریخ مشخصی آموزش دیدهاند، روشهایی وجود دارد که میتوانند اطلاعات جدید را در پاسخها لحاظ کنند:
- استفاده از ابزارهای تکمیلی: برخی نسخهها مثل ChatGPT با قابلیت Browse with Bing یا File Search میتوانند به منابع آنلاین دسترسی پیدا کرده و دادههای جدید را بازیابی کنند.
- Retrieval-Augmented Generation (RAG): این روش به مدل اجازه میدهد تا با ترکیب دانش داخلی خود و دادههای بیرونی، پاسخهای دقیقتر و بهروز ارائه دهد.
- راهکارهای توسعهدهندگان: از طریق API، توسعهدهندگان میتوانند دادههای تازه را به مدل معرفی کرده یا پاسخها را با اطلاعات خارجی تقویت کنند.
- نمونههای موفق: شرکتها و پروژههای مختلف از این روشها برای بهروزرسانی دانش مدلها و ارائه پاسخهای مرتبط با رویدادهای تازه استفاده کردهاند.
تاثیر تاریخ بهروزرسانی مدل بر محتوا و SEO
تاریخ بهروزرسانی مدلهای OpenAI نقش مهمی در دیده شدن محتوا دارد، بهویژه برای تولیدکنندگان محتوا و برندها. دانستن این تاریخ کمک میکند بفهمیم مدلها تا چه زمانی آموزش دیدهاند و چه اطلاعاتی برای آنها قابل دسترسی است. محتوای تازه و بهروز شانس بیشتری دارد که در نسخههای بعدی مدلها دیده شود و در پاسخها استفاده شود.
برای نویسندگان و برندها، مهم است که محتوای خود را با در نظر گرفتن این محدودیتها بنویسند و از اطلاعاتی استفاده کنند که احتمالا تا بهروزرسانی بعدی مدل معتبر خواهند بود. این مفهوم به اصطلاح «AI visibility» نامیده میشود و رابطه مستقیم با سئوی آینده و دیده شدن محتوا در پاسخهای مدلهای زبانی دارد. به عبارت دیگر، محتوایی که با زمانبندی درست و بهروز تولید شود، شانس بیشتری برای «نمایش» در هوش مصنوعی و ابزارهای مبتنی بر آن خواهد داشت.
تاریخ بهروزرسانی در سایر مدلهای مشهور

گرچه تمرکز این مقاله بر مدلهای OpenAI است، سایر مدلهای زبانی نیز تاریخ بهروزرسانی مشخصی دارند. به عنوان مثال، مدل Claude توسط Anthropic و مدل Gemini توسط Google هر کدام دورههای آموزش و cutoff مخصوص به خود را دارند. بررسی این تاریخها به کاربران کمک میکند محدودیتهای هر مدل را بهتر درک کنند اما جزئیات و جدول کامل این مدلها خارج از حوزه این مقاله است و هدف ما تمرکز بر OpenAI است.
| مدل | تاریخ cutoff (تقریبی) | منبع |
| Claude | ۲۰۲۳.۰۶ | Anthropic |
| Gemini | ۲۰۲۳.۰۷ | |
| Llama 3 | ۲۰۲۳.۰۵ | Meta |
تاریخهای بهروزرسانی جدید و آینده مدلهای OpenAI
OpenAI بهطور مستمر مدلهای خود را بهروزرسانی میکند و نسخههای جدید، قابلیتها و عملکرد پیشرفتهتری ارائه میدهند. با این حال، حتی جدیدترین مدلها نیز محدودیتهایی دارند و دانش داخلی آنها تنها تا تاریخ مشخصی بهروز است. به عنوان مثال، مدل GPT‑5 که در اوت ۲۰۲۵ معرفی شد، دارای تاریخ بهروزرسانی دانش اول اکتبر ۲۰۲۴ است. این بدان معناست که رویدادها و اطلاعات جدید پس از این تاریخ در حافظه مدل وجود ندارد، مگر آنکه از طریق ابزارهای جانبی یا API تکمیلی وارد شود.
در نسخههای اخیر مانند GPT‑4.1 و نسخههای «mini» و «nano» آن، تاریخ قطع دانش تا ژوئن ۲۰۲۴ گزارش شده است و OpenAI همواره نسخههای پیشنمایش (Preview) مانند GPT‑4.5 را برای آزمایش قابلیتها عرضه میکند. این نسخههای پیشنمایش معمولا پس از مدتی جای خود را به نسخههای رسمی میدهند و امکان بهروزرسانی مداوم دانش مدل فراهم نمیشود، مگر از طریق ابزارهایی مانند Browse with Bing یا روشهای Retrieval-Augmented Generation که اجازه میدهند مدل با دادههای بیرونی تعامل داشته باشد.
روندهای آینده
تحقیقات اخیر نشان میدهند که آینده بهروزرسانی مدلها به سمت یادگیری مداوم و خوداصلاحی پیش میرود:
۱. یادگیری مداوم (Continual / Lifelong Learning): مدلها میتوانند بهطور پیوسته از دادههای جدید یاد بگیرند، بدون اینکه دانش قبلی خود را از دست بدهند.
۲. خوداصلاحی و agentic: مدلهایی در حال توسعه هستند که میتوانند خودشان دادههای آموزشی جدید تولید و دانش خود را بهروزرسانی کنند.
۳. حافظه خارجی (Memory-Augmented Approaches): با اضافه کردن حافظه خارجی، مدل میتواند اطلاعات جدید را نگه دارد و در پاسخها استفاده کند، بدون تغییر در مدل اصلی.
۴. ویرایش مدل محلی (Model Editing): تکنیکهایی مانند ELDER امکان اصلاح دانش خاص را در مدل فراهم میکنند بدون نیاز به بازآموزی کامل.
۵. بهروزرسانی سریع نسخهها (Version Update Paradigms): روشهای نوین آموزش و تغییر مسیر نرخ یادگیری، تولید نسخههای جدید با دانش تازه را سریعتر و بهینهتر میکنند.
با این روندها، انتظار میرود که در آینده مدلهای OpenAI بتوانند دانش خود را نزدیکتر به زمان واقعی بهروز نگه دارند و پاسخهای دقیقتر و مرتبطتری به کاربران ارائه دهند. با این حال، تا رسیدن به این مرحله، تاریخ بهروزرسانی مدلها همچنان یک معیار کلیدی برای ارزیابی دقت و محدودیت پاسخها محسوب میشود.
جمعبندی
تاریخ بهروزرسانی مدلهای OpenAI یکی از مهمترین مفاهیم در استفاده از مدلهای زبانی است. این تاریخ نشان میدهد که هر مدل تا چه زمانی با دادهها آموزش دیده و چه اطلاعاتی برای آن قابل دسترس است. دانستن این محدودیت به کاربران و توسعهدهندگان کمک میکند تا دقت پاسخها را ارزیابی کنند، از دادههای تکمیلی یا ابزارهای جانبی استفاده کنند و مدل مناسب برای پروژههای خود را انتخاب نمایند.
با انتشار نسخههای جدیدی مانند GPT‑4.1 و GPT‑5 و پیشرفت تکنیکهای یادگیری مداوم و حافظه افزوده، انتظار میرود مدلهای OpenAI در آینده بتوانند دانش خود را نزدیکتر به زمان واقعی بهروز نگه دارند و پاسخهای مرتبطتر و دقیقتری ارائه دهند. در نهایت، تاریخ بهروزرسانی همچنان معیاری کلیدی برای سنجش محدودیتها و قابلیتهای مدلها باقی میماند.
منابع
github.com | allmo.ai | llmpulse.ai | help.openai.com
سوالات متداول
تاریخ بهروزرسانی نشان میدهد مدل تا چه زمانی با دادههای آموزشی تغذیه شده و پس از آن اطلاعات جدیدی به آن اضافه نشده است.
میتوان از ابزارهای جانبی مانند Browse with Bing، RAG یا API برای ترکیب دادههای جدید با دانش مدل استفاده کرد.
خیر، حتی جدیدترین مدلها مانند GPT‑5 دانش داخلیشان تا تاریخ مشخصی است. بهروزرسانی واقعی اطلاعات جدید نیازمند روشهای تکمیلی است.




دیدگاهتان را بنویسید