RAG چگونه کار می‌کند؟ راهنمای کامل فرایند بازیابی و تولید

فرض کنید یک متخصص انرژی‌های تجدیدپذیر هستید و می‌خواهید ارائه‌ای درباره جدیدترین دستاوردهای این صنعت آماده کنید. از یک دستیار هوش مصنوعی (یا چت‌بات) می‌پرسید آخرین پیشرفت‌ها در حوزه انرژی‌های تجدیدپذیر چیست اما پاسخ‌هایی کلی و قدیمی دریافت می‌کنید؛ بدون اشاره به پژوهش‌های جدید یا آمار به‌روز. این مسئله در مدل‌های زبانی بزرگ (LLM) سنتی که در دستیارهای هوش مصنوعی استفاده می‌شوند، رایج است. این مدل‌ها به داده‌های آموزشی ایستا متکی‌اند؛ یعنی به‌صورت ذاتی از اخبار، آمار و مطالعات جدید عقب می‌مانند. در نتیجه، وقتی با اطلاعات تازه یا پویا سروکار دارند، مستعد «توهم» (Hallucination) هستند.

اینجاست که تولید تقویت‌شده با بازیابی یا Retrieval-Augmented Generation (RAG) وارد عمل می‌شود. RAG با افزودن اطلاعات به‌روز از منابع معتبر به LLMها، این ضعف را جبران می‌کند و می‌تواند جدیدترین مطالعات و آمار را با زبانی شفاف و طبیعی ارائه دهد.

با تطبیق هوش مصنوعی با چالش‌های دنیای واقعی، RAG به یکی از رویکردهای پیشرو تبدیل شده است. طبق گزارشی از Forbes در سال ۲۰۲۵، یک خرده‌فروش آنلاین بزرگ پس از پیاده‌سازی جست‌وجو و سیستم پیشنهاددهی مبتنی بر RAG، افزایش ۲۵درصدی در تعامل کاربران را تجربه کرده است.

در این مقاله، به سوالات کلیدی‌ای مثل «تولید تقویت‌شده با بازیابی چیست؟» و «چگونه کار می‌کند؟» پاسخ می‌دهیم و در کنار آن، مزایا، کاربردهای واقعی و بهترین روش‌های پیاده‌سازی RAG را بررسی می‌کنیم.

Retrieval-Augmented Generation چیست؟

بیایید ابتدا درک دقیقی از مفهوم RAG داشته باشیم.

RAG یک چارچوب هوش مصنوعی است که با یکپارچه‌سازی (یا «بازیابی») دانش خارجی، عملکرد مدل‌های مولد مانند LLMها را بهبود می‌دهد. یک مدل مولد سنتی تنها به دانشی که از قبل آموزش دیده محدود است؛ دانشی که ممکن است ناقص یا قدیمی باشد. RAG این محدودیت را با استخراج فعال اطلاعات مرتبط از منابع خارجی برطرف می‌کند تا خروجی دقیق‌تر و به‌روزتری تولید شود.

RAG در دو مرحله اصلی عمل می‌کند:

بازیابی (Retrieval): سیستم، منابع معتبری مثل پایگاه‌های داده، مقالات پژوهشی یا مخازن دانشی سازمانی را جست‌وجو می‌کند تا اطلاعات مرتبط با پرسش کاربر را پیدا کند.
تولید (Generation): سپس یک مدل زبانی، داده‌های بازیابی‌شده را به پاسخی شفاف، دقیق و متناسب با زمینه سوال تبدیل می‌کند.

حالا که RAG را تعریف کردیم، بیایید نگاهی بیندازیم به این‌که این چارچوب در عمل چگونه کار می‌کند.

Retrieval-Augmented Generation چگونه کار می‌کند؟

تولید تقویت‌شده با بازیابی چطور کار میکند

فرایند RAG در نگاه اول ممکن است پیچیده به نظر برسد اما گردش کار آن ساده است. این رویکرد شبیه روشی است که انسان‌ها معمولا برای پاسخ به سوالات پیچیده در پیش می‌گیرند:

اول تحقیق می‌کنند و بعد پاسخ را شکل می‌دهند.

برای درک بهتر سازوکار RAG، بیایید این فرایند را قدم‌به‌قدم بررسی کنیم و ببینیم در پشت صحنه چه اتفاقی می‌افتد.

۱. دریافت و درک پرسش

فرایند از جایی شروع می‌شود که شما چیزی را در یک چت‌بات وارد می‌کنید: یک سوال، یک درخواست، یا حتی یک پرامپت خلاقانه. اولین وظیفه سیستم RAG، درک نیت شماست؛ کاری که با کمک پردازش زبان طبیعی (NLP) انجام می‌شود. در این مرحله، تکنیک‌های NLP برای اهداف زیر به کار می‌روند:

تحلیل پرسش (Parsing): شکستن ورودی به کلمات و عبارت‌های تشکیل‌دهنده
تحلیل نحوی و معنایی: درک ساختار گرامری و معنای جمله
شناسایی کلیدواژه‌ها و موجودیت‌ها: استخراج مفاهیم و اصطلاحات مهم داخل پرسش
تشخیص نیت کاربر: فهم این‌که واقعا چه چیزی می‌خواهید، فراتر از کلماتی که استفاده کرده‌اید

۲. بازیابی اطلاعات از پایگاه دانش خارجی

بعد از درک پرسش، سیستم RAG ماژول بازیابی (Retrieval Module) را فعال می‌کند. این ماژول وظیفه دارد اطلاعات مرتبط را از یک پایگاه دانش خارجی پیدا و استخراج کند. مهم‌ترین جنبه‌های این مرحله عبارت‌اند از:

ایندکس‌سازی پایگاه دانش

قبل از این‌که بازیابی انجام شود، پایگاه دانش باید ایندکس شود. این کار شامل پردازش اسناد و ساخت یک ساختار قابل جست‌وجو است. یکی از رایج‌ترین روش‌ها در این مرحله، استفاده از بردارهای امبدینگ (Vector Embeddings) است؛ به این صورت که اسناد و عبارت‌های جست‌وجو به نمایش عددی از معنا تبدیل می‌شوند تا سیستم بتواند سریعا مشابه‌ترین موارد را پیدا کند.

پیشنهاد مطالعه: ایندکس‌گذاری برداری در RAG: از IVF و HNSW تا MSTG

جست‌وجوی معنایی

RAG به‌جای تطبیق صرفا کلمه‌به‌کلمه، از جستجوی معنایی استفاده می‌کند. یعنی سیستم بر اساس «معنا» جست‌وجو می‌کند، نه فقط وجود یک واژه خاص. این رویکرد باعث می‌شود حتی اگر پرسش و اسناد از واژگان متفاوتی برای بیان یک مفهوم مشابه استفاده کرده باشند، نتایج مرتبط‌تری بازیابی شوند.

رتبه‌بندی و فیلتر کردن نتایج

ماژول بازیابی هر اطلاعاتی را برنمی‌گرداند. الگوریتم‌های رتبه‌بندی پیشرفته مشخص می‌کنند کدام اسناد مرتبط‌تر و مهم‌ترند. در کنار آن، فیلترهایی هم وجود دارد تا نتایج بی‌ربط یا کم‌کیفیت حذف شوند.

۳. غنی‌سازی ورودی برای تولید (Augmented Input)

اطلاعات بازیابی‌شده قرار نیست جایگزین دانش خود مدل مولد شوند؛ بلکه نقش یک ورودی تقویتی (Augmented Input) را دارند. در این مرحله، محتوای بازیابی‌شده با پرسش اولیه شما ترکیب و به ماژول تولید ارسال می‌شود. این ترکیب می‌تواند به روش‌های مختلفی انجام شود، از جمله:

پرامپت‌سازی زمینه‌محور (Contextual Prompting): اطلاعات جدید مستقیما در پرامپتی که به LLM داده می‌شود ادغام می‌شوند. مثلا اگر پرسش این باشد:

«مزایای RAG چیست؟»

و بخش‌هایی درباره مزایای RAG بازیابی شده باشند، پرامپت داخلی می‌تواند به شکلی شبیه این بازنویسی شود:

«با توجه به اطلاعات زیر درباره مزایای RAG [متن بازیابی‌شده]، مزایای RAG را توضیح بده.»

مکانیزم‌های توجه: در معماری‌های پیشرفته‌تر RAG، از مکانیزم توجه استفاده می‌شود تا مدل مولد هنگام تولید پاسخ، روی بخش‌های مهم‌تر اطلاعات بازیابی‌شده تمرکز کند. به‌جای این‌که همه داده‌ها وزن یکسانی داشته باشند، لایه‌های Attention مشخص می‌کنند کدام بخش‌ها برای پاسخ دادن به سوال حیاتی‌ترند.

۴. تولید محتوا (Content Generation)

در آخرین مرحله، ماژول تولید که معمولا یک LLM است ورودی غنی‌شده را دریافت کرده و پاسخ نهایی را می‌سازد. این پاسخ ویژگی‌های زیر را دارد:

مرتبط با زمینه سوال: مستقیما بر اساس اطلاعات بازیابی‌شده به پرسش شما جواب می‌دهد
متکی بر داده‌های واقعی: اطلاعات از پایگاه دانش خارجی و به‌روز استخراج شده‌اند که دقت را بالا می‌برد و احتمال توهم را کاهش می‌دهد
منسجم و روان: متن تولیدشده طبیعی، خوانا و ساختارمند است؛ نتیجه توانمندی ذاتی مدل زبانی

حالا که با سازوکار داخلی RAG آشنا شدیم، وقت آن است که سراغ مزایای تحول‌آفرین این رویکرد برویم.

مزایای Retrieval-Augmented Generation

RAG چند مزیت کلیدی برای مدل‌های زبانی بزرگ دارد: هزینه کمتر، دقت بالاتر، افزایش اعتماد کاربران و کنترل بیشتر برای توسعه‌دهندگان. مهم‌ترین مزایا عبارت‌اند از:

پیاده‌سازی مقرون‌به‌صرفه: به‌جای بازآموزی کامل مدل که هزینه‌بر است، RAG امکان استفاده از داده‌های جدید را به‌صورت بلادرنگ فراهم می‌کند و هزینه محاسباتی و مالی را کاهش می‌دهد.
افزایش اعتماد و شفافیت: با ارجاع‌دهی و مشخص‌بودن منبع داده‌ها، کاربران می‌توانند اطلاعات را بررسی کنند و به خروجی مدل اعتماد بیشتری داشته باشند.
کاهش خطا و سوگیری: چون پاسخ‌ها بر اساس منابع خارجی معتبر تولید می‌شوند، احتمال خطا و پاسخ‌های نادرست کمتر می‌شود.
انعطاف‌پذیری بین حوزه‌ها: RAG در صنایع و کاربردهای مختلف قابل استفاده است و معمولاً به بازآموزی سنگین نیاز ندارد.
کنترل بیشتر در محیط‌های سازمانی: توسعه‌دهندگان می‌توانند منابع اطلاعاتی مدل را مدیریت کنند، دسترسی به داده‌های حساس را محدود کنند و کیفیت پاسخ‌ها را راحت‌تر بهبود دهند.

تفاوت RAG و جستجوی معنایی (Semantic Search)

هر دو رویکرد برای بهبود بازیابی اطلاعات استفاده می‌شوند، اما خروجی آن‌ها متفاوت است.

Semantic Search فقط اسناد مرتبط را برمی‌گرداند. مثلا اگر بپرسید: «مزایای انرژی‌های تجدیدپذیر چیست؟» نتیجه، فهرستی از مقاله‌ها و گزارش‌هاست که باید خودتان آن‌ها را بخوانید.
RAG یک قدم جلوتر می‌رود. از همان منابع استفاده می‌کند، اما در نهایت یک پاسخ خلاصه و کاربردی تولید می‌کند؛ مثلا: «انرژی‌های تجدیدپذیر باعث کاهش انتشار کربن، کاهش هزینه‌های بلندمدت انرژی و افزایش استقلال انرژی از طریق منابع محلی می‌شوند.»

کاربردهای RAG در دنیای واقعی

RAG مثل LLMهای سنتی در حوزه‌های مختلفی مثل سلامت، مالی، پشتیبانی مشتری و تجارت الکترونیک استفاده می‌شود، اما با دقت بالاتر و توهم کمتر. چند نمونه رایج:

۱. چت‌بات‌های پشتیبانی مشتری

چت‌بات‌های مبتنی بر RAG از مستندات پشتیبانی، FAQها و تیکت‌های قبلی اطلاعات بازیابی می‌کنند و پاسخ‌های دقیق و به‌روز می‌دهند.

نتیجه: افزایش رضایت کاربران و کاهش زمان پاسخ‌گویی.

۲. جست‌وجو در مستندات توسعه‌دهنده

RAG تجربه جست‌وجو در مستندات پیچیده را بهبود می‌دهد و کد، مثال و توضیح مرتبط با سوال توسعه‌دهنده ارائه می‌کند.

مثال: ابزار Cody از Sourcegraph با استفاده از RAG پاسخ‌های دقیق و متناسب با کانتکست کد ارائه می‌دهد.

۳. پژوهش حقوقی مبتنی بر هوش مصنوعی

RAG با ترکیب و خلاصه‌سازی اسناد حقوقی، فرایند تحقیق حقوقی را سریع‌تر می‌کند.

مثال: Vincent AI از vLex با بازیابی و خلاصه‌سازی قوانین و آرای قضایی به سوالات پیچیده حقوقی پاسخ می‌دهد.

ریسک‌ها و چالش‌های RAG

ریسک ها و چالش های RAG

با وجود مزایا، RAG چالش‌هایی هم دارد که باید مدیریت شوند:

کیفیت و به‌روز بودن داده‌ها: داده ناقص یا قدیمی می‌تواند خروجی نادرست ایجاد کند.

راهکار: به‌روزرسانی منظم پایگاه دانش و اولویت‌دهی به منابع معتبر.

سوگیری و انصاف: سوگیری در داده یا مدل می‌تواند پاسخ‌های ناعادلانه تولید کند.

راهکار: تست خروجی‌ها در سناریوهای متنوع و استفاده از داده‌های متوازن.

حریم خصوصی و امنیت: دسترسی به داده‌های حساس ریسک افشای اطلاعات دارد.

راهکار: رمزنگاری، کنترل دسترسی و رعایت استانداردهایی مثل GDPR.

توهم و اطلاعات نادرست: اگر بازیابی اشتباه باشد، RAG هم می‌تواند پاسخ گمراه‌کننده بدهد.

راهکار: بهبود رتبه‌بندی نتایج و استفاده از امتیاز اطمینان (confidence score).

مقیاس‌پذیری و عملکرد: پایگاه‌های بزرگ می‌توانند باعث کندی سیستم شوند.

راهکار: ایندکس‌گذاری بهینه، کش‌کردن و معماری توزیع‌شده.

ملاحظات اخلاقی: شباهت پاسخ‌ها به انسان می‌تواند باعث سوءبرداشت کاربران شود.

راهکار: شفاف‌سازی درباره استفاده از AI و تعریف چارچوب اخلاقی.

بهترین روش‌ها و شروع کار با Retrieval-Augmented Generation

بهترین روش ها و شروع کار با Retrieval Augmented Generation

اگر بخواهید بیشترین بهره را از RAG متناسب با نیازهای خود بگیرید، باید با یک رویکرد هدفمند و استراتژیک جلو بروید. پیاده‌سازی درست RAG می‌تواند کیفیت و قدرت سیستم‌های هوش مصنوعی شما را به‌طور محسوسی افزایش دهد اما این موضوع بدون برنامه‌ریزی دقیق به نتیجه مطلوب نمی‌رسد.

در ادامه، مجموعه‌ای از بهترین روش‌ها برای شروع کار با RAG را مرور می‌کنیم.

۱. اهداف شفاف تعریف کنید

قبل از یکپارچه‌سازی RAG، دقیقا مشخص کنید قرار است چه مشکلی را حل کند و معیارهای موفقیت چه هستند.

آیا هدف شما کاهش زمان پاسخ‌گویی به کاربران است؟

یا به افزایش دقت در جست‌وجو و تحقیق نیاز دارید؟

یا تولید محتوای به‌روز و مرتبط می‌خواهید؟

داشتن اهداف مشخص، مسیر توسعه را روشن می‌کند و به شما اجازه می‌دهد عملکرد سیستم را به‌صورت قابل اندازه‌گیری ارزیابی کنید.

۲. پایگاه دانش را با دقت آماده کنید

کیفیت خروجی RAG مستقیما به کیفیت پایگاه دانش آن وابسته است. منابع دانشی مرتبط و معتبر را انتخاب کنید و برای پاک‌سازی، ساخت‌دهی و به‌روزرسانی داده‌ها زمان بگذارید.

اطلاعات باید:

دقیق و قابل اعتماد باشند
به‌روز نگه داشته شوند
ساختار مناسبی برای بازیابی سریع داشته باشند

به پایگاه دانش مثل فونداسیون نگاه کنید؛ بدون یک پایه محکم، سیستم RAG قابل اتکایی نخواهید داشت.

۳. اجزای مناسب RAG را انتخاب کنید

در پیاده‌سازی RAG، انتخاب درست ابزارها و کامپوننت‌ها نقش کلیدی دارد. باید بین سرعت جست‌وجو، دقت بازیابی، درک معنایی و کیفیت خروجی تعادل ایجاد کنید.

بخش بازیابی: دیتابیس‌های برداری مثل Milvus یا Pinecone گزینه‌های مناسبی برای جست‌وجوی معنایی در مقیاس بالا هستند.

بخش تولید: مدل‌های زبانی قدرتمند مانند GPT-4 می‌توانند اطلاعات بازیابی‌شده را به پاسخ‌های منسجم و قابل استفاده تبدیل کنند.

انتخاب درست این اجزا باعث می‌شود سیستم شما هم قدرتمند باشد و هم در آینده به‌راحتی مقیاس‌پذیر بماند.

۴. ساده شروع کنید و مرحله‌به‌مرحله گسترش دهید

شروع مستقیم با یک پیاده‌سازی بزرگ و پیچیده ریسک بالایی دارد. بهتر است با یک پایپ‌لاین ساده RAG و در قالب یک پروژه پایلوت کنترل‌شده شروع کنید.

ابتدا مطمئن شوید:

بازیابی اطلاعات به‌درستی انجام می‌شود
تولید پاسخ‌ها روان و مرتبط است

سپس، با بررسی عملکرد و دریافت بازخورد کاربران، هر دو بخش بازیابی و تولید را بهبود دهید.

برای مثال، یک تیم پشتیبانی می‌تواند ابتدا RAG را فقط برای پاسخ به سوالات ساده «چگونه انجام دهیم» به کار بگیرد و بعد سراغ سناریوهای پیچیده‌تر برود.

۵. ارزیابی و مانیتورینگ را جدی بگیرید

برای سنجش عملکرد RAG، باید معیارهای مشخصی تعریف کنید؛ از جمله:

میزان ارتباط پاسخ با پرسش
دقت بازیابی (Precision و Recall)
زمان پاسخ‌گویی (Latency)

علاوه بر این، لاگ‌ها و تعامل کاربران را به‌صورت مداوم بررسی کنید. ارزیابی پیوسته کمک می‌کند سیستم را بر اساس داده‌های واقعی بهینه کنید و مطمئن شوید همچنان به اهداف تعریف‌شده پایبند است.

۶. تجربه کاربری و شفافیت را در اولویت قرار دهید

یک سیستم RAG خوب فقط پاسخ دقیق نمی‌دهد، بلکه اعتماد کاربر را هم جلب می‌کند.

نمایش منبع اطلاعات، توضیح کوتاه درباره نحوه رسیدن سیستم به پاسخ و طراحی یک رابط کاربری قابل فهم، تجربه کاربر را به‌طور محسوسی بهبود می‌دهد و امکان بررسی و اعتماد به خروجی را فراهم می‌کند.

۷. به مسائل اخلاقی و سوگیری‌ها توجه کنید

کار با داده‌های خارجی و تولید خودکار محتوا، همیشه با ریسک سوگیری همراه است. مطمئن شوید پایگاه دانش و فرایند بازیابی تا حد ممکن متوازن و عادلانه‌اند. همچنین، موضوعات مربوط به حریم خصوصی و امنیت داده‌ها به‌ویژه در صورت استفاده از اطلاعات حساس باید از ابتدا در طراحی سیستم در نظر گرفته شوند.

آینده Retrieval-Augmented Generation

RAG با سرعت بالایی در حال رشد است و نقش مهمی در ترکیب دانش پویا با دقت مدل‌های مولد ایفا می‌کند. پیش‌بینی می‌شود بازار این فناوری تا سال ۲۰۳۵ به بیش از ۴۰ میلیارد دلار برسد؛ رشدی که نشان می‌دهد RAG به یکی از راه‌حل‌های اصلی برای کاهش توهم هوش مصنوعی و افزایش ارتباط و دقت محتوا تبدیل شده است.

در سال‌های آینده، بازیابی داده‌های بلادرنگ اهمیت بیشتری پیدا می‌کند. اتصال مستقیم مدل‌ها به منابع داده زنده باعث می‌شود پاسخ‌ها همیشه بر اساس جدیدترین اطلاعات تولید شوند و فاصله بین مدل‌های زبانی و دنیای واقعی کمتر شود.

از سوی دیگر، مدل‌های هیبریدی و چندرسانه‌ای مسیر توسعه RAG را شکل می‌دهند. ترکیب جست‌وجوی کلیدواژه‌ای با جست‌وجوی معنایی، گراف‌های دانشی و محتوای غیرمتنی مثل تصویر و ویدئو، تجربه‌ای دقیق‌تر و غنی‌تر از تعامل با سیستم‌های هوش مصنوعی ایجاد می‌کند.

در نهایت، با حرکت به سمت RAG شخصی‌سازی‌شده و Active RAG، مدل‌ها به‌صورت فعال‌تر و هوشمندتر اطلاعات مرتبط را بازیابی می‌کنند. این رویکرد باعث تولید پاسخ‌هایی دقیق‌تر، متناسب با زمینه و قابل اعتمادتر می‌شود؛ موضوعی که در کاربردهایی مثل پشتیبانی مشتری، آموزش و سیستم‌های سازمانی نقش تعیین‌کننده دارد.

جمع‌بندی

مدل‌های زبانی بزرگ با وجود توانمندی بالا، به‌دلیل اتکا به داده‌های ایستا در مواجهه با اطلاعات به‌روز دچار محدودیت و توهم می‌شوند. Retrieval-Augmented Generation با اتصال این مدل‌ها به منابع دانش خارجی، این ضعف را برطرف می‌کند و پاسخ‌هایی دقیق‌تر، به‌روزتر و قابل اعتمادتر ارائه می‌دهد.

RAG با ترکیب بازیابی اطلاعات و تولید محتوا، در کاربردهایی مثل چت‌بات‌ها، جست‌وجوی مستندات و سیستم‌های سازمانی، ارزش عملی بالایی ایجاد می‌کند. با برنامه‌ریزی درست و توجه به کیفیت داده‌ها و مسائل اخلاقی، RAG می‌تواند به یکی از مؤثرترین رویکردها برای ساخت سیستم‌های هوش مصنوعی کاربردی و قابل اتکا تبدیل شود.

منابع

domo.com

سوالات متداول

RAG یا Retrieval-Augmented Generation رویکردی است که مدل‌های زبانی را به منابع دانش خارجی متصل می‌کند. برخلاف مدل‌های معمولی که فقط به داده‌های آموزشی خود متکی‌اند، RAG قبل از تولید پاسخ، اطلاعات مرتبط و به‌روز را بازیابی می‌کند و بر اساس آن پاسخ می‌سازد.

فرایند RAG معمولا شامل دو مرحله اصلی است:
ابتدا اطلاعات مرتبط از پایگاه‌های دانش خارجی بازیابی می‌شود (Retrieval) و سپس مدل زبانی با استفاده از این اطلاعات غنی‌شده، پاسخ نهایی را تولید می‌کند (Generation).

RAG پاسخ‌ها را به داده‌های واقعی و قابل استناد متکی می‌کند. چون مدل به‌جای حدس‌زدن، از منابع مشخص و معتبر استفاده می‌کند، احتمال تولید اطلاعات نادرست یا ساختگی به‌طور قابل توجهی کاهش می‌یابد.

RAG در چت‌بات‌های پشتیبانی، جست‌وجوی مستندات توسعه‌دهنده، سیستم‌های پیشنهاددهی، پژوهش حقوقی و ابزارهای سازمانی استفاده می‌شود؛ جایی که دقت، به‌روز بودن و اعتمادپذیری پاسخ اهمیت بالایی دارد.

خیر. یکی از مزایای RAG این است که بدون بازآموزی کامل مدل، می‌توان داده‌های جدید را به‌صورت بلادرنگ وارد فرایند پاسخ‌گویی کرد. این موضوع هزینه و پیچیدگی پیاده‌سازی را کاهش می‌دهد.

RAG چگونه کار می‌کند؟ راهنمای کامل فرایند بازیابی و تولید

Retrieval-Augmented Generation چیست؟