RAG services pipeline
Generative AI project တစ်ခု, RAG လို advanced generative AI reference architectures တစ်ခုကိုဆောက်မယ်ဆိုရင် သူ့ရဲ့အရေးကြီးတဲ့ components တွေကို ဘယ်လိုထည့်သွင်းဖို့ စဥ်းစားရပါမယ်။ ဒီ components တွေလို့ပြောရရင် databases, knowledge bases, retrieval systems, vector databases, model embeddings, large language models (LLMs), inference engines, prompt processing, guardrail, fine-tuning services စတဲ့ တခြားအရာတွေလည်း ပါဝင်ပါတယ်။
ပြောရရင် RAG အနေနဲ့ users တွေကို ကိုအသုံးပြုမယ့် applications နဲ့သီးသန့်ကိစ္စတွေအတွက် ရွေးချယ်ခွင့်ပေးပါတယ်။ အခုအောက်မှာပြထားတဲ့ workflow မှာအဓိကအထူးပြုထားတာကတော့ Charmed OpenSearch နဲ့ KServe တို့ကိုအသုံးပြုထားပါတယ်။ ပြီးရင်ဒီမှာ fine-tuning ကိုမသုံးလည်းရပေမဲ့ project scales မှာ LLMs တစ်ခုရဲ့ performance ကို enhance လုပ်နိုင်တာကိုမြင်ရမှာပါ။

ကဲ အပေါ် workflow ထဲကအပိုင်းလေးတွေတစ်ခုချင်းရှင်းလိုက်ရအောငင်
Advanced parsing
RAG system တစ်ခုထဲဝင်လာမယ့် document အတွက် Text splitters တွေက advanced parsing techniques တွေပါ။ ဒါမှလည်း ရှင်းလင်းသပ်ရပ်ပြီး informative input ကိုပဲပေးနိုင်မှာပါ။ (Charmed Kubeflow)
Ingest/data processing
ဒီကောင်က data pipeline layer အတွက်ပါ, အဓိကတော့ data extraction, cleansing နဲ့ မလိုတဲ့ data တွေဖယ်ထုတ်ဖို့အတွက်ပါ။ (Charmed OpenSearch)
Embedding model
machine-learning ဖြစ်ပြီး raw data ကို vector အဖြစ်ပြန်ပြောင်းဖို့အတွက်ပါ။ (Charmed OpenSearch - Sentence transformer)
Retrieval and ranking
ဒီအပိုင်းက knowledge base က data ကိုယူပြီး သက်ဆိုင်မှုကိုပြတဲ့ scores ကနေ ရယူလာတဲ့ information ကိုသက်ဆိုင်မှုဘယ်လောက်ရှိလဲ ranking သတ်မှတ်ပါတယ်။ (Charmed OpenSearch with FAISS)
Vector database
အပေါ်က Retrieval and ranking ရှာနိုင်ဖို့အတွက် vector embedding တွေကိုသိမ်းတဲ့ db တစ်ခုပါ။ (Charmed OpenSearch - KNN Index)
Prompt processing
Queries နဲ့ retrieved text တွေကို readable format ပြောင်းပေးတာပါ၊ အဲ့တော့မှ LLM အတွက် structured ဖြစ်နေမှာပေါ့။ (Charmed OpenSearch)
Guardrail
Input နဲ့ output တွေအတွက် GenAI အနေနဲ့ ethical content ဖြစ်နေအောင် filter တစ်ခုအနေနဲ့အသုံးပြုတာပါ။ (Charmed OpenSearch: guardrail validation model) နောက်တစ်ပိုင်းမှာ Charmed OpenSearch အကြောင်းကိုသွားရအောင်။