བོད་ཡིག་དཔེ་དེབ་འབུམ་ལྔ་གྲངས་འཛིན་ཅན་དུ་བསྒྱུར་ནས་རིག་ནུས་གོང་སྤེལ་གཏོང་བ།

ནང་དོན་སྙིང་བསྡུས།

རྩོམ་ཡིག་འདིའི་ནང་དུ་བོད་ཡིག་གི་དཔེ་དེབ་ ༥༠༠,༠༠༠ ལྷག་ཌི་ཇི་ཊལ་དུ་བསྒྱུར་བའི་ཐབས་ལམ་དང་། དེ་དག་གཞིར་བཟུང་ནས་ Vector Search Engine བརྒྱུད་ LLM (Large Language Model) གྱི་ནུས་པ་ཇི་ལྟར་ཡར་རྒྱས་གཏོང་ཐུབ་མིན་སྐོར་ཞིབ་ཕྲ་བཀོད་ཡོད།

ཤེས་བྱའི་གཏེར་མཛོད་ནས་ ཌི་ཇི་ཊལ་གྱི་འཇིག་རྟེན་དུ།

དཔེ་དེབ་འབུམ་ལྔའི་ལས་གཞི་དང་ RAG ལག་རྩལ།

དཔེ་དེབ་ ༥༠༠,༠༠༠ ཌི་ཇི་ཊལ་དུ་བསྒྱུར་བའི་དཀའ་ངལ་དང་ཐབས་ལམ།

བོད་ཀྱི་རིག་གཞུང་གི་གཏེར་མཛོད་ལྟ་བུའི་དཔེ་དེབ་འབུམ་ལྔ་ལྷག་ཡོད་པ་འདི་དག་ཌི་ཇི་ཊལ་དུ་བསྒྱུར་བ་ནི་ལས་སླ་པོ་ཞིག་མིན། ང་ཚོས་ Monlam OCR (Optical Character Recognition) གྱི་ནུས་པ་ཚད་མཐོར་བཏང་ནས་ཡིག་རྙིང་དང་དབུ་མེད་སོགས་ཀློག་ཐུབ་པ་བཟོས་ཡོད། འདི་ནི་ LLM གྱི་རྒྱུ་ཆ་གཙོ་བོ་དེ་ཆགས་ཀྱི་ཡོད།

Monlam OCR གྱི་ངོས་འཛིན་ཚད་གཞི། (Accuracy)

Vector Search དང་ RAG ལག་རྩལ།

དཔེ་དེབ་དེ་དག་གི་ནང་དོན་རྣམས་ Vector Embeddings སུ་བསྒྱུར་ནས་ Vector Database ནང་དུ་ཉར་ཚགས་བྱེད་ཀྱི་ཡོད། དེ་ནས་ LLM གིས་དྲི་བ་དྲིས་སྐབས། RAG (Retrieval-Augmented Generation) ལག་རྩལ་བེད་སྤྱོད་བཏང་ནས་འབྲེལ་ཡོད་ཀྱི་ནང་དོན་རྣམས་ Vector Search བརྒྱུད་ནས་བཙལ་འཚོལ་བྱེད་ཅིང་། དེ་དག་ LLM ལ་མཁོ་སྤྲོད་བྱས་ཏེ་ལན་འདེབས་ཀྱི་བདེན་པ་དང་ཁུངས་བཙུན་པོ་བཟོ་ཐུབ།

RAG མ་ལག་གི་བཟོ་བཀོད། (RAG Architecture)

graph LR A[User Query] --> B(Embedding Model) B --> C[Vector Search] D[500k Books] --> E[OCR Processing] E --> F[Chunking] F --> G[Embedding Model] G --> H[(Vector DB)] C <--> H C --> I[Context Retrieval] I --> J[LLM Input] A --> J J --> K[Accurate Answer] style D fill:#f9f,stroke:#333 style H fill:#bbf,stroke:#333 style K fill:#bfb,stroke:#333
graph TB Start([འགོ་ཚུགས། - Start<br/>Thukpa Preparation]) --> Prep[གྲ་སྒྲིག - Preparation Phase] Prep --> Ingredients{རྐྱེན་ཆ་ - Ingredients<br/>Collection} %% Main Ingredients Branch Ingredients --> MainIngr[གཙོ་བོའི་རྐྱེན་ཆ།<br/>Main Ingredients] MainIngr --> Noodles[རྒྱ་ཐུག - Fresh Noodles<br/>500g] MainIngr --> Meat[ཤ་ - Meat<br/>Beef/Chicken 300g] MainIngr --> Veggies[ཚོད་མ། - Vegetables<br/>Cabbage, Carrot, Onion] %% Spices Branch Ingredients --> Spices[སྨན་རྫས། - Spices & Seasoning] Spices --> Garlic[སྒོག་སྐྱ། - Garlic 5-6 cloves] Spices --> Ginger[སྐྱིངས། - Ginger 2 inch] Spices --> SoySauce[སྦྲང་རྩི་ཆུ། - Soy Sauce] Spices --> Salt[ཚྭ། - Salt] Spices --> Pepper[ཨེ་མ་ - Black Pepper] %% Processing Starts Noodles --> Step1[གོམ་པ་དང་པོ།<br/>Step 1: Prepare Noodles] Meat --> Step2[གོམ་པ་གཉིས་པ།<br/>Step 2: Cut Meat] Veggies --> Step3[གོམ་པ་གསུམ་པ།<br/>Step 3: Chop Vegetables] %% Step 1 - Noodles Step1 --> BoilWater1[ཆུ་སྐོལ། - Boil Water<br/>Large Pot] BoilWater1 --> AddNoodles[རྒྱ་ཐུག་བཙུགས། - Add Noodles<br/>Cook 3-4 minutes] AddNoodles --> DrainNoodles[ཆུ་བཏོན། - Drain & Rinse<br/>Cold Water] DrainNoodles --> SetNoodles[ཁར་བཞག - Set Aside<br/>Keep Moist] %% Step 2 - Meat Preparation Step2 --> CutMeat[ཤ་བཅད། - Cut into Small Pieces<br/>Bite-sized cubes] CutMeat --> MarMeat{མངར་བ། - Marinate?<br/>Optional} MarMeat -->|ཡིན། Yes| MarProcess[Soy Sauce + Ginger<br/>15 minutes] MarMeat -->|མིན། No| ReadyMeat[གྲ་སྒྲིག་རྫོགས། - Ready] MarProcess --> ReadyMeat %% Step 3 - Vegetables Step3 --> ChopOnion[སྒོག་པ་བཅད། - Slice Onions<br/>Thin slices] Step3 --> ChopCabbage[ལྕོག་མ་བཅད། - Chop Cabbage<br/>Rough pieces] Step3 --> ChopCarrot[ཁ་རོད་བཅད། - Julienne Carrots<br/>Thin strips] Step3 --> MinceGarlic[སྒོག་སྐྱ་བཏགས། - Mince Garlic<br/>Fine pieces] Step3 --> SliceGinger[སྐྱིངས་བཅད། - Slice Ginger<br/>Thin slices] ChopOnion --> VegReady[ཚོད་མ་གྲ་སྒྲིག་རྫོགས།<br/>Vegetables Ready] ChopCabbage --> VegReady ChopCarrot --> VegReady MinceGarlic --> VegReady SliceGinger --> VegReady %% Cooking Process SetNoodles --> CookStart[འཚོད་འགོ་ཚུགས། - Begin Cooking] ReadyMeat --> CookStart VegReady --> CookStart CookStart --> HeatOil[སྣུམ་དྲོད། - Heat Oil<br/>Large pot/wok<br/>3 tbsp oil] HeatOil --> FryAromat[སྣུམ་ནང་དྲི་ཞིམ་བཙུགས།<br/>Fry Aromatics<br/>Garlic + Ginger<br/>30 seconds] FryAromat --> AddMeat[ཤ་བཙུགས། - Add Meat<br/>Cook until browned<br/>5-7 minutes] AddMeat --> AddOnion[སྒོག་པ་བཙུགས། - Add Onions<br/>Stir fry 2 minutes] AddOnion --> AddCarrot[ཁ་རོད་བཙུགས། - Add Carrots<br/>Stir fry 2 minutes] AddCarrot --> AddWater[ཆུ་བཙུགས། - Add Water/Stock<br/>6-8 cups<br/>Bring to boil] AddWater --> Simmer[ཏིམ་མེར་བཞག - Simmer<br/>15-20 minutes<br/>Until meat tender] Simmer --> AddCabbage[ལྕོག་མ་བཙུགས། - Add Cabbage<br/>Cook 5 minutes] AddCabbage --> Season[སྨན་རྫས་བཏབ། - Season] Season --> AddSoy[སྦྲང་རྩི་ཆུ། - Soy Sauce<br/>2-3 tbsp] Season --> AddSalt[ཚྭ། - Salt<br/>To taste] Season --> AddPepper[ཨེ་མ། - Pepper<br/>1/2 tsp] AddSoy --> Mix[བསྲེས། - Mix Well] AddSalt --> Mix AddPepper --> Mix Mix --> TasteCheck{བླང་ཞིབ། - Taste Check<br/>Seasoning OK?} TasteCheck -->|མིན། No| AdjustSeason[བཅོས་སྒྲིག - Adjust<br/>Add more seasoning] AdjustSeason --> TasteCheck TasteCheck -->|ཡིན། Yes| FinalBoil[མཐའ་མར་སྐོལ། - Final Boil<br/>2-3 minutes] %% Serving FinalBoil --> Serve[བདར་འགོ་ཚུགས། - Serving Process] Serve --> GetBowl[སྣོད་ལེན། - Take Bowl<br/>Large soup bowl] GetBowl --> AddNoodleBowl[རྒྱ་ཐུག་བཙུགས། - Add Noodles<br/>Portion size<br/>Generous amount] AddNoodleBowl --> PourSoup[ཁོ་ལ་བླུག - Pour Hot Soup<br/>Over noodles<br/>With meat & vegetables] PourSoup --> Garnish{རྒྱན་སྤྲས། - Garnish?<br/>Optional toppings} Garnish -->|ཡིན། Yes| AddGarnish[རྒྱན་ཆ་སྣོན།<br/>Add Toppings] Garnish -->|མིན། No| Ready[གྲ་སྒྲིག་རྫོགས།<br/>Ready to Serve] AddGarnish --> SpringOnion[སྒོག་པའི་ལོ་མ། - Spring Onion<br/>Chopped] AddGarnish --> Cilantro[ཧ་ཅང་། - Cilantro<br/>Fresh leaves] AddGarnish --> ChiliOil[མར་ཚ། - Chili Oil<br/>If desired] SpringOnion --> Ready Cilantro --> Ready ChiliOil --> Ready Ready --> Serve2[བདར། - Serve<br/>Piping Hot!] Serve2 --> Enjoy[ཟ་རོགས། - Enjoy!<br/>དྲོད་པོ་བཞིན་ཟོས།<br/>Eat while hot!] Enjoy --> End([མཇུག - End<br/>བདེ་སྐྱིད་ཡོང་།]) %% Styling style Start fill:#ff9999,stroke:#333,stroke-width:3px style Ingredients fill:#ffcc99,stroke:#333,stroke-width:2px style MainIngr fill:#99ccff,stroke:#333,stroke-width:2px style Spices fill:#cc99ff,stroke:#333,stroke-width:2px style CookStart fill:#ff6666,stroke:#333,stroke-width:3px style HeatOil fill:#ffaa66,stroke:#333,stroke-width:2px style Season fill:#66ff66,stroke:#333,stroke-width:2px style Serve fill:#ffff66,stroke:#333,stroke-width:3px style Ready fill:#66ff99,stroke:#333,stroke-width:2px style Enjoy fill:#66ffff,stroke:#333,stroke-width:3px style End fill:#99ff99,stroke:#333,stroke-width:3px

གཙོ་བོའི་ཁྱད་ཆོས།

དསྡས

སདངསདང

སདངསདང

ལུང་འདྲེན་དཔྱད་གཞི།

  • Lewis, P., et al.. 2020. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. USA: NeurIPS.
  • Monlam IT Team. 2024. Digitizing the Tibetan Canon: Challenges and Advances. Dharamshala: Monlam Reports.