Rojan Dahal
Read in English

परिचय

म एमएल प्रणालीका ती भागहरू बनाउँछु जुन मोडेल होइनन्

TitanCloud मा एआई इन्जिनियर हुँ। मेरो काम डक्युमेन्ट इन्टेलिजेन्स पाइपलाइन बनाउनु हो — जसले अपलोड भएका कागजातहरूलाई एलएलएमसम्म पुग्नुअघि नै फिल्टर र राउट गर्छ। मेरो Gannon विश्वविद्यालयबाट एमएस डेटा साइन्स डिसेम्बर २०२५ मा ४.० जीपीएसहित पूरा भएको छ।

उत्पादनस्तरको एमएल प्रणालीका ती तहहरू मलाई बढी रुचाउँछन् जसको चर्चा प्रायः कमै हुन्छ — नियम-आधारित प्रि-फिल्टर, क्यालिब्रेट गरिएको कन्फिडेन्स स्कोर, र एउटा अनुरोधलाई हरेक चरणमा पछ्याउन सक्ने ट्रेस कमान्ड। वास्तविक एमएल प्रणाली बिग्रिँदा प्रायः मोडेल बिग्रेको हुँदैन। मोडेल त सम्पूर्ण प्रणालीको अन्तिम ५% मात्र हो। बाँकी ९५% भागमा नै मेरो समय बित्छ, र मलाई लाग्छ त्यहीँ नै सबैभन्दा ठूलो लिभरेज लुकेको हुन्छ।

हाल म के गर्दैछु

TitanCloud मा मैले Amazon Bedrock मा आधारित तीन-एजेन्ट IDP पाइपलाइनको अगाडि चार-तहको गेटकिपर डिजाइन र निर्माण गरें। यसले एलएलएमले देख्नुअघि नै लगभग ९२% अपलोड भोलुमलाई अस्वीकार गर्छ, र बाँकी ट्राफिक क्यालिब्रेट गरिएको गुणस्तर र कन्फिडेन्स स्कोरसहित आइपुग्छ — ताकि तल्लो तहका एजेन्टहरूले आफ्नो आउटपुटमा कति विश्वास गर्ने भन्ने आफै निर्णय गर्न सकून्। मैले यो डिजाइनबारे विस्तारमा गेटकिपर ढाँचा मा र राउटिङ निर्णयहरूबारे सबैभन्दा सस्तो टोकन मा लेखेको छु (अहिले अङ्ग्रेजीमा मात्र उपलब्ध)।

यसअघि

दुई वर्ष BitsKraft मा एमएल इन्जिनियरको रूपमा बिताएँ — iOS र Android मा कम्प्युटर भिजन मोडेलहरू सिप गरें, र एउटा OCR पाइपलाइनका लागि डक्युमेन्ट-रिजन डिटेक्टर बनाएँ। मोडेलको काम सधैँ सजिलो भाग थियो; गाह्रो भाग चाहिँ दुई फरक रन्टाइम स्ट्याकहरूबाट मिल्दो नतिजा निकाल्नु थियो — किनभने ती दुवैले क्वान्टाइजेशन फरक तरिकाले गर्छन्। पुनरुत्पादनयोग्य बिल्डबारे मलाई थाहा भएको प्राय: सबै कुरा त्यहीँबाट आएको हो।

Gannon मा म सात जना प्राध्यापकहरूको अनुसन्धान समूहको ग्र्याजुएट असिस्टेन्ट थिएँ। साझा Postgres + Airflow स्ट्याक सम्हाल्थें, र मोडेल रजिस्ट्रीको अगाडि एउटा सानो FastAPI सेवा चलाउँथें। म सबैभन्दा गर्व गर्ने अनुसन्धान नतिजा हो — Jetson Nano मा २४ मिलिसेकेन्ड p99 मा चल्ने एउटा हाइब्रिड क्लासिकल-र-CNN डिफेक्ट डिटेक्शन पाइपलाइन — जुन NAMRC/MSEC 2025 मा प्रकाशित भयो।

म कसरी काम गर्छु

  • ट्रेस कमान्ड सबैभन्दा पहिले बनाउँछु। यदि एउटा अनुरोधलाई आफ्नो प्रणालीका हरेक चरणमा एउटै कमान्डबाट पछ्याउन सक्नुहुन्न भने, पाँच मिनेटमा सकिनुपर्ने डिबगिङमा दुई घण्टा बित्नेछ।
  • इभ्याल्युएसन सेटलाई कोडजस्तै व्यवहार गर्छु। भर्सन गर्छु। तालिकामा प्रतिस्थापन गर्छु। यदि तपाईंको इभ्याल्युएसन सेट छ महिनादेखि उस्तै छ र वर्कलोड फेरिएको छ, तपाईंका सङ्ख्याहरूले झूट बोलिरहेका छन्।
  • असफलतालाई स्पष्ट बनाउँछु। चुपचाप रिट्राइ गर्नु अन-कल टोलीप्रति देखाइने एउटा दया हो — तर वास्तविक समस्या पत्ता लगाउन खोज्ने टोलीप्रति त्यो क्रूरता बन्छ।
  • लेखेर राख्छु। यो साइटको अधिकांश लेखन वास्तविक प्रणालीहरूका फिल्ड नोटहरू हुन् — किनभने यो क्षेत्रलाई थप “थट लिडरसिप” चाहिएको होइन, तर उत्पादनमा वास्तवै बिग्रिएका कुराहरू सम्झन लायक हुन्छन्।

म के खोज्दैछु

मध्य २०२६ देखि सुरु हुने पूर्णकालीन एआई / एमएल इन्जिनियरिङ भूमिका (F-1 OPT, सरुवाका लागि तयार)। म ती टोलीहरूका लागि सबैभन्दा उपयोगी हुन्छु जसले पहिले नै प्रयोगकर्ता भएको उत्पादनस्तरको एमएल प्रणाली बनाइरहेका छन्, र जसलाई “निरस” तहहरूको त्यतिकै ख्याल राख्ने मानिस चाहिएको छ जति “रोचक” तहहरूको।

सम्पर्क गर्ने उत्तम तरिका: [email protected]। वा LinkedIn (/in/rojandahal), GitHub (DahalRojan), वा मेरो बायोडाटा हेर्न सक्नुहुन्छ।