नमस्ते! मेरा नाम मिलिंद अगर्वाल है और मैं जॉर्ज मेसन विश्वविद्यालय में कम्प्यूटर विज्ञान का द्वितीय वर्षीय पीएचडी (शोध) विद्यार्थी हूँ। मैं फ़िलहाल कम-संसाधनों वाली भाषाओं (लो-रिसोर्स) के लिए मापनीय डेटा निष्कर्षण (स्केलेबल डेटा एक्सट्रैक्शन) पर अनुसंधान कर रहा हूँ। पीएचडी के संदर्भ में इसका तात्पर्य है कि मैं भाषा पहचान और प्रकाशिक सम्प्रतीक अभिज्ञान (ऑप्टिकल करैक्टर रेकग्निशन, ओसीआर) क्षेत्रों में चुनौतियों का अन्वेषण कर रहा हूँ। मैं अपने आप को ख़ुशक़िस्मत समझता हूँ कि मैं प्रोफ़ेसर अँटोनीयोस अनस्तसोपौलोस के नेतृत्व में शोध कर रहा हूँ और कि मैं जॉर्ज मेसन एनेल्पी (प्राकृतिक भाषा प्रसंस्करण) लैब का हिस्सा हूँ।
मेसन में अपनी पीएचडी की शुरुआत करने से पहले, मैंने बॉल्टिमॉर के जॉन्स हॉप्किन्स विश्वविद्यालय में चार वर्ष बिताए, जहां मैंने कम्प्यूटर विज्ञान में स्नातक(बैचलर्ज़) एवं स्नातकोत्तर(मास्टर्ज़) उपाधियाँ प्राप्त की। अपने स्नातक वर्षों के दौरान मैंने गर्मियों की छुट्टियों में बहुत से प्रोफ़ेससोर्स के साथ अविस्मरणीय इंटर्न्शिप्स करीं, जैसे -प्रोफ़ेसर. डेविड यरोवस्की , प्रोफ़ेसर. जैनेट मार्कल, एवं प्रोफ़ेसोर. अलेक्सिस बैटल, जिन सभी के नेतृत्व में मैंने अकादमिक अनुसंधान में रुचि विकसित करी।
समाचार
- अप्रैल २०२४: मेरा पेपर "अ कन्साइस सर्वे ऑफ़ ओसीआर ऑन लो-रिसोर्स लैंग्वेजेज" (हिन्दी अनुवाद: कम संसाधनों वाली भाषाओं के ओसीआर का एक संक्षिप्त सर्वेक्षण ) NAACL २०२४ कांफ्रेंस की AmericasNLP वर्कशॉप में प्रकाशन के लिए चुन लिया गया है! मेक्सिको सिटी में मिलियेगा!
- अप्रैल २०२४: मेरे नये पेपर "स्क्रिप्ट-एनोस्टिक लैंग्वेज आइडेंटिफिकेशन" (हिन्दी अनुवाद: लिपि-अज्ञेयवादी भाषा पहचान ) को एमोरी विश्वविद्यालय में SouthNLP और जॉन्स हॉपकिन्स विश्वविद्यालय में MASC-SLL (श्रेष्ठ/बेस्ट पेपर पुरुस्कार) में पोस्टर के रूप में प्रस्तुत किया।
- मार्च २०२४: 'भाषा पहचान' पर नोट्र डेम विश्वविद्यालय द्वारा "आमंत्रित टॉक"
- दिसंबर २०२३: EMNLP २०२३ की सिंगापुर-स्थित मुख्य कांफ्रेंस में मैंने अपना शोध लिमिट (LIMIT) (पदानुक्रमित भाषा पहचान) को प्रकाशित और प्रस्तुत किया!
- नवंबर २०२३: मैंने अपने पीएचडी के क्वालीफ़ायर और कोम्प्रेहेंसिव एक्ज़ैम को पास कर लिया है! अब थीसिस प्रस्ताव की तरफ़!
- अप्रैल २०२३: हमारे एनएलपी ग्रुप ने जॉर्ज मेसन में MTMA २०२३ और MASC-SLL २०२३ का आयोजन किया!
- हम, ACL २०२३ टोरोंटो के साथ सहस्थित, IWSLT में बोलियों और कम संसाधनों वाली भाषाओं के लिए एक ट्रैक आयोजित कर रहे हैं! प्रशिक्षण डेटा टूनीज़न अरबी, आइरिश, मराठी, मॉल्टीज़, पख़्तो , तमाशेक़ एवं केचुआ (अंग्रेज़ी, हिंदी, फ़्रेंच एवं स्पैनिश अनुवाद सहित) में उपलब्ध है।
- मुझे, होनोलूलू हवाई में आयोजित, CRA के समावेशन, विविधता, समानता, अभिगम्यता और नेतृत्व कौशल (IDEALS) की ग्रैड कोहोर्ट वर्क्शाप/कार्यशाला में भाग लेने की स्वीकृति मिली और आमंत्रित किया गया!
ईमेल: magarwa at gmu dot edu
ट्विटर : @milind_ag
गिटहब: @magarw