Sunday, October 28, 2007

कैसे बने अरविंद कुमार दंपति का विशाल डाटाबेस और उन के कोश

भारत को पहला आधुनिक और संसार से टक्कर लेने वाला हिंदी थिसारस बनाने की लगन सन 1973 में अरविंद कुमार को ऐसी लगी कि टाइम्स आफ़ इंडिया (मुंबई) से प्रकाशित होने वाली उच्चस्तरीय औऱ लकप्रिय फ़िल्म पत्रिका माधुरी का संपादक पद त्याग कर 1978 मं दिल्ली चले आए और पहले कार्डों पर डाटा बनाना शुरू किया। इस में आरंभ से ही पत्नी कुसुम पूरी तरह उन के साथ थीं और सहयोगिनी बनी।

उन के पास भारत के लिए आधुनिक थिसारस बनाने के लिए कोई उपयुक्त माडल नहीं था। रोजट का थिसारस देश की संस्कृति को लक्षित करने के लिए बेहद अनुपयुक्त पाया गया। और उस के नए औऱ सुविशाल अंतरराष्ट्रीय संस्करण भी एशियाई संस्कृतियों से नाख़बर थे। पुराने अमर कोश का माडल आज के ज़माने में काम नहीं करता था। सब से पहले तो उस में जो ज्ञान संकलित था वह 1,500 साल पुराना था। दूसरे उस के सामाजिक संदर्भ दूसरे थे। वर्गों का विभाजन वरण व्यवस्था के अनुरूप किया गया था। स्वर्ग प्रकरण में देवी देवताओं की सूची नाकाफ़ी थी। संगीत अगर नैसर्गिक काररवाई था, तो संगीतकारों कलाकारों की गिनती शूद्रों मे थी। गायों को पशुओं में नहीं रखा था, बल्कि वैश्य वर्ग में थीं। ब्राह्मण वर्ग में न हो कर पुरोहित क्षत्रिय वर्ग में थे क्यों कि वे राजाओं के पुरोहित होते थे।

अतः दंपति को अपना बिल्कुल अलग और नया माडल अपनेआप बनाना था। यह कोई आसान नहीं था। उन्हों ने शब्दों के संकलन का काम नहीं रोका। कार्डों को वे अलग अलग ट्रेओं में रखते गए। हर ट्रे के विषय और उपविषय अलग रखे गए। ट्रेओँ का क्रम बदलने मात्र से माडल हर सप्ताह बदल जाता था। पहला मनपसंद माडल बनने में 14 साल लगे। तब तक पूरे कमरे में कई मेज़ों और रैकों में लगीं बीसियों ट्रेओं में 60,000 से ऊपर कार्डों में 2,50.000 से ऊपर शब्द और अभिव्यक्तियाँ लिखी जा चुकी थी। काम इतना बढ़ गया थी कि याद रखना मुश्किल हो गया था कि किन विषयों पर कार्ड समूह पहले ही बन चुके हैं।

अब तक उन का बेटा सुमीत ऐमबीबीऐस और ऐमडी (सर्जरी) कर चुका था और दिल्ली के राममनोगदर लोहिया अस्पताल में रैज़िडेंट सर्जन था। वहाँ कंप्यूटरन की प्रक्रिया चल रही थी। सुमीत को लगा कि सप्ताह के सातों दिन पूरा टाइम लगे रहने पर भी हमारा काम कंप्यूटर के बग़ैर कई दशकों में भी पूरा नही हो पाएगा। उस का कहना था कि कंप्यूटर पर डाटाबेस बनाना ही होगा। इतने संसाधन नहीं थे कि कंप्यूटर और महँगे प्रोग्राम ख़रीद सकें या प्रोग्रामर रख सकें। इस का इलाज़ सुमीत ने ही निकाला। वह ईरान की सरकारी तेल कंपनी में सर्जन का काम करने गया औऱ कामचलाऊ बचत होते ही लौट आया। पहला काम किया कंप्यूटर ख़रीदने का, दूसरा किया बग़ैर कोई संस्थान जाइन किए प्रोग्रामिंग सीखने का। शीघ्र ही उस ने फ़ौक्सप्रो FoxPro पर काम करने के लिए थिसारस लायक़ प्रोग्राम लिखा, धीरे धीरे आवश्यकतानुसार उस का विकास करता गया। यहाँ तक कि वह प्रोग्रामिंग में विशेषज्ञ बन गया, और बाद में तो सिंगापुरी की एक कंपनी में सीनियर वाइस प्रैज़िडेंट बन कर अस्पतालों को चलाने का जो प्रोग्राम बनाया वह दक्षिण पूर्व एशिया के कई अस्पतालों में सफलतापूर्वक चल रहा है।

अरविंद दंपति ने पहले 5,00,000 रिकार्डों का हिंदी डाटा बनाया था। उस में से चुने 1,100 शीर्षकों 23,759 उपशीर्षकों में 1,60,850 रिकार्ड वाले समांतर कोश हिंदी थिसारस का प्रकाशन दिसंबर 1996 में नेशनल बुक ट्रस्ट इंडिया ने स्वाधीनता की आगामी स्वर्ण जयंती के लिए विशेष उपहोर के तौर पर किया। पहली प्रति तत्कालीन राष्ट्रपति डा शंकरदयाल शर्मा ने राष्ट्रपति भवन में विशेष समारोह में स्वीकार की। लोगों ने इसे हाथो हाथ लिया। हर तरफ़ इस का स्वागत हुआ प्रशंसा मिली। इसे हिंदी के माथे पर सुनहरी बिंदी, सदी की सर्वश्रेष्ठ पुस्तक, जैसे विशेषणों से अलंकृत किया गया। पुस्तक के लिए कोश के प्रणेता अरविंद कुमार को अनेक पुरस्कारों से सम्मानित किया गया।

समांतर कोश के प्रकाशित होते ही अरविंद दंपति अपने डाटा में से और भी कठिन चयन कर के डाटा को अँगरेजी शब्द और मुहावरे डाल कर द्विभाषी बनाने लगे। बाद में 2007 तक अनथक और अनवरत लगन में रत अरविंद दंपति से हिंदी इंग्लिश के दस लाख से भी ऊपर शब्दों और अभिव्यक्तियो के विशाल डाटा बेस बनाया। उन के पास

कुल संकलित डाटा में से चुने गए केवल काम के रिकार्डों से जैनेरेट की गई संसार की अद्वितीय थिसारस और दो डिक्शनरियाँ है। संभवतः यह संसार में अपनी तरह का सब से विशाल सुसमृद्ध द्विभाषी थिसारस है। आम तौर पर ऐसे थिसारस कुल मिला कर 300-350 पेजों के होते हैं, और उन का मुख्य उद्देश्य दोनों भाषाओं के प्रारंभिक छात्रों भाषा सिखाना होता है--जैसे द कैंब्रिज फ़ैंच-इंग्लिश थिसारस (कैंब्रिज यूनिवर्सिटी प्रैस, 1998)। इस के लिए दावा किया गया है कि संसार में यह अपनी तरह का पहला द्विभाषी थिसारस है। इस में कुल मिला कर 326 पेज हैं। इन में से थिसारस के लिए बड़े टाइप में 240 पेज हैं। जिस के अंतिम 10 पेजों में दोनों भाषाओँ के क्रिया रूप दरशाए गए हैं। शेष भाग में दोनों भाषाओं में इंडैक्स हैं।

7 comments:

अनूप शुक्ल said...

आपका ब्लाग देखकर बहुत खुशी हुई। अब इसे नियमित देखना होगा।

अजित वडनेरकर said...

अरविंद जी,
आज की सुबह जैसे ही आपकी टिप्पणी मेल के ज़रिये मिली, मैं बता नहीं सकता कि कितनी खुशी मुझे हुई होगी। बचपन से आपके मुरीद हैं हम। क़रीब आठ साल पहले रूड़की में गुलजा़र साहब के सम्मान समारोह में उनके साथ आप भी आए थे तब आपको देखा था। परिचय न होने से अपरिचय जैसा ही अभिवादन हुआ था।
आपके काम का जबर्दस्त प्रशंसक हूं और उसका प्रयोग भी कर के देख चुका हूं। कामना करता हूं कि ईश्वर आपमे कार्य के प्रति ऐसी ही ऊर्जा आजीवन बनाए रखे। आप हमेशा प्रेरणास्रोत, मार्गदर्शक बने रहे।
आपका ईमेल आईडी अगर मिले तो अच्छा लगेगा। मैने अपने ब्लाग पर आज जो ताजी टिप्पणी लिखी है वह सिर्फ आपकी प्रेरक टिप्पणी पर ही लिखी है। ज़रूर देखें ।
सादर, साभार

इरफ़ान said...

आपके भागीरथ प्रयासों से हम अब तक उन शब्दों को काम में लाने के क़ाबिल हैं जो शायद अन्यथा दम तोड़ रहे थे. आपके कुशल स्वास्थ्य की कामना करता हूं.

रवि रतलामी said...

आपके संघर्ष की यह कहानी कहीं पर पहले भी पढ़ी थी. एक बार और पढ़कर आनंद आया.

हिन्दी ब्लॉग जगत् में आपकी मौजूदगी निसंदेह इंटरनेटी हिन्दी को और भी मजबूती प्रदान करेगी.

एक आग्रह है - आप अपने समांतर कोश को इंटरनेट पर और हो सके तो इलेक्ट्रॉनिक फ़ॉर्म में कहीं पर उपलब्ध करवाएँ जिससे इसकी पहुँच लोगों तक और भी आसान हो. यदि कोई व्यावसायिक बाधा न हो तो इसे इलेक्ट्रॉनिक फ़ॉर्म में अवश्य और अतिशीघ्र उपलब्ध करवाएँ. इलेक्ट्रॉनिक फ़ॉर्म की खासियत ये होती है कि उपयोक्ता का अच्छाखासा समय बच (पन्नों को पलटने में लगने वाला) जाता है, और सहूलियत भी होती ह .

ghughutibasuti said...

अरविन्द जी , यह सब पढ़कर बहुत खुशी हुई । इस बात का उत्साह भी बढ़ा कि भविष्य में इन पुस्तकों से भूले बिसरे , मस्तिष्क की तहों में खोए शब्द व बहुत से अनजाने शब्दों से जान पहचान हो सकती है व किसी भावना को अभिव्यक्ति के लिए शब्द न मिलने से दम न तोड़ना पड़ेगा ।
कृपया पुस्तकों को वी . पी. पी . से कैसे मंगाया जाए बताइये ।
घुघूती बासूती

Unknown said...

अरविंद जी
सादर स्वागत एवं प्रणाम। आपका कोश हिंदी संसार में अतुलनीय है। आपके ब्लाग से पाठकों के साथ संपर्क बढेगा। बधाई ।

hridayesh said...

wow , thats really a wonderful attempt . i will collect money to purchase it.
its too expensive.