बेंगलुरु | आर्टिफिशियल इंटेलिजेंस (AI) की वैश्विक जंग में भारत ने अमेरिका और चीन जैसे दिग्गजों को पछाड़कर अपनी श्रेष्ठता सिद्ध कर दी है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने अपने नए मॉडल्स ‘सर्वम विजन’ (Sarvam Vision) और ‘बुलबुल V3’ (Bulbul V3) के जरिए पूरी दुनिया को हैरान कर दिया है। कंपनी के को-फाउंडर प्रत्युष कुमार के अनुसार, ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) के क्षेत्र में उनके मॉडल ने गूगल जेमिनी 3 प्रो और ChatGPT जैसे स्थापित टूल्स को मात दे दी है। ‘सर्वम विजन’ ने olmOCR-Bench पर 84.3% की अभूतपूर्व सटीकता हासिल की है, जो इसे वर्तमान में दुनिया का सबसे प्रभावी विजन मॉडल बनाती है।
इस इनोवेशन की सबसे बड़ी विशेषता इसका भारतीय भाषाओं के प्रति समर्पण है। यह मॉडल भारत की सभी 22 अनुसूचित भाषाओं को पूरी तरह सपोर्ट करता है। यह 3B-पैरामीटर वाला एक विजन-लैंग्वेज मॉडल है, जो न केवल तस्वीरों में लिखे टेक्स्ट को पहचानता है, बल्कि जटिल चार्ट्स और टेबल्स का भी सटीक विश्लेषण करता है। इसके साथ ही, कंपनी ने ‘बुलबुल V3’ नामक एक आधुनिक टेक्स्ट-टू-स्पीच मॉडल पेश किया है, जो 35 अलग-अलग प्राकृतिक आवाजों में संवाद कर सकता है। यह तकनीक खराब गुणवत्ता वाली स्कैन फाइलों और स्थानीय कंटेंट को प्रोसेस करने में दुनिया के किसी भी अन्य AI टूल से कहीं अधिक सक्षम है।
Sarvam AI का मुख्य लक्ष्य भारत की सांस्कृतिक और भाषाई विविधताओं के अनुरूप स्वदेशी AI इकोसिस्टम तैयार करना है। OmniDocBench v1.5 पर 93.28% की जबरदस्त एक्यूरेसी प्राप्त कर इस स्टार्टअप ने साबित कर दिया है कि भारत अब कोर AI इनोवेशन के क्षेत्र में नेतृत्व करने के लिए तैयार है। विशेषज्ञों का मानना है कि ऐसे स्वदेशी मॉडल आने से डेटा सुरक्षा सुनिश्चित होगी और शिक्षा, गवर्नेंस एवं स्वास्थ्य जैसे महत्वपूर्ण क्षेत्रों में स्थानीय जरूरतों के हिसाब से बदलाव किए जा सकेंगे। यह सफलता वैश्विक मंच पर ‘डिजिटल इंडिया’ की मजबूती को एक नई और प्रभावशाली पहचान दिला रही है।

