TOP

ई - पेपर Subscribe Now!

ePaper
Subscribe Now!

Download
Android Mobile App

Daily Business Newspaper | A Knowledge Powerhouse in Hindi

08-04-2025

एलन मस्क का ग्रोक-3 चीन के डीपसीक से बेहतर

  •  आर्टिफिशियल इंटेलीजेंस (एआई) के बढ़ते ट्रेंड के बीच एलन मस्क के स्वामित्व वाले ग्रोक और चीन के डीपसीक मॉडल अब एआई क्षमता के मामले में सबसे आगे बने हुए हैं। एक रिपोर्ट के अनुसार, जहां एक मॉडल एक्सेसिबिलिटी और एफिशिएंसी के मामले में बेहतर है, वहीं दूसरा वृहत पैमाने के मामले में। हालांकि, दोनों ही मॉडल के प्रशिक्षण के संसाधनों में काफी भिन्नता है। काउंटरपॉइंट रिसर्च के अनुसार, ग्रोक-3 पैमाने के मामले में कोई समझौता नहीं करता। उसके पास दो लाख एनवीडिया एच100 (टेंसर कोर जीपीयू) का समर्थन है। वहीं, डीपसीक-आर1 उसके मुकाबले बेहद छोटे हिस्से का इस्तेमाल करके भी उसे चुनौती दे रहा है, जो दर्शाता है कि इनोवेटिव आर्टिटेक्चर और क्यूरेशन वृहद इंफ्रास्ट्रक्चर को टक्कर दे सकते हैं। डीपसीक ने फरवरी में अपने फ्लैगशिप रीजनिंग मॉडल डीपसीक-आर1 को ओपनसोर्स कर वैश्विक स्तर पर सुर्खियां बटोरनी शुरू की थी। यह मॉडल दुनिया के फ्रंटियर रीजनिंग मॉडल के बराबर परफॉर्मेंस डिलीवर करता है। काउंटरपॉइंट में एआई के प्रमुख विश्लेषक ने कहा कि इसकी खासियत केवल इसकी बेहतरीन क्षमताएं ही नहीं हैं, बल्कि यह तथ्य भी है कि इसे केवल दो हजार एनवीडिया एच800 जीपीयू का इस्तेमाल कर ट्रेन किया गया था, जो ॥100 का एक छोटा और निर्यात-अनुरूप विकल्प है, जो इसकी उपलब्धि को दक्षता के मामले में एक मास्टरक्लास बनाता है। मस्क के एक्सएआई ने ग्रोक-3 को पेश किया, जो इसका अब तक का सबसे एडवांस मॉडल है। यह मॉडल डीपसीक-आर1, ओपनएआई के जीपीटी-ओ1 और गूगल के जेमिनी 2 से बेहतर परफॉर्मेंस डिलीवर करता है। उनके अनुसार डीपसीक-आर1 से अलग, ग्रोक-3 को एक्सएआई के सुपरकंप्यूटर कलॉसस पर दो लाख एच100 जीपीयू का इस्तेमाल कर ट्रेनिंग दी गई है। ग्रोक-3 वृहत पैमाने की रणनीति का प्रतीक है, विशाल कम्प्यूट स्केल (जीपीयू लागत में अरबों डॉलर का प्रतिनिधित्व करता है) बढ़ते प्रदर्शन लाभ को प्रोत्साहित करता है। यह एक ऐसा रूट है जिसे केवल सबसे धनी तकनीकी दिग्गज या सरकारें ही वास्तविक में साकार कर सकती हैं। इसके विपरीत, डीपसीक-आर1, मिक्सचर-ऑफ-एक्सपर्ट्स (एमओई) और रीजनिंग के लिए रीइन्फोर्समेंट लर्निंग जैसी तकनीकों का लाभ उठाकर, क्यूरेटेड और उच्च-गुणवत्ता वाले डेटा के साथ मिलकर, कम्प्यूट के एक फ्रैक्शन के साथ तुलनात्मक परिणाम प्राप्त करने के लिए एल्गोरिदमिक सरलता की शक्ति को प्रदर्शित करता है। ग्रोक-3 साबित करता है कि 100 गुना अधिक जीपीयू लगाने से प्रदर्शन में सीमांत लाभ तेजी से मिल सकता है। लेकिन यह निवेश पर तेजी से घटते रिटर्न (आरओआई) को भी उजागर करता है। रिपोर्ट में कहा गया है कि डीपसीक-आर1 न्यूनतम हार्डवेयर ओवरहेड के साथ बेहतरीन प्रदर्शन प्राप्त करने से जुड़ा है, जबकि ग्रोक-3 किसी भी आवश्यक कम्प्यूटेशनल माध्यम से सीमाओं को तोडक़र आगे बढऩे से जुड़ा है।

Share
एलन मस्क का ग्रोक-3 चीन के डीपसीक से बेहतर

 आर्टिफिशियल इंटेलीजेंस (एआई) के बढ़ते ट्रेंड के बीच एलन मस्क के स्वामित्व वाले ग्रोक और चीन के डीपसीक मॉडल अब एआई क्षमता के मामले में सबसे आगे बने हुए हैं। एक रिपोर्ट के अनुसार, जहां एक मॉडल एक्सेसिबिलिटी और एफिशिएंसी के मामले में बेहतर है, वहीं दूसरा वृहत पैमाने के मामले में। हालांकि, दोनों ही मॉडल के प्रशिक्षण के संसाधनों में काफी भिन्नता है। काउंटरपॉइंट रिसर्च के अनुसार, ग्रोक-3 पैमाने के मामले में कोई समझौता नहीं करता। उसके पास दो लाख एनवीडिया एच100 (टेंसर कोर जीपीयू) का समर्थन है। वहीं, डीपसीक-आर1 उसके मुकाबले बेहद छोटे हिस्से का इस्तेमाल करके भी उसे चुनौती दे रहा है, जो दर्शाता है कि इनोवेटिव आर्टिटेक्चर और क्यूरेशन वृहद इंफ्रास्ट्रक्चर को टक्कर दे सकते हैं। डीपसीक ने फरवरी में अपने फ्लैगशिप रीजनिंग मॉडल डीपसीक-आर1 को ओपनसोर्स कर वैश्विक स्तर पर सुर्खियां बटोरनी शुरू की थी। यह मॉडल दुनिया के फ्रंटियर रीजनिंग मॉडल के बराबर परफॉर्मेंस डिलीवर करता है। काउंटरपॉइंट में एआई के प्रमुख विश्लेषक ने कहा कि इसकी खासियत केवल इसकी बेहतरीन क्षमताएं ही नहीं हैं, बल्कि यह तथ्य भी है कि इसे केवल दो हजार एनवीडिया एच800 जीपीयू का इस्तेमाल कर ट्रेन किया गया था, जो ॥100 का एक छोटा और निर्यात-अनुरूप विकल्प है, जो इसकी उपलब्धि को दक्षता के मामले में एक मास्टरक्लास बनाता है। मस्क के एक्सएआई ने ग्रोक-3 को पेश किया, जो इसका अब तक का सबसे एडवांस मॉडल है। यह मॉडल डीपसीक-आर1, ओपनएआई के जीपीटी-ओ1 और गूगल के जेमिनी 2 से बेहतर परफॉर्मेंस डिलीवर करता है। उनके अनुसार डीपसीक-आर1 से अलग, ग्रोक-3 को एक्सएआई के सुपरकंप्यूटर कलॉसस पर दो लाख एच100 जीपीयू का इस्तेमाल कर ट्रेनिंग दी गई है। ग्रोक-3 वृहत पैमाने की रणनीति का प्रतीक है, विशाल कम्प्यूट स्केल (जीपीयू लागत में अरबों डॉलर का प्रतिनिधित्व करता है) बढ़ते प्रदर्शन लाभ को प्रोत्साहित करता है। यह एक ऐसा रूट है जिसे केवल सबसे धनी तकनीकी दिग्गज या सरकारें ही वास्तविक में साकार कर सकती हैं। इसके विपरीत, डीपसीक-आर1, मिक्सचर-ऑफ-एक्सपर्ट्स (एमओई) और रीजनिंग के लिए रीइन्फोर्समेंट लर्निंग जैसी तकनीकों का लाभ उठाकर, क्यूरेटेड और उच्च-गुणवत्ता वाले डेटा के साथ मिलकर, कम्प्यूट के एक फ्रैक्शन के साथ तुलनात्मक परिणाम प्राप्त करने के लिए एल्गोरिदमिक सरलता की शक्ति को प्रदर्शित करता है। ग्रोक-3 साबित करता है कि 100 गुना अधिक जीपीयू लगाने से प्रदर्शन में सीमांत लाभ तेजी से मिल सकता है। लेकिन यह निवेश पर तेजी से घटते रिटर्न (आरओआई) को भी उजागर करता है। रिपोर्ट में कहा गया है कि डीपसीक-आर1 न्यूनतम हार्डवेयर ओवरहेड के साथ बेहतरीन प्रदर्शन प्राप्त करने से जुड़ा है, जबकि ग्रोक-3 किसी भी आवश्यक कम्प्यूटेशनल माध्यम से सीमाओं को तोडक़र आगे बढऩे से जुड़ा है।


Label

PREMIUM

CONNECT WITH US

X
Login
X

Login

X

Click here to make payment and subscribe
X

Please subscribe to view this section.

X

Please become paid subscriber to read complete news