डीपसीकच्या नवीन एआय मॉडेलची चर्चा का होतेय|Why Deepseek Is Getting Famous?

credit-deepseek

Why Deepseek Is Getting Famous: चीनमधील स्टार्टअप कंपनी डीपसीकच्या (Deepseek) नवीन एआय AI मॉडेल्सनी, विशेषतः डीपसीक-R१ या तर्क मॉडेलने, मोठ्या भाषिक मॉडेल्सच्या (LLMs) जगात खळबळ उडवून दिली आहे. या जगात ओपनएआयसारख्या मोठ्या कंपन्यांचे राज्य आहे. Deepseek R1 मॉडेल अनेक चाचण्यांमध्ये ओपनएआयच्या सर्वात चांगल्या मॉडेलच्या बरोबरीचे आहे, आणि तेही खूप कमी खर्चात. यामुळे टेक जगात (तंत्रज्ञानाच्या जगात) एक नवीन बदल झाला आहे.(मोठे भाषिक मॉडेल्स (LLMs) म्हणजे काय? हे खूप मोठे आणि शक्तिशाली कॉम्प्युटर प्रोग्राम असतात, जे माणसांसारखे बोलू आणि लिहू शकतात, आणि अनेक विषयांवर माहिती देऊ शकतात.) २८ जानेवारी २०२५ रोजी, डीपसीकच्या एआय असिस्टंटने (एआय म्हणजे कृत्रिम बुद्धिमत्ता, म्हणजे कॉम्प्युटर स्वतःच माणसासारखे काम करतो) अमेरिकेतील ॲपलच्या ॲप स्टोअरमध्ये ओपनएआयच्या चॅटजीपीटीला मागे टाकून सर्वात जास्त वापरले जाणारे मोफत ॲप्लिकेशन बनण्याचा मान मिळवला.

Deepseek R1|डीपसीक-आर१ ची कामगिरी.

मोठ्या भाषिक मॉडेलची (LLM) कामगिरी मोजण्यासाठी ‘मॅसिव्ह मल्टीटास्क लँग्वेज अंडरस्टँडिंग’ (MMLU) नावाचे एक माप वापरले जाते. MMLU म्हणजे काय? ही एक परीक्षा आहे, ज्यात ५७ वेगवेगळ्या विषयांवर १६,००० प्रश्न विचारले जातात. यावरून कळते की कोणते मॉडेल किती हुशार आहे. काहीजण या परीक्षेला बरोबर मानत नसले, तरी MMLU अजूनही महत्त्वाची परीक्षा आहे.

MMLU मध्ये, डीपसीक-आर१ ची कामगिरी ओपनएआयच्या o1 (आणि o1 ‘प्रो’) मॉडेलच्या जवळपास आहे. डीपसीक-आर१ ने ९०.८ गुण मिळवले, तर o1 ने ९२.३.  ६७१ अब्ज पॅरामीटर्सपर्यंत स्केल करता येण्याजोग्या डीपसीक-आर१ ने मेटाच्या प्रमुख Llama 3.1 (४०५ अब्ज पॅरामीटर्स) आणि अँथ्रोपिकच्या प्रसिद्ध क्लॉड ३.५ सोनेट (जून २०२४ मध्ये रिलीज झालेले) मॉडेललाही मागे टाकले. पॅरामीटर्स म्हणजे काय? पॅरामीटर्स म्हणजे मॉडेलची ताकद, जितके जास्त पॅरामीटर्स तितके मॉडेल जास्त शक्तिशाली. MMLU मध्ये माणसांचे सरासरी गुण ८९.८ असतात. म्हणून जग विचार करतंय why deepseek is getting famous.

डीपसीकचा तांत्रिक पेपर मॉडेलच्या GitHub पेजवर उपलब्ध आहे, ज्यात इंग्रजी, कोड, गणित आणि चीनी भाषांसाठी वापरल्या जाणाऱ्या विविध चाचण्यांमध्ये R1 चे गुण दर्शविले आहेत. GitHub पेज म्हणजे काय? GitHub पेज म्हणजे एक वेबसाईट जिथे कॉम्प्युटर प्रोग्राम ठेवले जातात.

भाषेच्या बाबतीत कामगिरी.

why Deepseek Is Getting Famous
Credit – The Hindu.

भाषेच्या बाबतीत, R1 ने ओपनएआय आणि अँथ्रोपिकच्या सर्वात शक्तिशाली मॉडेल्सच्या तुलनेत बहुतेक चाचण्यांमध्ये चांगली कामगिरी केली, फक्त SimpleQA मध्ये त्याला ३०.१ गुण मिळाले, जे o1 च्या ४७ गुणांपेक्षा ३५% पेक्षा कमी होते.

कोडिंग कसा करतो.

Why Deepseek Is Getting Famous
Credit – The Hindu

R1 ने LiveCodeBench बेंचमार्किंग टूलमध्ये ६५.९ गुणांसह सर्वोत्तम कामगिरी केली, परंतु इतर चाचण्यांमध्ये त्याची कामगिरी o1 आणि क्लॉड ३.५ सोनेटच्या जवळपास होती. बेंचमार्किंग टूल म्हणजे काय? बेंचमार्किंग टूल म्हणजे वेगवेगळ्या मॉडेल्सची तुलना करण्यासाठी वापरले जाणारे साधन. प्रत्येक चाचणीमध्ये R1 पहिल्या दोन क्रमांकांमध्ये आहे. 

कोड म्हणजे काय? कोड म्हणजे कॉम्प्युटरला समजणारी भाषा, ज्याने कॉम्प्युटरला काय करायचे आहे ते सांगतात.

गणिताच्या बाबतीत कामगिरी.

Why Deepseek Is Getting Famous?
Credit-The Hindu.

डीपसीक-आर१ ने MATH-500 आणि AIME 2024 मध्ये o1 च्या उत्कृष्ट गुणांनाही मागे टाकले. त्याने MATH-500 मध्ये ९७.३ आणि AIME 2024 मध्ये ७९.८ गुण मिळवले, तर ओपनएआयच्या o1 ने अनुक्रमे ९६.४ आणि ७९.२ गुण मिळवले.

डीपसीक-आर१ ची खर्चिक कार्यक्षमता

या मॉडेलचा सर्वात आकर्षक पैलू म्हणजे त्याची किंमत. डीपसीक-आर१ त्याच्या सर्वात जवळच्या प्रतिस्पर्धी, ओपनएआयच्या o1 च्या तुलनेत खूप कमी किमतीत उपलब्ध आहे. R1 च्या API (ॲप्लिकेशन प्रोग्रामिंग इंटरफेस) चा वापर करण्यासाठी, इनपुट कॉस्ट (मॉडेलच्या टेक्स्टबॉक्समध्ये प्रॉम्प्ट्स टाकण्याचा खर्च, ज्यामुळे प्रतिसाद तयार होतो) १ दशलक्ष टोकनसाठी फक्त $०.५५ आहे, तर o1 साठी $१५ आहे.

 API म्हणजे काय? API म्हणजे दोन कॉम्प्युटर प्रोग्राम्स एकमेकांशी बोलण्याचा एक मार्ग. 

इनपुट कॉस्ट म्हणजे काय? इनपुट कॉस्ट म्हणजे मॉडेलला प्रश्न विचारण्यासाठी लागणारा खर्च. 

टोकन म्हणजे काय? टोकन म्हणजे टेक्स्ट डेटाचा सर्वात लहान भाग (काही अक्षरे), जे LLM द्वारे प्रोसेस करण्यासाठी वापरले जाते. क्लॉड ३.५ सोनेटची इनपुट कॉस्ट १ दशलक्ष टोकनसाठी $३ (R1 च्या जवळपास सहापट) आहे.

ओपनएआयच्या o1, o1-mini, GPT 4o च्या तुलनेत R1 ची आउटपुट कॉस्ट (मॉडेलने तयार केलेल्या उत्तराची किंमत) देखील खूपच परवडणारी आहे. डीपसीक-आर१ ची प्रति दशलक्ष टोकन आउटपुट कॉस्ट ओपनएआयच्या o1 पेक्षा २५ पट स्वस्त आहे. 

आउटपुट कॉस्ट म्हणजे काय? आउटपुट कॉस्ट म्हणजे मॉडेलने उत्तर देण्यासाठी लागणारा खर्च.

I am AJIT, i am doing blogging, writing articles from four years on topics like current affairs, Government policies, schemes, latest technology, job openings.

Leave a Comment