द्वारा संचालित
Interview

टेक्नोलॉजिस्ट: विकेंद्रीकृत डेटा क्राउडसोर्सिंग बड़ी टेक के प्रभुत्व का मुकाबला करने की कुंजी है

यह लेख एक वर्ष से अधिक पहले प्रकाशित हुआ था। कुछ जानकारी अब वर्तमान नहीं हो सकती।

एक तकनीकी सीईओ ने विकेंद्रीकृत डेटा क्राउडसोर्सिंग के माध्यम से एआई को “लोकतांत्रिक बनाने” का प्रस्ताव दिया है।

लेखक
शेयर
टेक्नोलॉजिस्ट: विकेंद्रीकृत डेटा क्राउडसोर्सिंग बड़ी टेक के प्रभुत्व का मुकाबला करने की कुंजी है

विकेंद्रीकृत डेटा क्राउडसोर्सिंग: पक्षपात रहित एआई के लिए एक रास्ता

सिनेसेस वन के प्रौद्योगिकी विशेषज्ञ और सीईओ, आइजैक बैंग, चेतावनी देते हैं कि कुछ तकनीकी दिग्गज डेटा को जमा कर एआई दौड़ में नेतृत्व कर एक “बेहद खतरनाक” स्थिति पैदा कर रहे हैं। वह एआई शक्ति के “लोकतांत्रिक बनाने” की आवश्यकता पर जोर देते हैं ताकि चल रही एआई दौड़ का अंततः “विजेता” उद्योग का विशालकाय न बने।

बैंग के अनुसार, इस समस्या का एक हिस्सा बड़े डेटा-केंद्रित फर्मों पर निर्भर रहने के बजाय विकेंद्रीकृत डेटा क्राउडसोर्सिंग को प्राथमिकता देने में निहित है। बिटकॉइन.कॉम न्यूज को दिए गए उनके लिखित उत्तरों में, बैंग बताते हैं कि विकेंद्रीकृत डेटा क्राउडसोर्सिंग कंपनियों को घरेलू डेटा वैज्ञानिकों का उपयोग करने से बचने की अनुमति देता है। इसके बजाय, वे डेटा विश्लेषण कार्यों के लिए एक सामान्य समूह के डिजिटल श्रमिकों या विशेषज्ञों के लिए “कार्य प्रस्तुत कर सकते हैं।”

यह मॉडल, बैंग के मुताबिक, उन कंपनियों के लिए आदर्श है जो विस्तार करना चाहती हैं लेकिन जिनके पास घरेलू संसाधन नहीं हैं। व्यावसायिक लाभ के अलावा, विकेंद्रीकृत डेटा क्राउडसोर्सिंग भी केंद्रीय प्रौद्योगिकी दिग्गजों द्वारा सामना किए गए डेटा पक्षपात की चुनौती से निपटने में मदद करता है।

जहां सरकारें विकेंद्रीकृत डेटा प्रबंधन के संबंध में सार्वजनिक सुरक्षा चिंताओं को व्यक्त करती हैं, वहीं बैंग अधिक विनियमन के विरुद्ध चेतावनी देते हैं जो अंत में नवाचार को बाधित कर सकते हैं। इसके बजाय, वह नियामकों और विधायकों से आग्रह करते हैं कि वे नीतियाँ लागू करने से पहले “विकेंद्रीकृत डेटा सोर्सिंग का उपयोग कैसे किया जा सकता है और कैसे किया जा रहा है” का अध्ययन करें।

बैंग के अतिरिक्त उत्तरों में एआई उद्योग के भीतर प्रतिस्पर्धा और एआई उपयोग से जुड़े अंतर्निहित जोखिम संबोधित किए गए हैं। नीचे दिए गए सिनेसेस वन के सीईओ के प्रश्नों के उत्तर हैं।

बिटकॉइन.कॉम न्यूज (बीसीएन): एआई बाजार का आकार 2024 के अंत तक $184 बिलियन तक पहुंचने की उम्मीद है, और एआई उद्योग पूरी तरह से डेटा पर निर्भर है। सब कुछ इस बात पर आधारित है कि डेटा को कैसे प्राप्त, प्रशिक्षित और उपयोग किया जाए। इस स्थिति ने बड़ी डेटा-केंद्रित फर्मों को एक बढ़त दी है, यह देखते हुए कि वे वर्षों से लगभग बिना किसी लागत के डेटा एकत्र कर रहे हैं। डेटा पारिस्थितिकी तंत्र में कुछ बड़ी तकनीकी कंपनियों के प्रभुत्व के विषय में आपके क्या विचार हैं जो लगता है कि उन्हें एआई दौड़ में शुरुआत में ही बढ़त दे चुके हैं?

आइजैक बैंग (आईबी): एआई चौथी औद्योगिक क्रांति की शुरुआत करने की कुंजी प्रौद्योगिकी है, और इसके प्रभाव वर्तमान में हम जितना सोच सकते हैं उससे कहीं अधिक व्यापक हैं। कुछ प्रमुख खिलाड़ी जो डेटा जमा कर रहे हैं और एआई दौड़ का नेतृत्व कर रहे हैं, कई तरीकों से बेहद खतरनाक हैं। न केवल एआई प्रौद्योगिकी व्यवसायों को और अधिक उत्पादक बनने और उनके निचले स्तर को अधिकतम करने में सक्षम बनाएगी, बल्कि यह सरकारों को भौतिक और डिजिटल दोनों रूप से अपनी सैन्य क्षमताओं को बढ़ाने में भी सक्षम बनाएगी। एआई दौड़ का “विजेता” एक प्रमुख शक्ति होगा, और यह महत्वपूर्ण है कि हम सभी के अच्छे के लिए एआई की शक्ति को लोकतांत्रिक बनाने के लिए अभी कार्रवाई करें।

बीसीएन: विकेंद्रीकृत डेटा क्राउडसोर्सिंग क्या है, और यह पारंपरिक डेटा संग्रह विधियों से कैसे भिन्न है?

आईबी: पारंपरिक रूप से, कंपनियां अपने उपयोगकर्ताओं/ग्राहकों से प्रदान की गई उत्पाद या सेवा का उपयोग करके डेटा एकत्र करती हैं। एआई के लिए एकत्र किए गए डेटा का उपयोग करने के लिए कंपनियां डेटा वैज्ञानिकों और अन्य विशेषज्ञों को डेटा को साफ और एनोटेट करने के लिए नियोजित करती हैं। डेटा एकत्र करने और तैयार करने की पारंपरिक विधियाँ उन बड़ी कंपनियों के लिए प्रभावी होती हैं जिनके पास कई उपयोगकर्ता और बहुत सारा पैसा होता है। हालांकि, छोटे और मध्यम आकार की कंपनियों के लिए, उनके डेटा की जरूरतों को बढ़ाना मुश्किल होगा।

विकेंद्रीकृत डेटा क्राउडसोर्सिंग कच्चे डेटा या डेटा पूर्व प्रसंस्करण को बड़े नेटवर्क के डिजिटल श्रमिकों के माध्यम से प्राप्त करना है जो डेटा या पूर्व प्रसंस्करण कार्य प्रदान करने के लिए तैयार और सक्षम हैं। कंपनियां या डेवलपर, बिना उपयोगकर्ताओं या इन-हाउस डेटा वैज्ञानिकों के, डेटा कार्य के लिए डिजिटल श्रमिकों या विशेषज्ञों के एक सामान्य समूह से इनाम रख सकते हैं। इससे कंपनियों को इन-हाउस हायरिंग में काफी पैसा और समय खर्च किए बिना विस्तार करने की अनुमति मिलती है।

बीसीएन: कृपया डेटा क्राउडसोर्सिंग में मानव बुद्धिमत्ता की भूमिका, विशेष रूप से उन कार्यों में जहां एआई संघर्ष करता है, पर विचार करें।

आईबी: मनुष्यों के पास तार्किक तर्क की क्षमता होती है। आज के मशीन लर्निंग का उपयोग करने वाला एआई, पैटर्न को पहचानने के लिए सांख्यिकीय गणना का उपयोग करता है, बिना किसी तार्किक तर्क के। जैसे-जैसे एआई मॉडल में सुधार होता है, उच्च गुणवत्ता वाले डेटा और डोमेन-विशिष्ट डेटा की आवश्यकता अधिक से अधिक मूल्यवान होती जाती है। उदाहरण के लिए, एक सामान्य एलएलएम चिकित्सा सेटिंग में उपयोग के लिए उपयुक्त नहीं है। एलएलएम को चिकित्सा के एक विशिष्ट क्षेत्र के लिए ठीक किया जा सकता है, लेकिन ऐसा करने के लिए उस क्षेत्र में विशेषज्ञ ज्ञान वाले मानव की आवश्यकता होगी। यह अवधारणा न केवल सामान्य एलएलएम पर लागू होती है, बल्कि अन्य विशिष्ट उपयोग मामलों वाले किसी भी अन्य एआई अनुप्रयोगों पर भी लागू होती है।

बीसीएन: डेटा पक्षपात की चुनौती को दूर करने और एक अधिक विविध और प्रतिनिधि डेटासेट सुनिश्चित करने में डेटा क्राउडसोर्सिंग कैसे मदद कर सकता है?

आईबी: यह सरल है – डेटा प्रदाताओं और डेटा एनोटेटर्स के पूल जितना अधिक विविध होगा, डेटा उतना ही अधिक विविध और प्रतिनिधि होगा। विकेंद्रीकृत क्राउडसोर्सिंग नेटवर्क में, कच्चे डेटा के प्रदाता और/या डेटा एनोटेटर्स एक ही प्लेटफ़ॉर्म, कंपनी, नेटवर्क या समूह से नहीं आते हैं। यह डेटा पक्षपात को कम करता है जिसका एक केंद्रीय कंपनी सामना कर सकती है।

बीसीएन: डेटा क्राउडसोर्सिंग के कौन से कुछ अभिनव अनुप्रयोग हैं जो एआई जैसी उभरती प्रौद्योगिकियों के साथ संभावनाओं की सीमाओं को धक्का दे रहे हैं?

आईबी: सबसे व्यावहारिक उपयोग मामलों में से एक प्राकृतिक भाषा के क्षेत्र में है। आज के व्यवसाय वैश्विक हैं, और इसके लिए कंपनियों को उन सभी भाषाओं में समान गुणवत्ता वाली सेवाएँ और उत्पाद प्रदान करने में सक्षम होना आवश्यक है, जिनकी वे सेवा करते हैं। हालांकि, आज के सबसे अच्छा प्रदर्शन करने वाले एलएलएम मुख्य रूप से अंग्रेजी आधारित हैं। हमने देखा है कि कंपनियां अपनी आवश्यकताओं के लिए, जैसे कि उनके उत्पादों के स्थानीयकरण के लिए, विभिन्न भाषाओं और बोलियों के लिए क्राउडसोर्सिंग पर निर्भर करती हैं।

बीसीएन: कई विशेषज्ञों का मानना ​​है कि विकेंद्रीकृत डेटा सोर्सिंग ही सही राह है, लेकिन नियामकों और बड़े खिलाड़ियों की राय अलग है। कथित तौर पर, विकेंद्रीकृत डेटा प्रबंधन के बारे में नियामक चिंताओं में से एक पर्यवेक्षण और निरीक्षण कार्य हैं, जबकि बड़ी कंपनियों के लिए, उनकी चिंता राजस्व के आसपास घूमती है। आपकी राय में, कानून निर्माताओं को नवाचार का समर्थन करते हुए सार्वजनिक सुरक्षा और सुरक्षा सुनिश्चित करने के लिए डेटा-केंद्रित विनियमों के प्रति कैसे रुझान लेना चाहिए?

आईबी: जब तक सभी डेटा लेनदेन ऑनचेन रिकॉर्ड किए जाते हैं, तब तक निगरानी और निरीक्षण की चिंताओं को संबोधित करने के लिए पारदर्शिता पर्याप्त होनी चाहिए। यदि नियामकों को वास्तव में सार्वजनिक सुरक्षा और सुरक्षा की चिंता है, तो केंद्रीकृत संस्थाओं के डेटा प्रबंधन और उपयोग के लिए अधिक विनियम होने चाहिए। डर के साथ निष्कर्ष पर जाने के बजाय, कानून निर्माताओं को पहले इस बारे में जानना चाहिए कि विकेंद्रीकृत डेटा सोर्सिंग का उपयोग कैसे किया जा सकता है और कैसे किया जा रहा है। यदि कोई दुर्भावनापूर्ण इरादा या उपयोग है, तो उन्हें हस्तक्षेप करना चाहिए, बजाय इसके कि नवाचार को नुकसान पहुंचाने वाले छत्र विनियम जारी करें।

Technologist: Decentralized Data Crowdsourcing Is Key to Countering Big Tech's Dominance
सिनेसेस वन के सीईओ, आइजैक बैंग

बीसीएन: संभावित राष्ट्रीय सुरक्षा जोखिमों के बारे में आप कैसे चिंताओं का समाधान करते हैं, जैसे आपकी मंच का दुर्भावनापूर्ण गतिविधियों के लिए दुरुपयोग?

आईबी: इस समय, हमने प्लेटफार्म का कोई दुरुपयोग नहीं देखा है। राष्ट्रीय सुरक्षा स्तर पर संभावित जोखिम की कल्पना करना वास्तव में कठिन है। डेटा भंडारण स्तर पर, सिनेसेस दोनों वितरित भंडारण समाधान (जैसे आईपीएफएस, अर्वीव) और केंद्रीकृत समाधान (जैसे एडब्ल्यूएस) के साथ काम कर सकता है, यह ग्राहक पर निर्भर करता है। डेटा एनोटेशन स्तर पर, सभी को समीक्षा से गुजरना पड़ता है और यहां तक कि समीक्षाएं भी विशेष रूप से ग्राहक द्वारा अनुकूलित की जा सकती हैं ताकि दुर्भावनापूर्ण व्यवहार को रोका जा सके।

बीसीएन: अधिकांश बिग टेक खिलाड़ी विकेंद्रीकृत डेटा सोर्सिंग की क्षमता की समीक्षा करते समय अपने लाभों पर विचार करते हैं। फिर भी, आपका ब्लॉकचेन समाधान, सिनेसेस वन, प्रणाली को पुनर्भाषित करने के लिए तैयार है। कृपया संक्षेप में उस क्रांति को उजागर करें जो सिनेसेस वन एआई उद्योग में लाना चाहता है, यह प्रमुख चुनौतियों को नोट करते हुए जिन्हें आपने सामना किया है?

आईबी: सिनेसेस में, हमारा उद्देश्य किसी भी एआई डेटा आवश्यकताओं के लिए कंपनियों की सहायता करने वाले विशेषज्ञ और डोमेन विशिष्ट विशेषज्ञों के दुनिया के सबसे बड़े डिजिटल श्रमिक नेटवर्क बनना है। हम पहले से ही एआई प्रशिक्षण के लिए विशेषज्ञ स्तर के ज्ञान की मांग में वृद्धि देख रहे हैं (जैसे कि [फाइन ट्यूनिंग, आरएलएचएफ, कच्चा डेटा]) क्योंकि एआई को अधिक से अधिक उपयोग के मामलों के लिए उपयोग किया जा रहा है। हम किसी भी आकार की कंपनी को किसी भी डोमेन में सक्षम करना चाहते हैं ताकि प्लैटफ़ॉर्म और दुनिया भर के डिजिटल विशेषज्ञों के हमारे नेटवर्क का दोहन करके उनकी एआई डेटा आवश्यकताओं को बढ़ा सकें। यह न केवल कंपनियों को विस्तार में मदद करेगा, बल्कि दुनिया भर के लोगों को अपनी ऑनलाइन ज्ञान और कौशल प्रदान करके धन अर्जित करने के नए अवसर भी लाएगा।

बीसीएन: मुख्यधारा के बड़े डेटा प्रबंधन फर्मों के खिलाफ आपकी समाधान को प्रतिस्पर्धी माहौल में कैसे नेविगेट करने का इरादा है, जो अपने हितों की रक्षा के लिए हर संभव प्रयास करने के लिए तैयार हो सकते हैं?

आईबी: आश्चर्यजनक रूप से, मुख्यधारा के फर्मों ने अपने श्रमिकों के लिए जिन दर्द बिंदुओं को हल नहीं किया है, वे बहुत हैं। एक भुगतान के आसपास है, क्योंकि पारसीमावली भुगतान अक्सर महंगे और धीमे होते हैं। अन्य मुख्य दर्द बिंदु पारदर्शिता की कमी है। यह हमारे लिए एक बड़ा लाभ है क्योंकि हमारा भुगतान प्रणाली कोई न्यूनतम शेष राशि की आवश्यकता नहीं करती, इसमें कोई शुल्क नहीं है, और यह तात्कालिक है। हमने बहुत सारे निराश डिजिटल श्रमिकों का स्वामित्व किया है जिन्होंने वेब2 डेटा लेबलिंग स्पेस में बड़े खिलाड़ियों का उपयोग किया है। जैसे-जैसे हम सभी पृष्ठभूमियों के और अधिक डिजिटल श्रमिकों को लाएंगे और नेटवर्क का निर्माण करेंगे, हमारे समाधान संभावित ग्राहकों के लिए अधिक से अधिक आकर्षक हो जाएंगे।

बीसीएन: आपके फर्म द्वारा अपने समाधान प्रदान करने में जिन व्यक्तिगत जोखिमों का सामना करना पड़ा है, उसके अलावा, आपके प्‍लेटफॉर्म के उपयोगकर्ताओं को किस प्रकार के अंतर्निहित जोखिमों की उम्मीद करनी चाहिए और आपके पास उन्हें प्रबंधित करने की क्या योजनाएं हैं?

आईबी: हमारे उपयोगकर्ताओं के सामने आने वाले सबसे बड़े जोखिमों में से एक विशिष्ट अभियानों के लिए आवश्यक ज्ञान और/या कौशल का असमानता है। कुछ डेटा अभियानों तकनीकी होते हैं, और यदि कोई उपयोगकर्ता अच्छा प्रदर्शन नहीं करता है, तो उपयोगकर्ता को अच्छी तरह से पुरस्कृत नहीं किया जाएगा। सब कुछ, जिसमें उपयोगकर्ताओं की प्रतिष्ठा भी शामिल है, उपयोगकर्ताओं द्वारा प्रदान किए गए कार्य की सटीकता पर आधारित है। कुछ कार्यों के लिए तकनीकी कौशल/ज्ञान की आवश्यकता होती है, या उनकी सीखने की प्रक्रिया होती है। इसलिए प्लैटफ़ॉर्म पर किसी भी नए उपयोगकर्ता को अभियानों/डेटा कार्यों को सीखने में कुछ समय व्यतीत करने की उम्मीद करनी चाहिए। हम लगातार नए और मौजूदा उपयोगकर्ताओं के लिए नए शिक्षा और प्रशिक्षण सामग्री को अपडेट और तैयार कर रहे हैं ताकि हम उन्हें बेहतर प्रदर्शन करने के लिए गाइड कर सकें। यह सभी को लाभ देता है, जब तक कि उपयोगकर्ता सामग्री को पढ़ने और सीखने में समय व्यतीत करते हैं।

इस कहानी में टैग