एक साल बाद मर्कोर $500 मिलियन का वार्षिक राजस्व हासिल करने के बाद, डेटा-लेबलिंग स्टार्टअप के 22-वर्षीय संस्थापक अप्रत्याशित सोने की दौड़ में शामिल होकर अरबपति बन गए। जबकि फ्रंटियर एआई लैब पसंद करते हैं ओपनएआई और anthropic सुपरइंटेलिजेंस का पीछा करते हुए अरबों खर्च करें, इस समय एआई से वास्तव में पैसा कमाने वाली एकमात्र कंपनियां उन्हें कच्चा माल बेच रही हैं: मानव विशेषज्ञता। प्रशिक्षण डेटा प्रदाताओं में सालाना लगभग 10 बिलियन डॉलर का प्रवाह हो रहा है, जिससे एआई बुनियादी ढांचे की दुनिया का एक सोया हुआ कोना सबसे हॉट स्टार्टअप श्रेणी में बदल गया है।
मर्कोर लगभग उबाऊ चीज़ के रूप में शुरू हुआ। जब ब्रेंडन फूडी 19 वर्ष के थे, तो उन्होंने और दो हाई स्कूल दोस्तों ने अपने अन्य स्टार्टअप-संस्थापक मित्रों को विदेशों में सॉफ्टवेयर इंजीनियरों को नियुक्त करने में मदद करने के लिए 2023 में इसे लॉन्च किया। भाषा मॉडलों ने बायोडाटा की जांच की। मॉडल्स ने इंटरव्यू किये. जब तक स्केल एआई 2024 की शुरुआत में 1,200 विशेष कोडर्स के लिए अनुरोध के साथ आया, स्टार्टअप पहले से ही प्रति माह 1 मिलियन डॉलर जुटा रहा था।
तब पैमाना बुलाया। उन दिनों, स्केल एआई एआई प्रशिक्षण डेटा में यह लगभग एकमात्र घरेलू नाम था, जो स्वायत्त वाहनों, ई-कॉमर्स एल्गोरिदम और कोडिंग कार्यों के लिए दुनिया भर में सैकड़ों हजारों लोगों के डेटा को लेबल करके $ 14 बिलियन के मूल्यांकन तक बढ़ गया था। लेकिन जब ओपनएआई और anthropic अपने चैटबॉट्स को वास्तविक प्रोग्रामिंग क्षमता की ओर धकेलना शुरू कर दिया, पैमाना प्रशिक्षण डेटा तैयार करने के लिए सॉफ़्टवेयर इंजीनियरों की आवश्यकता थी – इस तरह के काम के लिए वास्तविक विशेषज्ञता की आवश्यकता होती है, न कि केवल भीड़-भाड़ वाले बटन-क्लिक की।
फ़ूडी ने कुछ बड़ा घटित होते देखा। जब उनके द्वारा भर्ती किए गए इंजीनियरों ने छूटे हुए भुगतान और अराजक प्लेटफ़ॉर्म प्रबंधन के बारे में शिकायत की पैमानाउसने घुमाया। सितंबर तक, मर्कोर वार्षिक राजस्व में $500 मिलियन की घोषणा की। फूडी के सबसे हालिया धन उगाहने वाले दौर में कंपनी का मूल्य 10 बिलियन डॉलर आंका गया। 22 साल की उम्र में, वह और उनके दो सह-संस्थापक अब सबसे कम उम्र के स्व-निर्मित अरबपति हैं।
मर्कोर की सफलता कोई बाहरी बात नहीं है। यह सीमांत प्रयोगशालाओं के एआई विकास के दृष्टिकोण में व्यापक फेरबदल का अब तक का सबसे स्पष्ट संकेत है। जबकि हर कोई डेटा सेंटर बिल्डआउट और चिप की कमी को लेकर चिंतित है, समान रूप से महत्वपूर्ण चीज़ के लिए एक समान दौड़ हो रही है: प्रशिक्षण डेटा जो वास्तव में काम करता है।
लैब्स ने आसान चीज़ें ख़त्म कर दी हैं. वे पहले ही अपने मॉडलों को सदियों पुराना सार्वजनिक रूप से उपलब्ध पाठ उपलब्ध करा चुके हैं। जब निवेशकों से वादा किए गए सुपरइंटेलिजेंस का उत्पादन नहीं हुआ, तो प्रयोगशालाओं ने कुछ अलग करने की ओर रुख किया: मॉडलों को विशिष्ट कौशल सिखाना एक ऐसी तकनीक जहां मॉडलों को ऐसे आउटपुट देने के लिए पुरस्कृत किया जाता है जो मनुष्य पसंद करते हैं। लेकिन पारंपरिक क्राउडसोर्सिंग के विपरीत, जहां आप कुत्तों की छवियों पर लेबल लगाने के लिए किसी को $3 का भुगतान करते हैं, इसके लिए वकीलों, सलाहकारों, भौतिकविदों और सर्जनों को नियुक्त करने की आवश्यकता होती है ताकि यह परिभाषित किया जा सके कि उनके संबंधित डोमेन में “अच्छा” का क्या अर्थ है।









