
गूगल ने इमेज बनाने के लिए अपना नया AI मॉडल जारी किया है, जिसे इमेजन 3 कहा जाता है । कंपनी ने इस रिलीज़ के बारे में कोई बड़ी घोषणा नहीं की। इसके बजाय, इसने बिना किसी ज़्यादा शोर-शराबे के मॉडल को उपयोगकर्ताओं के लिए उपलब्ध करा दिया। रिलीज़ के साथ ही, गूगल ने ऑनलाइन एक शोध पत्र भी प्रकाशित किया जिसमें बताया गया कि मॉडल कैसे काम करता है।
उपलब्धता और सुविधाएँ
अभी, इमेजन 3 केवल अमेरिका में उपयोगकर्ताओं के लिए उपलब्ध है। अन्य देशों में यह कब उपलब्ध होगा, इस बारे में अभी कोई जानकारी नहीं है। उपयोगकर्ता Google के AI टेस्ट किचन के माध्यम से मॉडल तक पहुँच सकते हैं । यह प्लेटफ़ॉर्म लोगों को साइन अप करने और इमेज बनाने के लिए इमेजन 3 का उपयोग शुरू करने देता है।
इमेजन 3, गूगल के इमेजन मॉडल का तीसरा संस्करण है। इसमें बेहतर बनावट निर्माण, बेहतर शब्द पहचान और संकेतों का सख्त पालन शामिल है। इसका मतलब है कि यह दिए गए विवरण के आधार पर चित्र बनाने में बेहतर होना चाहिए।
उपयोगकर्ता अनुभव और समस्याएं
वर्तमान में, इमेजन 3 के बारे में कुछ मिश्रित समीक्षाएं हैं। हालांकि, कुछ उपयोगकर्ताओं को कई लोगों और खराब रोशनी वाले दृश्यों को शामिल करते हुए क्लोज़-अप छवियों के साथ परेशानी होती है। ये ऐसे क्षेत्र थे जहां मॉडल के पिछले संस्करण ने बेहतर प्रदर्शन किया था।
एक अन्य समस्या अंगों के चित्र बनाने से संबंधित बताई गई है।
उपयोगकर्ताओं ने पाया कि जब उन्होंने "कॉफ़ी का कप पकड़े हुए एक आदमी" जैसे संकेतों का इस्तेमाल किया, तो मॉडल ने कभी-कभी अतिरिक्त अंग दिखाए या अंगों को असामान्य तरीके से वस्तुओं के साथ जोड़ दिया। मॉडल में संकेतों के लिए बहुत सख्त सेंसरशिप नियम भी हैं, जो परिणामों को प्रभावित कर सकते हैं।
तकनीकी विवरण
arXiv पर प्रकाशित Google के शोध पत्र में Imagen 3 के कुछ तकनीकी पहलुओं के बारे में बताया गया है । मॉडल में लेटेंट डिफ्यूजन नामक तकनीक का इस्तेमाल किया गया है। यह विधि स्टेबल डिफ्यूजन द्वारा प्रचलित डिफ्यूजन मॉडल का एक रूपांतर है। Google ने यह भी बताया कि उन्होंने मॉडल के इस्तेमाल से होने वाले संभावित नुकसान को कम करने के लिए नए तरीके लागू किए हैं।
अन्य मॉडलों के साथ तुलना
जेमिनी के फ्री-टियर चैटबॉट के विपरीत, जो इमेज भी बना सकता है लेकिन अलग-अलग क्षमताओं का उपयोग करता है, इमेजन 3 एक अलग आर्किटेक्चर पर बनाया गया है। इमेजन 3 को मुख्य रूप से इमेज डेटा पर प्रशिक्षित किया जाता है, जो इसे बेहतर और अधिक सटीक AI इमेज बनाने में मदद करता है।
इमेजन 3 के बारे में बिंदुओं का सारांश
- गूगल ने गुरुवार को छवि निर्माण के लिए अपना इमेजेन 3 एआई मॉडल जारी किया।
- यह मॉडल फिलहाल केवल अमेरिका के उपयोगकर्ताओं के लिए उपलब्ध है।
- उपयोगकर्ता गूगल के एआई टेस्ट किचन के माध्यम से इमेजेन 3 तक पहुंच सकते हैं।
- इमेजन 3 में बनावट में सुधार, बेहतर शब्द पहचान और सख्त संकेत अनुपालन है।
- कुछ उपयोगकर्ता क्लोज-अप छवियों और कम रोशनी वाले दृश्यों से संबंधित समस्याओं की रिपोर्ट करते हैं।
- यह मॉडल छवियों में सटीक अंग उत्पन्न करने में संघर्ष करता है।
- गूगल के शोध पत्र में प्रसार मॉडल के एक प्रकार, अव्यक्त प्रसार के उपयोग का विवरण दिया गया है।
- इमेजन 3, जेमिनी की छवि निर्माण तकनीक से अलग है, यह छवि-विशिष्ट प्रशिक्षण पर अधिक ध्यान केंद्रित करता है।