Home Blog AI Model को तैयार कर रहा Microsoft, आवाज की हू-ब-हू नकल करने...

AI Model को तैयार कर रहा Microsoft, आवाज की हू-ब-हू नकल करने वाले स्पीच,लॉन्च को लेकर है डर

0

Microsoft is preparing an AI model that mimics speech exactly like a voice, there is fear about its launch

नई दिल्ली। इंसानों के बीच बड़ी तेजी से एआई (आर्टिफिशियल इंटेलिजेंस) टेक्नोलॉजी का इस्तेमाल किया जा रहा है. कई सारे एक्सपर्ट्स इस बात का दावा कर चुके हैं कि आने वाले समय में एआई इंसानो की जगह ले लेगा. देश-दुनिया के बड़े टेक जाइंट्स ने अपना फोकस एआई की तरफ कर लिया है और लगातार उसपर काम कर रहे हैं. इसी कड़ी में माइक्रोसॉफ्ट ने एक नया एआई स्पीच जनरेटर बनाया है, जोकि किसी भी इंसान की आवाज सुनकर कुछ ही सेकेंड में उसकी आवाज में बात करने लगता है.

Ro No - 13028/44

कंपनी का ये एआई स्पीच जनरेटर VALL-E 2 टेक्स्ट-टू-स्पीच (TTS) जनरेटर है. VALL-E 2 इंसान की आवाज सुनकर कुछ सेकेंड में बिलकुल उसकी तरह ही आवाज निकाल सकता है. ये एआई स्पीच जनरेटर इतना ज्यादा रिलायबल है कि शोधकर्ताओं ने इसे फिलहाल के लिए इंसानों के बीच में नहीं उतारने की सलाह दी है.
शोधकर्ताओं के मुताबिक , VALL-E 2 इंसानों की एक्यूरेट और नेचुरल आवाज निकाल सकता है. आसान भाषा में कहें तो सिर्फ सुनकर इस बात का फैसला करना मुश्किल है कि आप मशीन से बात कर रहे या फिर किसी इंसान से. शोधकर्ताओं ने आगे बताया कि VALL-E 2 हाई क्वालिटी वाली स्पीच को आराम से बोल लेता है. इतना ही नही ये उन सेंटेंस को भी बोल सकता है जो पारंपरिक रूप से जटिल और चुनौतीपूर्ण होती हैं.

रिपीटिशन अवेयर सैम्पलिंग

ग्रुप्ड कोड मॉडलिंग

रिपीटिशन अवेयर सैम्पलिंग

रिपीटिशन अवेयर सैम्पलिंग डिकोडिंग हिस्ट्री में टोकन रिपीटिशन को ध्यान में रखकर ऑरिजनल न्यूकलस सैंपलिंग प्रॉसेस को रिफाइन करता है और डिकोडिंग को स्थिर रखता है।

ग्रुप्ड कोड मॉडलिंग

ग्रुप्ड कोड मॉडलिंग कोडेक कोड को ग्रुप में अरेंज करता है ताकि सिक्वेंस लेंथ को बेहतर ढंग से छोटा किया जा सके। यह अनुमान लगाने की गति को बढ़ाता है और लंबे सिक्वेंस मॉडलिंग से जुड़ी परेशानी को दूर करता है।

पब्लिकली लॉन्च नहीं होगा VALL-E 2

VALL-E 2 वॉइस टैलेंट जैसी आवाज में बोल सकता है। वॉइस का सिमिलर होना और नेचुरल होना स्पीच प्रॉम्प्ट की क्वालिटी और लेंथ पर निर्भर करता है। यह बैकग्राउंड में हो रहे शोर और दूसरे फैक्टर पर भी निर्भर करता है। हालांकि, इस मॉडल का गलत इस्तेमाल हो सकता है।

माइक्रोसॉफ्ट

माइक्रोसॉफ्ट के रिसर्चर्स का साफ कहना है कि VALL-E 2 मात्र एक रिसर्च प्रोजेक्ट है। इस मॉडल का इस्तेमाल एजुकेशनल लर्निंग, एंटरटेनमेंट, जर्नलिस्टिक, सेल्फ-ऑथर्ड कंटेंट, एक्सेसिबिलिटी फीचर्स, इंटरेक्विव वॉइस रिस्पॉन्स सिस्टम, ट्रांसलेशन चैटबॉट के लिए किया जा सकता है। हालांकि, क्योंकि इस मॉडल के गलत इस्तेमाल होने को लेकर भी संभावनाएं बनती हैं, इसलिए कंपनी इसे पब्लिकली लॉन्च नहीं करेगी।

गलत कामों में हो सकता है यूज

जैसा कि आपने ऊपर पढ़ा है, कि VALL-E 2 एक इंसान की तरह हूबहू आवाज निकाल सकता है. लेकिन इसकी इसी खासियत का यूज गलत कामों में किया जा सकता है. शोधकर्ताओं के मुताबिक VALL-E 2 एक रिसर्च प्रोडेक्ट है और अभी इसको इंसानों के बीच में उतारने का कोई प्लान नहीं है. इसके पीछे की वजह इसका गलत यूज करने से रोकना है. कोई भी इसका यूज करके किसी की आवाज निकालकर धोखाधड़ी कर सकता है. इसके अलावा वॉयस क्लोनिंग और डीपफेक के बढ़ते के चलते भी ये फैसला लिया गया है.

 

 

LEAVE A REPLY

Please enter your comment!
Please enter your name here