PresentID स्पीकर वेरिफिकेशन API यह जाँच करता है कि दो आवाजें एक ही व्यक्ति की हैं या नहीं यह क्षमता कॉल सेंटर में संभावित रूप से उपयोगी हो सकती है
हमने स्पीकर वेरिफिकेशन के लिए एक गहन शिक्षा-आधारित विधि का प्रस्ताव रखा है हमारी टीम ने इस प्रोजेक्ट पर एक साल से अधिक समय तक काम किया और सटीकता ऑक्सफ़ोर्ड विश्वविद्यालय में एंड्रयू ज़िसरस्मैन ग्रुप द्वारा प्रकाशित पेपर की सटीकता जैसे मानकों को पार कर गई है अन्य विधियों की तुलना में जो टेक्स्ट-निर्भर हैं हमारा मॉडल टेक्स्ट और भाषा-स्वतंत्र है दूसरी ओर हमारे मॉडल की प्रोसेसिंग स्पीड 1 सेकंड से कम है और यह मॉडल केवल 4 सेकंड की लंबाई की दो आवाजों के साथ एक व्यक्ति की पुष्टि करता है हमने मॉडल को अंग्रेजी फ्रेंच स्पेनिश जर्मन फारसी और अरबी भाषाओं में ट्रैक पर प्रशिक्षित किया है हमारा मॉडल पर्यावरण और वर्चुअल शोर के प्रति मजबूत है
**इनपुट:**
- आवाज फ़ाइल
- आवाज URL लिंक
- बेस64 आवाज
**आउटपुट:**
- परिणाम सूची
- परिणाम संदेश
**विशेषताएँ:**
- 90% से अधिक सटीकता
- 1 सेकंड से कम प्रोसेसिंग समय
- GPU की आवश्यकता नहीं है
- भाषा और टेक्स्ट-स्वतंत्र
- आपके ऐप के साथ आसान एकीकरण
- आईओएस एंड्रॉइड विंडोज और मैक उपकरणों का समर्थन
- आपके ऐप के साथ आसान एकीकरण
**उपयोग के मामले:**
- कॉल सेंटर
**नियम और प्रतिबंध:**
- डेटा को बेस64 या आवाज URL या आवाज फ़ाइल के माध्यम से भेजें
- आवाज तीन सेकंड से एक मिनट के बीच होनी चाहिए
- आवाज 5 MB से अधिक नहीं होनी चाहिए
- समर्थित फ़ाइल प्रकार: WAV MP3 M4A FLAC AAC OGG
स्पीकर वेरीफिकेशन एपीआई यह जांचता है कि दो आवाजें एक व्यक्ति की हैं या नहीं
आवाज तीन सेकंड से एक मिनट के बीच होनी चाहिए
आवाजों का आकार 5 एमबी से अधिक नहीं होना चाहिए
समर्थित फ़ाइल प्रकार: wav, mp3, m4a, FLAC, aac, ogg
वॉयस फाइल के साथ वॉयस भेजें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|
{
"data": {
"resultIndex": 0,
"resultMessage": "The two voices don't belong to the same person."
},
"hasError": false,
"statusCode": 200,
"statusMessage": "Login Successfull"
}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4784/send+voice+with+voice+file' --header 'Authorization: Bearer YOUR_API_KEY'
स्पीकर सत्यापन एपीआई जांचता है कि क्या दो आवाजें एक ही व्यक्ति की हैं या नहीं
आवाज तीन सेकंड से एक मिनट के बीच होनी चाहिए
आवाज 5 एमबी से अधिक नहीं होनी चाहिए
समर्थित फ़ाइल प्रकार: wav, mp3, m4a, FLAC, aac, ogg
Base64 के साथ आवाज़ भेजें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|
{"statusCode":400,"statusMessage":"You must upload a sound file.","hasError":true,"features":null}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4785/send+voice+with+base64' --header 'Authorization: Bearer YOUR_API_KEY'
स्पीकर वेरिफिकेशन एपीआई यह जांचता है कि दो आवाजें एक व्यक्ति की हैं या नहीं
आवाज तीन सेकंड से लेकर एक मिनट के बीच होनी चाहिए
आवाजों का आकार 5 एमबी से अधिक नहीं होना चाहिए
समर्थित फ़ाइल प्रकार: wav, mp3, m4a, FLAC, aac, ogg
वॉइस यूआरएल के साथ आवाज़ भेजें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|
{"statusCode":400,"statusMessage":"You must upload a sound file.","hasError":true,"features":null}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4786/send+voice+with+voice+url' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
प्रेजेंटआईडी स्पीकर वेरिफिकेशन एपीआई को यह सत्यापित करने के लिए डिज़ाइन किया गया है कि क्या दो आवाज़ के नमूने एक ही व्यक्ति से उत्पन्न होते हैं यह कार्यक्षमता उन अनुप्रयोगों के लिए आवश्यक है जो आवाज़ के माध्यम से सुरक्षित पहचान सत्यापन की आवश्यकता होते हैं जैसे कि बैंकिंग, एक्सेस नियंत्रण और दूरस्थ प्रमाणीकरण परिदृश्यों में
API का उपयोग करने के लिए आपको एक POST अनुरोध के माध्यम से दो अलग-अलग ऑडियो क्लिप प्रस्तुत करनी होगी API दोनों नमूनों की आवाज़ की विशेषताओं का विश्लेषण करता है और यह निर्धारित करने के लिए पिच, टोन और मडुलेशन जैसे लक्षणों की तुलना करता है कि क्या वे मेल खाते हैं फिर यह एक विश्वास स्कोर या बाइनरी परिणाम लौटाता है जो दर्शाता है कि क्या आवाज़ें एक ही व्यक्ति की हैं
एपीआई सामान्य ऑडियो फ़ाइल प्रारूपों को स्वीकार करता है जिसमें WAV MP3 और AAC शामिल हैं सर्वश्रेष्ठ परिणामों के लिए सुनिश्चित करें कि रिकॉर्डिंग स्पष्ट हों कम से कम पृष्ठभूमि शोर हो और बोला गया सामग्री दोनों नमूनों में समान हो
हाँ, एपीआई के कुछ सीमाएँ हैं जो आपके द्वारा चयनित सदस्यता योजना के आधार पर भिन्न होती हैं ये सीमाएँ उन ऑडियो फ़ाइलों के आकार से संबंधित हो सकती हैं जिन्हें आप अपलोड कर सकते हैं और प्रतिदिन या माह में आप कितनी सत्यापन अनुरोध कर सकते हैं विशेष विवरण के लिए कृपया मूल्य निर्धारण पृष्ठ या अपने उपयोगकर्ता डैशबोर्ड को देखें
आपको कई सामान्य त्रुटियों का सामना करना पड़ सकता है 400 बुरा अनुरोध: यह त्रुटि अक्सर तब होती है जब ऑडियो फ़ाइलें बहुत बड़ी होती हैं, corrupted होती हैं, या गलत प्रारूप में होती हैं सुनिश्चित करें कि आपकी फ़ाइलें आवश्यक आकार सीमाओं के भीतर हैं और ठीक से प्रारूपित हैं 401 अधिकृत नहीं: यह तब होता है जब आपका एपीआई कुंजी गायब होती है, गलत होती है, या समाप्त हो जाती है सुनिश्चित करें कि आपकी एपीआई कुंजी मान्य है और आपके अनुरोध शीर्षकों में सही ढंग से शामिल है 429 बहुत सारे अनुरोध: यह बताता है कि आपने अपनी सदस्यता योजना द्वारा निर्धारित एपीआई उपयोग सीमाओं को पार कर लिया है अपने योजना को अपग्रेड करने पर विचार करें या अपने अनुरोध दर को अधिक प्रभावी ढंग से प्रबंधित करें
प्रत्येक एंडपॉइंट एक JSON प्रतिक्रिया लौटाता है जिसमें एक `data` ऑब्जेक्ट होता है जिसमें `resultIndex` और `resultMessage` होता है `resultIndex` यह दर्शाता है कि आवाजें मेल खाती हैं या नहीं (कोई मेल नहीं के लिए 0 मेल के लिए 1) जबकि `resultMessage` प्रमाणन प्रक्रिया के एक वर्णनात्मक परिणाम को प्रदान करता है
प्रतिक्रिया डेटा में प्रमुख क्षेत्र शामिल हैं `resultIndex`, जो मैच स्थिति को इंगित करता है, `resultMessage`, जो परिणाम का वर्णन करता है, `hasError`, जो इंगीत करता है कि क्या कोई त्रुटि हुई है, और `statusCode` और `statusMessage` कुल अनुरोध स्थिति के लिए
एंडपॉइंट्स ऐसे पैरामीटर्स स्वीकार करते हैं जैसे ऑडियो फ़ाइल (वॉयस फ़ाइल, Base64, या वॉयस URL) ऑडियो की लंबाई 3 सेकंड से 1 मिनट के बीच होनी चाहिए अधिकतम 5 एमबी होनी चाहिए और समर्थित फ़ॉर्मेट जैसे WAV MP3 या AAC में होना चाहिए
प्रतिक्रिया डेटा एक JSON प्रारूप में व्यवस्थित है इसमें सत्यापन परिणामों के साथ एक `डेटा` ऑब्जेक्ट और त्रुटि हैंडलिंग और स्थिति के लिए अतिरिक्त फ़ील्ड शामिल हैं यह संरचना एप्लिकेशनों में आसान पार्सिंग और एकीकरण की अनुमति देती है
प्रतिकृत उपयोग के मामलों में कॉल केंद्रों में पहचान सत्यापन बैंकिंग में धोखाधड़ी रोकने और सुरक्षित पहुंच नियंत्रण प्रणालियाँ शामिल हैं एपीआई उपयोगकर्ताओं की आवाज़ के नमूनों के आधार पर पहचान की पुष्टि करके सुरक्षा को बढ़ा सकता है
उपयोगकर्ता लौटाए गए डेटा का उपयोग `resultIndex` की जांच करके कर सकते हैं यह निर्धारित करने के लिए कि क्या आवाज़ें मिलती हैं और `resultMessage` का उपयोग करके विस्तृत फीडबैक के लिए यह जानकारी आगे की कार्रवाई में मार्गदर्शन कर सकती है जैसे कि एक्सेस की अनुमति देना या संभावित धोखाधड़ी को झंडी दिखाना
एपीआई एक गहरे शिक्षण मॉडल का उपयोग करता है जो विभिन्न भाषाओं में विविध आवाज़ के नमूनों पर प्रशिक्षित है जिससे उच्च सटीकता और परिवेशीय शोर के खिलाफ मजबूती सुनिश्चित होती है बेंचमार्क के खिलाफ निरंतर परीक्षण डेटा गुणवत्ता को बनाए रखने में मदद करता है
यदि एपीआई एक त्रुटि या खाली परिणाम लौटाता है तो ऑडियो फ़ाइल के फ़ॉर्मेट, आकार और लंबाई की जांच करें सुनिश्चित करें कि इनपुट निर्दिष्ट आवश्यकताओं को पूरा करता है अपने एप्लेशन में त्रुटि प्रबंधन लागू करें ताकि इन परिस्थितियों को सुचारू रूप से संभाला जा सके
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
656ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,377ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
767ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,948ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,077ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,293ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
746ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,031ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
601ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
841ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
346ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,288ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
846ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
571ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,230ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,025ms