स्पीच एनालिसिस एपीआई ऑडियो को texto में सटीकता से परिवर्तित करता है जो विभिन्न अनुप्रयोगों में निर्बाध रूप से एकीकृत होता है यह उन्नत स्पीच रिकग्निशन और एआई का उपयोग करके विभिन्न उद्योगों और उपयोग के मामलों के लिए सटीक प्रतिलिपियाँ प्रदान करता है चाहे वह लाइव स्पीच प्रोसेसिंग हो या प्री-रिकॉर्डेड ऑडियो फाइलें यह एपीआई विश्वसनीय और त्रुटि-मुक्त परिवर्तनों को सुनिश्चित करता है
इस एपीआई की एक विशेषता इसकी बहुभाषी समर्थन है जो कई भाषाओं में उच्च-सटीकता वाली प्रतिलिपि बनाने की सुविधा प्रदान करती है यह इसे विभिन्न भाषाई संदर्भों में प्रतिलिपियों की आवश्यकता रखने वाले उपयोगकर्ताओं के लिए एक अनिवार्य उपकरण बनाता है
पाठ प्राप्त करें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किया गया टेक्स्ट लौटाता है आउटपुट में टेक्स्ट फॉर्मेट में पहचानी गई स्पीच शामिल होती है जिसका उपयोग उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए किया जा सकता है
प्रतिक्रिया डेटा के प्रमुख क्षेत्र आमतौर पर "परिवर्तित पाठ" के लिए "ट्रांसक्रिप्शन" "भाषा" जो पहचान की गई भाषा को इंगित करती है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाती है शामिल होते हैं
POST Obtain Text एंडपॉइंट के लिए प्राथमिक पैरामीटर "audio_url" है जो ट्रांसक्राइब किए जाने वाले ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अतिरिक्त पैरामीटर "language" शामिल हो सकते हैं जो ट्रांसक्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करते हैं
प्रतिक्रिया डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़े शामिल हैं मुख्य संरचना में ट्रांसक्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जो अनुप्रयोगों में आसान पार्सिंग और एकीकरण की अनुमति देता है
टीपिकल उपयोग के मामले में वीडियो के लिए सबटाइटल बनाना बैठकों या इंटरव्यू के लिए ट्रांस्क्रिप्ट तैयार करना सुनने में अक्षम उपयोगकर्ताओं के लिए पहुंच को बढ़ाना और विभिन्न उद्योगों में अंतर्दृष्टियों के लिए बोले गए_CONTENT का विश्लेषण करना शामिल है
डेटा सटीकता उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेटों पर निरंतर प्रशिक्षण के माध्यम से बनाए रखी जाती है एपीआई गलती को कम करने और ट्रांसक्रिप्शन की विश्वसनीयता को सुधारने के लिए गुणवत्ता जांच भी करता है
उपयोगकर्ता "भाषा" पैरामीटर निर्धारित करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में सही वाक्यों के साथ उचित विराम चिह्न और बड़े अक्षर शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता बोलने वालों के उच्चारण और पृष्ठभूमि शोर के स्तर के आधार पर सटीकता में भिन्नताएं अपेक्षित कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
373ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
728ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
270ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
6,955ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,164ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
204ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
520ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
687ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
302ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,658ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9,827ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
16ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
15,224ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,138ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,914ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
692ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,732ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
7,712ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
464ms