ऑडियो से टेक्स्ट कनवर्टर एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोली गई भाषा को संरचित टेक्स्ट में बदलने के लिए डिज़ाइन किया गया है अत्याधुनिक स्पीच पहचान और कृत्रिम बुद्धिमत्ता का उपयोग करते हुए यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले प्रतिलेख प्रदान करता है चाहे वह लाइव ऑडियो हो या प्री-रिकॉर्डेड फ़ाइलें यह एपीआई न्यूनतम त्रुटियों के साथ सटीक और विश्वसनीय टेक्स्ट रूपांतरण सुनिश्चित करता है इस एपीआई का एक प्रमुख लाभ इसकी बहुभाषी क्षमता है जो उपयोगकर्ताओं को बहुविविध भाषाओं में ऑडियो को अत्यधिक सटीकता के साथ ट्रांसक्राइब करने की अनुमति देती है यह विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए एक अमूल्य संसाधन बनाता है
परिवर्तन - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6372/audio+to+text+converter+api/9137/conversion?url=https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
संक्रमण अंतिम बिंदु ऑडियो इनपुट से प्राप्त एक संरचित पाठ आउटपुट लौटाता है इसमें ट्रांसक्राइब किया गया पाठ और मैटाडेटा शामिल है जैसे पहचान की गई भाषा आत्मविश्वास स्कोर और यदि लागू हो तो किसी भी टाइमस्टैम्प
प्रतिक्रिया डेटा में मुख्य क्षेत्र आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ) "भाषा" (ऑडियो की पहचानी गई भाषा) "कॉन्फिडेंस" (सटीकता स्कोर) और "टाइमस्टैम्प" (यदि सक्षम किया गया हो तो, यह बताता है कि कब शब्द बोला गया) शामिल होते हैं
रूपांतरण एंडपॉइंट मुख्य रूप से "ऑडियो_यूआरएल" पैरामीटर की आवश्यकता होती है जो ट्रांसक्रिप्शन के लिए ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अन्य वैकल्पिक पैरामीटर में "भाषा" शामिल हो सकती है जो ट्रांसक्रिप्शन के लिए वांछित भाषा निर्दिष्ट करता है
प्रतिक्रिया डेटा JSON प्रारूप में संगठित है जिसमें कुंजी-मूल्य जोड़े ट्रांसक्रिप्शन और संबंधित मेटाडेटा का प्रतिनिधित्व करते हैं यह संरचना आसानी से पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है
विशिष्ट उपयोग के मामलों में बैठकों का लिप्यांतरण करना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों के लिखित रिकॉर्ड बनाना और पॉडकास्ट को पाठ में परिवर्तित करना शामिल है ताकि इसे सुलभता और एसईओ उद्देश्यों के लिए उपयोग किया जा सके
डेटा सटीकता को उन्नत भाषाई मान्यता एल्गोरिदम और विविध ऑडियो डेटा सेट पर निरंतर प्रशिक्षण के माध्यम से बनाए रखा जाता है नियमित अपडेट और गुणवत्ता जांच विभिन्न भाषाओं और उच्चारणों में उच्च रूपांतरण विश्वसनीयता सुनिश्चित करते हैं
उपयोगकर्ता वैकल्पिक पैरामीटर जैसे "भाषा" निर्दिष्ट करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके जिससे बहुभाषी ऑडियो सामग्री के लिए सटीकता बढ़ सकती है
मानक डेटा पैटर्न में बोले गए सामग्री का स्पष्ट लिप्यांतरण शामिल है जिसकी लंबाई और संरचना ऑडियो गुणवत्ता और जटिलता के आधार पर भिन्न हो सकती है उपयोगकर्ताओं को उम्मीद करनी चाहिए कि पाठ सुसंगत हो जो बोले गए शब्दों से निकटता से मेल खाता हो
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
16ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
365ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,664ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9,827ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,807ms
सर्विस लेवल:
99%
रिस्पॉन्स टाइम:
461ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
835ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,281ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,094ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,847ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,034ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,745ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
152ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,239ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
2,700ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,512ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
5,509ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,434ms