वॉइस ट्रांसक्रिप्शन एपीआई बोले गए शब्दों को संरचित पाठ में परिवर्तित करने के लिए एक उन्नत और विश्वसनीय समाधान है। अत्याधुनिक स्पीच रिकॉग्निशन और आर्टिफिशियल इंटेलिजेंस का लाभ उठाते हुए यह विभिन्न उद्योगों और अनुप्रयोगों के लिए अनुकूलित सटीक ट्रांसक्रिप्शन प्रदान करता है। चाहे यह वास्तविक समय की बोली का प्रोसेसिंग हो या रिकॉर्डेड ऑडियो, यह एपीआई न्यूनतम गलतियों के साथ सटीक और कुशल टेक्स्ट रूपांतरण की गारंटी देता है
इसके प्रमुख फीचर्स में से एक बहुभाषी समर्थन है जो उपयोगकर्ताओं को विभिन्न भाषाओं में ऑडियो कोRemarkable precision के साथ ट्रांसक्रिप्ट करने की अनुमति देता है। यह उन लोगों के लिए एक आवश्यक उपकरण बनाता है जिन्हें विभिन्न भाषाई परिप्रेक्ष्य में उच्च गुणवत्ता वाले ट्रांसक्रिप्शन की आवश्यकता है
प्रतिलेखन - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s31.aconvert.com/convert/p3r68-cdx67/s49sb-3bftf.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request GET 'https://zylalabs.com/api/6376/voice+transcription+api/9143/transcription?url=https://imgv3.fotor.com/images/blog-richtext-image/make-a-watermark-for-a-landscape-image.jpg' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किए गए टेक्स्ट को वापस करता है आउटपुट में टेक्स्ट प्रारूप में पहचानी गई स्पीच शामिल होती है जिसे उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए उपयोग किया जा सकता है
प्रतिक्रिया डेटा में मुख्य क्षेत्र आमतौर पर "ट्रांसक्रिप्शन" के लिए रूपांतरित पाठ "भाषा" के लिए जो पहचानी गई भाषा को इंगित करता है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाता है
पीओएसटी ऑब्टेन टेक्स्ट एंडपॉइंट के लिए प्राथमिक पैरामीटर "ऑडियो_यूआरएल" है जो ट्रांस्क्राइब किए जाने वाले ऑडियो फ़ाइल के यूआरएल को निर्दिष्ट करता है अतिरिक्त पैरामीटर में "भाषा" शामिल हो सकती है जो ट्रांस्क्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करती है
प्रतिक्रिया डेटा एक JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य युग्म होते हैं मुख्य संरचना में ट्रांस्क्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जिससे एप्लिकेशन में आसान पार्सिंग और एकीकरण संभव है
प्रमुख उपयोग मामलों में वीडियो के लिए सबटाइटल बनाना मीटिंग या इंटरव्यू के लिए ट्रांसक्रिप्ट तैयार करना सुनने में असमर्थ उपयोगकर्ताओं के लिए पहुंच को बेहतर बनाना और विभिन्न उद्योगों में अंतर्दृष्टि के लिए बोले गए सामग्री का विश्लेषण करना शामिल है
डेटा सटीकता को उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेट पर निरंतर प्रशिक्षण के माध्यम से बनाए रखा जाता है एपीआई गुणवत्ता जांच का भी उपयोग करता है ताकि त्रुटियों को कम किया जा सके और ट्रांसक्रिप्शन की विश्वसनीयता में सुधार हो सके
उपयोगकर्ता अपनी अनुरोधों को अनुकूलित कर सकते हैं "भाषा" पैरामीटर को निर्दिष्ट करके विशिष्ट भाषाओं के लिए ट्रांसक्रिप्शन को लक्षित करने के लिए यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में उचित विराम चिह्न और पूंजीकरण के साथ स्पष्ट वाक्य शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता वक्ता के उच्चारण और बैकग्राउंड शोर स्तरों के आधार पर सटीकता में भिन्नताएँ उम्मीद कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
11,869ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,452ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,228ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
320ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,761ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
10,033ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,497ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
286ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
922ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,845ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
5,064ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,618ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,704ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,825ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
799ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
22ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
6,292ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,371ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,773ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
3,097ms