स्पीच टू टेक्स्ट API API ID: 4914

स्पीच टू टेक्स्ट एपीआई बोले गए भाषा को लिखित पाठ में उच्च सटीकता के साथ परिवर्तित करता है जिससे वास्तविक समय की ट्रांसक्रिप्शन और वॉयस कमांड क्षमताओं की सुविधा मिलती है

इस API को अपने AI एजेंट से MCP के माध्यम से उपयोग करें

OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline और किसी भी MCP-संगत AI क्लाइंट के साथ काम करता है।

डॉक्स और सेटअप

इस MCP को रैप करके एक स्किल बनाएं: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

एपीआई के बारे में:

स्पीच-टू-टेक्स्ट एपीआई एक जटिल तकनीकी समाधान का प्रतिनिधित्व करता है जो बोली गई भाषा और लिखित पाठ के बीच की खाई को पाटने के लिए डिज़ाइन किया गया है। इसके मूल में, यह एपीआई स्पीच को समझता है और उसे सटीक पाठात्मक प्रतिनिधित्व में अनुवाद करता है। न्यूरल नेटवर्क और विशाल डेटा सेट का उपयोग करते हुए, यह कई भाषाओं, लहजों और बोलियों को समझ और ट्रांसक्राइब कर सकता है, विभिन्न भाषाई संदर्भों में व्यापक अनुप्रयोग सुनिश्चित करता है।

इसके अतिरिक्त, स्पीच-टू-टेक्स्ट एपीआई को स्केलेबिलिटी के ध्यान में रखते हुए डिज़ाइन किया गया है। यह भाषण डेटा की विभिन्न मात्रा को समायोजित कर सकता है, छोटी आवाज कमांड से लेकर लंबे बोले गए अंशों तक। यह स्केलेबिलिटी सुनिश्चित करती है कि एपीआई एकल अनुरोधों और बड़े पैमाने पर तैनाती दोनों को संभाल सके, जिससे यह विभिन्न अनुप्रयोगों के लिए एक बहुपरकारी उपकरण बनता है।

कुल मिलाकर, स्पीच-टू-टेक्स्ट एपीआई प्राकृतिक भाषा प्रसंस्करण और स्पीच पहचान के क्षेत्र में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है। अत्याधुनिक तकनीक को उपयोगकर्ता-केंद्रित डिज़ाइन के साथ मिलाकर, यह बोली गई भाषा को लिखित पाठ में परिवर्तित करने के लिए एक शक्तिशाली उपकरण प्रदान करता है। इसकी बहुपरकारीता, सटीकता और अनुकूलनशीलता इसे विभिन्न अनुप्रयोगों के लिए एक मूल्यवान संसाधन बनाती है, रोजमर्रा की संचार से लेकर विशेष उद्योग उपयोग के मामलों तक।

यह एपीआई क्या प्राप्त करता है और आपका एपीआई क्या प्रदान करता है (इनपुट/आउटपुट)?

एपीआई एक ऑडियो फ़ाइल प्राप्त करता है और एक पाठ लौटाता है।

इस एपीआई के सबसे सामान्य उपयोग मामलों में क्या शामिल हैं?

स्वर सहायक: वर्चुअल सहायक जैसे सिरी, एलेक्सा और गूगल असिस्टेंट की कार्यक्षमता को बढ़ाना, जिससे वे उपयोगकर्ता के आदेशों और प्रश्नों को प्राकृतिक भाषा में समझ और संसाधित कर सकें।

ट्रांसक्रिप्शन सेवाएँ: बैठकों, इंटरव्यू और व्याख्यान से ऑडियो को दस्तावेज़ीकरण और रिकॉर्ड-कीपिंग उद्देश्यों के लिए स्वचालित रूप से टेक्स्ट में परिवर्तित करना।

ग्राहक सेवा: ग्राहकों और सेवा एजेंटों के बीच आवाज इंटरएक्शन को ट्रांसक्राइब करके ग्राहक सहायता में सुधार करना, जिससे बेहतर विश्लेषण और फॉलो-अप संभव हो।

भाषण विश्लेषण: ग्राहक की भावना, व्यवहारिक पैटर्न और कॉल सेंटर या मार्केटिंग अभियानों के दौरान सहभागिता स्तरों के बारे में अंतर्दृष्टि के लिए बोले गए इंटरएक्शन का विश्लेषण करना।

भाषा अध्ययन: भाषा शिक्षार्थियों का समर्थन करना, बोले गए अभ्यास सत्रों को ट्रांसक्राइब करना और उच्चारण और प्रवाह पर फीडबैक प्रदान करना।

सामग्री निर्माण: कंटेंट क्रिएटर्स और पत्रकारों की सहायता करना, इंटरव्यू, पॉडकास्ट या भाषणों को ट्रांसक्राइब करके, जिसे फिर लेखों, ब्लॉगों या अन्य लिखित सामग्री के लिए उपयोग किया जा सकता है।

क्या आपकी योजनाओं में कोई सीमाएँ हैं?

एपीआई कॉल की संख्या के अलावा, कोई अन्य सीमा नहीं है।

API डॉक्यूमेंटेशन

एंडपॉइंट्स

पाठ प्राप्त करें Endpoint ID: 6186

इस एंडपॉइंट का उपयोग करने के लिए आपको ऑडियो टेक्स्ट प्राप्त करने के लिए एक mp3 फ़ाइल निर्दिष्ट करनी होगी

                                                                            
POST https://pr157-testing.zylalabs.com/api/4914/speech+to+text+api/6186/get+text

पाठ प्राप्त करें - एंडपॉइंट फीचर्स

ऑब्जेक्ट	विवरण
`रिक्वेस्ट बॉडी`	[आवश्यक] फाइल बाइनरी

एंडपॉइंट टेस्ट करें

API उदाहरण प्रतिक्रिया

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
  "text": "Hola a todos, espero que se encuentren bien."
}

पाठ प्राप्त करें - कोड स्निपेट्स


    curl --location 'https://zylalabs.com/api/4914/speech+to+text+api/6186/get+text' \
    --header 'Content-Type: multipart/form-data' \ 
    --form 'image=@"FILE_PATH"'

API एक्सेस कुंजी और प्रमाणीकरण

साइन अप करने के बाद, प्रत्येक डेवलपर को एक पर्सनल API एक्सेस की असाइन की जाती है, जो अक्षरों और अंकों का एक यूनिक संयोजन होता है, जिसका उपयोग हमारे API एंडपॉइंट तक पहुंचने के लिए किया जाता है। प्रमाणीकरण के लिए स्पीच टू टेक्स्ट API के साथ बस अपने बेयरर टोकन को Authorization हेडर में शामिल करें।

हेडर्स

हेडर	विवरण
`Authorization`	[आवश्यक] होना चाहिए `Bearer access_key`. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें।

प्रश्न

सरल पारदर्शी प्राइसिंग

कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।

मासिक वार्षिक

(वार्षिक बिलिंग के साथ 2 महीने बचाएँ 🎉)