डोमेन टेक्स्ट एक्सट्रैक्शन एपीआई विभिन्न प्रारूपों जैसे HTML, मार्कडाउन या सादा पाठ से वेब डोमेन से पाठ सामग्री निकालने के लिए एक निर्बाध समाधान प्रदान करता है। यह बहुपरकारी एपीआई उपयोगकर्ताओं की आवश्यकताओं को पूरा करता है जो वेब صفحات से प्रासंगिक पाठ डेटा को कुशलतापूर्वक पुनः प्राप्त करना चाहते हैं。
इसके मजबूत कार्यक्षमता और सहज इंटरफ़ेस के साथ, डोमेन टेक्स्ट एक्सट्रैक्शन एपीआई वेब डोमेन से पाठ निकालने की प्रक्रिया को सरल बनाता है। चाहे उपयोगकर्ताओं को सादा पाठ, मार्कडाउन या HTML सामग्री की आवश्यकता हो, एपीआई सटीक निष्कर्षण सुनिश्चित करता है जबकि मूल संरचना और प्रारूपण को बनाए रखता है।
उपयोगकर्ता आसानी से अपने अनुप्रयोगों और प्रणालियों में डोमेन टेक्स्ट एक्सट्रैक्शन एपीआई को एकीकृत कर सकते हैं, इसके अच्छी तरह से दस्तावेजीकृत एंडपॉइंट्स और सरल एकीकरण प्रक्रिया के लिए धन्यवाद। एपीआई सामान्य प्रोग्रामिंग भाषाओं और प्लेटफार्मों का समर्थन करता है, जो कई प्रकार के परियोजनाओं और कार्यप्रणालियों में निर्बाध एकीकरण को सक्षम बनाता है।
कुल मिलाकर, डोमेन टेक्स्ट एक्सट्रैक्शन एपीआई HTML, मार्कडाउन या सादा पाठ प्रारूप में वेब डोमेन से पाठ सामग्री निकालने के लिए एक मूल्यवान उपकरण है। इसकी बहुपरकारीता, प्रदर्शन और विश्वसनीयता के लिए धन्यवाद, एपीआई आपको वेब पृष्ठों से प्रासंगिक पाठ डेटा को कुशलता और प्रभावशीलता के साथ पुनः प्राप्त करने की अनुमति देती है।
यह एक पैरामीटर प्राप्त करेगा और आपको एक JSON प्रदान करेगा।
बेसिक प्लान: 100 अनुरोध प्रति मिनट।
प्रो प्लान: 100 अनुरोध प्रति मिनट।
प्रो प्लस प्लान: 100 अनुरोध प्रति मिनट।
प्रीमियम प्लान: 100 अनुरोध प्रति मिनट।
इस एंडपॉइंट का उपयोग करने के लिए, आपको एक डोमेन का URL निर्दिष्ट करना होगा। इसमें एक वैकल्पिक पैरामीटर भी होगा जहाँ आप स्क्रैप करने के लिए जानकारी के प्रकार को इंगित कर सकते हैं (HTML, मार्कडाउन, पाठ) HTML डिफ़ॉल्ट है
खुरचें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] |
type |
वैकल्पिक |
{"url":"https://en.wikipedia.org/wiki/Harry_Kane","title":"Harry Kane - Wikipedia","description":"Harry KaneMBE Kane with England in 2023Personal informationFull name Harry Edward KaneDate of birth 28 July 1993 (age 31)Place of birth Walthamstow, London, EnglandHeight 6 ft 2 in...","links":["https://en.wikipedia.org/wiki/Harry_Kane"],"image":"https://upload.wikimedia.org/wikipedia/commons/thumb/9/91/Harry_Kane_on_October_10%2C_2023.jpg/640px-Harry_Kane_on_October_10%2C_2023.jpg","_note":"Response truncated for documentation purposes"}
curl --location --request GET 'https://zylalabs.com/api/4178/domain+text+extractor+api/5063/scrape?url=https://en.wikipedia.org/wiki/Harry_Kane&type=markdown' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
इस एपीआई का उपयोग करने के लिए उपयोगकर्ताओं को सामग्री को स्क्रैप करने के लिए एक डोमेन का URL दर्शाना होगा
डोमेन टेक्स्ट एक्सट्रैक्शन एपीआई प्रोग्रामेटिक रूप से वेब डोमेन से विभिन्न प्रारूपों में पाठ्य सामग्री निकालता है जैसे एचटीएमएल मार्कडाउन या सीधे पाठ
विभिन्न स्वादों के लिए विभिन्न योजनाएं हैं जिसमें कुछ अनुरोधों के लिए मुफ्त परीक्षण शामिल है लेकिन आपकी दर का सीमित होना सेवा के दुरुपयोग से बचने के लिए है
जाइला लगभग सभी प्रोग्रामिंग भाषाओं के लिए एक व्यापक श्रृंखला के एकीकरण विधियों की पेशकश करता है आप अपने प्रोजेक्ट के साथ एकीकृत करने के लिए आवश्यकतानुसार इन कोड का उपयोग कर सकते हैं
यह उपयोगकर्ताओं को मैन्युअल रूप से ऐसा करने की आवश्यकता के बिना कई वेब पृष्ठों से प्रासंगिक पाठ्य जानकारी को जल्दी और आसानी से एक्सेस करने की अनुमति देता है
GET स्क्रेप एन्डपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें निर्दिष्ट वेब डोमेन से निकाली गई URL, शीर्षक, वर्णन, लिंक, छवि और सामग्री शामिल होती है यह उपयोगकर्ताओं को वेब पृष्ठों से संगठित जानकारी तक कुशलता से पहुँचने की अनुमति देता है
प्रतिक्रिया डेटा में मुख्य क्षेत्र "url" (स्रोत URL) "title" (पृष्ठ शीर्षक) "description" (एक संक्षिप्त सारांश) "links" (संबंधित हाइपरलिंक) "image" (एक प्रासंगिक छवि URL) और "content" (मुख्य पाठ सामग्री) शामिल हैं
प्रतिक्रिया डेटा JSON प्रारूप में संगठित है जिसमें प्रत्येक कुंजी scraped सामग्री के एक विशिष्ट पहलू का प्रतिनिधित्व करती है यह संरचित प्रारूप आसान पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देता है
GET स्क्रैप एपीआई एक अनिवार्य "url" पैरामीटर को स्वीकार करता है जिससे डोमेन को स्क्रैप करने के लिए निर्दिष्ट किया जाता है और एक वैकल्पिक "type" पैरामीटर को स्वीकार करता है जो वांछित प्रारूप (HTML, Markdown, या साधे टेक्स्ट) को इंगित करता है जिसे डिफ़ॉल्ट रूप से HTML माना जाता है
GET स्क्रेप एंडपॉइंट विभिन्न प्रकार的信息 तक पहुँच प्रदान करता है जिसमें पृष्ठ शीर्षक विवरण मुख्य सामग्री चित्र और लिंक शामिल हैं जिससे वेब पृष्ठों से व्यापक डेटा निष्कर्षण संभव होता है
डेटा सटीकता मजबूत स्क्रेपिंग तकनीकों के माध्यम से बनाए रखी जाती है जो सुनिश्चित करती हैं कि सामग्री सीधे स्रोत वेब पृष्ठों से निकाली जाए। नियमित अपडेट और गुणवत्ता जांच यह सुनिश्चित करने में मदद करती हैं कि निकाले गए डेटा की विश्वसनीयता बनी रहे
विशिष्ट उपयोग के मामलों में ब्लॉग के लिए सामग्री संग्रहण अनुसंधान के लिए डेटा खनन अंतर्दृष्टि के लिए पाठ विश्लेषण अनुपालन के लिए सामग्री निगरानी और कीवर्ड और मेटाडेटा निकालकर एसईओ अनुकूलन शामिल हैं
उपयोगकर्ता वापस किए गए डेटा का उपयोग अपनी अनुप्रयोगों में सामग्री प्रदर्शन, विश्लेषण या निगरानी के लिए कर सकते हैं संरचित JSON प्रारूप आवश्यकतानुसार विशिष्ट क्षेत्रों को आसान हेरफेर और निकासी की अनुमति देता है
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
16ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9,827ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
365ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,389ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,861ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,626ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,732ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
670ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
91ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
6,196ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,191ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,183ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,703ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
5,854ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,052ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
5,228ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
9,245ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,746ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
5,124ms