पेज ग्रैबर एपीआई एक उन्नत उपकरण है जिसे वेब पेजों से डेटा के निष्कर्षण और विश्लेषण को सुविधाजनक बनाने के लिए डिज़ाइन किया गया है, जो उन पृष्ठों की पूरी एचटीएमएल सामग्री को पुनर्प्राप्त करता है। यह एपीआई उन उपयोगकर्ताओं के लिए उपयोगी है, जिन्हें विभिन्न उद्देश्यों के लिए वेबसाइटों में निहित जानकारी तक पहुंचने की आवश्यकता होती है, जैसे कि मार्केट रिसर्च, प्रतिस्पर्धा की निगरानी, या वेब एप्लिकेशन विकास।
मुख्य विशेषताएँ:
पूर्ण एचटीएमएल कोड पुनर्प्राप्ति: एचटीएमएल एक्सट्रैक्टर एपीआई का मुख्य कार्य किसी विशेष वेब पृष्ठ का संपूर्ण एचटीएमएल कोड कैप्चर करना है। इसमें पृष्ठ की सभी संरचनात्मक सामग्री शामिल होती है, जैसे कि टैग, विशेषताएँ और एम्बेडेड तत्व। पूर्ण एचटीएमएल प्राप्त करके, उपयोगकर्ता पृष्ठ पर सभी दृश्य और छिपी हुई जानकारी तक पहुंच सकते हैं, जिससे सामग्री का समग्र विश्लेषण संभव हो सके।
विभिन्न प्रकार के वेब पृष्ठों के लिए समर्थन: एपीआई बहुपरकारी है और स्थैतिक पृष्ठों से लेकर गतिशील साइटों तक के विभिन्न प्रकार के वेब साइटों का समर्थन करता है जो जावास्क्रिप्ट का उपयोग करके सामग्री उत्पन्न करते हैं। विभिन्न प्रकार की सामग्री को संभालने की क्षमता एपीआई को विभिन्न अनुप्रयोगों के लिए उपयुक्त बनाती है, जैसे कि समाचार डेटा संग्रह, सामाजिक नेटवर्क की निगरानी, और जटिल वेब पृष्ठ संरचना का विश्लेषण।
विशिष्ट डेटा निष्कर्षण: हालांकि एपीआई पूर्ण एचटीएमएल प्रदान करता है, लेकिन इसे विशिष्ट पृष्ठ डेटा को निकालने के लिए भी उपयोग किया जा सकता है। उपयोगकर्ता एपीआई को HTML पार्सिंग तकनीकों के साथ जोड़ सकते हैं, जैसे कि नियमित अभिव्यक्तियों या HTML प्रसंस्करण पुस्तकालयों का उपयोग करके विशिष्ट जानकारी निकालना, जैसे उत्पाद कीमतें, संपर्क विवरण या कोई अन्य प्रासंगिक डेटा।
संक्षेप में, पेज ग्रैबर एपीआई एक शक्तिशाली और लचीला उपकरण है जो वेब पृष्ठों से एचटीएमएल सामग्री को निकालने के लिए है। यह उन लोगों के लिए एक प्रभावी समाधान प्रदान करता है जिन्हें विश्लेषण, अनुसंधान या विकास के लिए वेब पृष्ठ सामग्री तक पूर्ण पहुंच की आवश्यकता होती है। विभिन्न प्रकार के पृष्ठ प्रकारों को संभालने की इसकी क्षमता और इसकी आसान एकीकरण इसे वेब डेटा प्रबंधन और विश्लेषण में कई उपयोग मामलों के लिए एक मूल्यवान विकल्प बनाती है।
एपीआई एक वेब पृष्ठ का यूआरएल प्राप्त करता है और उस पृष्ठ की पूरी एचटीएमएल सामग्री प्रदान करता है।
प्रतिस्पर्धी अनुसंधान: प्रतिस्पर्धियों की वेबसाइटों से सामग्री एकत्र करें ताकि कीमतों, उत्पादों, प्रचारों और विपणन रणनीतियों का विश्लेषण किया जा सके।
समाचार निगरानी: समाचार साइटों से सामग्री निकालें ताकि नवीनतम घटनाओं और अपडेट के साथ वास्तविक समय में अद्यतित रह सकें।
शैक्षणिक अनुसंधान के लिए डेटा संग्रह: शैक्षणिक अनुसंधान या केस स्टडी के लिए कई वेबसाइटों से सामग्री प्राप्त करें और उसका विश्लेषण करें।
वेब एप्लिकेशन विकास: विकास और परीक्षण के दौरान स्वयं वेब एप्लिकेशन से एचटीएमएल को निकालने और पार्स करने के लिए एपीआई का उपयोग करें।
एसईओ विश्लेषण: महत्वपूर्ण SEO तत्वों जैसे कि मेटा टैग्स, हेडिंग्स, और लिंक संरचना का विश्लेषण करने के लिए वेब पृष्ठों से एचटीएमएल निकालें।
प्रति माह अनुमति प्राप्त एपीआई कॉल की संख्या के अलावा कोई अन्य सीमाएँ नहीं हैं।
सामग्री यूआरएल - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
urlSupplier |
[आवश्यक] String |
forceCache |
[आवश्यक] boolean |
{"method":"GET","urlSupplier":"https:\/\/beaute-pacifique.com\/","redirectedUrlSupplier":null,"_note":"Response truncated for documentation purposes"}
curl --location --request GET 'https://zylalabs.com/api/5080/page+grabber+api/6471/content+url?urlSupplier=https://www.reuters.com/article/us-usa-economy-idUSKBN2A40BO&forceCache=True' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
इस एपीआई का उपयोग करने के लिए, आप एक अनुरोध भेजते हैं जिसमें वेब पृष्ठ का यूआरएल होता है और पार्सिंग और निकासी के लिए पूर्ण एचटीएमएल सामग्री प्राप्त करते हैं
पेज ग्रैबर एपीआई एक वेब पृष्ठ से पूरी एचटीएमएल कोड प्राप्त करता है जिससे सामग्री से डेटा पार्स और निकालना आसान हो जाता है
सबके लिए विभिन्न योजनाएँ हैं जिसमें छोटी संख्या में अनुरोधों के लिए एक मुफ्त परीक्षण शामिल है लेकिन इसकी दर का सीमित होना सेवा के दुरुपयोग को रोकने के लिए है
जायला लगभग सभी प्रोग्रामिंग भाषाओं के लिए एक विस्तृत श्रृंखला के समाकलन तरीकों की पेशकश करता है आप अपनी आवश्यकता के अनुसार इन कोड का उपयोग करके अपने प्रोजेक्ट के साथ समाकलित कर सकते हैं
एपीआई एक डोमेन की उम्र और इतिहास के बारे में विस्तृत जानकारी लौटाता है जिसमें इसकी निर्मिति के बाद के वर्ष, महीने और दिन शामिल हैं साथ ही समाप्ति और अपडेट तिथियाँ भी शामिल हैं
पृष्ठ ग्रैबर एपीआई एक निर्दिष्ट वेब पृष्ठ की पूर्ण एचटीएमएल सामग्री लौटाता है जिसमें सभी संरचनात्मक तत्व जैसे टैग, विशेषताएँ और एंबेडेड स्क्रिप्ट शामिल हैं यह उपयोगकर्ताओं को पृष्ठ पर दृश्य और अदृश्य दोनों जानकारी तक पहुँचने की अनुमति देता है
प्रतिक्रिया में मुख्य क्षेत्र "विधि" (उपयोग की गई HTTP विधि), "urlSupplier" (मांग की गई मूल URL), "redirectedUrlSupplier" (यदि लागू हो), और "pageSource" (पृष्ठ की संपूर्ण HTML सामग्री) शामिल हैं
उत्तर डेटा JSON प्रारूप में संरचित है जिसमें कुंजी-मूल्य युग्म होते हैं जो HTTP विधि, अनुरोधित URL, कोई पुनर्निर्देशित URL और पूर्ण HTML स्रोत प्रदान करते हैं यह संगठन प्रासंगिक जानकारी के सरल विश्लेषण और निष्कर्षण की अनुमति देता है
उपयोगकर्ता HTML से पाठ सामग्री चित्र लिंक और मेटाडेटा सहित विभिन्न प्रकार की जानकारी निकाल सकते हैं यह प्रतिस्पर्धी विश्लेषण SEO ऑडिट और शोध के लिए डेटा संग्रह जैसे कार्यों के लिए उपयोगी है
उपयोगकर्ता विभिन्न वेब पृष्ठों से एचटीएमएल सामग्री प्राप्त करने के लिए विभिन्न यूआरएल निर्दिष्ट करके अपने अनुरोध कस्टमाइज़ कर सकते हैं इसके अतिरिक्त वे पुनर्प्राप्ति के बाद विशेष डेटा बिंदुओं को निकालने के लिए एचटीएमएल पार्सिंग तकनीकों को लागू कर सकते हैं
विशिष्ट उपयोग के मामले में प्रतिस्पर्धी अनुसंधान समाचार निगरानी शैक्षणिक डेटा संग्रह वेब एप्लिकेशन विकास और एसईओ विश्लेषण शामिल हैं एपीआई की बहुपरकता इसे विभिन्न डेटा निकासी की जरूरतों के लिए उपयुक्त बनाती है
डेटा सटीकता सुनिश्चित की जाती है जब सीधे निर्दिष्ट URL से लाइव HTML सामग्री प्राप्त की जाती है यह सुनिश्चित करता है कि उपयोगकर्ताओं को वेब पृष्ठ का सबसे वर्तमान संस्करण प्राप्त होता है जो वेबसाइट के मालिक द्वारा किए गए किसी भी अपडेट या परिवर्तनों को दर्शाता है
यदि आपको आंशिक या खाली परिणाम मिलते हैं तो सुनिश्चित करें कि अनुरोधित यूआरएल सही है पृष्ठ की उपलब्धता सुनिश्चित करें और यह सत्यापित करें कि सामग्री को JavaScript के माध्यम से गतिशील रूप से लोड नहीं किया जा रहा है उपयुक्त रूप से अपने निष्कर्षण विधियों को समायोजित करें ताकि इन परिस्थितियों को संभाला जा सके
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,098ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
18,474ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
155ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,683ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,560ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,507ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,907ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,612ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,681ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,415ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,296ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
7,291ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
6,292ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,215ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
75ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
10,037ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
6,100ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
163ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
619ms