A API de Extração de Texto de Domínio fornece uma solução integrada para extrair conteúdo textual de domínios da web em vários formatos, como HTML, Markdown ou texto simples. Esta API versátil atende às necessidades de usuários que buscam recuperar dados textuais relevantes de páginas da web de forma eficiente.
Com sua funcionalidade robusta e interface intuitiva, a API de Extração de Texto de Domínio simplifica o processo de extração de texto de domínios da web. Se os usuários precisarem de texto simples, conteúdo em Markdown ou HTML, a API garante extração precisa enquanto preserva a estrutura e formatação originais do texto.
Os usuários podem integrar a API de Extração de Texto de Domínio em suas aplicações e sistemas com facilidade, graças aos seus endpoints bem documentados e ao simples processo de integração. A API suporta linguagens de programação e plataformas comuns, possibilitando integração fluida em uma ampla gama de projetos e fluxos de trabalho.
No geral, a API de Extração de Texto de Domínio é uma ferramenta valiosa para extrair conteúdo textual de domínios da web nos formatos HTML, Markdown ou texto simples. Graças à sua versatilidade, desempenho e confiabilidade, a API permite recuperar dados textuais relevantes de páginas da web de forma eficiente e eficaz.
Ela receberá um parâmetro e fornecerá um JSON.
Plano Básico: 100 solicitações por minuto.
Plano Pro: 100 solicitações por minuto.
Plano Pro Plus: 100 solicitações por minuto.
Plano Premium: 100 solicitações por minuto.
Para usar este endpoint, você deve especificar a URL de um domínio. Também haverá um parâmetro opcional onde você pode indicar o tipo de informação a ser extraída (HTML, markdown, texto) HTML é o padrão.
raspar - Recursos do endpoint
| Objeto | Descrição |
|---|---|
url |
[Obrigatório] |
type |
Opcional |
{"url":"https://en.wikipedia.org/wiki/Harry_Kane","title":"Harry Kane - Wikipedia","description":"Harry KaneMBE Kane with England in 2023Personal informationFull name Harry Edward KaneDate of birth 28 July 1993 (age 31)Place of birth Walthamstow, London, EnglandHeight 6 ft 2 in...","links":["https://en.wikipedia.org/wiki/Harry_Kane"],"image":"https://upload.wikimedia.org/wikipedia/commons/thumb/9/91/Harry_Kane_on_October_10%2C_2023.jpg/640px-Harry_Kane_on_October_10%2C_2023.jpg","_note":"Response truncated for documentation purposes"}
curl --location --request GET 'https://zylalabs.com/api/4178/domain+text+extractor+api/5063/scrape?url=https://en.wikipedia.org/wiki/Harry_Kane&type=markdown' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
Para usar esta API, os usuários devem indicar a URL de um domínio para extrair o conteúdo
A API de Extração de Texto do Domínio extrai programaticamente conteúdo textual de domínios da web em vários formatos, como HTML, Markdown ou texto simples
Existem diferentes planos para atender a todos os gostos incluindo um teste gratuito para um pequeno número de solicitações mas sua taxa é limitada para evitar abuso do serviço
Zyla oferece uma ampla variedade de métodos de integração para quase todas as linguagens de programação Você pode usar esses códigos para integrar ao seu projeto conforme necessário
Permite que os usuários acessem rapidamente e facilmente informações textuais relevantes de várias páginas da web sem a necessidade de fazê-lo manualmente
O endpoint GET Scrape retorna um objeto JSON contendo a URL, título, descrição, links, imagem e conteúdo extraído do domínio web especificado. Isso permite que os usuários acessem informações estruturadas de páginas da web de forma eficiente
Os campos principais nos dados de resposta incluem "url" (a URL de origem) "title" (o título da página) "description" (um breve resumo) "links" (hiperlinks associados) "image" (uma URL de imagem relevante) e "content" (o conteúdo textual principal)
Os dados da resposta estão organizados em um formato JSON, com cada chave representando um aspecto específico do conteúdo extraído. Esse formato estruturado permite fácil análise e integração em aplicações
O endpoint GET Scrape aceita um parâmetro "url" obrigatório para especificar o domínio a ser raspado e um parâmetro "type" opcional para indicar o formato desejado (HTML Markdown ou texto simples), com o padrão sendo HTML
O endpoint GET Scrape fornece acesso a vários tipos de informações, incluindo títulos de páginas, descrições, conteúdo principal, imagens e links, permitindo a extração abrangente de dados de páginas da web
A precisão dos dados é mantida por meio de técnicas de raspagem robustas que garantem que o conteúdo seja extraído diretamente das páginas da web de origem Atualizações regulares e verificações de qualidade ajudam a garantir a confiabilidade dos dados extraídos
Casos de uso típicos incluem agregação de conteúdo para blogs mineração de dados para pesquisa análise de texto para insights monitoramento de conteúdo para conformidade e otimização de SEO através da extração de palavras-chave e metadados
Os usuários podem utilizar os dados retornados integrando-os em seus aplicativos para exibição de conteúdo análise ou monitoramento O formato JSON estruturado permite fácil manipulação e extração de campos específicos conforme necessário
Nível de serviço:
100%
Tempo de resposta:
547ms
Nível de serviço:
100%
Tempo de resposta:
690ms
Nível de serviço:
91%
Tempo de resposta:
2.513ms
Nível de serviço:
100%
Tempo de resposta:
1.945ms
Nível de serviço:
100%
Tempo de resposta:
650ms
Nível de serviço:
100%
Tempo de resposta:
4.048ms
Nível de serviço:
100%
Tempo de resposta:
1.429ms
Nível de serviço:
100%
Tempo de resposta:
3.168ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
1.971ms
Nível de serviço:
100%
Tempo de resposta:
17ms
Nível de serviço:
100%
Tempo de resposta:
16ms
Nível de serviço:
100%
Tempo de resposta:
17ms
Nível de serviço:
100%
Tempo de resposta:
16ms
Nível de serviço:
100%
Tempo de resposta:
10.815ms
Nível de serviço:
100%
Tempo de resposta:
2.539ms
Nível de serviço:
100%
Tempo de resposta:
3.520ms
Nível de serviço:
50%
Tempo de resposta:
1.773ms
Nível de serviço:
100%
Tempo de resposta:
20ms
Nível de serviço:
100%
Tempo de resposta:
5.977ms