Esta API es una herramienta de OCR (Reconocimiento Óptico de Caracteres). Cualquier imagen que le pases será examinada y extraerá cada palabra dentro de ella.
Necesitarás pasar la URL de la imagen de tu elección. Y se te entregará el contenido de texto que tiene. Es una API muy intuitiva y te sorprenderán los resultados.
Esta API es ideal para aquellas empresas que han almacenado muchas imágenes y quieren recuperar el texto que contienen. Esto te ayudará a reconocer si tu marca está siendo utilizada en imágenes en la web sin autorización.
Además, esta API ayudará a categorizar esas imágenes con texto. Gracias al reconocimiento de caracteres, recibirás las palabras completas y podrás detectar la categoría de la imagen solo con leer su texto.
¡Aparte de las limitaciones en llamadas a la API por mes, todos los planes funcionan de la misma manera!
Con este endpoint, recibirás el texto dentro de la imagen que le pases.
Solo con la URL de la imagen, podrás extraer todo el texto en formato JSON.
La imagen debe ser una imagen JPEG o PNG normal (con o sin transparencia). Normalmente, tales imágenes tienen extensiones: .jpg, .jpeg, .png. El servicio verifica los archivos de entrada por tipo MIME y acepta los siguientes tipos:
image/jpegimage/pngEl tamaño del archivo de imagen debe ser menor de 16Mb
Análisis de imagen - Características del Endpoint
| Objeto | Descripción |
|---|---|
url |
[Requerido] The URL of the image you want to extract the text from. Remember that only JPG, JPEG and PNG are supported. |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://file.io/GiqYoEWsoy9i","md5":"d4438cf64b5544dc22854b6585d8c398","width":2160,"height":3840,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.11990740740740741,0.019010416666666665,0.8467592592592592,0.89453125],"entities":[{"kind":"text","name":"text","text":"تحديات تؤثر على خدمة الذكاء الاصطناعى للغة العربية - التشكيل\nC\n00\nه استخدام القرآن الكريم\nيعتبر القرآن الكريم أكبر\nمصدر للغة العربية ولكن\nيصعب في بعض الأحيان\nاستخدامه في تدريب نماذج\nالذكاء الاصطناعي لتجنب\nتحريف المعنى. هناك بعض\nالنماذج التي تم تدريبها\nعلى القرآن الكريم، ولكن لم\nتزل هناك حاجة للمزيد من\nالجهود في هذا المجال.\nقه الكتابة من اليمين إلى اليسار\nتكتب اللغة العربية من اليمين إلى اليسار، وهذا يشكل تحديا في تطوير\nنماذج الذكاء الاصطناعي القادرة على الفهم والتعامل مع هذا النوع\nمن اللغات، مع أن هناك بعض النماذج التى تم تدريبها على الكتابة\nمن اليمين إلى اليسار، ولكن لم تزل هناك تحسينات مطلوبة لجعلها\nأكثر قبولاً وفعالية.\nوم الأرقام العربية\n09\nولّدت الأرقام العربية على أنها أرقام إنجليزية، فالرقم . (صفر) من\nالصعب توليده في الذكاء الاصطناعي، إذ يعتقد أنه عبارة عن نقطة."}]}]}]}]}
curl --location --request POST 'https://zylalabs.com/api/37/optical+character+recognition+api/108/image+analysis?url=https://storage.googleapis.com/api4ai-static/samples/ocr-1.png' --header 'Authorization: Bearer YOUR_API_KEY'
Para usar este punto final, la imagen debe ser una imagen JPEG o PNG normal (con o sin transparencia). Normalmente, estas imágenes tienen las extensiones: .jpg, .jpeg, .png. El servicio verifica el archivo de entrada por tipo MIME y acepta los siguientes tipos:
image/jpeg
image/png
El tamaño del archivo de imagen debe ser menor de 16 Mb.
Análisis de Imágenes con archivo - Características del Endpoint
| Objeto | Descripción |
|---|---|
Cuerpo de la Solicitud |
[Requerido] Archivo Binario |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://gopostr.s3.amazonaws.com/binary_file_test_1679/tEMRXL7fQiIgoCXMcQ7UUWHcyqtYa4IeTb1NoAyt.jpg","md5":"f556d7e2b92037ea8b6af4d731597f1d","width":464,"height":479,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.4547413793103448,0.6868475991649269,0.44396551724137934,0.16075156576200417],"entities":[{"kind":"text","name":"text","text":"10\nAFA\nSAVE THE\nPLONET"}]}]}]}]}
curl --location 'https://zylalabs.com/api/37/optical+character+recognition+api/1679/image+analysis+with+file' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--form 'image=@"FILE_PATH"'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
Cada punto final devuelve el texto extraído de la imagen proporcionada en formato JSON. La respuesta incluye detalles como el estado de la solicitud, la URL de la imagen, las dimensiones y el texto reconocido junto con las coordenadas de su caja delimitadora.
Los campos clave en la respuesta incluyen "estado" (indicando éxito o fracaso), "nombre" (URL de la imagen), "ancho" y "altura" (dimensiones), y "entidades" (que contiene el texto reconocido y su posición en la imagen).
Los datos de respuesta están estructurados como un objeto JSON que contiene un arreglo "results". Cada resultado incluye metadatos sobre la imagen y un arreglo "entities" que detalla el texto reconocido y sus coordenadas del cuadro delimitador.
Cada punto final proporciona información sobre el texto extraído de las imágenes, incluyendo las palabras reconocidas, sus posiciones y las dimensiones generales de la imagen. Esto puede ser útil para el análisis y la categorización del texto.
Los casos de uso típicos incluyen la digitalización de documentos impresos, el monitoreo del uso de la marca en imágenes y la categorización de imágenes según el texto que contienen. Las empresas pueden aprovechar estos datos para la gestión de contenido y el cumplimiento.
Los usuarios pueden utilizar los datos devueltos al analizar la respuesta JSON para extraer el texto reconocido y sus coordenadas. Esta información se puede utilizar para un análisis adicional, indexación o integración en aplicaciones para mejorar la funcionalidad.
Los puntos finales aceptan un solo parámetro: la URL de la imagen o el archivo de imagen en sí. La imagen debe estar en formato JPEG o PNG y tener un tamaño inferior a 16 MB. Asegúrese de que el tipo MIME coincida con los formatos aceptados para un procesamiento exitoso.
La precisión de los datos se mantiene mediante el uso de algoritmos de OCR avanzados que analizan el contenido de la imagen. La API está diseñada para manejar varios estilos y diseños de texto, asegurando una extracción de texto confiable de diversas fuentes de imagen.
Nivel de Servicio:
100%
Tiempo de Respuesta:
10.469ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.245ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.971ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.076ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.942ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.450ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.649ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
211ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
810ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.812ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
5.352ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.736ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.627ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
6.952ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.305ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
531ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.101ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
260ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
396ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
5.538ms