Envía dos cadenas de texto y recibe el porcentaje de similitud entre ellas.
Detección de Plagio: Las instituciones educativas y los editores de contenido pueden utilizar la API para comparar las presentaciones de los estudiantes o artículos publicados con documentos existentes. Al detectar altos puntajes de similitud, puede identificar posibles casos de plagio o contenido duplicado.
Recomendación de Contenido: Las plataformas de comercio electrónico, servicios de streaming y sitios web de noticias pueden mejorar la experiencia del usuario recomendando productos, películas o artículos similares. La API puede analizar las preferencias del usuario y sugerir elementos con altos puntajes de similitud con sus selecciones anteriores.
Chatbots de Servicio al Cliente: Los sistemas de soporte al cliente pueden utilizar la API para mejorar las respuestas de los chatbots. Analizando la similitud entre las consultas de los clientes y una base de datos de preguntas frecuentes o interacciones pasadas, el chatbot puede proporcionar respuestas más precisas y relevantes.
Clustering y Organización de Documentos: Las organizaciones que manejan grandes volúmenes de documentos, como firmas legales o instituciones de investigación, pueden utilizar la API para agrupar y categorizar documentos según su similitud de contenido. Esto ayuda en la gestión y recuperación eficiente de documentos.
Mejora de Motores de Búsqueda: Los motores de búsqueda pueden aprovechar la API para mejorar los resultados de búsqueda. Comparando la similitud entre las consultas de los usuarios y las páginas indexadas, la API puede clasificar y mostrar los resultados más relevantes, mejorando la experiencia general de búsqueda para los usuarios.
Además del número de llamadas a la API, no hay ninguna otra limitación.
Devuelve un puntaje de similitud entre 0 y 1 (1 es similar y 0 es disímil) de dos textos dados.
text_1 (requerido) - primer texto de entrada. Máximo 5000 caracteres.
text_2 (requerido) - segundo texto de entrada. Máximo 5000 caracteres.
Verificar similitud - Características del Endpoint
| Objeto | Descripción |
|---|---|
Cuerpo de la Solicitud |
[Requerido] Json |
{"similarity": 0.8383592963218689}
curl --location --request POST 'https://zylalabs.com/api/4498/text+similarity+measurement+api/5519/check+similarity' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{"text_1": "This is an example sentence.",
"text_2": "This is just another example sentence."}'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
La API acepta entradas de texto sin formato en formato UTF-8. Se pueden procesar tanto frases cortas como párrafos largos, lo que permite un uso flexible en diversas aplicaciones.
La API utiliza modelos avanzados de PLN para embedding textos en vectores de 768 dimensiones y luego calcula la similitud coseno entre estos vectores para producir una puntuación de similitud que varía de -1 a 1, donde 1 indica textos idénticos.
La API utiliza modelos basados en transformadores de última generación, como BERT o sus variantes, para incrustar textos. Estos modelos están preentrenados en grandes corpus y ajustados para lograr una alta precisión en la captura del significado semántico.
La API está optimizada para baja latencia, respondiendo típicamente en unos pocos cientos de milisegundos para solicitudes estándar. El rendimiento puede variar según la longitud y complejidad de los textos de entrada.
Sí, la API admite múltiples idiomas, siempre que el modelo de incrustación subyacente haya sido entrenado con datos multilingües. Esto permite cálculos de similitud precisos en diferentes idiomas.
El endpoint Comprobar Similitud devuelve un objeto JSON que contiene una única clave, "similaridad", que representa la puntuación de similitud entre los dos textos de entrada. La puntuación varía de 0 a 1, donde 1 indica textos idénticos y 0 indica ninguna similitud.
Los datos de respuesta incluyen el campo "similitud", que es un número de punto flotante. Esta puntuación cuantifica el grado de similitud entre las dos cadenas de texto proporcionadas.
Los usuarios pueden personalizar sus solicitudes proporcionando dos cadenas de texto como parámetros, `text_1` y `text_2`, cada una con una longitud máxima de 5000 caracteres. Esto permite comparaciones flexibles según las necesidades del usuario.
Los datos de respuesta están estructurados en formato JSON, con un único par clave-valor. La clave es "similarity" y el valor es la puntuación de similitud calculada, lo que facilita su análisis y uso en aplicaciones.
Los casos de uso típicos incluyen la detección de plagio en entornos educativos, la recomendación de contenido en el comercio electrónico, la mejora de los chatbots de atención al cliente y la mejora de los resultados del motor de búsqueda a través de una mejor clasificación de relevancia.
La precisión de los datos se mantiene mediante el uso de modelos de PLN avanzados que están preentrenados en conjuntos de datos extensos. Actualizaciones continuas y ajustes finos aseguran que los modelos sigan siendo efectivos para capturar similitudes textuales.
Si uno o ambos textos de entrada están vacíos, es probable que la API devuelva un puntaje de similitud de 0, lo que indica que no hay similitud. Los usuarios deben asegurarse de proporcionar ambos textos de entrada para comparaciones significativas.
Los patrones de datos estándar incluyen puntuaciones cercanas a 1 para textos altamente similares, puntuaciones alrededor de 0.5 para textos moderadamente similares y puntuaciones cercanas a 0 para textos disimilares. Este patrón ayuda a los usuarios a evaluar de manera efectiva el grado de similitud.
Nivel de Servicio:
100%
Tiempo de Respuesta:
449ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
393ms
Nivel de Servicio:
83%
Tiempo de Respuesta:
191ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
388ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
393ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
308ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
250ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
162ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
820ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
603ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
32ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
369ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
45ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
44ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.750ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
30ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
658ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
48ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
66ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
10.032ms