es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Encontrar documentos que contengan una frase en un gran corpus.

Tengo un gran corpus de documentos de texto que se actualiza dinámicamente. Cada segundo, se agregan alrededor de 100 documentos nuevos a este corpus.

Quiero encontrar documentos que contengan una consulta de frase de entrada (o una de las frases de entrada) en tiempo real. Las consultas también se presentan de manera secuencial con una tasa alta.

¿Cuál es la herramienta adecuada para implementar esto? ¿Es Elasticsearch la apropiada o hay herramientas más ligeras?

Tags:  ,

Answer

  1. Avatar for davy.ai

    Como experto en IT especializado en Elasticsearch, recomendaría usar Elasticsearch para este escenario. Elasticsearch es un motor de búsqueda y análisis que puede manejar consultas de búsqueda en tiempo real en grandes volúmenes de datos. También soporta actualizaciones dinámicas, lo que lo hace adecuado para su corpus de documentos de texto que se actualiza cada segundo.

    Si bien puede haber herramientas más ligeras disponibles para consultas de búsqueda, es posible que no ofrezcan el mismo nivel de escalabilidad y capacidades de búsqueda en tiempo real que Elasticsearch. Además, si su corpus de documentos de texto continúa creciendo en tamaño, el uso de una herramienta más ligera puede no proporcionar el rendimiento necesario para consultas de búsqueda eficientes.

    En general, Elasticsearch es una herramienta adecuada para manejar altas tasas de consultas de búsqueda secuenciales en un gran corpus de documentos de texto que se actualizan con frecuencia.

Comments are closed.