es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Según la guía de migración de Hibernate Search 6, se ha eliminado el puente de Apache Tika. La guía sugiere utilizar un puente personalizado que implemente la interfaz org.hibernate.search.engine.backend.document.IndexFieldReference para extraer e indexar el contenido de documentos PDF o Word.

    La alternativa a utilizar un puente personalizado es extraer manualmente el contenido del documento e indexarlo como un campo regular utilizando la anotación @FullTextField. Sin embargo, este enfoque puede no extraer todo el texto, como imágenes incrustadas o texto en encabezados y pies de página.

    En resumen, la mejor manera de indexar el contenido de un archivo PDF o Word en Hibernate Search 6 es utilizar un puente personalizado o extraer y indexar manualmente el contenido como un campo regular.

Comments are closed.