es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

El comando “post” de Solr siempre falla con ADVERTENCIA: Solr devuelve un error 404 para la URL: http://localhost:8983/solr/core-name/update/extract… para archivos HTML.

Linux Mint 20.1
Apache Solr 8.11.1

Soy capaz de enviar documentos XML desde el subdirectorio de ejemplos como ipod_other.xml, solo que no puedo enviar un archivo HTML simple y bien formado que he agregado a ese subdirectorio para probar Solr porque espero indexar documentos HTML. (Tenga en cuenta que esta es mi primera experiencia con Solr.)

~/dev/solr-8.11.1/example/exampledocs $ ../../bin/post -c gettingstarted  sample.html 
/home/russ/dev/jdk-11.0.10+9/bin/java -classpath /home/russ/dev/solr-8.11.1/dist/solr-core-8.11.1.jar -Dauto=yes -Dc=gettingstarted -Ddata=files org.apache.solr.util.SimplePostTool sample.html
Versión de SimplePostTool 5.0.0
Enviando archivos a la url [base] http://localhost:8983/solr/gettingstarted/update...
Entrando en modo automático. Se consideran las extensiones de archivo xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
Enviando el archivo sample.html (text/html) a [base]/extract
SimplePostTool: ADVERTENCIA: Solr devolvió un error #404 (No encontrado) para la url: http://localhost:8983/solr/gettingstarted/update/extract?resource.name=%2Fhome%2Fruss%2Fdev%2Fsolr-8.11.1%2Fexample%2Fexampledocs%2Fsample.html&literal.id=%2Fhome%2Fruss%2Fdev%2Fsolr-8.11.1%2Fexample%2Fexampledocs%2Fsample.html

En server/solr/gettingstarted/conf/solrconfig.xml he agregado:

<requestHandler name="/update" class="solr.UpdateRequestHandler" />

como se sugiere en otros lugares, pero esto no hace ninguna diferencia.

Soy capaz de acceder a http://localhost:8983/solr/#/ y http://localhost:8983/solr/#/gettingstarted/core-overview, así como ejecutar consultas.

Tags:  

Answer

  1. Avatar for davy.ai

    Parece que el usuario está teniendo problemas al enviar un archivo HTML bien formado a Apache Solr 8.11.1 en Linux Mint 20.1. El usuario intentó enviar el archivo HTML “sample.html” al núcleo “gettingstarted” utilizando el siguiente comando:

    ~/dev/solr-8.11.1/example/exampledocs $ ../../bin/post -c gettingstarted sample.html

    El usuario recibió un error 404 que indica que no se encontró el archivo. El archivo SolrConfig.xml en el núcleo “gettingstarted” fue modificado añadiendo un manejador de solicitudes:

    <requesthandler name="/update" class="solr.UpdateRequestHandler"></requesthandler>

    Sin embargo, esto no resolvió el problema.

    El usuario puede acceder a las interfaces web de Solr en http://localhost:8983/solr/#/ y http://localhost:8983/solr/#/gettingstarted/core-overview, así como ejecutar consultas.

    Se recomienda asegurarse de que el archivo HTML esté correctamente formado y probar utilizando ExtractingRequestHandler modificando el archivo SolrConfig.xml y añadiendo el siguiente manejador de solicitudes:

    <requesthandler name="/update/extract" class="solr.extraction.ExtractingRequestHandler">
      <lst name="default">
        <str name="lowernames">true</str>
        <str name="uprefix">ignored_</str>
        <str name="captureAttr">true</str>
        <str name="fmap.a">links</str>
      </lst>
    </requesthandler>
    

    Luego, intente enviar el archivo HTML nuevamente utilizando el siguiente comando:

    ~/dev/solr-8.11.1/bin/post -c gettingstarted -params "literal.id=sample.html" sample.html

    Esto debería permitir al usuario enviar e indexar correctamente el archivo HTML utilizando Solr.

Comments are closed.