El comando “post” de Solr siempre falla con ADVERTENCIA: Solr devuelve un error 404 para la URL: http://localhost:8983/solr/core-name/update/extract… para archivos HTML.
Linux Mint 20.1
Apache Solr 8.11.1
Soy capaz de enviar documentos XML desde el subdirectorio de ejemplos como ipod_other.xml, solo que no puedo enviar un archivo HTML simple y bien formado que he agregado a ese subdirectorio para probar Solr porque espero indexar documentos HTML. (Tenga en cuenta que esta es mi primera experiencia con Solr.)
~/dev/solr-8.11.1/example/exampledocs $ ../../bin/post -c gettingstarted sample.html
/home/russ/dev/jdk-11.0.10+9/bin/java -classpath /home/russ/dev/solr-8.11.1/dist/solr-core-8.11.1.jar -Dauto=yes -Dc=gettingstarted -Ddata=files org.apache.solr.util.SimplePostTool sample.html
Versión de SimplePostTool 5.0.0
Enviando archivos a la url [base] http://localhost:8983/solr/gettingstarted/update...
Entrando en modo automático. Se consideran las extensiones de archivo xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
Enviando el archivo sample.html (text/html) a [base]/extract
SimplePostTool: ADVERTENCIA: Solr devolvió un error #404 (No encontrado) para la url: http://localhost:8983/solr/gettingstarted/update/extract?resource.name=%2Fhome%2Fruss%2Fdev%2Fsolr-8.11.1%2Fexample%2Fexampledocs%2Fsample.html&literal.id=%2Fhome%2Fruss%2Fdev%2Fsolr-8.11.1%2Fexample%2Fexampledocs%2Fsample.html
En server/solr/gettingstarted/conf/solrconfig.xml he agregado:
<requestHandler name="/update" class="solr.UpdateRequestHandler" />
como se sugiere en otros lugares, pero esto no hace ninguna diferencia.
Soy capaz de acceder a http://localhost:8983/solr/#/ y http://localhost:8983/solr/#/gettingstarted/core-overview, así como ejecutar consultas.
davy.ai
Parece que el usuario está teniendo problemas al enviar un archivo HTML bien formado a Apache Solr 8.11.1 en Linux Mint 20.1. El usuario intentó enviar el archivo HTML “sample.html” al núcleo “gettingstarted” utilizando el siguiente comando:
~/dev/solr-8.11.1/example/exampledocs $ ../../bin/post -c gettingstarted sample.html
El usuario recibió un error 404 que indica que no se encontró el archivo. El archivo SolrConfig.xml en el núcleo “gettingstarted” fue modificado añadiendo un manejador de solicitudes:
<requesthandler name="/update" class="solr.UpdateRequestHandler"></requesthandler>
Sin embargo, esto no resolvió el problema.
El usuario puede acceder a las interfaces web de Solr en http://localhost:8983/solr/#/ y http://localhost:8983/solr/#/gettingstarted/core-overview, así como ejecutar consultas.
Se recomienda asegurarse de que el archivo HTML esté correctamente formado y probar utilizando ExtractingRequestHandler modificando el archivo SolrConfig.xml y añadiendo el siguiente manejador de solicitudes:
Luego, intente enviar el archivo HTML nuevamente utilizando el siguiente comando:
~/dev/solr-8.11.1/bin/post -c gettingstarted -params "literal.id=sample.html" sample.html
Esto debería permitir al usuario enviar e indexar correctamente el archivo HTML utilizando Solr.