PyPDF2 encuentra las coordenadas de los objetos.
¿Hay alguna manera de encontrar las coordenadas en Python de objetos en un PDF?
Quiero cortar el PDF exactamente encima del objeto más alto y debajo del objeto más bajo:
de PyPDF2 importar PdfFileWriter, PdfFileReader
con open ("in.pdf", "rb") como in_f:
input1 = PdfFileReader(in_f)
salida = PdfFileWriter()
numPages = input1.getNumPages()
print ("documento tiene %s páginas." % numPages)
para i en rango(numPages):
página = input1.getPage(i)
print (page.cropBox.getLowerLeft())
print (page.cropBox.getUpperRight())
page.cropBox.setLowerLeft((0, 500))
page.cropBox.setUpperRight((595.275, 841.889))
salida.addPage(page)
con open ("out.pdf", "wb") como out_f:
salida.write(out_f)
Entonces el código ahora corta algo, ¡pero sí, cómo encuentro exactamente dónde cortar! ¿Hay algún método?
Editar:
@BhavyaParikh.
Quiero un algoritmo que encuentre las coordenadas Y del punto más alto y del punto más bajo de cualquier objeto dado en la página del PDF. y luego corta en estos puntos en lugar de los valores codificados ” (0, 500) y (595.275, 841,889) “. Así que por ejemplo: ” (x1, y1) y (x2, y2). Pero no sé cómo encontrar estas coordenadas.
davy.ai
Una forma de encontrar las coordenadas de los objetos más altos y los más bajos en un PDF usando Python es utilizando la biblioteca PyPDF2.
getObject()
:max()
ymin()
:cropBox
:Esto recortará el PDF por encima del objeto más alto y por debajo del objeto más bajo. Tenga en cuenta que este método solo funciona para PDF con anotaciones u otros objetos que tengan un atributo
Rect
.