es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: PYPDF

PyPDF2 encuentra las coordenadas de los objetos.

¿Hay alguna manera de encontrar las coordenadas en Python de objetos en un PDF? Quiero cortar el PDF exactamente encima del objeto más alto y debajo del objeto más bajo: de PyPDF2 importar PdfFileWriter, PdfFileReader con open (“in.pdf”, “rb”) como in_f: input1 = PdfFileReader(in_f) salida = PdfFileWriter() numPages = input1.getNumPages() . . . Read more

Traduzco documentos de TI al español. Traduzco el siguiente texto al español: Escriba un Splitted PDF Back to HDFS utilizando un cliente inseguro de Python. Traducción: Escribir un PDF dividido de vuelta a HDFS utilizando un cliente inseguro de Python.

He utilizado PdfFileReader para leer el archivo desde el Lake de datos y mi requerimiento es dividir el PDF leído en páginas individuales y escribir los archivos individuales en una carpeta diferente en HDFS. Para leer los archivos he utilizado el siguiente código y está funcionando: from PyPDF2 import PdfFileWriter, . . . Read more

¿Cómo convertir varios archivos PDF a txt en Python?

import os from PyPDF2 import PdfFileReader, PdfFileWriter for filename in os.listdir(“C:/117”): path = os.path.join(“C:/117/”, filename) print(path) with open(‘file.txt’, ‘w’, encoding=’utf-8′) as file: for page_num in range(PdfFileReader(path).numPages): print(‘Page: {0}’.format(page_num)) pageObj = PdfFileReader(path).getPage(page_num) try: txt = pageObj.extractText() except: pass else: file.write(‘Page{0}\n’.format(page_num+1)) file.write(txt) file.close() “”” Estoy convirtiendo cientos de archivos pdf en txt. . . . Read more