es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: PDFTOTEXT

¿Cómo convertir varios archivos PDF a txt en Python?

import os from PyPDF2 import PdfFileReader, PdfFileWriter for filename in os.listdir(“C:/117”): path = os.path.join(“C:/117/”, filename) print(path) with open(‘file.txt’, ‘w’, encoding=’utf-8′) as file: for page_num in range(PdfFileReader(path).numPages): print(‘Page: {0}’.format(page_num)) pageObj = PdfFileReader(path).getPage(page_num) try: txt = pageObj.extractText() except: pass else: file.write(‘Page{0}\n’.format(page_num+1)) file.write(txt) file.close() “”” Estoy convirtiendo cientos de archivos pdf en txt. . . . Read more