Extraer texto de un fichero pdf (Acrobat) con Visual Basic

varios · Registrado: Oct 10, 2006 Mensajes: 2092

¿hay alguna forma de extraer el texto de un fichero PDF (Portable Document Format - Formato de Documento Portátil)?

Utilizo Visual Basic 6 y me gustaría saber si existe alguna forma de sacar el texto de un fichero PDF.

Tengo una aplicación que genera determinados datos de los clientes en PDF, siempre con el mismo formato y he comprobado que los ficheros PDF que genera no están protegidos, por lo que quiero acceder a cada uno de ellos y obtener un dato (el CIF del cliente).

Puesto que el formato siempre es:

CIF Cliente: ....
creo que es posible si puediera obtener el texto de los ficheros pdf con Visual Basic.

varios · Registrado: Oct 10, 2006 Mensajes: 2092

Se me olvidaba comentar que otro uso que quiero darle es el siguiente: tengo miles de ficheros pdf pues en nuestra organización, todos los documentos que utilizamos siempre los generamos en PDF, el problema es que cuando queremos buscar algún texto contenido en alguno de estos ficheros pdf tengo que hacerlo con una aplicación externa (Google Desktop, etc) y es bastante incómodo, sobre todo para los usuarios.

La idea es poder hacer una aplicación en Visual Basic que obtenga todo el texto de todos los ficheros pdf y lo guarde en una base de datos junto con el nombre del documento y la ubicación, de esta forma, realizando la búsqueda en la base de datos podría abrir directamente el fichero pdf que contenga el texto de búsqueda.

alonsojpd · Registrado: Sep 16, 2003 Mensajes: 2687

Anuncios

varios · Registrado: Oct 10, 2006 Mensajes: 2092

El código que has puesto me ha sido de gran utilidad ¿podrías poner la aplición de ejemplo en descargas?

alonsojpd · Registrado: Sep 16, 2003 Mensajes: 2687

Anuncios

iceberg · Registrado: Apr 25, 2007 Mensajes: 1

Hola a todos soy nuevo en este foro.
Intente usar el programa de ejemplo para convertir un PDF a un texto y no pude hacer que funcione.
Lo intente con varios archivos pero ninguno parece trabajar.
Saludos

alonsojpd · Registrado: Sep 16, 2003 Mensajes: 2687

Anuncios

davidf · Registrado: May 17, 2007 Mensajes: 1

Este codigo funciona perfectamente si tenemos instalado el acrobat 5.0 pero, ¿alguien me podria indicar como hacerlo con el adobe 8.0 ?

rodrigoJR · Registrado: Nov 02, 2011 Mensajes: 1

Estimados...

Estoy intentando ejecutar el codigo que se encuentra en la pagina , pero me ha sido imposible, no se que librerias agregar al modulo para que este funcion, al crear el objeto
Set numPagPDFObj = CreateObject("acroexch.pddoc") , el programa se cae y no se que librerias mas agregar...

que me falta para que este codigo funcione ?, necesito su ayuda en forma urgente ya que el tiempo de mi desarrollo se esta acabando y no se como resolver este gran problema...por favor necesito vuestra ayuda.
saludos desde Santiago de Chile.

Rodrigo.