Results 1 to 14 of 14

Thread: PDF inlezen en converteren naar tekst

  1. #1

    PDF inlezen en converteren naar tekst

    Hi,
    Heeft iemand ervaring het openen van een PDF bestand en deze vervolgens analyseren?
    Ik wil bv een ingekomen PDF factuur kunnen inlezen, waarbij je de factuurregels kunt herkennen, de datum, afzender, enz.

  2. #2
    Senior Member
    Join Date
    Dec 2003
    Location
    Den Haag
    Posts
    210
    Zeker. Quick PDF Library heb ik gebruikt.
    https://www.debenu.com/products/deve...u-pdf-library/

  3. #3

  4. #4
    John Kuiper
    Join Date
    Apr 2007
    Location
    Almere
    Posts
    8,747
    En goedkoper. Van horen is het een hele goede tool voor Delphi
    Delphi is great. Lazarus is more powerfull

  5. #5

  6. #6
    Dank voor de opties!
    Blijven voor mij de volgende vragen:
    QuickPDF: Erg uitgebreid, ik probeer een demo en mis DebenuPDFLibrary1411, is er een makkelijke demo?
    Gnostice: Alles geïnstalleerd, maar bij demo worden gtPDFClasses, gtCstPDFDoc, gtExPDFDoc en meer niet gevonden, kan ze ook niet vinden op de schijf
    Github:Hier heb ik al vaker geprobeerd iets te halen, maar mis een basisinformatie. Hoe laad je hier programma's in? Hoe werkt GitHub?

  7. #7
    mov rax,marcov; push rax marcov's Avatar
    Join Date
    Apr 2004
    Location
    Ehv, Nl
    Posts
    10,357
    groene knop "code", uit dropdown "download zip" kiezen.

    Maar in het algemeen is het misschien handig om op "pdfium" en "pdfium Delphi" te zoeken.

  8. #8
    Name:  bestandlijst.png
Views: 337
Size:  10.6 KBOK, dat ging makkelijk.
    Nu krijg ik de melding: Unable to load libPdfium.dll wanneer ik hem run vanuit de debugger. (bestaat wel)
    Start ik PDFiumReader (of 64) dan geen melding en kan ik een PDF openen.
    Maar dan? Hoe kan ik de PDF analyseren?

  9. #9
    mov rax,marcov; push rax marcov's Avatar
    Join Date
    Apr 2004
    Location
    Ehv, Nl
    Posts
    10,357
    Zet in de run parameters van delphi de directory van de dll als werkdir. Mogelijk dat delphi hem ergens in win32/debug/ of zo stouwt, en dan zijn de dlls niet in dezelfde directory.

  10. #10
    Dankjewel marcov, dat hielp, echter krijg ik nu nog steeds alleen de mogelijkheid een PDF te openen en dan weer af te drukken.
    Zie ik iets over het hoofd?

  11. #11
    mov rax,marcov; push rax marcov's Avatar
    Join Date
    Apr 2004
    Location
    Ehv, Nl
    Posts
    10,357
    Geen idee, ik had het ooit van het lazarus forum gesaved als een antwoord op pdf parsen, maar dat had ik inmiddels anders opgelost, en heb het ooit gebruikt.

  12. #12
    TDigitalTrain user Hans Brenkman's Avatar
    Join Date
    Mar 2002
    Location
    Weert
    Posts
    1,861
    Is de PDF factuur een afbeelding, dus wil je eigenlijk m.b.v. OCR er eerst een tekst van maken of bevat de PDF al tekst ?

    Voor een PDF welke tekst als afbeelding bevat (bijv. gescande factuur) gebruik ik (vanuit de Delphi-app) PdfToPng.exe om er een tijdelijke externe PNG van te maken en met TTesseractOCR4 (MIT License) en Delphi om van de PNG er een tijdelijk tekst-bestand van te maken en zo te lezen. PdfToPng.exe maakt van iedere pagina in de PDF een PNG met oplopend nummer, die kun je dan weer een voor een afwerken.
    https://github.com/r1me/TTesseractOCR4

    Voor een PDF welke al tekst bevat (bijv. factuur geprint naar / opgeslagen als PDF) gebruik ik (vanuit de Delphi-app) PdfToText.exe om de PDF naar een tekst bestand te schrijven en zo te lezen.
    PdfToPng.exe en PdfToText.exe (open source):
    http://www.xpdfreader.com/download.html
    Testen kan niet de afwezigheid van fouten aantonen, slechts de aanwezigheid van gevonden fouten.

    Het is verdacht als een nieuw ontwikkeld programma direct lijkt te werken: waarschijnlijk neutraliseren twee ontwerpfouten elkaar.

  13. #13
    Senior Member
    Join Date
    Dec 2003
    Location
    Den Haag
    Posts
    210
    Quote Originally Posted by Maarten View Post
    Dank voor de opties!
    Blijven voor mij de volgende vragen:
    QuickPDF: Erg uitgebreid, ik probeer een demo en mis DebenuPDFLibrary1411, is er een makkelijke demo?
    Quick PDF Library is inderdaad erg uitgebreid. Heb je Library Path goed staan?
    https://www.debenu.com/products/deve...tting-started/

    Gnostice had mogelijkheid destijds om de hele PDF naar een memo te schrijven bijvoorbeeld.
    Quick PDF Library heeft veel meer analyse mogelijkheden. Het hangt af wat je precies nodig hebt.
    https://www.debenu.com/products/deve...nt-extraction/

  14. #14
    Dank aan Hans, ik ben nu met pdftotxt bezig en dat werkt best goed.
    Alleen moet je extern programma starten en vervolgens .txt openen.
    Ik hoorde dat je met een app de pdf ook naar een dropbox kunt slepen, dat zou natuurlijk helemaal mooi zijn.

Thread Information

Users Browsing this Thread

There are currently 1 users browsing this thread. (0 members and 1 guests)

Bookmarks

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •