Results 1 to 7 of 7

Thread: Afspelen van .mp3 bestand

  1. #1

    Afspelen van .mp3 bestand

    Hallo allemaal een gezond en gelukkig 2021.

    Ik ben bezig met een programma om een mp3 bestand (tekst) te laten horen. Dat op zich is niet het probleem, maar wat ik wil is dat van tekst mp3 bestand de woorden afzonderlijk laten horen.

    Voorbeeld
    -----------
    Dit is een tekst van Piet.mp3 ===> de hele zin wordt uitgesproken, maar dat moet zijn : elk woord afzonderlijk. Losse woorden als mp3 bestand kan niet. De vraag is hoe laat je de woorden afzonderlijk horen gebruik makend van het mp3-bestand. Dat betekend dat de pauze tussen de woorden
    instelbaar moeten zijn.

    Met een vriendelijke groet, Frans

  2. #2
    Moet dit per se uit een MP3 gedestilleerd worden?
    Lijkt me knap lastig.
    Ik zou eerder aan een text-to-speech interface denken (en nee, daar heb ik vervolgens ook geen enkel verstand van).

    Bart

  3. #3
    Counting your refs Paul-Jan's Avatar
    Join Date
    Feb 2002
    Location
    Lage Zwaluwe
    Posts
    2,159
    Uiteraard ook jij de beste wensen voor dit nieuwe jaar!

    Laat ik beginnen met onderstrepen wat Bart B zegt: dit is geen "ik los het even op / leg het even uit" probleem. Het goed detecteren van de stiltes tussen woorden ("silence detection / word boundary detection") is onderdeel van het grotere probleemgebied Spraakherkenning, en daar wordt nog hartstikke veel onderzoek naar gedaan.

    Als je iets wilt doen in deze richting, zou ik één van deze twee kiezen:

    Aanpak 1 - Zo low level mogelijk beginnen
    Render intern de MP3 naar een waveform (dat is een simpele zin maar geen simpele programmeeroefening ) en ga daarin op zoek naar gebieden met een relatief laag volume. Knip daarmee het geluid.
    Een Delphi-linkje waarbij het moeilijke deel door Bass wordt afgehandeld: http://www.un4seen.com/forum/?topic=2017.0

    Aanpak 2 - Zo high level mogelijk beginnen
    Voer de MP3 aan de Google Speech to Text API. Je krijgt dan woorden terug met hun boundaries, daarop kun je dan het juiste deel van het geluidsfragment afspelen.
    Bonus: je hebt gratis de tekst (hoe goed of hoe slecht dat ook werkt voor Nederlandstalige teksten).
    Last edited by Paul-Jan; 02-Jan-21 at 12:49.

  4. #4
    Vraagje: heb je alleen de MP3, of weet je ook de de tekst die erin gesproken wordt?

    Bart

  5. #5
    Als het gaat om het rustig uitspreken van een tekst - dus vertraagd, kun je dit ook met BASS (un4seen) doen.
    Zelf gebruik ik BASS om muziek versneld/vertraagd af te spelen zonder dat de toonhoogte wijzigt.

  6. #6
    MaartenW heb je hier een voorbeeld van?

    H.G. Frans

  7. #7
    In BASS zitten flink wat voorbeelden.
    Ik kwam de mogelijkheid tegen in bass-fx voorbeeld 'tempo'. Ben van daar uit verder gaan werken.

Thread Information

Users Browsing this Thread

There are currently 1 users browsing this thread. (0 members and 1 guests)

Bookmarks

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •