Page 1 sur 2

Soft de transcription audio -> texte

Publié : 12 mai 2015, 22:41
par Dorian
Salut la foule,

Est-ce que vous connaissez un soft gratos ou pas cher capable d'ingurgiter un fichier audio et d'en ressortir un fichier texte avec la transcription de tout ce qui y est dit (en français) ?
J'ai bien vu Dragon Dictate 4 qui ferait ça, mais c'est pas donné (200€).
Des idées ?

PS : c'est pour retranscrire en texte des interviews en environnement parfois bien bruyant.

Re: Soft de transcription audio -> texte

Publié : 13 mai 2015, 10:08
par Brotools
J'ai un pote qui bosse régulièrement sur des transcriptions (pour docus notamment) et il a essayé différents trucs, rien ne marche vraiment. Ce qu'il avait trouvé de plus approchant comme technique "effective" était d'écouter l'audio au casque, de répéter clairement ce qui était dit et de capturer sa voix via un soft type Dragon.
Mais, même là, ça laissait de nombreuses fautes, faux sens, etc... et il passait presque plus de temps à corriger les coquilles que s'il avait transcris "à l'ancienne" (en écoutant et tapant en même temps)...

Re: Soft de transcription audio -> texte

Publié : 13 mai 2015, 11:17
par Chewby
adobe premiere est censé le faire depuis quelques temps, ça vaut le coup de tenter avec la démo non?

Re: Soft de transcription audio -> texte

Publié : 13 mai 2015, 18:21
par Dorian
Alors pour Premiere (CC 2014), j'ai lu ça sur le site d'Adobe :
Suppression de l’analyse de la parole | Adobe Premiere Pro CC 8.2

À compter de la version d’Adobe Premiere Pro CC (8.2) de décembre 2014, la fonction de transcription ou d’analyse de la parole sera supprimée.

La fonction d’analyse de la parole de Premiere Pro analyse la parole et convertit les paroles en métadonnées de texte pouvant faire l’objet d’une recherche.

Au moment de la mise en œuvre de l’analyse de la parole, il était prévu que le moteur sous-jacent de cette fonction soit amélioré plus rapidement qu’il ne l’a été. Au fil du temps, les commentaires des utilisateurs et les recherches ont confirmé que cette fonction ne pourrait pas atteindre le degré de précision utile aux utilisateurs.

C’est pourquoi l’analyse de la parole est supprimée dans Adobe Premiere Pro CC. Vous ne pouvez donc plus analyser aucun nouveau média et générer des métadonnées de transcription dans Adobe Premiere Pro CC.

Vous pouvez continuer, en revanche, à afficher les métadonnées de transcription des éléments analysés précédemment avec Adobe Premiere Pro CC 8.1 ou version antérieure. Les métadonnées d’analyse de la parole générées sont intégrées aux fichiers multimédia. Le texte est donc toujours visible et utilisable lorsque les éléments analysés sont importés et utilisés dans la dernière version d’Adobe Premiere Pro CC.
Du coup c'est mort... En plus, je me vois mal me plonger dans ce type de soft, qui est quand même un gros morceau.

@Brotools : pour Dragon Dictate, il n'y a pas de démo, du coup avec ce que tu me dis, je ne me vois pas investir...

Bon, ben je sens que je vais me taper les transcriptions "à l'ancienne" :-( .

Re: Soft de transcription audio -> texte

Publié : 13 mai 2015, 20:05
par mrleon
Et y'a rien pour iOS ? Parce que la reconnaissance de base de siri marche vraiment pas mal si on est dans de bonnes conditions de silence.

Re: Soft de transcription audio -> texte

Publié : 13 mai 2015, 20:57
par Dorian
Effectivement, que ce soit sur iOS ou Android, il y a de très bons moteurs de reconnaissance vocale, mais de là à en extraire un fichier texte exploitable, quitte à lire le fichier audio via un ordi / sono quelconque ?

Faudrait que je regarde sous Windows si y'a pas des solutions plus accessibles ($$$) que Dragon Dictate 4 sur Mac... Je suis très étonné qu'en 2015 y'ait pas des solutions abouties et performantes, notamment pour les malentendants...

Re: Soft de transcription audio -> texte

Publié : 14 mai 2015, 00:23
par manu_n
Et bien c'est pas pour rien que aujourd'hui encore, la production des sous-titres sourds et malentendants reste assez laborieuse. (et donc coûteuse). Je ne connais pas de moteur speech-to-text open-source performant. Les moteurs commerciaux nécessitent une phase d'apprentissage pour chaque voix. C'est pour ça qu'on utilise des 'perroquets' (un-e locuteu-r-se dont la voix a été 'apprise' au moteur et qui répète le texte d'un locuteur quelconque afin que le moteur fonctionne). et derrière, y'a des humains qui vérifient/retouchent.
Une fois je suis allé au NAB évaluer une solution qui prétendait gérer (en quasi temps réel, quelques secondes) le Français. J'ai apporté quelques extraits de JT en français. Le résultat était inexploitable.

Re: Soft de transcription audio -> texte

Publié : 16 mai 2015, 13:08
par elonn
Et la fonction native "dictée et parole" dans le mac alors basé sur l'algotyhme de Dragon Dictate...
Parfois ca marche bien, parfois c'est nul. mais c'et amusant d'essayer et dans la question Dorian il y a quand meme :

"Est-ce que vous connaissez un soft gratos ...... "

Et bien oui on connait un soft Gratos..... mais peut on avoir un service efficace associé avec cet adjectif...

Moi je veux bien payer cher si ça marche......

Ce que j'ai fait de mieux pour un bande sonore un peu bruyante avec un ton de comédie ou un langage parlé naturel est de répéter moi meme au mac avec une intonation la plus neutre possible en direct live ce que l'itv dit.
Et la parfois ca donne des bonnes surprises.
Mais il y a toujours un pourcentage à reprendre à la main....

Re: Soft de transcription audio -> texte

Publié : 17 mai 2015, 12:52
par Dorian
elonn a écrit :Et la fonction native "dictée et parole" dans le mac alors basé sur l'algotyhme de Dragon Dictate...
Parfois ca marche bien, parfois c'est nul.
Oui, mais comme dit dans mon premier message, je recherchait plutot un truc "file based", ie. capable de transcrire un fichier audio préexistant...
mais c'et amusant d'essayer et dans la question Dorian il y a quand meme :

"Est-ce que vous connaissez un soft gratos ...... "

Et bien oui on connait un soft Gratos..... mais peut on avoir un service efficace associé avec cet adjectif...
J'aurais du dire opensource (comme l'a compris Manu), c'était dans un soucis de compréhension générale pour les non-linuxiens ;-) .
Moi je veux bien payer cher si ça marche......
Tu me connais, tu sais que c'est ma philosophie aussi. Mais dans ce cas précis, c'est pour un docu que je co-réalise, sans aucun budget, en one shot (à priori), du coup de l'opensource aurait été idéal... Mais comme semble le dire Manu, ça n'existe pas :-( .
Ce que j'ai fait de mieux pour un bande sonore un peu bruyante avec un ton de comédie ou un langage parlé naturel est de répéter moi meme au mac avec une intonation la plus neutre possible en direct live ce que l'itv dit.
Et la parfois ca donne des bonnes surprises.
Mais il y a toujours un pourcentage à reprendre à la main....
Oui, j'ai l'impression que c'est la "norme" dans le domaine. Je vais faire des essais la semaine prochaine, dés que j'ai récupérer mon micro chant.

Merci à tous pour vos pistes !

Re: Soft de transcription audio -> texte

Publié : 17 mai 2015, 18:22
par elonn
Dorian tu peux utiliser la sortie de ton twisted WAves via sound flower ou source nexus ( ce que j'utilise pour ma part ) qui rentre dans le mac via source nexus et le module dictée et parole recoit la lecture de ton fichier audio. c'est temps réél certes ( donc ca peut etre long ) et ca ne marche pas terrible. mais pour le fun ca ecrit quand meme des trucs...

Et j'imagine que tu y avais pensé.. non..