J’enregistre de nombreux films avec ma Freebox, et dans la mesure du possible, j’aime les regarder en VO. Les vidéos enregistrées par la Freebox sont des fichiers m2ts qui comportent plusieurs flux audios (typiquement VO et VF, voire « audio-description »), mais aussi d’autres flux comme le Télétexte. On y retrouve en général les sous-titres pour mal-entendants, et, lorsque vous disposez d’un flux VO, des sous-titres VF. Il est assez rare d’avoir les sous-titres VO, mais ça arrive.

Je trouve que le Télétexte a plusieurs défauts : il n’est pas toujours supporté par les lecteurs vidéo, il affiche des des textes ultra moches qui rappellent le Minitel, et il n’est pas toujours une très grande fiabilité. En effet les sous-titres ne sont pas toujours synchronisés avec le film, et certaines phrases ne s’affichent pas du tout. Bref, c’est pas très immersif pendant un film.

Heureusement ccextractor peut facilement vous permettre d’extraire les sous-titres d’un flux pour en faire un fichier srt, supporté par la quasi totalité des lecteurs.

Une fois installé, le fonctionnement de l’outil est simple. La seule difficulté consiste à identifier la bonne page de Télétexte. J’utilise 889 par défaut, un choix qui fonctionne bien. Vous pouvez sinon tester les autres pages existantes, et qui s’affichent dans la console lorsque vous lancez une extraction

$ ccextractor la\ vie\ de\ brian.m2ts -tpage 889
[…]
Notice: Teletext page with possible subtitles detected: 152
Notice: Teletext page with possible subtitles detected: 889
Notice: Teletext page with possible subtitles detected: 888
Notice: Teletext page with possible subtitles detected: 15

En prime, ccextractor fonctionne sous Linux, Windows et Mac. Il existe même un paquet tout prêt pour Debian. Alors il n’y a pas de raison de s’en priver !

Bon film !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.