Existe-t-il un moyen de télécharger les transcriptions YouTube générées automatiquement sans télécharger la vidéo?
Je voudrais consulter les discussions TED, mais j'ai une bande passante limitée et je voudrais exporter les transcriptions automatisées (également connues sous le nom de sous-titres ou de sous-titres codés).
Réponses:
Utilisez la fonction "Network inspector" du débogueur de script de votre navigateur et trouvez une deuxième demande pour la page timedtext après avoir activé les sous-titres transcrits, puis copiez simplement toute cette demande dans la barre d'adresse pour les télécharger au format natif YouTube xml.
Pour obtenir la version SRT, exécutez ce code dans la console de débogage pour la page de ce xml:
Voici également la version bookmarklet du script:
la source
Il existe plusieurs façons d'extraire les sous-titres d'une vidéo YouTube -
En spécifiant la langue et VideoId dans cette URL générique -
http://www.youtube.com/api/timedtext?lang={LANG}&v={VIDEOID}
vous pouvez obtenir un.xml
fichier contenant les sous-titres dans la langue souhaitée pour une vidéo choisie.Pour vous débarrasser des balises dans ce fichier et avoir simplement la transcription en texte brut , voici ce que vous devez faire:
Alternativement, il existe un outil open-source appelé Google2SRT qui télécharge tous les abonnés disponibles à partir d'une vidéo YouTube en un seul clic et les convertit en
.srt
format afin qu'il puisse être utilisé dans des lecteurs multimédias comme VLC Media Player.Mise à jour: Ted.com fournit maintenant des transcriptions des discussions sur son site.
la source
http://video.google.com/timedtext?lang=english&v=b11AXknrsEI
mais ça ne marche pas. De plus, l'accès aux outils de développement n'aide pas. Il y a des tonnes de ressources là-dedans et aucune d'entre elles ne dit timedtext.english
deen
eteng
mais il fait la même chose.Je pense que ce script utilisateur devrait fonctionner pour vous:
http://userscripts.org/scripts/show/50003/
la source
Google2SRT 0.6 prend en charge YouTube ASR: http://sourceforge.net/projects/google2srt/
la source
S'il s'agit de votre propre vidéo, vous pouvez télécharger les sous-titres à partir du gestionnaire de vidéos. Aller à:
Gestionnaire de vidéos >> Modifier (sur la vidéo que vous voulez) >> Légendes >> (Cliquez sur la piste que vous souhaitez télécharger) >> Actions (liste déroulante)
Au moment de la rédaction, trois types de fichiers sont disponibles:
Ceux-ci ont des utilisations différentes dans différentes applications, mais sont très similaires. SRT est probablement le plus courant.
Sinon, si ce n'est pas votre vidéo, la meilleure méthode (seule méthode) est d'obtenir le fichier xml à partir des outils Developer.
À l'aide de Google Chrome dans cet exemple, accédez à la vidéo, puis procédez comme suit:
timedtext?
plus un tas de variables. Le second est généralement celui que vous souhaitez. Cela commence comme ceci:<transcript> <text start="4.14" dur="3.049">my name is doctor john rush</text> <text start="7.189" dur="3.731">I'm the CEO and president</text>
Ce fichier xml est utile si vous souhaitez utiliser la transcription dans une page Web. À part cela, je ne pense pas que vous puissiez l'utiliser de la même manière que vous utiliseriez un fichier SRT. Si vous êtes un bon programmeur, vous pouvez facilement écrire un programme qui le convertira en SRT. J'ai écrit mon propre programme C # qui extrait les données dans un but différent et cela a pris moins de deux heures.
la source