CentOS
Existe-t-il un moyen simple de convertir des entités HTML spéciales à partir d'un flux de données? Je passe des données à un script bash et parfois ces données incluent des entités spéciales. Par exemple:
"test" & amp; test $ test! test @ # $% ^ & amp; *
Je ne sais pas pourquoi certains personnages s'affichent bien et d'autres non, mais malheureusement, je n'ai pas le contrôle sur les données entrant.
Je pense que je pourrais peut-être utiliser SED ici, mais cela semble être lourd et éventuellement sujet à de faux positifs. Existe-t-il une commande Linux vers laquelle je pourrais me diriger et qui se spécialise dans le décodage de ce type de données?
recode semble disponible sur les dépôts de paquets par défaut des principales distributions GNU / Linux. Par exemple, pour décoder des entités HTML en UTF-8:
la source
Avec Python 3:
la source
Prend le fichier texte de stdin:
Il a probablement besoin de bash> = version 4
la source