Que signifient STX, SOH et GS dans la sortie Notepad ++?

20

Après avoir examiné la source MIME pour un e-mail (contenant probablement des caractères internationaux), je vois des trucs comme ça dans Notepad ++

entrez la description de l'image ici

Je comprends que CRLFc'est un retour chariot, mais qu'en est-il des autres? Qu'est-ce SOH, GSet cela STXsignifie?

Mike B
la source

Réponses:

19

Notepad ++ utilise ces symboles pour représenter des caractères de contrôle ou des caractères non imprimables.

Personnage de contrôle - Wikipedia

Un caractère de contrôle ou un caractère non imprimable est un point de code (un nombre) dans un jeu de caractères, qui ne représente pas un symbole écrit.

Codes de contrôle C0 et C1 - Wikipedia

STX - Début du texte - Premier caractère du texte du message et peut être utilisé pour terminer l'en-tête du message.

SOH - Début d'en-tête - Premier caractère d'un en-tête de message.

GS - Séparateur de groupes - Peut être utilisé comme délimiteur pour marquer des champs de structures de données. S'il est utilisé pour les niveaux hiérarchiques, US est le niveau le plus bas (division des éléments de données en texte brut), tandis que RS, GS et FS sont de niveau croissant pour diviser les groupes composés d'éléments du niveau inférieur.

Steven
la source
Hmm ... Je ne comprends pas pourquoi les en-têtes d'un e-mail peuvent contenir un caractère non imprimable. Serait-il exact d'interpréter cette description antérieure comme signifiant "un caractère de contrôle ou un caractère non imprimable est un point de code (un nombre) dans un jeu de caractères, qui ne représente pas un symbole ASCII écrit".
Mike B
Je ne connais pas les spécifications des en-têtes de courrier ni pourquoi elles peuvent contenir des caractères non imprimables. Cependant, Notepad ++ utilise ses propres symboles (comme vous l'avez montré) pour afficher ces caractères de contrôle.
Steven
Les caractères non imprimables apparaissent tous dans l'en-tête X-Example, entre guillemets. Cet en-tête ne fait partie d'aucune norme de messagerie (voir stackoverflow.com/questions/14469110/… ). Il aura été défini soit par le client qui a créé l'e-mail, soit par l'un des transports en cours de route. Quoi qu'il en soit, en ce qui concerne le traitement de l'e-mail, il s'agit en fait d'un commentaire et pourrait être n'importe quoi. C'est comme si quelqu'un dessinait un petit cœur sur une enveloppe - cela ne fait pas partie de la norme postale et n'affecte pas du tout la livraison.
Randy Orrison
... eh bien, bien sûr, tant que ça ne casse pas les choses. Un en-tête X avec de très longues chaînes UNICODE pourrait déclencher un bogue de dépassement de tampon dans un programme de transport, et un coeur écrit sur l'adresse pourrait confondre le facteur. Mais dans des limites raisonnables, il est simplement ignoré.
Randy Orrison
6

SOH est Start Of Header

STX est Start of teXt

GS est Group Seperator

td512
la source