Licence Unicode

35

Les conditions d'utilisation Unicode stipulent que tout logiciel utilisant leurs fichiers de données (ou une modification de ceux-ci) doit porter les références de licence Unicode. Il me semble que la plupart des bibliothèques Unicode ont des fonctions permettant de vérifier si un caractère est un chiffre, une lettre, un symbole, etc., et contiennent donc une modification des fichiers de données Unicode (généralement sous la forme de tableaux). Cela signifie-t-il que la licence est applicable et que toutes les applications utilisant de telles bibliothèques Unicode doivent la porter?

J'ai vérifié, et il semble que très peu de programmes Unicode possèdent la licence, bien que la plupart de ceux qui ne l'ont pas obtenue appartenaient à des sociétés membres du consortium Unicode (obtiennent-elles des exemptions de licence?).

Certains (par exemple, Mozilla) ne sont que des "membres de liaison" et, bien que leur logiciel ne comporte pas de licence (pour autant que je sache), ils s'appuient évidemment sur des données dérivées de ces fichiers de données. Mozilla est-il en infraction avec la licence?

Devrions-nous transporter la licence dans toutes les applications qui incluent toute forme de support Unicode avancé (c'est-à-dire, sont-elles obligées de compter sur les fichiers de données Unicode)? Ou existe-t-il une forme de large exemption (étant donné que très peu de programmes détiennent une licence)?


J'ai transmis cette question au personnel Unicode. Je posterai la réponse ici quand / si j'en ai une.

Eric Grange
la source
FWIW Firefox contient de nombreux textes de licence:about:license
Thilo le
1
@Thilo Oui et aucun d'entre eux ne fait référence à Unicode AFAICT. Le fait qu’ils reconnaissent qu’ils sont si nombreux, mais pas celui Unicode, est en partie à l’origine de cette question.
Eric Grange le
1
Firefox utilise la bibliothèque ICU. La licence Unicode n'est pas une licence virale.
Hans Passant le
1
La licence Unicode affecte les données, pas le code, si ICU inclut les données, alors Firefox aussi. A moins que tu sois une clause d'exclusion, mais je n'ai pu trouver aucune ...
Eric Grange

Réponses:

21

Remarque préliminaire: je ne suis plus avocat et je ne me suis jamais spécialisé dans les lois relatives au droit d'auteur et à la propriété intellectuelle. Si vous voulez une réponse incontestable, vous devriez consulter un avocat.

1. Les données et les fichiers de données ne sont pas identiques

Comme il est dit, la pièce 1 couvre les fichiers de données:

EN TÉLÉCHARGEANT, EN INSTALLANT, EN COPIANT OU AUTREMENT, EN UTILISANT LES FICHIERS DE DONNÉES DE UNICODE INC. [...]

Les fichiers de données et les données elles-mêmes ne sont pas identiques. Lorsque Microsoft implémente des méthodes majuscules et minuscules dans .NET Framework, la norme unicode est utilisée, mais cela ne signifie pas que .NET Framework contient, quelque part, les fichiers téléchargés à partir de http://www.unicode.org/

Illustration simple d'une différence entre les données et le support:

Imaginez que je crée une base de données avec une liste de pays, de villes et les codes postaux correspondants. J'expose ces données via un service Web et sur mon site Web.

Les données elles-mêmes sont dans le domaine public: vous ne pouvez pas légitimement protéger la liste des pays par le droit d'auteur et demander à chaque personne qui utilise cette liste de vous payer ou de distribuer une copie de vos droits d'auteur.

D'autre part, rien ne m'interdit d'imposer une licence restrictive à l'utilisation du service Web ou du site Web (d'autant que j'ai investi beaucoup d'efforts lors de la création de cet ensemble de données). Si je découvrais qu'une application grattait mon site Web pour télécharger les données, cela constituerait une violation du droit d'auteur et je pourrais poursuivre la personne qui a créé le scraper.

2. Les données sont trop vagues

Si http://www.unicode.org/ indiquait que la licence couvre les données elles-mêmes, il serait très difficile pour cette organisation de faire respecter ce droit d'auteur.

Imaginez la méthode suivante:

public char ToUpper(char c)
{
    string upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
    if (upper.Contains(c))
    {
        return c;
    }

    string lower = "abcdefghijklmnopqrstuvwxyz";
    if (lower.Contains(c))
    {
        return upper[lower.IndexOf(c)];
    }

    throw new OutOfRangeException();
}

Est-ce une violation du droit d'auteur? Ai-je réellement utilisé les données de http://www.unicode.org/ et devrais-je inclure la copie de la licence dans ma réponse ci-dessous? Ou peut-être que je viens de taper ces lettres moi-même?

En d'autres termes, si les données elles-mêmes étaient sous licence, jusqu'où la licence pourrait-elle aller?

3. Copyright et données

Voici quelques citations intéressantes:

http://www.lib.umich.edu/copyright/facts-and-data : Université du Michigan

Le droit d'auteur ne s'applique pas aux faits, données ou idées. [...]

Cependant, le droit d'auteur peut protéger une collection de données telle que contenue dans une base de données ou une compilation, mais uniquement si elle remplit certaines conditions. Il ne suffit pas de travailler très fort pour rassembler les données. [...]

Pour qu'une base de données puisse bénéficier de la protection du droit d'auteur, l'auteur doit faire des choix concernant la sélection, la coordination ou l'arrangement des faits ou des données, et ces choix doivent être au moins un peu créatifs. [...]

Il est important de se rappeler que même si une base de données ou une compilation est organisée avec suffisamment d'originalité pour bénéficier de la protection du droit d'auteur, les faits et les données de cette base de données sont toujours dans le domaine public.

http://www.ands.org.au/guides/copyright-and-data-awareness.html : Service de données national australien

Un tableau ou une compilation, composé de mots, de chiffres ou de symboles (ou une combinaison de ceux-ci) est protégé s'il est:

  1. une oeuvre littéraire et

  2. a le degré d'originalité requis.

[...] Le droit d'auteur ne s'applique pas aux faits / informations eux-mêmes, mais à la manière particulière dont les faits / informations sont présentés dans l'ensemble de données ou la base de données.

Ces deux exemples, l’un concernant les États-Unis, l’autre - l’Australie, montrent clairement que les données elles-mêmes, c’est-à-dire les symboles Unicode avec leurs numéros respectifs et les attributs tels que "est-ce un chiffre?" ou "est-ce une lettre majuscule de l'alphabet cyrillique?" n'est pas couvert par le droit d'auteur.

Les fichiers de données, en revanche, peuvent être protégés par le droit d'auteur, en fonction de leur originalité. Par exemple, les fichiers PDF que vous trouverez sur http://www.unicode.org/ seraient très probablement couverts par un droit d'auteur. Si, au contraire, il est purement question d'un fichier CSV associant des caractères minuscules à des majuscules ou vice versa, l'auteur de telles données ne pourrait guère faire respecter le droit d'auteur sur ces données.

Clairement, la ToUpperméthode que je viens d’expliquer n’est pas une violation du http://www.unicode.org/ copyright. Ni le code utilisé par .NET Framework ou Firefox, à moins que ces systèmes ne contiennent quelque part dans les fichiers de données qui sont clairement, sans aucun doute, copiés à partir de http://www.unicode.org/ avec, éventuellement, des modifications mineures.

Arseni Mourzenko
la source
1
1. La licence couvre une modification des fichiers de données, il est douteux que Microsoft ait recréé ceux-ci à partir de zéro, d’autant plus que ces fichiers sont ce qui fait la norme Unicode.
Eric Grange
2. Voir le détail de l’ANNEXE 1 en quoi consistent les fichiers de date, cela ne semble pas du tout vague.
Eric Grange
1
3. Les données peuvent faire l'objet d'une licence et le sont certainement (données cartographiques, ou données de recherche, dcc.ac.uk/resources/how-guides/license-research-data )
Eric Grange
@ Eric Grange: (1) douteux ou non, il n'y a aucune preuve formelle que Microsoft a utilisé ces fichiers de données en l'état. (3) Je suis tout à fait d’accord pour dire que les données peuvent être licenciées. C'est juste que dans ces deux cas particuliers que j'ai énumérés (à savoir les noms de pays et l'alphabet anglais), vous aurez du mal à convaincre le juge que ce sont vos données et qu'elles sont couvertes par votre copyright.
Arseni Mourzenko
Excellente réponse, et je l’inviterais davantage si je ne pouvais que me tourner vers "je ne suis pas avocat" (plus).
1

Ces fichiers constituent légalement une base de données, ce qui signifie que de nombreuses juridictions ne le traitent pas comme une œuvre susceptible de droit d'auteur, mais qu'il est soumis à d'autres types de protection. En particulier, ces pays prendront en compte les efforts (quantitatifs et / ou qualitatifs) nécessaires à la constitution de telles bases de données. Voir par exemple la directive européenne sur les bases de données .

Par exemple, il n’ya aucune décision créative à prendre en compte pour définir la relation entre les lettres majuscules et minuscules. Ce tableau n'est donc pas soumis au droit d'auteur dans l'UE et, comme le consortium Unicode n'est pas européen non plus, il n'est pas non plus couvert par les lois sur les droits de base de données. (Il n'y a pas d'équivalent du traité de Berne pour les droits de base de données)

MSalters
la source
La page wikipedia que vous avez liée indique le contraire: elles sont protégées par le droit d'auteur en tant que collections ...
Eric Grange
1
Non, une distinction explicite est faite. Selon le wiki, "La protection du droit d'auteur n'est pas disponible pour les bases de données qui se veulent complete". Et depuis unicode.org, "Unicode fournit un numéro unique pour le everycaractère". Les collections sont protégées par le droit d'auteur lorsqu'elles constituent une sélection de créations. ASCII serait, par exemple, une sélection de 127 caractères les plus utiles en anglais, du moins selon ses créateurs.
MSalters