Quelle est la différence entre l'utilisation de RDFS / OWL et XML?

10

Je me demandais quels avantages les langages d'ontologie de RDFS / OWL ont par rapport à l'utilisation d'un système de balisage / balisage (tel que http://www.schema.org/ ) pour gérer et créer des métadonnées?

Webster Thesaurus
la source
3
Le moteur d'inférence, c'est quoi. De quoi, étonnamment, aucune des réponses ci-dessous ne parle. Des moteurs tels que Jena peuvent déduire de nouvelles données et utiliser des propriétés transitives.
Andrew T Finnell
2
@AndrewFinnell publier une explication plus détaillée comme réponse s'il vous plaît
Andrew, je suis d'accord et voterais votre réponse. Les réponses actuellement existantes ci-dessous ne sont pas informées et de faible qualité.
Dibbeke
@AndrewFinnell, je voudrais également que vous publiez votre propre réponse, je me demande également si l'inférence dépasse la portée du PO ou non. (À l'origine, je le pensais, mais ce n'est peut-être pas le cas)
ZJR

Réponses:

5

Votre question n'a pas beaucoup de sens telle quelle. RDFS est un langage de schéma très basique pour exprimer les contraintes RDF. OWL est un schéma plus avancé pour exprimer une ontologie compliquée. Ils n'ont absolument rien de commun avec XML, sauf qu'ils peuvent être exprimés en XML.

Stefano Borini
la source
4

Je ne pourrais pas être plus d'accord avec la réponse de ZJR. Il n'est absolument pas informé.

  1. Comment analysez-vous les microdonnées? Qu'est-ce que ça analyse aussi? RDFa analyse RDF, un modèle de données commun pour lequel le Web sémantique réclame. Les microdonnées sont apparues essentiellement parce que Hickie ne pouvait pas être dérangé pour lire les spécifications RDF et RDFa. Cela pourrait être plus facile pour un développeur, mais ce n'est pas mieux pour le Web (c'est-à-dire paresseux )
  2. Pour une liste des vocabulaires OWL courants, voir ci-dessous:

  3. La prochaine version de RDF est imminente, y compris de nouveaux formats de sérialisation tels que Turtle et RDFj

  4. SPARQL 1.1 est également une cotisation imminente. Fédération de requêtes, expression de chemin de propriété, mise à jour SPARQL et bien plus encore.

  5. La BBC est construite sur RDF. L'API de graphique Facebook fournit RDF (c'est vrai, vous pouvez déférer un URI de graphique en utilisant l'en-tête Text / turtle Accepts et récupérer RDF) et de nombreuses autres grandes sociétés.

Donc, en résumé, le Web sémantique, RDF, RDFS, OWL, SPARQL et tous les standards du Web sémantique sont très vivants et dynamiques. Si vous ne me croyez pas, jetez un œil à toutes les activités sur http://www.semanticoverflow.com

William Greenly
la source
la BBC est construite sur RDF, bien qu'elle mappe sur des microdonnées, alors? Ils ont reconstruit le site dans la décennie 2000-2010 à une époque où le W3C promettait de merveilleux outils magiques à venir pour RDF, ces outils ne se sont pas vraiment matérialisés, RDF est un héritage là-dedans. Structure organisationnelle solide, mais horrible à partager, les microdonnées couvrent le dernier kilomètre. (et sauvez le jour)
ZJR
et puis certains: un SPARQL utile est imminent depuis toujours, le libellé de la spécification RDF utilisé pour aspirer beaucoup de temps et effrayé la plupart des implémenteurs potentiels pendant des années. (ne sait pas s'ils ont corrigé cela, ont-ils corrigé cela? à mon humble avis, trop tard, de toute façon ) et puis, la RDF<some-letter>nomenclature génère des confusions et des querelles tout le temps.
ZJR
1
La BBC est construite sur RDF en utilisant BigOWLIM, pas sur des microdonnées. Les mircodonnées ne sont pas un format de données canonique. C'est un ajout au HTML. La nouvelle plateforme olympique est entièrement construite sur RDF, comme mentionné dans les communiqués de presse et les présentations à leur Académie.
William Greenly le
4

RDF / OWL vs XML est une fausse alternative. En fait, l'une des sérialisations populaires utilise XML.

RDF / OWL vs microformats est également une fausse alternative. En fait, il existe des normes qui permettent d'utiliser RDF en tant que microformat, eRDF et RDFa officiel du W3C avec une manière standardisée de l' incorporer dans HTML5 .

La véritable question est donc de savoir quel est l'avantage d'utiliser des formats standard approuvés par le W3C. Les raisons sont les suivantes:

  • il existe déjà plusieurs ontologies, y compris les plus largement utilisées comme Dublin Core et FOAF .
  • plusieurs magasins triples compatibles avec RDF / OWL pour la plupart des langages de programmation.
  • plusieurs des magasins triples mentionnés ci-dessus comportent des moteurs d'inférence avec une interface SPARQL .

Dans l'ensemble, je ne vois aucune raison pour laquelle vous devriez opter pour un microformat non standard et non W3C.

vartec
la source
1

RDF et OWL sont des normes établies pour l'encodage des données sémantiques et de leur schéma, à un niveau beaucoup plus profond et générique qu'un balisage ad hoc.

Par exemple, avec OWL, vous pouvez définir un nouveau schéma, qui sera au moins partiellement compris par d'autres outils (car vous pouvez mélanger différents schémas OWL / RDF ensemble). De cette façon, vous pouvez exporter à partir d'un ensemble de données différentes "vues" de celui-ci et faire coopérer tout le monde. De plus, vous pouvez simplement "explorer" les liens entre les objets et leurs propriétés.

Avec les microdonnées, il s'agit essentiellement d'un ensemble de choses ad hoc et acceptées que vous pouvez appliquer, et non d'une plate-forme sémantique générale.

PL
la source
Je suis toujours confus sur la façon dont RDF diffère de RDFS diffère de OWL .... Ces termes peuvent-ils être utilisés de manière interchangeable ...?
Webster Thesaurus
@WebsterThesaurus RDF est un langage assez simple pour décrire des concepts basés sur des triplets de sujet-verbe-objet. RDFS est un schéma RDF, essentiellement un ensemble de termes prédéfinis pour faciliter la définition de la signification des relations. OWL est un système de description d'ontologie, beaucoup plus puissant que RDFS, mais plus difficile à implémenter
p_l
1

Je voudrais commencer par noter que cette réponse n'est pas écrite par un expert dans le domaine. Bien que je sois un partisan des systèmes distribués sémantiques, je pense que les applications de OWL sont actuellement limitées. Bien que décrire précisément le créneau dans lequel OWL peut être appliqué serait au-delà de la portée de cette réponse, je pourrais peut-être mettre en lumière certains avantages et inconvénients.

OWL est fondamentalement un langage qui permet l'expression de constructions sémantiques en utilisant la classification, un peu comme les classes que vous connaissez de la POO et les contraintes entre les classes et leurs instances. On pourrait y voir une manière plus formelle et d'ordre supérieur de décrire les relations que vous connaissez à partir d'une base de données relationnelle.

Pour décrire et communiquer ce langage, il doit être sérialisé dans un certain format. Il existe plusieurs formats, dont RDF n'est qu'un.

Il existe trois niveaux différents d'OWL, permettant d'augmenter l'expressivité, mais limitant la calculabilité (par exemple, si vous pouvez trouver une solution possible aux questions que vous posez à la base de connaissances décrite par une définition OWL). Ce sont OWL Lite, DL et Full.

L'avantage le plus important de l'utilisation de OWL / RDF est l'échange de connaissances entre différentes bases de connaissances (ou hiérarchies de classification) et la création d'inférences utiles sans avoir à concevoir toutes ces bases au préalable pour leur permettre de communiquer. Cela se fait en partie en définissant des classes d'équivalence. L'utilisation d'espaces de noms permet à l'ingénieur de vérifier l'unicité; un paradigme utile.

Un autre avantage est la quantité toujours croissante de moteurs d'inférence et de langages de requête. Dans notre monde en réseau, il existe une demande d'échange de connaissances distribué.

Un inconvénient important est peut-être la relative grande complexité de la détermination de la calculabilité des inférences et de leurs contraintes d'espace et de temps. Par exemple. dans OWL full, vous pourrez peut-être demander des inférences dont il n'est pas prouvé qu'elles se terminent. Ainsi, il y a certainement une limite à la puissance d'OWL.

La connaissance OWL est discrète ... il n'y a pas de demi-vérités ou de systèmes de croyance. Les avoir rendrait probablement les solutions beaucoup trop complexes.

Mais l'inconvénient le plus important à mon goût est qu'on ne peut tout simplement pas trouver beaucoup de bons ingénieurs dans le domaine. Vous aurez besoin d'un ingénieur du savoir, d'un ou deux informaticiens et d'une petite équipe de développement pour constituer même une petite base de connaissances. Par conséquent, il est souvent beaucoup moins cher et efficace d'utiliser simplement des langages descriptifs tels que le schéma XML et de décrire la sémantique nécessaire dans un document lisible par l'homme.

Dibbeke
la source
0

RDFS consiste à décrire des données structurées. Il serait beaucoup plus utile s'il incluait des méthodes ou des fonctions, afin que nous puissions décrire les interfaces avec lui. Actuellement, vous avez besoin d'un vocabulaire supplémentaire pour le faire, par exemple WSDL ou Hydra par webservices. Je suppose qu'il y a aussi un vocabulaire pour la POO, je ne connais pas beaucoup de vocabulaires.

OWL est quelque chose comme XSD, il s'agit de valider vos données, par exemple si vous attendez une chaîne avec au plus 20 caractères, vous utilisez OWL pour décrire cette règle et générer un validateur. En théorie, vous pourriez faire de même avec RDFS et XSD, je n'ai aucune idée pourquoi les gens ont dû inventer OWL au lieu d'utiliser simplement XSD. C'est peut-être parce que XSD n'est pas basé sur RDFS, donc par exemple, la chaîne XSD n'est pas un descendant de RDFS Literal.

Schema.org décrit des classes communes comme Person par exemple. Ils créent leur propre vocabulaire comme RDFS, qui inclut Thing au lieu de rdfs: Class, domainIncludes au lieu de rdfs: domain, rangeIncludes au lieu de rdfs: range, et ainsi de suite au lieu d'utiliser RDFS. Leurs types restreints sont également ad-hoc, ils utilisent Text et Number sans les définir ni les connecter au moins aux primitives rdfs: Literal ou XSD. Ils n'utilisent pas XSD ou OWL pour définir des types restreints pour autant que je sache. Je ne sais pas s'il y a des restrictions dans leur vocabulaire, mais si c'est le cas, je suppose qu'ils le mentionnent dans les descriptions lisibles par l'homme, vous ne pourrez donc pas générer un validateur approprié contre schema.org, ce que vous pourriez faire s'ils utiliserait XSD / OWL et RDFS.

Je pense donc que l'avantage d'utiliser des normes comme RDFS, XSD, OWL que vous pouvez écrire des bibliothèques que vous pouvez réutiliser par chaque document.

inf3rno
la source
-2

Dans le but de développer de futurs produits, les fichiers XML RDFS / OWL doivent être considérés comme à peu près morts et disparus.

Ils nécessitent trop de travail pour exprimer des concepts qu'une solution personnalisée basée sur des formats de texte personnalisés exprimerait mieux , tout en maintenant les données plus lisibles et modifiables pour les humains et les machines. Ils n'ajoutent aucune valeur réelle et ne font que rendre la vie un peu plus misérable pour tous ceux qui tombent sur eux. (et doit gérer leur nomenclature d'espace de noms)

Il existe cependant de gigantesques solutions de gestion de documents basées sur celles-ci, et elles ont été récemment développées, déployées et sont en service. Ils menacent de s'attarder très longtemps. À l'avenir, de nombreux programmeurs souffriront sans aucun doute de nombreux WTF induits par RDF et OWL.

Les systèmes de microdonnées (la version conviviale du validateur des microformats ) comme ceux décrits dans schema.org , présentent à la place de nombreux avantages pour les développeurs, les éditeurs et les lecteurs; à la fois humaine et mécanique.

Les concepts RDF (ceux qui valent la peine d'être sauvegardés) peuvent être mappés (et sont en fait explicitement mappés) sur des représentations de microdonnées sans douleur.

Les éléments de microdonnées permettent aux auteurs et aux systèmes de gestion de documents d' enrichir la communication d'une manière assez facile (aussi simple que CSS ou DOM) à gérer et à personnaliser pour le lecteur.

ZJR
la source
Attendez, je ne comprends pas ... alors en quoi les microdonnées sont-elles différentes de XML / HTML? Le plan décrit dans schema.org dit spécifiquement qu'ils utilisent des balises à l'intérieur de leurs pages Web ... n'est-ce pas ce que font XML et HTML?
Webster Thesaurus
Et si les microdonnées sont tellement meilleures, pourquoi le W3C fait-il pression pour RDFS / OWL et non pour les microdonnées lui-même?
Webster Thesaurus
Je pense que cette réponse est plutôt trompeuse, comme RDF! = XML. L'encodage XML de RDF n'est que l'un des nombreux et a été conçu dans le but d'être mélangé aux applications XML existantes. De plus, revenir à des systèmes personnalisés (oui, y compris les microdonnées) signifie revenir à "écrire un analyseur personnalisé pour tout f * cking" au lieu de pouvoir utiliser un vocabulaire générique. Avec RDF / OWL, je peux mélanger différentes applications travaillant chacune sur un sous-ensemble de données impliquées, ainsi qu'écrire du code flexible qui a une réflexion automatique - un bon exemple est Xanasys LinkExplorer.
p_l
1
Réponse d'opinion non informative. Veuillez indiquer les références pour sauvegarder ces revendications.
Dibbeke
@Dibbeke Ma première supposition était que le PO recherchait des métadonnées pragmatiques. RDF dans ce cas est exagéré. La partie d'opinion est relative à ma croyance en RDF étant toujours une exagération .
ZJR