Qual è la differenza tra l'utilizzo di RDFS / OWL rispetto a XML?


10

Mi chiedevo quali vantaggi i linguaggi ontologici di RDFS / OWL hanno rispetto all'uso di un sistema di tagging / markup (come http://www.schema.org/ ) per la gestione e la creazione di metadati?


3
Il motore dell'inferenza, ecco cosa. Che sorprendentemente nessuna delle risposte di seguito parla. Motori come Jena possono inferire nuovi dati e utilizzare proprietà transitive.
Andrew T Finnell,

2
@AndrewFinnell pubblica una spiegazione più dettagliata come risposta per favore

Andrew, sono d'accordo e voterei la tua risposta. Le risposte attualmente esistenti di seguito sono disinformate e di bassa qualità.
Dibbeke,

@AndrewFinnell, anche io vorrei che tu scrivessi la tua risposta, inoltre mi chiedo se l'inferenza va oltre lo scopo del PO o no. (Inizialmente lo pensavo, ma forse non lo è)
ZJR

Risposte:


5

La tua domanda ha poco senso così com'è. RDFS è un linguaggio di schema molto semplice per esprimere i vincoli RDF. OWL è uno schema più avanzato per esprimere un'ontologia complicata. Non hanno assolutamente nulla in comune con XML, tranne che possono essere espressi in XML.


4

Non potrei andare più d'accordo con la risposta di ZJR. È completamente disinformato.

  1. Come analizzi i microdati? Cosa analizza anche lui? RDFa analizza RDF, un modello di dati comune che è ciò per cui il Web semantico ha richiesto. Fondamentalmente i microdati sono nati perché Hickie non poteva essere disturbato a leggere le specifiche RDF e RDFa. Potrebbe essere più facile per uno sviluppatore, ma non è migliore per il web (ad esempio pigro )
  2. Per un elenco dei vocabolari OWL comuni, vedere di seguito:

  3. La prossima versione di RDF è imminente, compresi i nuovi formati di serializzazione come Turtle e RDFj

  4. Anche SPARQL 1.1 è imminente. Federazione delle query, espressione del percorso delle proprietà, aggiornamento SPARQL e molto altro ancora.

  5. La BBC è costruita su RDF. L'API del grafico di Facebook fornisce RDF (esatto, puoi deferire un URI grafico usando l'intestazione text / turtle Accepts e ottenere RDF) e molte altre grandi aziende.

Quindi, in sintesi, Semantic Web, RDF, RDFS, OWL, SPARQL e tutti gli standard di Semantic Web sono molto attivi e attivi. Se non mi credi, dai un'occhiata a tutte le attività su http://www.semanticoverflow.com


la BBC è costruita su RDF, sebbene si associ a microdati, quindi? Hanno ricostruito il sito nel decennio 2000-2010 in un momento in cui il W3C stava promettendo meravigliosi strumenti magici per RDF, quegli strumenti non si sono concretizzati, RDF è eredità, lì dentro. Solida struttura organizzativa, ma orribile da condividere, i microdati coprono l'ultimo miglio. (e salva il giorno)
ZJR

e poi alcuni: un utile SPARQL è imminente da sempre, la formulazione delle specifiche RDF ha usato per succhiare alla grande e ha spaventato la maggior parte dei potenziali implementatori per anni. (non so se l'hanno risolto, l'hanno risolto? imho, troppo tardi, comunque ) e poi, la RDF<some-letter>nomenclatura genera confusioni e litigi tutto il tempo.
ZJR,

1
La BBC è costruita su RDF usando BigOWLIM, non microdati. Mircodata non è un formato di dati canonico. È un'aggiunta all'HTML. La nuova piattaforma olimpica è interamente costruita su RDF, come menzionato nei comunicati stampa e nelle presentazioni presso la loro Accademia.
William Greenly,

4

RDF / OWL vs XML è un'alternativa falsa. In effetti una delle serializzazioni popolari sta usando XML.

Anche RDF / OWL vs microformati è una falsa alternativa. In effetti ci sono standard che consentono di utilizzare RDF come microformato, eRDF e RDFa ufficiale del W3C con un modo standardizzato di incorporarlo in HTML5 .

Quindi davvero la domanda è quale sia il vantaggio di utilizzare formati standard approvati W3C. I motivi sono:

  • ci sono già molte ontologie là fuori tra cui quelle più utilizzate come Dublin Core e FOAF .
  • più negozi tripli compatibili con RDF / OWL per quasi tutti i linguaggi di programmazione.
  • vari dei tripli negozi sopra menzionati dispongono di motori di inferenza con interfaccia SPARQL .

Nel complesso, non vedo alcun motivo per cui dovresti scegliere un microformato non standard, non W3C.


1

RDF e OWL sono standard stabiliti per la codifica dei dati semantici e del loro schema, a un livello molto più profondo e generico di un markup ad hoc.

Ad esempio, con OWL, è possibile definire un nuovo schema, che sarà compreso almeno in parte da altri strumenti (poiché è possibile mescolare insieme diversi schemi OWL / RDF). In questo modo, è possibile esportare da un set di dati diverse "viste" di esso e far cooperare tutti. Inoltre, puoi semplicemente "esplorare" i collegamenti tra gli oggetti e le loro proprietà.

Con i microdati, è fondamentalmente un insieme ad-hoc e accettato di cose che puoi applicare, non una piattaforma semantica generale.


Sono ancora confuso su come RDF differisce da RDFS differisce da OWL .... Questi termini possono essere usati in modo intercambiabile ...?
Webster Thesaurus,

@WebsterThesaurus RDF è un linguaggio piuttosto semplice per descrivere concetti basati su triple di Oggetto-Verbo-Oggetto. RDFS è lo schema RDF, fondamentalmente un insieme predefinito di termini per facilitare la definizione del significato delle relazioni. OWL è un sistema di descrizione ontologica, molto più potente di RDFS, ma più difficile da implementare
p_l

1

Vorrei iniziare osservando che questa risposta non è stata scritta da un esperto del settore. Sebbene io sia un sostenitore dei sistemi semantici distribuiti, penso che le applicazioni di OWL siano attualmente limitate. Anche se descrivere con precisione la nicchia in cui si può applicare la GUFO andrebbe oltre lo scopo di questa risposta, potrei essere in grado di mettere in luce alcuni pro e contro.

OWL è fondamentalmente un linguaggio che consente l'espressione di costrutti semantici utilizzando la classificazione, non diversamente dalle classi conosciute da OOP e dai vincoli tra le classi e le loro istanze. Si potrebbe vedere come un modo più formale e di ordine superiore per descrivere le relazioni che conosci da un database relazionale.

Per descrivere e comunicare questo linguaggio, deve essere serializzato in un determinato formato. Esistono diversi formati, di cui RDF è solo uno.

Esistono tre diversi livelli di OWL, che consentono di aumentare l'espressività, ma limitano la calcolabilità (ad es. Se è possibile trovare una possibile soluzione alle domande poste nella knowledge base descritta da una definizione di OWL). Questi sono OWL Lite, DL e Full.

Il vantaggio più importante dell'utilizzo di OWL / RDF è lo scambio di conoscenze tra diverse basi di conoscenza (o gerarchie di classificazione) e la creazione di inferenze utili senza dover progettare preventivamente tutte queste basi per consentire loro di comunicare. Ciò viene in parte definito definendo le classi di equivalenza. L'uso di spazi dei nomi consente all'ingegnere di accertare l'unicità; un paradigma utile.

Un altro vantaggio è la quantità sempre crescente di motori di inferenza e linguaggi di query. Nel nostro mondo in rete, c'è una richiesta di scambio di conoscenza distribuito.

Forse uno svantaggio importante è la relativa elevata complessità nell'accertare la calcolabilità delle inferenze e i loro vincoli di spazio e tempo. Per esempio. in OWL completo potresti essere in grado di chiedere inferenze che non è possibile dimostrare di terminare. Pertanto, esiste sicuramente un limite alla potenza di OWL.

La conoscenza di OWL è discreta ... non ci sono mezze verità o sistemi di credenze. Avere questi renderebbe molto probabilmente le soluzioni troppo complesse.

Ma lo svantaggio più importante per i miei gusti è che non si possono trovare molti bravi ingegneri sul campo. Avrai bisogno di un ingegnere della conoscenza, uno o due scienziati informatici e un piccolo team di sviluppo per costruire anche una piccola base di conoscenze. Pertanto, è spesso molto più economico ed efficace utilizzare solo linguaggi descrittivi come lo schema XML e descrivere la semantica necessaria in un documento leggibile dall'uomo.


0

RDFS riguarda la descrizione di dati strutturati. Sarebbe molto più utile se includesse metodi o funzioni, in modo da poter descrivere le interfacce con esso. Attualmente è necessario un vocabolario aggiuntivo per farlo, ad esempio WSDL o Hydra da webservices. Immagino che ci sia anche un vocabolario per OOP, semplicemente non conosco molti vocaboli.

OWL è qualcosa come XSD, si tratta di convalidare i tuoi dati, ad esempio se ti aspetti una stringa con al massimo 20 caratteri, usi OWL per descrivere quella regola e generare un validatore. In teoria potresti fare lo stesso con RDFS e XSD, non ho idea del perché la gente abbia dovuto inventare OWL invece di usare solo XSD. Forse è perché XSD non è basato su RDFS, quindi ad esempio la stringa XSD non è un discendente di RDFS Literal.

Schema.org descrive classi comuni come Person per esempio. Creano il proprio RDFS come vocab, che include Thing anziché rdfs: Class, domainIncludes anziché rdfs: domain, rangeIncludes anziché rdfs: range e così via invece di utilizzare RDFS. Anche i loro tipi con restrizioni sono ad-hoc, usano Text e Number senza definirli o collegarli almeno a rdf: primitive letterali o XSD. Non usano XSD o OWL per definire tipi limitati, per quanto posso dire. Non sono sicuro che ci siano restrizioni nel loro vocabolario, ma in tal caso credo che lo menzionino nelle descrizioni leggibili dall'uomo, quindi non sarai in grado di generare un validatore adeguato contro schema.org, cosa che potresti fare se userebbe XSD / OWL e RDFS.

Quindi penso che il vantaggio di usare standard come RDFS, XSD, OWL sia che puoi scrivere librerie che puoi riutilizzare per ogni documento.


-2

Ai fini dello sviluppo di prodotti futuri, i file XML RDFS / OWL devono essere considerati praticamente obsoleti.

Richiedono troppo lavoro per esprimere i concetti che una soluzione personalizzata basata su formati di testo personalizzati esprimerebbe meglio , mantenendo allo stesso tempo i dati più leggibili e modificabili per le persone e le macchine. Non aggiungono alcun valore reale e rendono la vita solo un po 'più infelice per tutti coloro che si imbattono in loro. (e deve fare i conti con la loro nomenclatura dello spazio dei nomi)

Esistono però soluzioni gigantesche per la gestione dei documenti basate su di esse, recentemente sviluppate, distribuite e attualmente in servizio. Minacciano di indugiare per molto tempo. Molti programmatori in futuro soffriranno senza dubbio di molti WTF indotti da RDF e OWL.

I sistemi di microdati , (la versione di microformati di facile utilizzo per i validatori ) come quelli descritti in schema.org , presentano invece molti vantaggi per sviluppatori, editori e lettori; sia umano che meccanico.

I concetti RDF (quelli che vale la pena salvare) possono essere mappati (e in realtà vengono esplicitamente mappati) su rappresentazioni di microdati indolori.

Gli articoli di microdati consentono agli autori e ai sistemi di gestione dei documenti di arricchire la comunicazione in un modo abbastanza semplice (facile come CSS o DOM) da gestire e personalizzare per il lettore.


Aspetta, non capisco ... quindi in che modo i Microdata sono diversi da XML / HTML? Il piano descritto in schema.org afferma in particolare che usano i tag all'interno delle loro pagine web ... non è quello che fanno anche XML e HTML?
Webster Thesaurus,

E se i Microdata sono molto migliori, perché il W3C sta spingendo per RDFS / OWL e non per i Microdata stessi?
Webster Thesaurus,

Penso che questa risposta sia piuttosto fuorviante, come RDF! = XML. La codifica XML di RDF è solo una delle tante ed è stata progettata con lo scopo di essere miscelata in applicazioni XML esistenti. Inoltre, tornare ai sistemi personalizzati (sì, inclusi i microdati) significa tornare a "scrivere un parser personalizzato per f * cking tutto" invece di essere in grado di usare un vocabolario generico. Con RDF / OWL posso mescolare diverse applicazioni ognuna delle quali lavora su un sottoinsieme di dati coinvolti, oltre a scrivere codice flessibile con riflessione automatica - un buon esempio è Xanasys LinkExplorer.
p_l

1
Risposta supponente non informativa. Si prega di mostrare i riferimenti per il backup di queste affermazioni.
Dibbeke,

@Dibbeke La mia ipotesi originale era che l'OP stava cercando metadate pragmatiche. RDF in quel caso è eccessivo. La parte considerata è relativa alla mia convinzione che RDF sia sempre eccessivo .
ZJR,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.