Le prove attuali supportano l'adozione di modelli contestuali rispetto a modelli canonici?

L'idea "canonica" è pervasiva nel software; modelli come Modello canonico , Schema canonico , Modello dati canonico e così via, sembrano emergere ancora e ancora in fase di sviluppo.

Come molti sviluppatori, ho spesso seguito, acriticamente, la saggezza convenzionale secondo cui hai bisogno di un modello canonico, altrimenti dovrai affrontare un'esplosione combinatoria di mappatori e traduttori. O almeno, ho usato per fare che fino a un paio di anni fa, quando ho letto il po-infame EF voto di sfiducia :

Le ipotesi che un tempo sostenevano il perseguimento di modelli di dati canonici non erano e non potevano includere fattori che sarebbero stati scoperti una volta che l'idea sarebbe stata messa in pratica. Abbiamo scoperto, attraverso anni di tentativi ed errori, che l'utilizzo di modelli separati per ogni singolo contesto in cui un modello di dati canonico potrebbe essere utilizzato è l'approccio meno complesso, è l'approccio meno costoso e quello che porta a una maggiore manutenibilità ed estensibilità delle applicazioni e degli endpoint che utilizzano modelli contestuali, ed è un approccio che non incoraggia l'entropia del software che fanno i modelli canonici.

Il saggio non presenta prove di alcun tipo a supporto delle sue affermazioni, ma mi ha fatto mettere in dubbio l'approccio CDM abbastanza a lungo per provare l'alternativa e il software risultante non è esploso, letteralmente o figurativamente. Ma ciò non significa molto in isolamento; Avrei potuto essere solo fortunato.

Quindi mi chiedo, sono state fatte ricerche serie sugli effetti pratici a lungo termine dell'avere un modello canonico rispetto ai modelli contestuali in un sistema software o in un'architettura?

Oppure, se è troppo presto per chiederlo, allora alcuni sviluppatori / architetti hanno scritto di esperienze personali che passano da un CDM a modelli contestuali indipendenti, o viceversa, e quali sono stati gli effetti pratici su cose come produttività, complessità o affidabilità?

Che dire delle differenze a diversi livelli, ovvero utilizzando lo stesso modello in una singola applicazione anziché utilizzarlo in un sistema di applicazioni o un'intera impresa?

(Solo fatti, per favore; le storie di guerra sono benvenute ma nessuna speculazione.)

— Aaronaught
fonte

Non ho idea di cosa stiano parlando nell'articolo "Vota senza fiducia". Il resto dell'articolo ha un senso, ma la sezione sul canonicismo è così astratta che non significa nulla. Sarebbe stato bello se avessero fornito un esempio di ciò di cui stavano parlando.

— Robert Harvey,

@Robert: non ho idea se ci sia qualche verità, ma per me è abbastanza chiaro cosa significhi ... sicuramente hai familiarità con i modelli CM / CDM? Nella sua incarnazione più semplice, sta condividendo un singolo modello / contesto EF monolitico (o Linq to SQL, o qualsiasi altra cosa) nell'intera applicazione anziché l'approccio più (percepito) dotto-tapey di scrivere query specifiche per parti specifiche dell'applicazione. A un livello superiore, sta adottando uno schema universale per un'intera organizzazione che tutte le singole applicazioni / sistemi devono tradurre.

— Aaronaught,

Sembra che il dibattito EF si concentri sul primo tavolo rispetto al primo progetto di classe, poiché il progetto primo tavolo (in cui le classi sono generate dalle tabelle) suggerisce un modello monolitico (anche se ci sono sempre query e viste specializzate), mentre il primo progetto di classe (dove le tabelle sono generate dalle classi) suggerisce un modello OO più flessibile e flessibile. Sono un po 'vecchio stile, preferendo l'approccio al primo tavolo, ma ho potuto vedere come l'approccio di prima classe sarebbe attraente per alcuni.

— Robert Harvey,

@Robert, non era mia intenzione sollevare il "dibattito EF", ho appena preso una sola citazione da quella pagina perché era il luogo in cui ho sentito l'argomento per la prima volta (e non sono sicuro di averlo sentito chiaramente espresso altrove). Separatamente, non sono sicuro di essere d'accordo sul fatto che il design da tavolo rappresenta in realtà un modello monolitico; lo stesso database lo è, ma solo il DBMS ne è veramente consapevole - parti diverse dell'applicazione tendono a essere consapevoli solo delle tabelle e delle query specifiche da cui dipendono.

— Aaronaught,

In risposta all'articolo EF Vote of No Confidence , Tim Mallalieu scrive:

Non stiamo raccomandando che la gente ritorni ai giorni in cui evangelizzavamo l'uso dell'XSD per "schemi canonici". Non credo che la gente pensi che questo sia trattabile. Ciò in cui crediamo, tuttavia, è che sia desiderabile avere un singolo meta-modello (EDM se vuoi) con il quale puoi descrivere molti modelli di dominio e che con un'unica grammatica possiamo fornire un insieme di servizi comuni su qualsiasi dato modello di dominio.

Ad esempio, considerare un'applicazione che deve essere scritta su un database con 600 tabelle. Credo che questa app dovrebbe avere un singolo modello con 600 tipi di entità al suo interno? No ... Inoltre, credo che una determinata entità di dominio (ad esempio il Cliente) abbia una sola forma in quell'app e che questa forma debba essere la forma canonica per l'intera Azienda? ... Diamine no.

L'articolo di Wikipedia per il modello canonico fa riferimento a cose come Enterprise Service Bus , Service-Oriented Architecture e CORBA , cose che sembrano quasi non essere più menzionate. Furono tutti posti come la soluzione alla proliferazione dei dati e alle sfide di comunicazione dell'impresa, il One Ring to Rule Them All. ^TM Ci sono riusciti? O sono crollati sotto il loro stesso peso?

Hai chiesto esperienze personali, quindi te ne darò una. Nel settore aerospaziale utilizziamo molto la telemetria. Una delle sfide con i sistemi di telemetria è trovare un modo per diversi intervalli di test di comunicare i dati dei test in modo significativo. Questo problema sembra abbastanza semplice, finché non si tenta di definire un dizionario di dati di termini comuni.

Cosa significa "altitudine"? È l'altezza dal suolo o è l'altezza dal livello del mare? E se stai parlando di un sottomarino? Quindi la sua profondità, non l'altitudine. Per l'esercito, la parola "trasmissione" ha un significato diverso quando ti riferisci a un'antenna radar rispetto a un veicolo terrestre. La superficie dell'ala che fa rotolare un aereo è chiamata "alettone" su alcuni piani e "elevone" su altri.

Questo è solo un suggerimento per la montagna di problemi che seguono. Sebbene esistano standard per la comunicazione dei dati, ogni intervallo di test è diverso e ha esigenze, obiettivi e priorità diversi. Gli standard possono differire anche tra progetti diversi nella stessa gamma. Per questo motivo, i range di test comprendono che la soluzione non arriverà sostituendo tutto con un unico sistema monolitico, ma concordando semplici protocolli di comunicazione e fornendo modi per tradurre dal vocabolario di un range a un altro.

I problemi che devono affrontare le grandi aziende sono simili. Microsoft tende a pensare in termini monolitici, ma ciò è dovuto al fatto che la sua società è, in linea generale, monolitica. Non appena è necessario comunicare tra aziende diverse con culture e modalità di business molto diverse (o anche tra dipartimenti diversi nella stessa azienda), One Ring to Rule Them All. ^TM inizia immediatamente a guastarsi.

— Robert Harvey
fonte

È interessante sapere che gli stessi progettisti Microsoft non raccomandano il mega-modello condiviso; sfortunatamente è esattamente così che Linq to SQL, EF e molti altri ORM tendono ad essere utilizzati. Indipendentemente da ciò, ci sono ancora molte persone là fuori che promuovono il concetto di modello canonico e mi piacerebbe ancora sapere come si comporta in pratica rispetto all'alternativa.

— Aaronaught,

@Aaronaught: vedi la mia modifica.

— Robert Harvey,

È una buona modifica e FYI l'ho votata. Sono, tuttavia, già a conoscenza di molte specifiche questioni di incongruenza che emergono quando si cerca di canonicalizzare un modello; Sono particolarmente interessato a conoscere esperienze o dati a lungo termine sui team che hanno investito il tempo per risolvere tali incongruenze, in modo da avere un mappatore per endpoint (end-to-model), piuttosto che investire il tempo in end separato invece i mapper end-to-end e quali approcci hanno prodotto le soluzioni a più basso costo / complessità minima.

— Aaronaught,

O per dirla più sinteticamente: so che è molto lavoro per creare e mantenere un modello canonico, quello che voglio sapere è quando (se mai) i benefici sono stati osservati per superare i costi.

— Aaronaught,