I fautori dei linguaggi di programmazione funzionale affermano che la programmazione funzionale rende più facile ragionare sul codice. Coloro che sono a favore di linguaggi tipicamente statici affermano che i loro compilatori rilevano errori sufficienti per compensare l'ulteriore complessità dei sistemi di tipi. Ma tutto ciò che leggo su questi argomenti si basa su argomenti razionali, non su dati empirici.
Esistono studi empirici sugli effetti che le diverse categorie di linguaggi di programmazione hanno sui tassi di difetto o su altri parametri di qualità?
(Le risposte a questa domanda sembrano indicare che non esistono tali studi, almeno non per il dibattito dinamico vs. statico)