4
Come posso ottenere il massimo teorico di 4 FLOP per ciclo?
Come è possibile ottenere le massime prestazioni teoriche di 4 operazioni in virgola mobile (doppia precisione) per ciclo su una moderna CPU Intel x86-64? Per quanto ne so, sono necessari tre cicli per un SSE add e cinque cicli per un mulcompletamento sulla maggior parte delle moderne CPU Intel (vedere …