Llamen a un exorcista, amigos!
Reposted from PabloIF
Por la tontería. Cálculos de servilleta:

Según Nvidia, cada core CUDA Ampere FP32 ejecuta 1 FMA por ciclo, lo que equivaldría a 2 FLOPs (un FMA es una multiplicación y una suma en una sola instrucción FP32).

Así que saldría: 1536 cores × 1007 MHz (en dock) × 2​ (flops/ciclo) ≈ 3,09 TFLOPS.

Comments