Llamen a un exorcista, amigos!
Reposted from
PabloIF
Por la tontería. Cálculos de servilleta:
Según Nvidia, cada core CUDA Ampere FP32 ejecuta 1 FMA por ciclo, lo que equivaldría a 2 FLOPs (un FMA es una multiplicación y una suma en una sola instrucción FP32).
Así que saldría: 1536 cores × 1007 MHz (en dock) × 2 (flops/ciclo) ≈ 3,09 TFLOPS.
Según Nvidia, cada core CUDA Ampere FP32 ejecuta 1 FMA por ciclo, lo que equivaldría a 2 FLOPs (un FMA es una multiplicación y una suma en una sola instrucción FP32).
Así que saldría: 1536 cores × 1007 MHz (en dock) × 2 (flops/ciclo) ≈ 3,09 TFLOPS.
Comments