FlashAttention-4 Hits 71% GPU Utilización en NVIDIA Blackwell B200
Juntos el FlashAttention-4 de AI alcanza 1,605 TFLOPs/s en GPUs B200, hasta 2.7x más rápido que Triton. La nueva tubería supera los cuellos de botella de escalado de hardware asimétrico. (Leer más)






