Не реализовывал - но должен ложиться хорошо. Получится несколько склоев логики. За 100 наносекунд успеет что угодно. А если вдруг по странному стечению обстоятельств не успеет на каком-нибудь особо медленном старинном FPGA - всегда можно конвейеризовать.