не придется. Через деления "32 на 16" можно 40 бит за пару-тройку итераций офигачить (делить-то на 8 бит! ). А вот множить 40х40 это уже будет понакладнее. Будет 9 частичных произведений.
(«Телесистемы»: Конференция «Микроконтроллеры и их применение»)