crypto: blowfish-x86_64 - improve x86_64 blowfish 4-way performance
authorJussi Kivilinna <jussi.kivilinna@mbnet.fi>
Fri, 23 Sep 2011 16:50:55 +0000 (19:50 +0300)
committerHerbert Xu <herbert@gondor.apana.org.au>
Fri, 21 Oct 2011 12:23:07 +0000 (14:23 +0200)
commite827bb09c815955d5d5f0ddf98483a7efd04f55b
tree6a4b262e8b51c5b863855549d5f6280b4f5c0e6c
parentfad8fa4782fde8afffc16b2b907b7f5bdbf03133
crypto: blowfish-x86_64 - improve x86_64 blowfish 4-way performance

This patch adds improved F-macro for 4-way parallel functions. With new
F-macro for 4-way parallel functions, blowfish sees ~15% improvement in
speed tests on AMD Phenom II (~5% on Intel Xeon E7330).

However when used in 1-way blowfish function new macro would be ~10%
slower than original, so old F-macro is kept for 1-way functions.
Patch cleans up old F-macro as it is no longer needed in 4-way part.

Patch also does register macro renaming to reduce stack usage.

Signed-off-by: Jussi Kivilinna <jussi.kivilinna@mbnet.fi>
Signed-off-by: Herbert Xu <herbert@gondor.apana.org.au>
arch/x86/crypto/blowfish-x86_64-asm_64.S