net: optimise csum_replace4()
authorLEROY Christophe <christophe.leroy@c-s.fr>
Tue, 23 Sep 2014 08:54:32 +0000 (10:54 +0200)
committerDavid S. Miller <davem@davemloft.net>
Fri, 26 Sep 2014 20:14:16 +0000 (16:14 -0400)
commit4565af0d406bed44bc8756230eae8f7caa5e0334
tree23461c0db192f9ed959e06c48d2501f4a3f61cba
parent3290d6555350a035319643e7d7a6d14be08073e5
net: optimise csum_replace4()

csum_partial() is a generic function which is not optimised for small fixed
length calculations, and its use requires to store "from" and "to" values in
memory while we already have them available in registers. This also has impact,
especially on RISC processors. In the same spirit as the change done by
Eric Dumazet on csum_replace2(), this patch rewrites inet_proto_csum_replace4()
taking into account RFC1624.

I spotted during a NATted tcp transfert that csum_partial() is one of top 5
consuming functions (around 8%), and the second user of csum_partial() is
inet_proto_csum_replace4().

I have proposed the same modification to inet_proto_csum_replace4() in another
patch.

Signed-off-by: Christophe Leroy <christophe.leroy@c-s.fr>
Acked-by: Eric Dumazet <edumazet@google.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
include/net/checksum.h