bonding: properly stop queuing work when requested
authorAndy Gospodarek <andy@greyhouse.net>
Fri, 23 Sep 2011 10:53:34 +0000 (10:53 +0000)
committerDavid S. Miller <davem@davemloft.net>
Mon, 3 Oct 2011 17:48:20 +0000 (13:48 -0400)
commita0db2dad0935e798973bb79676e722b82f177206
tree818935b03072555e34e15dbe2e883b682fcedf67
parent12d0d0d3a7349daa95dbfd5d7df8146255bc7c67
bonding: properly stop queuing work when requested

During a test where a pair of bonding interfaces using ARP monitoring
were both brought up and torn down (with an rmmod) repeatedly, a panic
in the timer code was noticed.  I tracked this down and determined that
any of the bonding functions that ran as workqueue handlers and requeued
more work might not properly exit when the module was removed.

There was a flag protected by the bond lock called kill_timers that is
set when the interface goes down or the module is removed, but many of
the functions that monitor link status now unlock the bond lock to take
rtnl first.  There is a chance that another CPU running the rmmod could
get the lock and set kill_timers after the first check has passed.

This patch does not allow any function to queue work that will make
itself run unless kill_timers is not set.  I also noticed while doing
this work that bond_resend_igmp_join_requests did not have a check for
kill_timers, so I added the needed call there as well.

Signed-off-by: Andy Gospodarek <andy@greyhouse.net>
Reported-by: Liang Zheng <lzheng@redhat.com>
Signed-off-by: David S. Miller <davem@davemloft.net>
drivers/net/bonding/bond_3ad.c
drivers/net/bonding/bond_alb.c
drivers/net/bonding/bond_main.c