genirq: Prevent proc race against freeing of irq descriptors
[pandora-kernel.git] / kernel / irq / irqdesc.c
1 /*
2  * Copyright (C) 1992, 1998-2006 Linus Torvalds, Ingo Molnar
3  * Copyright (C) 2005-2006, Thomas Gleixner, Russell King
4  *
5  * This file contains the interrupt descriptor management code
6  *
7  * Detailed information is available in Documentation/DocBook/genericirq
8  *
9  */
10 #include <linux/irq.h>
11 #include <linux/slab.h>
12 #include <linux/export.h>
13 #include <linux/interrupt.h>
14 #include <linux/kernel_stat.h>
15 #include <linux/radix-tree.h>
16 #include <linux/bitmap.h>
17
18 #include "internals.h"
19
20 /*
21  * lockdep: we want to handle all irq_desc locks as a single lock-class:
22  */
23 static struct lock_class_key irq_desc_lock_class;
24
25 #if defined(CONFIG_SMP)
26 static void __init init_irq_default_affinity(void)
27 {
28         alloc_cpumask_var(&irq_default_affinity, GFP_NOWAIT);
29         cpumask_setall(irq_default_affinity);
30 }
31 #else
32 static void __init init_irq_default_affinity(void)
33 {
34 }
35 #endif
36
37 #ifdef CONFIG_SMP
38 static int alloc_masks(struct irq_desc *desc, gfp_t gfp, int node)
39 {
40         if (!zalloc_cpumask_var_node(&desc->irq_data.affinity, gfp, node))
41                 return -ENOMEM;
42
43 #ifdef CONFIG_GENERIC_PENDING_IRQ
44         if (!zalloc_cpumask_var_node(&desc->pending_mask, gfp, node)) {
45                 free_cpumask_var(desc->irq_data.affinity);
46                 return -ENOMEM;
47         }
48 #endif
49         return 0;
50 }
51
52 static void desc_smp_init(struct irq_desc *desc, int node)
53 {
54         desc->irq_data.node = node;
55         cpumask_copy(desc->irq_data.affinity, irq_default_affinity);
56 #ifdef CONFIG_GENERIC_PENDING_IRQ
57         cpumask_clear(desc->pending_mask);
58 #endif
59 }
60
61 static inline int desc_node(struct irq_desc *desc)
62 {
63         return desc->irq_data.node;
64 }
65
66 #else
67 static inline int
68 alloc_masks(struct irq_desc *desc, gfp_t gfp, int node) { return 0; }
69 static inline void desc_smp_init(struct irq_desc *desc, int node) { }
70 static inline int desc_node(struct irq_desc *desc) { return 0; }
71 #endif
72
73 static void desc_set_defaults(unsigned int irq, struct irq_desc *desc, int node,
74                 struct module *owner)
75 {
76         int cpu;
77
78         desc->irq_data.irq = irq;
79         desc->irq_data.chip = &no_irq_chip;
80         desc->irq_data.chip_data = NULL;
81         desc->irq_data.handler_data = NULL;
82         desc->irq_data.msi_desc = NULL;
83         irq_settings_clr_and_set(desc, ~0, _IRQ_DEFAULT_INIT_FLAGS);
84         irqd_set(&desc->irq_data, IRQD_IRQ_DISABLED);
85         desc->handle_irq = handle_bad_irq;
86         desc->depth = 1;
87         desc->irq_count = 0;
88         desc->irqs_unhandled = 0;
89         desc->name = NULL;
90         desc->owner = owner;
91         for_each_possible_cpu(cpu)
92                 *per_cpu_ptr(desc->kstat_irqs, cpu) = 0;
93         desc_smp_init(desc, node);
94 }
95
96 int nr_irqs = NR_IRQS;
97 EXPORT_SYMBOL_GPL(nr_irqs);
98
99 static DEFINE_MUTEX(sparse_irq_lock);
100 static DECLARE_BITMAP(allocated_irqs, IRQ_BITMAP_BITS);
101
102 #ifdef CONFIG_SPARSE_IRQ
103
104 static RADIX_TREE(irq_desc_tree, GFP_KERNEL);
105
106 static void irq_insert_desc(unsigned int irq, struct irq_desc *desc)
107 {
108         radix_tree_insert(&irq_desc_tree, irq, desc);
109 }
110
111 struct irq_desc *irq_to_desc(unsigned int irq)
112 {
113         return radix_tree_lookup(&irq_desc_tree, irq);
114 }
115
116 static void delete_irq_desc(unsigned int irq)
117 {
118         radix_tree_delete(&irq_desc_tree, irq);
119 }
120
121 #ifdef CONFIG_SMP
122 static void free_masks(struct irq_desc *desc)
123 {
124 #ifdef CONFIG_GENERIC_PENDING_IRQ
125         free_cpumask_var(desc->pending_mask);
126 #endif
127         free_cpumask_var(desc->irq_data.affinity);
128 }
129 #else
130 static inline void free_masks(struct irq_desc *desc) { }
131 #endif
132
133 void irq_lock_sparse(void)
134 {
135         mutex_lock(&sparse_irq_lock);
136 }
137
138 void irq_unlock_sparse(void)
139 {
140         mutex_unlock(&sparse_irq_lock);
141 }
142
143 static struct irq_desc *alloc_desc(int irq, int node, struct module *owner)
144 {
145         struct irq_desc *desc;
146         gfp_t gfp = GFP_KERNEL;
147
148         desc = kzalloc_node(sizeof(*desc), gfp, node);
149         if (!desc)
150                 return NULL;
151         /* allocate based on nr_cpu_ids */
152         desc->kstat_irqs = alloc_percpu(unsigned int);
153         if (!desc->kstat_irqs)
154                 goto err_desc;
155
156         if (alloc_masks(desc, gfp, node))
157                 goto err_kstat;
158
159         raw_spin_lock_init(&desc->lock);
160         lockdep_set_class(&desc->lock, &irq_desc_lock_class);
161
162         desc_set_defaults(irq, desc, node, owner);
163
164         return desc;
165
166 err_kstat:
167         free_percpu(desc->kstat_irqs);
168 err_desc:
169         kfree(desc);
170         return NULL;
171 }
172
173 static void free_desc(unsigned int irq)
174 {
175         struct irq_desc *desc = irq_to_desc(irq);
176
177         unregister_irq_proc(irq, desc);
178
179         /*
180          * sparse_irq_lock protects also show_interrupts() and
181          * kstat_irq_usr(). Once we deleted the descriptor from the
182          * sparse tree we can free it. Access in proc will fail to
183          * lookup the descriptor.
184          */
185         mutex_lock(&sparse_irq_lock);
186         delete_irq_desc(irq);
187         mutex_unlock(&sparse_irq_lock);
188
189         free_masks(desc);
190         free_percpu(desc->kstat_irqs);
191         kfree(desc);
192 }
193
194 static int alloc_descs(unsigned int start, unsigned int cnt, int node,
195                        struct module *owner)
196 {
197         struct irq_desc *desc;
198         int i;
199
200         for (i = 0; i < cnt; i++) {
201                 desc = alloc_desc(start + i, node, owner);
202                 if (!desc)
203                         goto err;
204                 mutex_lock(&sparse_irq_lock);
205                 irq_insert_desc(start + i, desc);
206                 mutex_unlock(&sparse_irq_lock);
207         }
208         return start;
209
210 err:
211         for (i--; i >= 0; i--)
212                 free_desc(start + i);
213
214         mutex_lock(&sparse_irq_lock);
215         bitmap_clear(allocated_irqs, start, cnt);
216         mutex_unlock(&sparse_irq_lock);
217         return -ENOMEM;
218 }
219
220 static int irq_expand_nr_irqs(unsigned int nr)
221 {
222         if (nr > IRQ_BITMAP_BITS)
223                 return -ENOMEM;
224         nr_irqs = nr;
225         return 0;
226 }
227
228 int __init early_irq_init(void)
229 {
230         int i, initcnt, node = first_online_node;
231         struct irq_desc *desc;
232
233         init_irq_default_affinity();
234
235         /* Let arch update nr_irqs and return the nr of preallocated irqs */
236         initcnt = arch_probe_nr_irqs();
237         printk(KERN_INFO "NR_IRQS:%d nr_irqs:%d %d\n", NR_IRQS, nr_irqs, initcnt);
238
239         if (WARN_ON(nr_irqs > IRQ_BITMAP_BITS))
240                 nr_irqs = IRQ_BITMAP_BITS;
241
242         if (WARN_ON(initcnt > IRQ_BITMAP_BITS))
243                 initcnt = IRQ_BITMAP_BITS;
244
245         if (initcnt > nr_irqs)
246                 nr_irqs = initcnt;
247
248         for (i = 0; i < initcnt; i++) {
249                 desc = alloc_desc(i, node, NULL);
250                 set_bit(i, allocated_irqs);
251                 irq_insert_desc(i, desc);
252         }
253         return arch_early_irq_init();
254 }
255
256 #else /* !CONFIG_SPARSE_IRQ */
257
258 struct irq_desc irq_desc[NR_IRQS] __cacheline_aligned_in_smp = {
259         [0 ... NR_IRQS-1] = {
260                 .handle_irq     = handle_bad_irq,
261                 .depth          = 1,
262                 .lock           = __RAW_SPIN_LOCK_UNLOCKED(irq_desc->lock),
263         }
264 };
265
266 int __init early_irq_init(void)
267 {
268         int count, i, node = first_online_node;
269         struct irq_desc *desc;
270
271         init_irq_default_affinity();
272
273         printk(KERN_INFO "NR_IRQS:%d\n", NR_IRQS);
274
275         desc = irq_desc;
276         count = ARRAY_SIZE(irq_desc);
277
278         for (i = 0; i < count; i++) {
279                 desc[i].kstat_irqs = alloc_percpu(unsigned int);
280                 alloc_masks(&desc[i], GFP_KERNEL, node);
281                 raw_spin_lock_init(&desc[i].lock);
282                 lockdep_set_class(&desc[i].lock, &irq_desc_lock_class);
283                 desc_set_defaults(i, &desc[i], node, NULL);
284         }
285         return arch_early_irq_init();
286 }
287
288 struct irq_desc *irq_to_desc(unsigned int irq)
289 {
290         return (irq < NR_IRQS) ? irq_desc + irq : NULL;
291 }
292
293 static void free_desc(unsigned int irq)
294 {
295         dynamic_irq_cleanup(irq);
296 }
297
298 static inline int alloc_descs(unsigned int start, unsigned int cnt, int node,
299                               struct module *owner)
300 {
301         u32 i;
302
303         for (i = 0; i < cnt; i++) {
304                 struct irq_desc *desc = irq_to_desc(start + i);
305
306                 desc->owner = owner;
307         }
308         return start;
309 }
310
311 static int irq_expand_nr_irqs(unsigned int nr)
312 {
313         return -ENOMEM;
314 }
315
316 #endif /* !CONFIG_SPARSE_IRQ */
317
318 /**
319  * generic_handle_irq - Invoke the handler for a particular irq
320  * @irq:        The irq number to handle
321  *
322  */
323 int generic_handle_irq(unsigned int irq)
324 {
325         struct irq_desc *desc = irq_to_desc(irq);
326
327         if (!desc)
328                 return -EINVAL;
329         generic_handle_irq_desc(irq, desc);
330         return 0;
331 }
332 EXPORT_SYMBOL_GPL(generic_handle_irq);
333
334 /* Dynamic interrupt handling */
335
336 /**
337  * irq_free_descs - free irq descriptors
338  * @from:       Start of descriptor range
339  * @cnt:        Number of consecutive irqs to free
340  */
341 void irq_free_descs(unsigned int from, unsigned int cnt)
342 {
343         int i;
344
345         if (from >= nr_irqs || (from + cnt) > nr_irqs)
346                 return;
347
348         for (i = 0; i < cnt; i++)
349                 free_desc(from + i);
350
351         mutex_lock(&sparse_irq_lock);
352         bitmap_clear(allocated_irqs, from, cnt);
353         mutex_unlock(&sparse_irq_lock);
354 }
355 EXPORT_SYMBOL_GPL(irq_free_descs);
356
357 /**
358  * irq_alloc_descs - allocate and initialize a range of irq descriptors
359  * @irq:        Allocate for specific irq number if irq >= 0
360  * @from:       Start the search from this irq number
361  * @cnt:        Number of consecutive irqs to allocate.
362  * @node:       Preferred node on which the irq descriptor should be allocated
363  * @owner:      Owning module (can be NULL)
364  *
365  * Returns the first irq number or error code
366  */
367 int __ref
368 __irq_alloc_descs(int irq, unsigned int from, unsigned int cnt, int node,
369                   struct module *owner)
370 {
371         int start, ret;
372
373         if (!cnt)
374                 return -EINVAL;
375
376         if (irq >= 0) {
377                 if (from > irq)
378                         return -EINVAL;
379                 from = irq;
380         }
381
382         mutex_lock(&sparse_irq_lock);
383
384         start = bitmap_find_next_zero_area(allocated_irqs, IRQ_BITMAP_BITS,
385                                            from, cnt, 0);
386         ret = -EEXIST;
387         if (irq >=0 && start != irq)
388                 goto err;
389
390         if (start + cnt > nr_irqs) {
391                 ret = irq_expand_nr_irqs(start + cnt);
392                 if (ret)
393                         goto err;
394         }
395
396         bitmap_set(allocated_irqs, start, cnt);
397         mutex_unlock(&sparse_irq_lock);
398         return alloc_descs(start, cnt, node, owner);
399
400 err:
401         mutex_unlock(&sparse_irq_lock);
402         return ret;
403 }
404 EXPORT_SYMBOL_GPL(__irq_alloc_descs);
405
406 /**
407  * irq_reserve_irqs - mark irqs allocated
408  * @from:       mark from irq number
409  * @cnt:        number of irqs to mark
410  *
411  * Returns 0 on success or an appropriate error code
412  */
413 int irq_reserve_irqs(unsigned int from, unsigned int cnt)
414 {
415         unsigned int start;
416         int ret = 0;
417
418         if (!cnt || (from + cnt) > nr_irqs)
419                 return -EINVAL;
420
421         mutex_lock(&sparse_irq_lock);
422         start = bitmap_find_next_zero_area(allocated_irqs, nr_irqs, from, cnt, 0);
423         if (start == from)
424                 bitmap_set(allocated_irqs, start, cnt);
425         else
426                 ret = -EEXIST;
427         mutex_unlock(&sparse_irq_lock);
428         return ret;
429 }
430
431 /**
432  * irq_get_next_irq - get next allocated irq number
433  * @offset:     where to start the search
434  *
435  * Returns next irq number after offset or nr_irqs if none is found.
436  */
437 unsigned int irq_get_next_irq(unsigned int offset)
438 {
439         return find_next_bit(allocated_irqs, nr_irqs, offset);
440 }
441
442 struct irq_desc *
443 __irq_get_desc_lock(unsigned int irq, unsigned long *flags, bool bus,
444                     unsigned int check)
445 {
446         struct irq_desc *desc = irq_to_desc(irq);
447
448         if (desc) {
449                 if (check & _IRQ_DESC_CHECK) {
450                         if ((check & _IRQ_DESC_PERCPU) &&
451                             !irq_settings_is_per_cpu_devid(desc))
452                                 return NULL;
453
454                         if (!(check & _IRQ_DESC_PERCPU) &&
455                             irq_settings_is_per_cpu_devid(desc))
456                                 return NULL;
457                 }
458
459                 if (bus)
460                         chip_bus_lock(desc);
461                 raw_spin_lock_irqsave(&desc->lock, *flags);
462         }
463         return desc;
464 }
465
466 void __irq_put_desc_unlock(struct irq_desc *desc, unsigned long flags, bool bus)
467 {
468         raw_spin_unlock_irqrestore(&desc->lock, flags);
469         if (bus)
470                 chip_bus_sync_unlock(desc);
471 }
472
473 int irq_set_percpu_devid(unsigned int irq)
474 {
475         struct irq_desc *desc = irq_to_desc(irq);
476
477         if (!desc)
478                 return -EINVAL;
479
480         if (desc->percpu_enabled)
481                 return -EINVAL;
482
483         desc->percpu_enabled = kzalloc(sizeof(*desc->percpu_enabled), GFP_KERNEL);
484
485         if (!desc->percpu_enabled)
486                 return -ENOMEM;
487
488         irq_set_percpu_devid_flags(irq);
489         return 0;
490 }
491
492 /**
493  * dynamic_irq_cleanup - cleanup a dynamically allocated irq
494  * @irq:        irq number to initialize
495  */
496 void dynamic_irq_cleanup(unsigned int irq)
497 {
498         struct irq_desc *desc = irq_to_desc(irq);
499         unsigned long flags;
500
501         raw_spin_lock_irqsave(&desc->lock, flags);
502         desc_set_defaults(irq, desc, desc_node(desc), NULL);
503         raw_spin_unlock_irqrestore(&desc->lock, flags);
504 }
505
506 /**
507  * kstat_irqs_cpu - Get the statistics for an interrupt on a cpu
508  * @irq:        The interrupt number
509  * @cpu:        The cpu number
510  *
511  * Returns the sum of interrupt counts on @cpu since boot for
512  * @irq. The caller must ensure that the interrupt is not removed
513  * concurrently.
514  */
515 unsigned int kstat_irqs_cpu(unsigned int irq, int cpu)
516 {
517         struct irq_desc *desc = irq_to_desc(irq);
518
519         return desc && desc->kstat_irqs ?
520                         *per_cpu_ptr(desc->kstat_irqs, cpu) : 0;
521 }
522
523 /**
524  * kstat_irqs - Get the statistics for an interrupt
525  * @irq:        The interrupt number
526  *
527  * Returns the sum of interrupt counts on all cpus since boot for
528  * @irq. The caller must ensure that the interrupt is not removed
529  * concurrently.
530  */
531 unsigned int kstat_irqs(unsigned int irq)
532 {
533         struct irq_desc *desc = irq_to_desc(irq);
534         int cpu;
535         int sum = 0;
536
537         if (!desc || !desc->kstat_irqs)
538                 return 0;
539         for_each_possible_cpu(cpu)
540                 sum += *per_cpu_ptr(desc->kstat_irqs, cpu);
541         return sum;
542 }
543
544 /**
545  * kstat_irqs_usr - Get the statistics for an interrupt
546  * @irq:        The interrupt number
547  *
548  * Returns the sum of interrupt counts on all cpus since boot for
549  * @irq. Contrary to kstat_irqs() this can be called from any
550  * preemptible context. It's protected against concurrent removal of
551  * an interrupt descriptor when sparse irqs are enabled.
552  */
553 unsigned int kstat_irqs_usr(unsigned int irq)
554 {
555         int sum;
556
557         irq_lock_sparse();
558         sum = kstat_irqs(irq);
559         irq_unlock_sparse();
560         return sum;
561 }