netfilter: xt_recent: check for unsupported user space flags
[pandora-kernel.git] / net / netfilter / xt_recent.c
1 /*
2  * Copyright (c) 2006 Patrick McHardy <kaber@trash.net>
3  * Copyright © CC Computer Consultants GmbH, 2007 - 2008
4  *
5  * This program is free software; you can redistribute it and/or modify
6  * it under the terms of the GNU General Public License version 2 as
7  * published by the Free Software Foundation.
8  *
9  * This is a replacement of the old ipt_recent module, which carried the
10  * following copyright notice:
11  *
12  * Author: Stephen Frost <sfrost@snowman.net>
13  * Copyright 2002-2003, Stephen Frost, 2.5.x port by laforge@netfilter.org
14  */
15 #include <linux/init.h>
16 #include <linux/ip.h>
17 #include <linux/ipv6.h>
18 #include <linux/module.h>
19 #include <linux/moduleparam.h>
20 #include <linux/proc_fs.h>
21 #include <linux/seq_file.h>
22 #include <linux/string.h>
23 #include <linux/ctype.h>
24 #include <linux/list.h>
25 #include <linux/random.h>
26 #include <linux/jhash.h>
27 #include <linux/bitops.h>
28 #include <linux/skbuff.h>
29 #include <linux/inet.h>
30 #include <net/net_namespace.h>
31 #include <net/netns/generic.h>
32
33 #include <linux/netfilter/x_tables.h>
34 #include <linux/netfilter/xt_recent.h>
35
36 MODULE_AUTHOR("Patrick McHardy <kaber@trash.net>");
37 MODULE_AUTHOR("Jan Engelhardt <jengelh@medozas.de>");
38 MODULE_DESCRIPTION("Xtables: \"recently-seen\" host matching");
39 MODULE_LICENSE("GPL");
40 MODULE_ALIAS("ipt_recent");
41 MODULE_ALIAS("ip6t_recent");
42
43 static unsigned int ip_list_tot = 100;
44 static unsigned int ip_pkt_list_tot = 20;
45 static unsigned int ip_list_hash_size = 0;
46 static unsigned int ip_list_perms = 0644;
47 static unsigned int ip_list_uid = 0;
48 static unsigned int ip_list_gid = 0;
49 module_param(ip_list_tot, uint, 0400);
50 module_param(ip_pkt_list_tot, uint, 0400);
51 module_param(ip_list_hash_size, uint, 0400);
52 module_param(ip_list_perms, uint, 0400);
53 module_param(ip_list_uid, uint, 0400);
54 module_param(ip_list_gid, uint, 0400);
55 MODULE_PARM_DESC(ip_list_tot, "number of IPs to remember per list");
56 MODULE_PARM_DESC(ip_pkt_list_tot, "number of packets per IP address to remember (max. 255)");
57 MODULE_PARM_DESC(ip_list_hash_size, "size of hash table used to look up IPs");
58 MODULE_PARM_DESC(ip_list_perms, "permissions on /proc/net/xt_recent/* files");
59 MODULE_PARM_DESC(ip_list_uid,"owner of /proc/net/xt_recent/* files");
60 MODULE_PARM_DESC(ip_list_gid,"owning group of /proc/net/xt_recent/* files");
61
62 struct recent_entry {
63         struct list_head        list;
64         struct list_head        lru_list;
65         union nf_inet_addr      addr;
66         u_int16_t               family;
67         u_int8_t                ttl;
68         u_int8_t                index;
69         u_int16_t               nstamps;
70         unsigned long           stamps[0];
71 };
72
73 struct recent_table {
74         struct list_head        list;
75         char                    name[XT_RECENT_NAME_LEN];
76         unsigned int            refcnt;
77         unsigned int            entries;
78         struct list_head        lru_list;
79         struct list_head        iphash[0];
80 };
81
82 struct recent_net {
83         struct list_head        tables;
84 #ifdef CONFIG_PROC_FS
85         struct proc_dir_entry   *xt_recent;
86 #endif
87 };
88
89 static int recent_net_id;
90 static inline struct recent_net *recent_pernet(struct net *net)
91 {
92         return net_generic(net, recent_net_id);
93 }
94
95 static DEFINE_SPINLOCK(recent_lock);
96 static DEFINE_MUTEX(recent_mutex);
97
98 #ifdef CONFIG_PROC_FS
99 static const struct file_operations recent_old_fops, recent_mt_fops;
100 #endif
101
102 static u_int32_t hash_rnd __read_mostly;
103 static bool hash_rnd_inited __read_mostly;
104
105 static inline unsigned int recent_entry_hash4(const union nf_inet_addr *addr)
106 {
107         return jhash_1word((__force u32)addr->ip, hash_rnd) &
108                (ip_list_hash_size - 1);
109 }
110
111 static inline unsigned int recent_entry_hash6(const union nf_inet_addr *addr)
112 {
113         return jhash2((u32 *)addr->ip6, ARRAY_SIZE(addr->ip6), hash_rnd) &
114                (ip_list_hash_size - 1);
115 }
116
117 static struct recent_entry *
118 recent_entry_lookup(const struct recent_table *table,
119                     const union nf_inet_addr *addrp, u_int16_t family,
120                     u_int8_t ttl)
121 {
122         struct recent_entry *e;
123         unsigned int h;
124
125         if (family == NFPROTO_IPV4)
126                 h = recent_entry_hash4(addrp);
127         else
128                 h = recent_entry_hash6(addrp);
129
130         list_for_each_entry(e, &table->iphash[h], list)
131                 if (e->family == family &&
132                     memcmp(&e->addr, addrp, sizeof(e->addr)) == 0 &&
133                     (ttl == e->ttl || ttl == 0 || e->ttl == 0))
134                         return e;
135         return NULL;
136 }
137
138 static void recent_entry_remove(struct recent_table *t, struct recent_entry *e)
139 {
140         list_del(&e->list);
141         list_del(&e->lru_list);
142         kfree(e);
143         t->entries--;
144 }
145
146 /*
147  * Drop entries with timestamps older then 'time'.
148  */
149 static void recent_entry_reap(struct recent_table *t, unsigned long time)
150 {
151         struct recent_entry *e;
152
153         /*
154          * The head of the LRU list is always the oldest entry.
155          */
156         e = list_entry(t->lru_list.next, struct recent_entry, lru_list);
157
158         /*
159          * The last time stamp is the most recent.
160          */
161         if (time_after(time, e->stamps[e->index-1]))
162                 recent_entry_remove(t, e);
163 }
164
165 static struct recent_entry *
166 recent_entry_init(struct recent_table *t, const union nf_inet_addr *addr,
167                   u_int16_t family, u_int8_t ttl)
168 {
169         struct recent_entry *e;
170
171         if (t->entries >= ip_list_tot) {
172                 e = list_entry(t->lru_list.next, struct recent_entry, lru_list);
173                 recent_entry_remove(t, e);
174         }
175         e = kmalloc(sizeof(*e) + sizeof(e->stamps[0]) * ip_pkt_list_tot,
176                     GFP_ATOMIC);
177         if (e == NULL)
178                 return NULL;
179         memcpy(&e->addr, addr, sizeof(e->addr));
180         e->ttl       = ttl;
181         e->stamps[0] = jiffies;
182         e->nstamps   = 1;
183         e->index     = 1;
184         e->family    = family;
185         if (family == NFPROTO_IPV4)
186                 list_add_tail(&e->list, &t->iphash[recent_entry_hash4(addr)]);
187         else
188                 list_add_tail(&e->list, &t->iphash[recent_entry_hash6(addr)]);
189         list_add_tail(&e->lru_list, &t->lru_list);
190         t->entries++;
191         return e;
192 }
193
194 static void recent_entry_update(struct recent_table *t, struct recent_entry *e)
195 {
196         e->index %= ip_pkt_list_tot;
197         e->stamps[e->index++] = jiffies;
198         if (e->index > e->nstamps)
199                 e->nstamps = e->index;
200         list_move_tail(&e->lru_list, &t->lru_list);
201 }
202
203 static struct recent_table *recent_table_lookup(struct recent_net *recent_net,
204                                                 const char *name)
205 {
206         struct recent_table *t;
207
208         list_for_each_entry(t, &recent_net->tables, list)
209                 if (!strcmp(t->name, name))
210                         return t;
211         return NULL;
212 }
213
214 static void recent_table_flush(struct recent_table *t)
215 {
216         struct recent_entry *e, *next;
217         unsigned int i;
218
219         for (i = 0; i < ip_list_hash_size; i++)
220                 list_for_each_entry_safe(e, next, &t->iphash[i], list)
221                         recent_entry_remove(t, e);
222 }
223
224 static bool
225 recent_mt(const struct sk_buff *skb, const struct xt_match_param *par)
226 {
227         struct net *net = dev_net(par->in ? par->in : par->out);
228         struct recent_net *recent_net = recent_pernet(net);
229         const struct xt_recent_mtinfo *info = par->matchinfo;
230         struct recent_table *t;
231         struct recent_entry *e;
232         union nf_inet_addr addr = {};
233         u_int8_t ttl;
234         bool ret = info->invert;
235
236         if (par->match->family == NFPROTO_IPV4) {
237                 const struct iphdr *iph = ip_hdr(skb);
238
239                 if (info->side == XT_RECENT_DEST)
240                         addr.ip = iph->daddr;
241                 else
242                         addr.ip = iph->saddr;
243
244                 ttl = iph->ttl;
245         } else {
246                 const struct ipv6hdr *iph = ipv6_hdr(skb);
247
248                 if (info->side == XT_RECENT_DEST)
249                         memcpy(&addr.in6, &iph->daddr, sizeof(addr.in6));
250                 else
251                         memcpy(&addr.in6, &iph->saddr, sizeof(addr.in6));
252
253                 ttl = iph->hop_limit;
254         }
255
256         /* use TTL as seen before forwarding */
257         if (par->out != NULL && skb->sk == NULL)
258                 ttl++;
259
260         spin_lock_bh(&recent_lock);
261         t = recent_table_lookup(recent_net, info->name);
262         e = recent_entry_lookup(t, &addr, par->match->family,
263                                 (info->check_set & XT_RECENT_TTL) ? ttl : 0);
264         if (e == NULL) {
265                 if (!(info->check_set & XT_RECENT_SET))
266                         goto out;
267                 e = recent_entry_init(t, &addr, par->match->family, ttl);
268                 if (e == NULL)
269                         *par->hotdrop = true;
270                 ret = !ret;
271                 goto out;
272         }
273
274         if (info->check_set & XT_RECENT_SET)
275                 ret = !ret;
276         else if (info->check_set & XT_RECENT_REMOVE) {
277                 recent_entry_remove(t, e);
278                 ret = !ret;
279         } else if (info->check_set & (XT_RECENT_CHECK | XT_RECENT_UPDATE)) {
280                 unsigned long time = jiffies - info->seconds * HZ;
281                 unsigned int i, hits = 0;
282
283                 for (i = 0; i < e->nstamps; i++) {
284                         if (info->seconds && time_after(time, e->stamps[i]))
285                                 continue;
286                         if (info->hit_count && ++hits >= info->hit_count) {
287                                 ret = !ret;
288                                 break;
289                         }
290                 }
291
292                 /* info->seconds must be non-zero */
293                 if (info->check_set & XT_RECENT_REAP)
294                         recent_entry_reap(t, time);
295         }
296
297         if (info->check_set & XT_RECENT_SET ||
298             (info->check_set & XT_RECENT_UPDATE && ret)) {
299                 recent_entry_update(t, e);
300                 e->ttl = ttl;
301         }
302 out:
303         spin_unlock_bh(&recent_lock);
304         return ret;
305 }
306
307 static bool recent_mt_check(const struct xt_mtchk_param *par)
308 {
309         struct recent_net *recent_net = recent_pernet(par->net);
310         const struct xt_recent_mtinfo *info = par->matchinfo;
311         struct recent_table *t;
312 #ifdef CONFIG_PROC_FS
313         struct proc_dir_entry *pde;
314 #endif
315         unsigned i;
316         bool ret = false;
317
318         if (unlikely(!hash_rnd_inited)) {
319                 get_random_bytes(&hash_rnd, sizeof(hash_rnd));
320                 hash_rnd_inited = true;
321         }
322         if (info->check_set & ~XT_RECENT_VALID_FLAGS) {
323                 pr_info(KBUILD_MODNAME ": Unsupported user space flags "
324                         "(%08x)\n", info->check_set);
325                 return false;
326         }
327         if (hweight8(info->check_set &
328                      (XT_RECENT_SET | XT_RECENT_REMOVE |
329                       XT_RECENT_CHECK | XT_RECENT_UPDATE)) != 1)
330                 return false;
331         if ((info->check_set & (XT_RECENT_SET | XT_RECENT_REMOVE)) &&
332             (info->seconds || info->hit_count ||
333             (info->check_set & XT_RECENT_MODIFIERS)))
334                 return false;
335         if ((info->check_set & XT_RECENT_REAP) && !info->seconds)
336                 return false;
337         if (info->hit_count > ip_pkt_list_tot) {
338                 pr_info(KBUILD_MODNAME ": hitcount (%u) is larger than "
339                         "packets to be remembered (%u)\n",
340                         info->hit_count, ip_pkt_list_tot);
341                 return false;
342         }
343         if (info->name[0] == '\0' ||
344             strnlen(info->name, XT_RECENT_NAME_LEN) == XT_RECENT_NAME_LEN)
345                 return false;
346
347         mutex_lock(&recent_mutex);
348         t = recent_table_lookup(recent_net, info->name);
349         if (t != NULL) {
350                 t->refcnt++;
351                 ret = true;
352                 goto out;
353         }
354
355         t = kzalloc(sizeof(*t) + sizeof(t->iphash[0]) * ip_list_hash_size,
356                     GFP_KERNEL);
357         if (t == NULL)
358                 goto out;
359         t->refcnt = 1;
360         strcpy(t->name, info->name);
361         INIT_LIST_HEAD(&t->lru_list);
362         for (i = 0; i < ip_list_hash_size; i++)
363                 INIT_LIST_HEAD(&t->iphash[i]);
364 #ifdef CONFIG_PROC_FS
365         pde = proc_create_data(t->name, ip_list_perms, recent_net->xt_recent,
366                   &recent_mt_fops, t);
367         if (pde == NULL) {
368                 kfree(t);
369                 goto out;
370         }
371         pde->uid = ip_list_uid;
372         pde->gid = ip_list_gid;
373 #endif
374         spin_lock_bh(&recent_lock);
375         list_add_tail(&t->list, &recent_net->tables);
376         spin_unlock_bh(&recent_lock);
377         ret = true;
378 out:
379         mutex_unlock(&recent_mutex);
380         return ret;
381 }
382
383 static void recent_mt_destroy(const struct xt_mtdtor_param *par)
384 {
385         struct recent_net *recent_net = recent_pernet(par->net);
386         const struct xt_recent_mtinfo *info = par->matchinfo;
387         struct recent_table *t;
388
389         mutex_lock(&recent_mutex);
390         t = recent_table_lookup(recent_net, info->name);
391         if (--t->refcnt == 0) {
392                 spin_lock_bh(&recent_lock);
393                 list_del(&t->list);
394                 spin_unlock_bh(&recent_lock);
395 #ifdef CONFIG_PROC_FS
396                 remove_proc_entry(t->name, recent_net->xt_recent);
397 #endif
398                 recent_table_flush(t);
399                 kfree(t);
400         }
401         mutex_unlock(&recent_mutex);
402 }
403
404 #ifdef CONFIG_PROC_FS
405 struct recent_iter_state {
406         const struct recent_table *table;
407         unsigned int            bucket;
408 };
409
410 static void *recent_seq_start(struct seq_file *seq, loff_t *pos)
411         __acquires(recent_lock)
412 {
413         struct recent_iter_state *st = seq->private;
414         const struct recent_table *t = st->table;
415         struct recent_entry *e;
416         loff_t p = *pos;
417
418         spin_lock_bh(&recent_lock);
419
420         for (st->bucket = 0; st->bucket < ip_list_hash_size; st->bucket++)
421                 list_for_each_entry(e, &t->iphash[st->bucket], list)
422                         if (p-- == 0)
423                                 return e;
424         return NULL;
425 }
426
427 static void *recent_seq_next(struct seq_file *seq, void *v, loff_t *pos)
428 {
429         struct recent_iter_state *st = seq->private;
430         const struct recent_table *t = st->table;
431         const struct recent_entry *e = v;
432         const struct list_head *head = e->list.next;
433
434         while (head == &t->iphash[st->bucket]) {
435                 if (++st->bucket >= ip_list_hash_size)
436                         return NULL;
437                 head = t->iphash[st->bucket].next;
438         }
439         (*pos)++;
440         return list_entry(head, struct recent_entry, list);
441 }
442
443 static void recent_seq_stop(struct seq_file *s, void *v)
444         __releases(recent_lock)
445 {
446         spin_unlock_bh(&recent_lock);
447 }
448
449 static int recent_seq_show(struct seq_file *seq, void *v)
450 {
451         const struct recent_entry *e = v;
452         unsigned int i;
453
454         i = (e->index - 1) % ip_pkt_list_tot;
455         if (e->family == NFPROTO_IPV4)
456                 seq_printf(seq, "src=%pI4 ttl: %u last_seen: %lu oldest_pkt: %u",
457                            &e->addr.ip, e->ttl, e->stamps[i], e->index);
458         else
459                 seq_printf(seq, "src=%pI6 ttl: %u last_seen: %lu oldest_pkt: %u",
460                            &e->addr.in6, e->ttl, e->stamps[i], e->index);
461         for (i = 0; i < e->nstamps; i++)
462                 seq_printf(seq, "%s %lu", i ? "," : "", e->stamps[i]);
463         seq_printf(seq, "\n");
464         return 0;
465 }
466
467 static const struct seq_operations recent_seq_ops = {
468         .start          = recent_seq_start,
469         .next           = recent_seq_next,
470         .stop           = recent_seq_stop,
471         .show           = recent_seq_show,
472 };
473
474 static int recent_seq_open(struct inode *inode, struct file *file)
475 {
476         struct proc_dir_entry *pde = PDE(inode);
477         struct recent_iter_state *st;
478
479         st = __seq_open_private(file, &recent_seq_ops, sizeof(*st));
480         if (st == NULL)
481                 return -ENOMEM;
482
483         st->table    = pde->data;
484         return 0;
485 }
486
487 static ssize_t
488 recent_mt_proc_write(struct file *file, const char __user *input,
489                      size_t size, loff_t *loff)
490 {
491         const struct proc_dir_entry *pde = PDE(file->f_path.dentry->d_inode);
492         struct recent_table *t = pde->data;
493         struct recent_entry *e;
494         char buf[sizeof("+b335:1d35:1e55:dead:c0de:1715:5afe:c0de")];
495         const char *c = buf;
496         union nf_inet_addr addr = {};
497         u_int16_t family;
498         bool add, succ;
499
500         if (size == 0)
501                 return 0;
502         if (size > sizeof(buf))
503                 size = sizeof(buf);
504         if (copy_from_user(buf, input, size) != 0)
505                 return -EFAULT;
506
507         /* Strict protocol! */
508         if (*loff != 0)
509                 return -ESPIPE;
510         switch (*c) {
511         case '/': /* flush table */
512                 spin_lock_bh(&recent_lock);
513                 recent_table_flush(t);
514                 spin_unlock_bh(&recent_lock);
515                 return size;
516         case '-': /* remove address */
517                 add = false;
518                 break;
519         case '+': /* add address */
520                 add = true;
521                 break;
522         default:
523                 printk(KERN_INFO KBUILD_MODNAME ": Need +ip, -ip or /\n");
524                 return -EINVAL;
525         }
526
527         ++c;
528         --size;
529         if (strnchr(c, size, ':') != NULL) {
530                 family = NFPROTO_IPV6;
531                 succ   = in6_pton(c, size, (void *)&addr, '\n', NULL);
532         } else {
533                 family = NFPROTO_IPV4;
534                 succ   = in4_pton(c, size, (void *)&addr, '\n', NULL);
535         }
536
537         if (!succ) {
538                 printk(KERN_INFO KBUILD_MODNAME ": illegal address written "
539                        "to procfs\n");
540                 return -EINVAL;
541         }
542
543         spin_lock_bh(&recent_lock);
544         e = recent_entry_lookup(t, &addr, family, 0);
545         if (e == NULL) {
546                 if (add)
547                         recent_entry_init(t, &addr, family, 0);
548         } else {
549                 if (add)
550                         recent_entry_update(t, e);
551                 else
552                         recent_entry_remove(t, e);
553         }
554         spin_unlock_bh(&recent_lock);
555         /* Note we removed one above */
556         *loff += size + 1;
557         return size + 1;
558 }
559
560 static const struct file_operations recent_mt_fops = {
561         .open    = recent_seq_open,
562         .read    = seq_read,
563         .write   = recent_mt_proc_write,
564         .release = seq_release_private,
565         .owner   = THIS_MODULE,
566 };
567
568 static int __net_init recent_proc_net_init(struct net *net)
569 {
570         struct recent_net *recent_net = recent_pernet(net);
571
572         recent_net->xt_recent = proc_mkdir("xt_recent", net->proc_net);
573         if (!recent_net->xt_recent)
574                 return -ENOMEM;
575         return 0;
576 }
577
578 static void __net_exit recent_proc_net_exit(struct net *net)
579 {
580         proc_net_remove(net, "xt_recent");
581 }
582 #else
583 static inline int recent_proc_net_init(struct net *net)
584 {
585         return 0;
586 }
587
588 static inline void recent_proc_net_exit(struct net *net)
589 {
590 }
591 #endif /* CONFIG_PROC_FS */
592
593 static int __net_init recent_net_init(struct net *net)
594 {
595         struct recent_net *recent_net = recent_pernet(net);
596
597         INIT_LIST_HEAD(&recent_net->tables);
598         return recent_proc_net_init(net);
599 }
600
601 static void __net_exit recent_net_exit(struct net *net)
602 {
603         struct recent_net *recent_net = recent_pernet(net);
604
605         BUG_ON(!list_empty(&recent_net->tables));
606         recent_proc_net_exit(net);
607 }
608
609 static struct pernet_operations recent_net_ops = {
610         .init   = recent_net_init,
611         .exit   = recent_net_exit,
612         .id     = &recent_net_id,
613         .size   = sizeof(struct recent_net),
614 };
615
616 static struct xt_match recent_mt_reg[] __read_mostly = {
617         {
618                 .name       = "recent",
619                 .revision   = 0,
620                 .family     = NFPROTO_IPV4,
621                 .match      = recent_mt,
622                 .matchsize  = sizeof(struct xt_recent_mtinfo),
623                 .checkentry = recent_mt_check,
624                 .destroy    = recent_mt_destroy,
625                 .me         = THIS_MODULE,
626         },
627         {
628                 .name       = "recent",
629                 .revision   = 0,
630                 .family     = NFPROTO_IPV6,
631                 .match      = recent_mt,
632                 .matchsize  = sizeof(struct xt_recent_mtinfo),
633                 .checkentry = recent_mt_check,
634                 .destroy    = recent_mt_destroy,
635                 .me         = THIS_MODULE,
636         },
637 };
638
639 static int __init recent_mt_init(void)
640 {
641         int err;
642
643         if (!ip_list_tot || !ip_pkt_list_tot || ip_pkt_list_tot > 255)
644                 return -EINVAL;
645         ip_list_hash_size = 1 << fls(ip_list_tot);
646
647         err = register_pernet_subsys(&recent_net_ops);
648         if (err)
649                 return err;
650         err = xt_register_matches(recent_mt_reg, ARRAY_SIZE(recent_mt_reg));
651         if (err)
652                 unregister_pernet_subsys(&recent_net_ops);
653         return err;
654 }
655
656 static void __exit recent_mt_exit(void)
657 {
658         xt_unregister_matches(recent_mt_reg, ARRAY_SIZE(recent_mt_reg));
659         unregister_pernet_subsys(&recent_net_ops);
660 }
661
662 module_init(recent_mt_init);
663 module_exit(recent_mt_exit);