posix-timers: fix posix_timer_event() vs dequeue_signal() race
[pandora-kernel.git] / kernel / signal.c
1 /*
2  *  linux/kernel/signal.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  *
6  *  1997-11-02  Modified for POSIX.1b signals by Richard Henderson
7  *
8  *  2003-06-02  Jim Houston - Concurrent Computer Corp.
9  *              Changes to use preallocated sigqueue structures
10  *              to allow signals to be sent reliably.
11  */
12
13 #include <linux/slab.h>
14 #include <linux/module.h>
15 #include <linux/init.h>
16 #include <linux/sched.h>
17 #include <linux/fs.h>
18 #include <linux/tty.h>
19 #include <linux/binfmts.h>
20 #include <linux/security.h>
21 #include <linux/syscalls.h>
22 #include <linux/ptrace.h>
23 #include <linux/signal.h>
24 #include <linux/signalfd.h>
25 #include <linux/capability.h>
26 #include <linux/freezer.h>
27 #include <linux/pid_namespace.h>
28 #include <linux/nsproxy.h>
29
30 #include <asm/param.h>
31 #include <asm/uaccess.h>
32 #include <asm/unistd.h>
33 #include <asm/siginfo.h>
34 #include "audit.h"      /* audit_signal_info() */
35
36 /*
37  * SLAB caches for signal bits.
38  */
39
40 static struct kmem_cache *sigqueue_cachep;
41
42 static int __sig_ignored(struct task_struct *t, int sig)
43 {
44         void __user *handler;
45
46         /* Is it explicitly or implicitly ignored? */
47
48         handler = t->sighand->action[sig - 1].sa.sa_handler;
49         return handler == SIG_IGN ||
50                 (handler == SIG_DFL && sig_kernel_ignore(sig));
51 }
52
53 static int sig_ignored(struct task_struct *t, int sig)
54 {
55         /*
56          * Tracers always want to know about signals..
57          */
58         if (t->ptrace & PT_PTRACED)
59                 return 0;
60
61         /*
62          * Blocked signals are never ignored, since the
63          * signal handler may change by the time it is
64          * unblocked.
65          */
66         if (sigismember(&t->blocked, sig) || sigismember(&t->real_blocked, sig))
67                 return 0;
68
69         return __sig_ignored(t, sig);
70 }
71
72 /*
73  * Re-calculate pending state from the set of locally pending
74  * signals, globally pending signals, and blocked signals.
75  */
76 static inline int has_pending_signals(sigset_t *signal, sigset_t *blocked)
77 {
78         unsigned long ready;
79         long i;
80
81         switch (_NSIG_WORDS) {
82         default:
83                 for (i = _NSIG_WORDS, ready = 0; --i >= 0 ;)
84                         ready |= signal->sig[i] &~ blocked->sig[i];
85                 break;
86
87         case 4: ready  = signal->sig[3] &~ blocked->sig[3];
88                 ready |= signal->sig[2] &~ blocked->sig[2];
89                 ready |= signal->sig[1] &~ blocked->sig[1];
90                 ready |= signal->sig[0] &~ blocked->sig[0];
91                 break;
92
93         case 2: ready  = signal->sig[1] &~ blocked->sig[1];
94                 ready |= signal->sig[0] &~ blocked->sig[0];
95                 break;
96
97         case 1: ready  = signal->sig[0] &~ blocked->sig[0];
98         }
99         return ready != 0;
100 }
101
102 #define PENDING(p,b) has_pending_signals(&(p)->signal, (b))
103
104 static int recalc_sigpending_tsk(struct task_struct *t)
105 {
106         if (t->signal->group_stop_count > 0 ||
107             PENDING(&t->pending, &t->blocked) ||
108             PENDING(&t->signal->shared_pending, &t->blocked)) {
109                 set_tsk_thread_flag(t, TIF_SIGPENDING);
110                 return 1;
111         }
112         /*
113          * We must never clear the flag in another thread, or in current
114          * when it's possible the current syscall is returning -ERESTART*.
115          * So we don't clear it here, and only callers who know they should do.
116          */
117         return 0;
118 }
119
120 /*
121  * After recalculating TIF_SIGPENDING, we need to make sure the task wakes up.
122  * This is superfluous when called on current, the wakeup is a harmless no-op.
123  */
124 void recalc_sigpending_and_wake(struct task_struct *t)
125 {
126         if (recalc_sigpending_tsk(t))
127                 signal_wake_up(t, 0);
128 }
129
130 void recalc_sigpending(void)
131 {
132         if (!recalc_sigpending_tsk(current) && !freezing(current))
133                 clear_thread_flag(TIF_SIGPENDING);
134
135 }
136
137 /* Given the mask, find the first available signal that should be serviced. */
138
139 int next_signal(struct sigpending *pending, sigset_t *mask)
140 {
141         unsigned long i, *s, *m, x;
142         int sig = 0;
143         
144         s = pending->signal.sig;
145         m = mask->sig;
146         switch (_NSIG_WORDS) {
147         default:
148                 for (i = 0; i < _NSIG_WORDS; ++i, ++s, ++m)
149                         if ((x = *s &~ *m) != 0) {
150                                 sig = ffz(~x) + i*_NSIG_BPW + 1;
151                                 break;
152                         }
153                 break;
154
155         case 2: if ((x = s[0] &~ m[0]) != 0)
156                         sig = 1;
157                 else if ((x = s[1] &~ m[1]) != 0)
158                         sig = _NSIG_BPW + 1;
159                 else
160                         break;
161                 sig += ffz(~x);
162                 break;
163
164         case 1: if ((x = *s &~ *m) != 0)
165                         sig = ffz(~x) + 1;
166                 break;
167         }
168         
169         return sig;
170 }
171
172 static struct sigqueue *__sigqueue_alloc(struct task_struct *t, gfp_t flags,
173                                          int override_rlimit)
174 {
175         struct sigqueue *q = NULL;
176         struct user_struct *user;
177
178         /*
179          * In order to avoid problems with "switch_user()", we want to make
180          * sure that the compiler doesn't re-load "t->user"
181          */
182         user = t->user;
183         barrier();
184         atomic_inc(&user->sigpending);
185         if (override_rlimit ||
186             atomic_read(&user->sigpending) <=
187                         t->signal->rlim[RLIMIT_SIGPENDING].rlim_cur)
188                 q = kmem_cache_alloc(sigqueue_cachep, flags);
189         if (unlikely(q == NULL)) {
190                 atomic_dec(&user->sigpending);
191         } else {
192                 INIT_LIST_HEAD(&q->list);
193                 q->flags = 0;
194                 q->user = get_uid(user);
195         }
196         return(q);
197 }
198
199 static void __sigqueue_free(struct sigqueue *q)
200 {
201         if (q->flags & SIGQUEUE_PREALLOC)
202                 return;
203         atomic_dec(&q->user->sigpending);
204         free_uid(q->user);
205         kmem_cache_free(sigqueue_cachep, q);
206 }
207
208 void flush_sigqueue(struct sigpending *queue)
209 {
210         struct sigqueue *q;
211
212         sigemptyset(&queue->signal);
213         while (!list_empty(&queue->list)) {
214                 q = list_entry(queue->list.next, struct sigqueue , list);
215                 list_del_init(&q->list);
216                 __sigqueue_free(q);
217         }
218 }
219
220 /*
221  * Flush all pending signals for a task.
222  */
223 void flush_signals(struct task_struct *t)
224 {
225         unsigned long flags;
226
227         spin_lock_irqsave(&t->sighand->siglock, flags);
228         clear_tsk_thread_flag(t, TIF_SIGPENDING);
229         flush_sigqueue(&t->pending);
230         flush_sigqueue(&t->signal->shared_pending);
231         spin_unlock_irqrestore(&t->sighand->siglock, flags);
232 }
233
234 void ignore_signals(struct task_struct *t)
235 {
236         int i;
237
238         for (i = 0; i < _NSIG; ++i)
239                 t->sighand->action[i].sa.sa_handler = SIG_IGN;
240
241         flush_signals(t);
242 }
243
244 /*
245  * Flush all handlers for a task.
246  */
247
248 void
249 flush_signal_handlers(struct task_struct *t, int force_default)
250 {
251         int i;
252         struct k_sigaction *ka = &t->sighand->action[0];
253         for (i = _NSIG ; i != 0 ; i--) {
254                 if (force_default || ka->sa.sa_handler != SIG_IGN)
255                         ka->sa.sa_handler = SIG_DFL;
256                 ka->sa.sa_flags = 0;
257                 sigemptyset(&ka->sa.sa_mask);
258                 ka++;
259         }
260 }
261
262 int unhandled_signal(struct task_struct *tsk, int sig)
263 {
264         if (is_global_init(tsk))
265                 return 1;
266         if (tsk->ptrace & PT_PTRACED)
267                 return 0;
268         return (tsk->sighand->action[sig-1].sa.sa_handler == SIG_IGN) ||
269                 (tsk->sighand->action[sig-1].sa.sa_handler == SIG_DFL);
270 }
271
272
273 /* Notify the system that a driver wants to block all signals for this
274  * process, and wants to be notified if any signals at all were to be
275  * sent/acted upon.  If the notifier routine returns non-zero, then the
276  * signal will be acted upon after all.  If the notifier routine returns 0,
277  * then then signal will be blocked.  Only one block per process is
278  * allowed.  priv is a pointer to private data that the notifier routine
279  * can use to determine if the signal should be blocked or not.  */
280
281 void
282 block_all_signals(int (*notifier)(void *priv), void *priv, sigset_t *mask)
283 {
284         unsigned long flags;
285
286         spin_lock_irqsave(&current->sighand->siglock, flags);
287         current->notifier_mask = mask;
288         current->notifier_data = priv;
289         current->notifier = notifier;
290         spin_unlock_irqrestore(&current->sighand->siglock, flags);
291 }
292
293 /* Notify the system that blocking has ended. */
294
295 void
296 unblock_all_signals(void)
297 {
298         unsigned long flags;
299
300         spin_lock_irqsave(&current->sighand->siglock, flags);
301         current->notifier = NULL;
302         current->notifier_data = NULL;
303         recalc_sigpending();
304         spin_unlock_irqrestore(&current->sighand->siglock, flags);
305 }
306
307 static int collect_signal(int sig, struct sigpending *list, siginfo_t *info)
308 {
309         struct sigqueue *q, *first = NULL;
310         int still_pending = 0;
311
312         if (unlikely(!sigismember(&list->signal, sig)))
313                 return 0;
314
315         /*
316          * Collect the siginfo appropriate to this signal.  Check if
317          * there is another siginfo for the same signal.
318         */
319         list_for_each_entry(q, &list->list, list) {
320                 if (q->info.si_signo == sig) {
321                         if (first) {
322                                 still_pending = 1;
323                                 break;
324                         }
325                         first = q;
326                 }
327         }
328         if (first) {
329                 list_del_init(&first->list);
330                 copy_siginfo(info, &first->info);
331                 __sigqueue_free(first);
332                 if (!still_pending)
333                         sigdelset(&list->signal, sig);
334         } else {
335
336                 /* Ok, it wasn't in the queue.  This must be
337                    a fast-pathed signal or we must have been
338                    out of queue space.  So zero out the info.
339                  */
340                 sigdelset(&list->signal, sig);
341                 info->si_signo = sig;
342                 info->si_errno = 0;
343                 info->si_code = 0;
344                 info->si_pid = 0;
345                 info->si_uid = 0;
346         }
347         return 1;
348 }
349
350 static int __dequeue_signal(struct sigpending *pending, sigset_t *mask,
351                         siginfo_t *info)
352 {
353         int sig = next_signal(pending, mask);
354
355         if (sig) {
356                 if (current->notifier) {
357                         if (sigismember(current->notifier_mask, sig)) {
358                                 if (!(current->notifier)(current->notifier_data)) {
359                                         clear_thread_flag(TIF_SIGPENDING);
360                                         return 0;
361                                 }
362                         }
363                 }
364
365                 if (!collect_signal(sig, pending, info))
366                         sig = 0;
367         }
368
369         return sig;
370 }
371
372 /*
373  * Dequeue a signal and return the element to the caller, which is 
374  * expected to free it.
375  *
376  * All callers have to hold the siglock.
377  */
378 int dequeue_signal(struct task_struct *tsk, sigset_t *mask, siginfo_t *info)
379 {
380         int signr;
381
382         /* We only dequeue private signals from ourselves, we don't let
383          * signalfd steal them
384          */
385         signr = __dequeue_signal(&tsk->pending, mask, info);
386         if (!signr) {
387                 signr = __dequeue_signal(&tsk->signal->shared_pending,
388                                          mask, info);
389                 /*
390                  * itimer signal ?
391                  *
392                  * itimers are process shared and we restart periodic
393                  * itimers in the signal delivery path to prevent DoS
394                  * attacks in the high resolution timer case. This is
395                  * compliant with the old way of self restarting
396                  * itimers, as the SIGALRM is a legacy signal and only
397                  * queued once. Changing the restart behaviour to
398                  * restart the timer in the signal dequeue path is
399                  * reducing the timer noise on heavy loaded !highres
400                  * systems too.
401                  */
402                 if (unlikely(signr == SIGALRM)) {
403                         struct hrtimer *tmr = &tsk->signal->real_timer;
404
405                         if (!hrtimer_is_queued(tmr) &&
406                             tsk->signal->it_real_incr.tv64 != 0) {
407                                 hrtimer_forward(tmr, tmr->base->get_time(),
408                                                 tsk->signal->it_real_incr);
409                                 hrtimer_restart(tmr);
410                         }
411                 }
412         }
413
414         recalc_sigpending();
415         if (!signr)
416                 return 0;
417
418         if (unlikely(sig_kernel_stop(signr))) {
419                 /*
420                  * Set a marker that we have dequeued a stop signal.  Our
421                  * caller might release the siglock and then the pending
422                  * stop signal it is about to process is no longer in the
423                  * pending bitmasks, but must still be cleared by a SIGCONT
424                  * (and overruled by a SIGKILL).  So those cases clear this
425                  * shared flag after we've set it.  Note that this flag may
426                  * remain set after the signal we return is ignored or
427                  * handled.  That doesn't matter because its only purpose
428                  * is to alert stop-signal processing code when another
429                  * processor has come along and cleared the flag.
430                  */
431                 if (!(tsk->signal->flags & SIGNAL_GROUP_EXIT))
432                         tsk->signal->flags |= SIGNAL_STOP_DEQUEUED;
433         }
434         if ((info->si_code & __SI_MASK) == __SI_TIMER && info->si_sys_private) {
435                 /*
436                  * Release the siglock to ensure proper locking order
437                  * of timer locks outside of siglocks.  Note, we leave
438                  * irqs disabled here, since the posix-timers code is
439                  * about to disable them again anyway.
440                  */
441                 spin_unlock(&tsk->sighand->siglock);
442                 do_schedule_next_timer(info);
443                 spin_lock(&tsk->sighand->siglock);
444         }
445         return signr;
446 }
447
448 /*
449  * Tell a process that it has a new active signal..
450  *
451  * NOTE! we rely on the previous spin_lock to
452  * lock interrupts for us! We can only be called with
453  * "siglock" held, and the local interrupt must
454  * have been disabled when that got acquired!
455  *
456  * No need to set need_resched since signal event passing
457  * goes through ->blocked
458  */
459 void signal_wake_up(struct task_struct *t, int resume)
460 {
461         unsigned int mask;
462
463         set_tsk_thread_flag(t, TIF_SIGPENDING);
464
465         /*
466          * For SIGKILL, we want to wake it up in the stopped/traced/killable
467          * case. We don't check t->state here because there is a race with it
468          * executing another processor and just now entering stopped state.
469          * By using wake_up_state, we ensure the process will wake up and
470          * handle its death signal.
471          */
472         mask = TASK_INTERRUPTIBLE;
473         if (resume)
474                 mask |= TASK_WAKEKILL;
475         if (!wake_up_state(t, mask))
476                 kick_process(t);
477 }
478
479 /*
480  * Remove signals in mask from the pending set and queue.
481  * Returns 1 if any signals were found.
482  *
483  * All callers must be holding the siglock.
484  *
485  * This version takes a sigset mask and looks at all signals,
486  * not just those in the first mask word.
487  */
488 static int rm_from_queue_full(sigset_t *mask, struct sigpending *s)
489 {
490         struct sigqueue *q, *n;
491         sigset_t m;
492
493         sigandsets(&m, mask, &s->signal);
494         if (sigisemptyset(&m))
495                 return 0;
496
497         signandsets(&s->signal, &s->signal, mask);
498         list_for_each_entry_safe(q, n, &s->list, list) {
499                 if (sigismember(mask, q->info.si_signo)) {
500                         list_del_init(&q->list);
501                         __sigqueue_free(q);
502                 }
503         }
504         return 1;
505 }
506 /*
507  * Remove signals in mask from the pending set and queue.
508  * Returns 1 if any signals were found.
509  *
510  * All callers must be holding the siglock.
511  */
512 static int rm_from_queue(unsigned long mask, struct sigpending *s)
513 {
514         struct sigqueue *q, *n;
515
516         if (!sigtestsetmask(&s->signal, mask))
517                 return 0;
518
519         sigdelsetmask(&s->signal, mask);
520         list_for_each_entry_safe(q, n, &s->list, list) {
521                 if (q->info.si_signo < SIGRTMIN &&
522                     (mask & sigmask(q->info.si_signo))) {
523                         list_del_init(&q->list);
524                         __sigqueue_free(q);
525                 }
526         }
527         return 1;
528 }
529
530 /*
531  * Bad permissions for sending the signal
532  */
533 static int check_kill_permission(int sig, struct siginfo *info,
534                                  struct task_struct *t)
535 {
536         struct pid *sid;
537         int error;
538
539         if (!valid_signal(sig))
540                 return -EINVAL;
541
542         if (info != SEND_SIG_NOINFO && (is_si_special(info) || SI_FROMKERNEL(info)))
543                 return 0;
544
545         error = audit_signal_info(sig, t); /* Let audit system see the signal */
546         if (error)
547                 return error;
548
549         if ((current->euid ^ t->suid) && (current->euid ^ t->uid) &&
550             (current->uid  ^ t->suid) && (current->uid  ^ t->uid) &&
551             !capable(CAP_KILL)) {
552                 switch (sig) {
553                 case SIGCONT:
554                         sid = task_session(t);
555                         /*
556                          * We don't return the error if sid == NULL. The
557                          * task was unhashed, the caller must notice this.
558                          */
559                         if (!sid || sid == task_session(current))
560                                 break;
561                 default:
562                         return -EPERM;
563                 }
564         }
565
566         return security_task_kill(t, info, sig, 0);
567 }
568
569 /* forward decl */
570 static void do_notify_parent_cldstop(struct task_struct *tsk, int why);
571
572 /*
573  * Handle magic process-wide effects of stop/continue signals. Unlike
574  * the signal actions, these happen immediately at signal-generation
575  * time regardless of blocking, ignoring, or handling.  This does the
576  * actual continuing for SIGCONT, but not the actual stopping for stop
577  * signals. The process stop is done as a signal action for SIG_DFL.
578  *
579  * Returns true if the signal should be actually delivered, otherwise
580  * it should be dropped.
581  */
582 static int prepare_signal(int sig, struct task_struct *p)
583 {
584         struct signal_struct *signal = p->signal;
585         struct task_struct *t;
586
587         if (unlikely(signal->flags & SIGNAL_GROUP_EXIT)) {
588                 /*
589                  * The process is in the middle of dying, nothing to do.
590                  */
591         } else if (sig_kernel_stop(sig)) {
592                 /*
593                  * This is a stop signal.  Remove SIGCONT from all queues.
594                  */
595                 rm_from_queue(sigmask(SIGCONT), &signal->shared_pending);
596                 t = p;
597                 do {
598                         rm_from_queue(sigmask(SIGCONT), &t->pending);
599                 } while_each_thread(p, t);
600         } else if (sig == SIGCONT) {
601                 unsigned int why;
602                 /*
603                  * Remove all stop signals from all queues,
604                  * and wake all threads.
605                  */
606                 rm_from_queue(SIG_KERNEL_STOP_MASK, &signal->shared_pending);
607                 t = p;
608                 do {
609                         unsigned int state;
610                         rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
611                         /*
612                          * If there is a handler for SIGCONT, we must make
613                          * sure that no thread returns to user mode before
614                          * we post the signal, in case it was the only
615                          * thread eligible to run the signal handler--then
616                          * it must not do anything between resuming and
617                          * running the handler.  With the TIF_SIGPENDING
618                          * flag set, the thread will pause and acquire the
619                          * siglock that we hold now and until we've queued
620                          * the pending signal.
621                          *
622                          * Wake up the stopped thread _after_ setting
623                          * TIF_SIGPENDING
624                          */
625                         state = __TASK_STOPPED;
626                         if (sig_user_defined(t, SIGCONT) && !sigismember(&t->blocked, SIGCONT)) {
627                                 set_tsk_thread_flag(t, TIF_SIGPENDING);
628                                 state |= TASK_INTERRUPTIBLE;
629                         }
630                         wake_up_state(t, state);
631                 } while_each_thread(p, t);
632
633                 /*
634                  * Notify the parent with CLD_CONTINUED if we were stopped.
635                  *
636                  * If we were in the middle of a group stop, we pretend it
637                  * was already finished, and then continued. Since SIGCHLD
638                  * doesn't queue we report only CLD_STOPPED, as if the next
639                  * CLD_CONTINUED was dropped.
640                  */
641                 why = 0;
642                 if (signal->flags & SIGNAL_STOP_STOPPED)
643                         why |= SIGNAL_CLD_CONTINUED;
644                 else if (signal->group_stop_count)
645                         why |= SIGNAL_CLD_STOPPED;
646
647                 if (why) {
648                         /*
649                          * The first thread which returns from finish_stop()
650                          * will take ->siglock, notice SIGNAL_CLD_MASK, and
651                          * notify its parent. See get_signal_to_deliver().
652                          */
653                         signal->flags = why | SIGNAL_STOP_CONTINUED;
654                         signal->group_stop_count = 0;
655                         signal->group_exit_code = 0;
656                 } else {
657                         /*
658                          * We are not stopped, but there could be a stop
659                          * signal in the middle of being processed after
660                          * being removed from the queue.  Clear that too.
661                          */
662                         signal->flags &= ~SIGNAL_STOP_DEQUEUED;
663                 }
664         }
665
666         return !sig_ignored(p, sig);
667 }
668
669 /*
670  * Test if P wants to take SIG.  After we've checked all threads with this,
671  * it's equivalent to finding no threads not blocking SIG.  Any threads not
672  * blocking SIG were ruled out because they are not running and already
673  * have pending signals.  Such threads will dequeue from the shared queue
674  * as soon as they're available, so putting the signal on the shared queue
675  * will be equivalent to sending it to one such thread.
676  */
677 static inline int wants_signal(int sig, struct task_struct *p)
678 {
679         if (sigismember(&p->blocked, sig))
680                 return 0;
681         if (p->flags & PF_EXITING)
682                 return 0;
683         if (sig == SIGKILL)
684                 return 1;
685         if (task_is_stopped_or_traced(p))
686                 return 0;
687         return task_curr(p) || !signal_pending(p);
688 }
689
690 static void complete_signal(int sig, struct task_struct *p, int group)
691 {
692         struct signal_struct *signal = p->signal;
693         struct task_struct *t;
694
695         /*
696          * Now find a thread we can wake up to take the signal off the queue.
697          *
698          * If the main thread wants the signal, it gets first crack.
699          * Probably the least surprising to the average bear.
700          */
701         if (wants_signal(sig, p))
702                 t = p;
703         else if (!group || thread_group_empty(p))
704                 /*
705                  * There is just one thread and it does not need to be woken.
706                  * It will dequeue unblocked signals before it runs again.
707                  */
708                 return;
709         else {
710                 /*
711                  * Otherwise try to find a suitable thread.
712                  */
713                 t = signal->curr_target;
714                 while (!wants_signal(sig, t)) {
715                         t = next_thread(t);
716                         if (t == signal->curr_target)
717                                 /*
718                                  * No thread needs to be woken.
719                                  * Any eligible threads will see
720                                  * the signal in the queue soon.
721                                  */
722                                 return;
723                 }
724                 signal->curr_target = t;
725         }
726
727         /*
728          * Found a killable thread.  If the signal will be fatal,
729          * then start taking the whole group down immediately.
730          */
731         if (sig_fatal(p, sig) &&
732             !(signal->flags & (SIGNAL_UNKILLABLE | SIGNAL_GROUP_EXIT)) &&
733             !sigismember(&t->real_blocked, sig) &&
734             (sig == SIGKILL || !(t->ptrace & PT_PTRACED))) {
735                 /*
736                  * This signal will be fatal to the whole group.
737                  */
738                 if (!sig_kernel_coredump(sig)) {
739                         /*
740                          * Start a group exit and wake everybody up.
741                          * This way we don't have other threads
742                          * running and doing things after a slower
743                          * thread has the fatal signal pending.
744                          */
745                         signal->flags = SIGNAL_GROUP_EXIT;
746                         signal->group_exit_code = sig;
747                         signal->group_stop_count = 0;
748                         t = p;
749                         do {
750                                 sigaddset(&t->pending.signal, SIGKILL);
751                                 signal_wake_up(t, 1);
752                         } while_each_thread(p, t);
753                         return;
754                 }
755         }
756
757         /*
758          * The signal is already in the shared-pending queue.
759          * Tell the chosen thread to wake up and dequeue it.
760          */
761         signal_wake_up(t, sig == SIGKILL);
762         return;
763 }
764
765 static inline int legacy_queue(struct sigpending *signals, int sig)
766 {
767         return (sig < SIGRTMIN) && sigismember(&signals->signal, sig);
768 }
769
770 static int send_signal(int sig, struct siginfo *info, struct task_struct *t,
771                         int group)
772 {
773         struct sigpending *pending;
774         struct sigqueue *q;
775
776         assert_spin_locked(&t->sighand->siglock);
777         if (!prepare_signal(sig, t))
778                 return 0;
779
780         pending = group ? &t->signal->shared_pending : &t->pending;
781         /*
782          * Short-circuit ignored signals and support queuing
783          * exactly one non-rt signal, so that we can get more
784          * detailed information about the cause of the signal.
785          */
786         if (legacy_queue(pending, sig))
787                 return 0;
788         /*
789          * fast-pathed signals for kernel-internal things like SIGSTOP
790          * or SIGKILL.
791          */
792         if (info == SEND_SIG_FORCED)
793                 goto out_set;
794
795         /* Real-time signals must be queued if sent by sigqueue, or
796            some other real-time mechanism.  It is implementation
797            defined whether kill() does so.  We attempt to do so, on
798            the principle of least surprise, but since kill is not
799            allowed to fail with EAGAIN when low on memory we just
800            make sure at least one signal gets delivered and don't
801            pass on the info struct.  */
802
803         q = __sigqueue_alloc(t, GFP_ATOMIC, (sig < SIGRTMIN &&
804                                              (is_si_special(info) ||
805                                               info->si_code >= 0)));
806         if (q) {
807                 list_add_tail(&q->list, &pending->list);
808                 switch ((unsigned long) info) {
809                 case (unsigned long) SEND_SIG_NOINFO:
810                         q->info.si_signo = sig;
811                         q->info.si_errno = 0;
812                         q->info.si_code = SI_USER;
813                         q->info.si_pid = task_pid_vnr(current);
814                         q->info.si_uid = current->uid;
815                         break;
816                 case (unsigned long) SEND_SIG_PRIV:
817                         q->info.si_signo = sig;
818                         q->info.si_errno = 0;
819                         q->info.si_code = SI_KERNEL;
820                         q->info.si_pid = 0;
821                         q->info.si_uid = 0;
822                         break;
823                 default:
824                         copy_siginfo(&q->info, info);
825                         break;
826                 }
827         } else if (!is_si_special(info)) {
828                 if (sig >= SIGRTMIN && info->si_code != SI_USER)
829                 /*
830                  * Queue overflow, abort.  We may abort if the signal was rt
831                  * and sent by user using something other than kill().
832                  */
833                         return -EAGAIN;
834         }
835
836 out_set:
837         signalfd_notify(t, sig);
838         sigaddset(&pending->signal, sig);
839         complete_signal(sig, t, group);
840         return 0;
841 }
842
843 int print_fatal_signals;
844
845 static void print_fatal_signal(struct pt_regs *regs, int signr)
846 {
847         printk("%s/%d: potentially unexpected fatal signal %d.\n",
848                 current->comm, task_pid_nr(current), signr);
849
850 #if defined(__i386__) && !defined(__arch_um__)
851         printk("code at %08lx: ", regs->ip);
852         {
853                 int i;
854                 for (i = 0; i < 16; i++) {
855                         unsigned char insn;
856
857                         __get_user(insn, (unsigned char *)(regs->ip + i));
858                         printk("%02x ", insn);
859                 }
860         }
861 #endif
862         printk("\n");
863         show_regs(regs);
864 }
865
866 static int __init setup_print_fatal_signals(char *str)
867 {
868         get_option (&str, &print_fatal_signals);
869
870         return 1;
871 }
872
873 __setup("print-fatal-signals=", setup_print_fatal_signals);
874
875 int
876 __group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
877 {
878         return send_signal(sig, info, p, 1);
879 }
880
881 static int
882 specific_send_sig_info(int sig, struct siginfo *info, struct task_struct *t)
883 {
884         return send_signal(sig, info, t, 0);
885 }
886
887 /*
888  * Force a signal that the process can't ignore: if necessary
889  * we unblock the signal and change any SIG_IGN to SIG_DFL.
890  *
891  * Note: If we unblock the signal, we always reset it to SIG_DFL,
892  * since we do not want to have a signal handler that was blocked
893  * be invoked when user space had explicitly blocked it.
894  *
895  * We don't want to have recursive SIGSEGV's etc, for example,
896  * that is why we also clear SIGNAL_UNKILLABLE.
897  */
898 int
899 force_sig_info(int sig, struct siginfo *info, struct task_struct *t)
900 {
901         unsigned long int flags;
902         int ret, blocked, ignored;
903         struct k_sigaction *action;
904
905         spin_lock_irqsave(&t->sighand->siglock, flags);
906         action = &t->sighand->action[sig-1];
907         ignored = action->sa.sa_handler == SIG_IGN;
908         blocked = sigismember(&t->blocked, sig);
909         if (blocked || ignored) {
910                 action->sa.sa_handler = SIG_DFL;
911                 if (blocked) {
912                         sigdelset(&t->blocked, sig);
913                         recalc_sigpending_and_wake(t);
914                 }
915         }
916         if (action->sa.sa_handler == SIG_DFL)
917                 t->signal->flags &= ~SIGNAL_UNKILLABLE;
918         ret = specific_send_sig_info(sig, info, t);
919         spin_unlock_irqrestore(&t->sighand->siglock, flags);
920
921         return ret;
922 }
923
924 void
925 force_sig_specific(int sig, struct task_struct *t)
926 {
927         force_sig_info(sig, SEND_SIG_FORCED, t);
928 }
929
930 /*
931  * Nuke all other threads in the group.
932  */
933 void zap_other_threads(struct task_struct *p)
934 {
935         struct task_struct *t;
936
937         p->signal->group_stop_count = 0;
938
939         for (t = next_thread(p); t != p; t = next_thread(t)) {
940                 /*
941                  * Don't bother with already dead threads
942                  */
943                 if (t->exit_state)
944                         continue;
945
946                 /* SIGKILL will be handled before any pending SIGSTOP */
947                 sigaddset(&t->pending.signal, SIGKILL);
948                 signal_wake_up(t, 1);
949         }
950 }
951
952 int __fatal_signal_pending(struct task_struct *tsk)
953 {
954         return sigismember(&tsk->pending.signal, SIGKILL);
955 }
956 EXPORT_SYMBOL(__fatal_signal_pending);
957
958 struct sighand_struct *lock_task_sighand(struct task_struct *tsk, unsigned long *flags)
959 {
960         struct sighand_struct *sighand;
961
962         rcu_read_lock();
963         for (;;) {
964                 sighand = rcu_dereference(tsk->sighand);
965                 if (unlikely(sighand == NULL))
966                         break;
967
968                 spin_lock_irqsave(&sighand->siglock, *flags);
969                 if (likely(sighand == tsk->sighand))
970                         break;
971                 spin_unlock_irqrestore(&sighand->siglock, *flags);
972         }
973         rcu_read_unlock();
974
975         return sighand;
976 }
977
978 int group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
979 {
980         unsigned long flags;
981         int ret;
982
983         ret = check_kill_permission(sig, info, p);
984
985         if (!ret && sig) {
986                 ret = -ESRCH;
987                 if (lock_task_sighand(p, &flags)) {
988                         ret = __group_send_sig_info(sig, info, p);
989                         unlock_task_sighand(p, &flags);
990                 }
991         }
992
993         return ret;
994 }
995
996 /*
997  * __kill_pgrp_info() sends a signal to a process group: this is what the tty
998  * control characters do (^C, ^Z etc)
999  */
1000
1001 int __kill_pgrp_info(int sig, struct siginfo *info, struct pid *pgrp)
1002 {
1003         struct task_struct *p = NULL;
1004         int retval, success;
1005
1006         success = 0;
1007         retval = -ESRCH;
1008         do_each_pid_task(pgrp, PIDTYPE_PGID, p) {
1009                 int err = group_send_sig_info(sig, info, p);
1010                 success |= !err;
1011                 retval = err;
1012         } while_each_pid_task(pgrp, PIDTYPE_PGID, p);
1013         return success ? 0 : retval;
1014 }
1015
1016 int kill_pid_info(int sig, struct siginfo *info, struct pid *pid)
1017 {
1018         int error = -ESRCH;
1019         struct task_struct *p;
1020
1021         rcu_read_lock();
1022 retry:
1023         p = pid_task(pid, PIDTYPE_PID);
1024         if (p) {
1025                 error = group_send_sig_info(sig, info, p);
1026                 if (unlikely(error == -ESRCH))
1027                         /*
1028                          * The task was unhashed in between, try again.
1029                          * If it is dead, pid_task() will return NULL,
1030                          * if we race with de_thread() it will find the
1031                          * new leader.
1032                          */
1033                         goto retry;
1034         }
1035         rcu_read_unlock();
1036
1037         return error;
1038 }
1039
1040 int
1041 kill_proc_info(int sig, struct siginfo *info, pid_t pid)
1042 {
1043         int error;
1044         rcu_read_lock();
1045         error = kill_pid_info(sig, info, find_vpid(pid));
1046         rcu_read_unlock();
1047         return error;
1048 }
1049
1050 /* like kill_pid_info(), but doesn't use uid/euid of "current" */
1051 int kill_pid_info_as_uid(int sig, struct siginfo *info, struct pid *pid,
1052                       uid_t uid, uid_t euid, u32 secid)
1053 {
1054         int ret = -EINVAL;
1055         struct task_struct *p;
1056
1057         if (!valid_signal(sig))
1058                 return ret;
1059
1060         read_lock(&tasklist_lock);
1061         p = pid_task(pid, PIDTYPE_PID);
1062         if (!p) {
1063                 ret = -ESRCH;
1064                 goto out_unlock;
1065         }
1066         if ((info == SEND_SIG_NOINFO || (!is_si_special(info) && SI_FROMUSER(info)))
1067             && (euid != p->suid) && (euid != p->uid)
1068             && (uid != p->suid) && (uid != p->uid)) {
1069                 ret = -EPERM;
1070                 goto out_unlock;
1071         }
1072         ret = security_task_kill(p, info, sig, secid);
1073         if (ret)
1074                 goto out_unlock;
1075         if (sig && p->sighand) {
1076                 unsigned long flags;
1077                 spin_lock_irqsave(&p->sighand->siglock, flags);
1078                 ret = __group_send_sig_info(sig, info, p);
1079                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1080         }
1081 out_unlock:
1082         read_unlock(&tasklist_lock);
1083         return ret;
1084 }
1085 EXPORT_SYMBOL_GPL(kill_pid_info_as_uid);
1086
1087 /*
1088  * kill_something_info() interprets pid in interesting ways just like kill(2).
1089  *
1090  * POSIX specifies that kill(-1,sig) is unspecified, but what we have
1091  * is probably wrong.  Should make it like BSD or SYSV.
1092  */
1093
1094 static int kill_something_info(int sig, struct siginfo *info, int pid)
1095 {
1096         int ret;
1097
1098         if (pid > 0) {
1099                 rcu_read_lock();
1100                 ret = kill_pid_info(sig, info, find_vpid(pid));
1101                 rcu_read_unlock();
1102                 return ret;
1103         }
1104
1105         read_lock(&tasklist_lock);
1106         if (pid != -1) {
1107                 ret = __kill_pgrp_info(sig, info,
1108                                 pid ? find_vpid(-pid) : task_pgrp(current));
1109         } else {
1110                 int retval = 0, count = 0;
1111                 struct task_struct * p;
1112
1113                 for_each_process(p) {
1114                         if (p->pid > 1 && !same_thread_group(p, current)) {
1115                                 int err = group_send_sig_info(sig, info, p);
1116                                 ++count;
1117                                 if (err != -EPERM)
1118                                         retval = err;
1119                         }
1120                 }
1121                 ret = count ? retval : -ESRCH;
1122         }
1123         read_unlock(&tasklist_lock);
1124
1125         return ret;
1126 }
1127
1128 /*
1129  * These are for backward compatibility with the rest of the kernel source.
1130  */
1131
1132 /*
1133  * The caller must ensure the task can't exit.
1134  */
1135 int
1136 send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1137 {
1138         int ret;
1139         unsigned long flags;
1140
1141         /*
1142          * Make sure legacy kernel users don't send in bad values
1143          * (normal paths check this in check_kill_permission).
1144          */
1145         if (!valid_signal(sig))
1146                 return -EINVAL;
1147
1148         spin_lock_irqsave(&p->sighand->siglock, flags);
1149         ret = specific_send_sig_info(sig, info, p);
1150         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1151         return ret;
1152 }
1153
1154 #define __si_special(priv) \
1155         ((priv) ? SEND_SIG_PRIV : SEND_SIG_NOINFO)
1156
1157 int
1158 send_sig(int sig, struct task_struct *p, int priv)
1159 {
1160         return send_sig_info(sig, __si_special(priv), p);
1161 }
1162
1163 void
1164 force_sig(int sig, struct task_struct *p)
1165 {
1166         force_sig_info(sig, SEND_SIG_PRIV, p);
1167 }
1168
1169 /*
1170  * When things go south during signal handling, we
1171  * will force a SIGSEGV. And if the signal that caused
1172  * the problem was already a SIGSEGV, we'll want to
1173  * make sure we don't even try to deliver the signal..
1174  */
1175 int
1176 force_sigsegv(int sig, struct task_struct *p)
1177 {
1178         if (sig == SIGSEGV) {
1179                 unsigned long flags;
1180                 spin_lock_irqsave(&p->sighand->siglock, flags);
1181                 p->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
1182                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1183         }
1184         force_sig(SIGSEGV, p);
1185         return 0;
1186 }
1187
1188 int kill_pgrp(struct pid *pid, int sig, int priv)
1189 {
1190         int ret;
1191
1192         read_lock(&tasklist_lock);
1193         ret = __kill_pgrp_info(sig, __si_special(priv), pid);
1194         read_unlock(&tasklist_lock);
1195
1196         return ret;
1197 }
1198 EXPORT_SYMBOL(kill_pgrp);
1199
1200 int kill_pid(struct pid *pid, int sig, int priv)
1201 {
1202         return kill_pid_info(sig, __si_special(priv), pid);
1203 }
1204 EXPORT_SYMBOL(kill_pid);
1205
1206 int
1207 kill_proc(pid_t pid, int sig, int priv)
1208 {
1209         int ret;
1210
1211         rcu_read_lock();
1212         ret = kill_pid_info(sig, __si_special(priv), find_pid(pid));
1213         rcu_read_unlock();
1214         return ret;
1215 }
1216
1217 /*
1218  * These functions support sending signals using preallocated sigqueue
1219  * structures.  This is needed "because realtime applications cannot
1220  * afford to lose notifications of asynchronous events, like timer
1221  * expirations or I/O completions".  In the case of Posix Timers 
1222  * we allocate the sigqueue structure from the timer_create.  If this
1223  * allocation fails we are able to report the failure to the application
1224  * with an EAGAIN error.
1225  */
1226  
1227 struct sigqueue *sigqueue_alloc(void)
1228 {
1229         struct sigqueue *q;
1230
1231         if ((q = __sigqueue_alloc(current, GFP_KERNEL, 0)))
1232                 q->flags |= SIGQUEUE_PREALLOC;
1233         return(q);
1234 }
1235
1236 void sigqueue_free(struct sigqueue *q)
1237 {
1238         unsigned long flags;
1239         spinlock_t *lock = &current->sighand->siglock;
1240
1241         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1242         /*
1243          * If the signal is still pending remove it from the
1244          * pending queue. We must hold ->siglock while testing
1245          * q->list to serialize with collect_signal().
1246          */
1247         spin_lock_irqsave(lock, flags);
1248         if (!list_empty(&q->list))
1249                 list_del_init(&q->list);
1250         spin_unlock_irqrestore(lock, flags);
1251
1252         q->flags &= ~SIGQUEUE_PREALLOC;
1253         __sigqueue_free(q);
1254 }
1255
1256 int send_sigqueue(struct sigqueue *q, struct task_struct *t, int group)
1257 {
1258         int sig = q->info.si_signo;
1259         struct sigpending *pending;
1260         unsigned long flags;
1261         int ret;
1262
1263         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1264
1265         ret = -1;
1266         if (!likely(lock_task_sighand(t, &flags)))
1267                 goto ret;
1268
1269         ret = 1; /* the signal is ignored */
1270         if (!prepare_signal(sig, t))
1271                 goto out;
1272
1273         ret = 0;
1274         if (unlikely(!list_empty(&q->list))) {
1275                 /*
1276                  * If an SI_TIMER entry is already queue just increment
1277                  * the overrun count.
1278                  */
1279                 BUG_ON(q->info.si_code != SI_TIMER);
1280                 q->info.si_overrun++;
1281                 goto out;
1282         }
1283         q->info.si_overrun = 0;
1284
1285         signalfd_notify(t, sig);
1286         pending = group ? &t->signal->shared_pending : &t->pending;
1287         list_add_tail(&q->list, &pending->list);
1288         sigaddset(&pending->signal, sig);
1289         complete_signal(sig, t, group);
1290 out:
1291         unlock_task_sighand(t, &flags);
1292 ret:
1293         return ret;
1294 }
1295
1296 /*
1297  * Wake up any threads in the parent blocked in wait* syscalls.
1298  */
1299 static inline void __wake_up_parent(struct task_struct *p,
1300                                     struct task_struct *parent)
1301 {
1302         wake_up_interruptible_sync(&parent->signal->wait_chldexit);
1303 }
1304
1305 /*
1306  * Let a parent know about the death of a child.
1307  * For a stopped/continued status change, use do_notify_parent_cldstop instead.
1308  */
1309
1310 void do_notify_parent(struct task_struct *tsk, int sig)
1311 {
1312         struct siginfo info;
1313         unsigned long flags;
1314         struct sighand_struct *psig;
1315
1316         BUG_ON(sig == -1);
1317
1318         /* do_notify_parent_cldstop should have been called instead.  */
1319         BUG_ON(task_is_stopped_or_traced(tsk));
1320
1321         BUG_ON(!tsk->ptrace &&
1322                (tsk->group_leader != tsk || !thread_group_empty(tsk)));
1323
1324         info.si_signo = sig;
1325         info.si_errno = 0;
1326         /*
1327          * we are under tasklist_lock here so our parent is tied to
1328          * us and cannot exit and release its namespace.
1329          *
1330          * the only it can is to switch its nsproxy with sys_unshare,
1331          * bu uncharing pid namespaces is not allowed, so we'll always
1332          * see relevant namespace
1333          *
1334          * write_lock() currently calls preempt_disable() which is the
1335          * same as rcu_read_lock(), but according to Oleg, this is not
1336          * correct to rely on this
1337          */
1338         rcu_read_lock();
1339         info.si_pid = task_pid_nr_ns(tsk, tsk->parent->nsproxy->pid_ns);
1340         rcu_read_unlock();
1341
1342         info.si_uid = tsk->uid;
1343
1344         /* FIXME: find out whether or not this is supposed to be c*time. */
1345         info.si_utime = cputime_to_jiffies(cputime_add(tsk->utime,
1346                                                        tsk->signal->utime));
1347         info.si_stime = cputime_to_jiffies(cputime_add(tsk->stime,
1348                                                        tsk->signal->stime));
1349
1350         info.si_status = tsk->exit_code & 0x7f;
1351         if (tsk->exit_code & 0x80)
1352                 info.si_code = CLD_DUMPED;
1353         else if (tsk->exit_code & 0x7f)
1354                 info.si_code = CLD_KILLED;
1355         else {
1356                 info.si_code = CLD_EXITED;
1357                 info.si_status = tsk->exit_code >> 8;
1358         }
1359
1360         psig = tsk->parent->sighand;
1361         spin_lock_irqsave(&psig->siglock, flags);
1362         if (!tsk->ptrace && sig == SIGCHLD &&
1363             (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN ||
1364              (psig->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDWAIT))) {
1365                 /*
1366                  * We are exiting and our parent doesn't care.  POSIX.1
1367                  * defines special semantics for setting SIGCHLD to SIG_IGN
1368                  * or setting the SA_NOCLDWAIT flag: we should be reaped
1369                  * automatically and not left for our parent's wait4 call.
1370                  * Rather than having the parent do it as a magic kind of
1371                  * signal handler, we just set this to tell do_exit that we
1372                  * can be cleaned up without becoming a zombie.  Note that
1373                  * we still call __wake_up_parent in this case, because a
1374                  * blocked sys_wait4 might now return -ECHILD.
1375                  *
1376                  * Whether we send SIGCHLD or not for SA_NOCLDWAIT
1377                  * is implementation-defined: we do (if you don't want
1378                  * it, just use SIG_IGN instead).
1379                  */
1380                 tsk->exit_signal = -1;
1381                 if (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN)
1382                         sig = 0;
1383         }
1384         if (valid_signal(sig) && sig > 0)
1385                 __group_send_sig_info(sig, &info, tsk->parent);
1386         __wake_up_parent(tsk, tsk->parent);
1387         spin_unlock_irqrestore(&psig->siglock, flags);
1388 }
1389
1390 static void do_notify_parent_cldstop(struct task_struct *tsk, int why)
1391 {
1392         struct siginfo info;
1393         unsigned long flags;
1394         struct task_struct *parent;
1395         struct sighand_struct *sighand;
1396
1397         if (tsk->ptrace & PT_PTRACED)
1398                 parent = tsk->parent;
1399         else {
1400                 tsk = tsk->group_leader;
1401                 parent = tsk->real_parent;
1402         }
1403
1404         info.si_signo = SIGCHLD;
1405         info.si_errno = 0;
1406         /*
1407          * see comment in do_notify_parent() abot the following 3 lines
1408          */
1409         rcu_read_lock();
1410         info.si_pid = task_pid_nr_ns(tsk, tsk->parent->nsproxy->pid_ns);
1411         rcu_read_unlock();
1412
1413         info.si_uid = tsk->uid;
1414
1415         /* FIXME: find out whether or not this is supposed to be c*time. */
1416         info.si_utime = cputime_to_jiffies(tsk->utime);
1417         info.si_stime = cputime_to_jiffies(tsk->stime);
1418
1419         info.si_code = why;
1420         switch (why) {
1421         case CLD_CONTINUED:
1422                 info.si_status = SIGCONT;
1423                 break;
1424         case CLD_STOPPED:
1425                 info.si_status = tsk->signal->group_exit_code & 0x7f;
1426                 break;
1427         case CLD_TRAPPED:
1428                 info.si_status = tsk->exit_code & 0x7f;
1429                 break;
1430         default:
1431                 BUG();
1432         }
1433
1434         sighand = parent->sighand;
1435         spin_lock_irqsave(&sighand->siglock, flags);
1436         if (sighand->action[SIGCHLD-1].sa.sa_handler != SIG_IGN &&
1437             !(sighand->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDSTOP))
1438                 __group_send_sig_info(SIGCHLD, &info, parent);
1439         /*
1440          * Even if SIGCHLD is not generated, we must wake up wait4 calls.
1441          */
1442         __wake_up_parent(tsk, parent);
1443         spin_unlock_irqrestore(&sighand->siglock, flags);
1444 }
1445
1446 static inline int may_ptrace_stop(void)
1447 {
1448         if (!likely(current->ptrace & PT_PTRACED))
1449                 return 0;
1450         /*
1451          * Are we in the middle of do_coredump?
1452          * If so and our tracer is also part of the coredump stopping
1453          * is a deadlock situation, and pointless because our tracer
1454          * is dead so don't allow us to stop.
1455          * If SIGKILL was already sent before the caller unlocked
1456          * ->siglock we must see ->core_waiters != 0. Otherwise it
1457          * is safe to enter schedule().
1458          */
1459         if (unlikely(current->mm->core_waiters) &&
1460             unlikely(current->mm == current->parent->mm))
1461                 return 0;
1462
1463         return 1;
1464 }
1465
1466 /*
1467  * Return nonzero if there is a SIGKILL that should be waking us up.
1468  * Called with the siglock held.
1469  */
1470 static int sigkill_pending(struct task_struct *tsk)
1471 {
1472         return ((sigismember(&tsk->pending.signal, SIGKILL) ||
1473                  sigismember(&tsk->signal->shared_pending.signal, SIGKILL)) &&
1474                 !unlikely(sigismember(&tsk->blocked, SIGKILL)));
1475 }
1476
1477 /*
1478  * This must be called with current->sighand->siglock held.
1479  *
1480  * This should be the path for all ptrace stops.
1481  * We always set current->last_siginfo while stopped here.
1482  * That makes it a way to test a stopped process for
1483  * being ptrace-stopped vs being job-control-stopped.
1484  *
1485  * If we actually decide not to stop at all because the tracer
1486  * is gone, we keep current->exit_code unless clear_code.
1487  */
1488 static void ptrace_stop(int exit_code, int clear_code, siginfo_t *info)
1489 {
1490         int killed = 0;
1491
1492         if (arch_ptrace_stop_needed(exit_code, info)) {
1493                 /*
1494                  * The arch code has something special to do before a
1495                  * ptrace stop.  This is allowed to block, e.g. for faults
1496                  * on user stack pages.  We can't keep the siglock while
1497                  * calling arch_ptrace_stop, so we must release it now.
1498                  * To preserve proper semantics, we must do this before
1499                  * any signal bookkeeping like checking group_stop_count.
1500                  * Meanwhile, a SIGKILL could come in before we retake the
1501                  * siglock.  That must prevent us from sleeping in TASK_TRACED.
1502                  * So after regaining the lock, we must check for SIGKILL.
1503                  */
1504                 spin_unlock_irq(&current->sighand->siglock);
1505                 arch_ptrace_stop(exit_code, info);
1506                 spin_lock_irq(&current->sighand->siglock);
1507                 killed = sigkill_pending(current);
1508         }
1509
1510         /*
1511          * If there is a group stop in progress,
1512          * we must participate in the bookkeeping.
1513          */
1514         if (current->signal->group_stop_count > 0)
1515                 --current->signal->group_stop_count;
1516
1517         current->last_siginfo = info;
1518         current->exit_code = exit_code;
1519
1520         /* Let the debugger run.  */
1521         __set_current_state(TASK_TRACED);
1522         spin_unlock_irq(&current->sighand->siglock);
1523         read_lock(&tasklist_lock);
1524         if (!unlikely(killed) && may_ptrace_stop()) {
1525                 do_notify_parent_cldstop(current, CLD_TRAPPED);
1526                 read_unlock(&tasklist_lock);
1527                 schedule();
1528         } else {
1529                 /*
1530                  * By the time we got the lock, our tracer went away.
1531                  * Don't drop the lock yet, another tracer may come.
1532                  */
1533                 __set_current_state(TASK_RUNNING);
1534                 if (clear_code)
1535                         current->exit_code = 0;
1536                 read_unlock(&tasklist_lock);
1537         }
1538
1539         /*
1540          * While in TASK_TRACED, we were considered "frozen enough".
1541          * Now that we woke up, it's crucial if we're supposed to be
1542          * frozen that we freeze now before running anything substantial.
1543          */
1544         try_to_freeze();
1545
1546         /*
1547          * We are back.  Now reacquire the siglock before touching
1548          * last_siginfo, so that we are sure to have synchronized with
1549          * any signal-sending on another CPU that wants to examine it.
1550          */
1551         spin_lock_irq(&current->sighand->siglock);
1552         current->last_siginfo = NULL;
1553
1554         /*
1555          * Queued signals ignored us while we were stopped for tracing.
1556          * So check for any that we should take before resuming user mode.
1557          * This sets TIF_SIGPENDING, but never clears it.
1558          */
1559         recalc_sigpending_tsk(current);
1560 }
1561
1562 void ptrace_notify(int exit_code)
1563 {
1564         siginfo_t info;
1565
1566         BUG_ON((exit_code & (0x7f | ~0xffff)) != SIGTRAP);
1567
1568         memset(&info, 0, sizeof info);
1569         info.si_signo = SIGTRAP;
1570         info.si_code = exit_code;
1571         info.si_pid = task_pid_vnr(current);
1572         info.si_uid = current->uid;
1573
1574         /* Let the debugger run.  */
1575         spin_lock_irq(&current->sighand->siglock);
1576         ptrace_stop(exit_code, 1, &info);
1577         spin_unlock_irq(&current->sighand->siglock);
1578 }
1579
1580 static void
1581 finish_stop(int stop_count)
1582 {
1583         /*
1584          * If there are no other threads in the group, or if there is
1585          * a group stop in progress and we are the last to stop,
1586          * report to the parent.  When ptraced, every thread reports itself.
1587          */
1588         if (stop_count == 0 || (current->ptrace & PT_PTRACED)) {
1589                 read_lock(&tasklist_lock);
1590                 do_notify_parent_cldstop(current, CLD_STOPPED);
1591                 read_unlock(&tasklist_lock);
1592         }
1593
1594         do {
1595                 schedule();
1596         } while (try_to_freeze());
1597         /*
1598          * Now we don't run again until continued.
1599          */
1600         current->exit_code = 0;
1601 }
1602
1603 /*
1604  * This performs the stopping for SIGSTOP and other stop signals.
1605  * We have to stop all threads in the thread group.
1606  * Returns nonzero if we've actually stopped and released the siglock.
1607  * Returns zero if we didn't stop and still hold the siglock.
1608  */
1609 static int do_signal_stop(int signr)
1610 {
1611         struct signal_struct *sig = current->signal;
1612         int stop_count;
1613
1614         if (sig->group_stop_count > 0) {
1615                 /*
1616                  * There is a group stop in progress.  We don't need to
1617                  * start another one.
1618                  */
1619                 stop_count = --sig->group_stop_count;
1620         } else {
1621                 struct task_struct *t;
1622
1623                 if (unlikely((sig->flags & (SIGNAL_STOP_DEQUEUED | SIGNAL_UNKILLABLE))
1624                                          != SIGNAL_STOP_DEQUEUED) ||
1625                     unlikely(signal_group_exit(sig)))
1626                         return 0;
1627                 /*
1628                  * There is no group stop already in progress.
1629                  * We must initiate one now.
1630                  */
1631                 sig->group_exit_code = signr;
1632
1633                 stop_count = 0;
1634                 for (t = next_thread(current); t != current; t = next_thread(t))
1635                         /*
1636                          * Setting state to TASK_STOPPED for a group
1637                          * stop is always done with the siglock held,
1638                          * so this check has no races.
1639                          */
1640                         if (!(t->flags & PF_EXITING) &&
1641                             !task_is_stopped_or_traced(t)) {
1642                                 stop_count++;
1643                                 signal_wake_up(t, 0);
1644                         }
1645                 sig->group_stop_count = stop_count;
1646         }
1647
1648         if (stop_count == 0)
1649                 sig->flags = SIGNAL_STOP_STOPPED;
1650         current->exit_code = sig->group_exit_code;
1651         __set_current_state(TASK_STOPPED);
1652
1653         spin_unlock_irq(&current->sighand->siglock);
1654         finish_stop(stop_count);
1655         return 1;
1656 }
1657
1658 static int ptrace_signal(int signr, siginfo_t *info,
1659                          struct pt_regs *regs, void *cookie)
1660 {
1661         if (!(current->ptrace & PT_PTRACED))
1662                 return signr;
1663
1664         ptrace_signal_deliver(regs, cookie);
1665
1666         /* Let the debugger run.  */
1667         ptrace_stop(signr, 0, info);
1668
1669         /* We're back.  Did the debugger cancel the sig?  */
1670         signr = current->exit_code;
1671         if (signr == 0)
1672                 return signr;
1673
1674         current->exit_code = 0;
1675
1676         /* Update the siginfo structure if the signal has
1677            changed.  If the debugger wanted something
1678            specific in the siginfo structure then it should
1679            have updated *info via PTRACE_SETSIGINFO.  */
1680         if (signr != info->si_signo) {
1681                 info->si_signo = signr;
1682                 info->si_errno = 0;
1683                 info->si_code = SI_USER;
1684                 info->si_pid = task_pid_vnr(current->parent);
1685                 info->si_uid = current->parent->uid;
1686         }
1687
1688         /* If the (new) signal is now blocked, requeue it.  */
1689         if (sigismember(&current->blocked, signr)) {
1690                 specific_send_sig_info(signr, info, current);
1691                 signr = 0;
1692         }
1693
1694         return signr;
1695 }
1696
1697 int get_signal_to_deliver(siginfo_t *info, struct k_sigaction *return_ka,
1698                           struct pt_regs *regs, void *cookie)
1699 {
1700         struct sighand_struct *sighand = current->sighand;
1701         struct signal_struct *signal = current->signal;
1702         int signr;
1703
1704 relock:
1705         /*
1706          * We'll jump back here after any time we were stopped in TASK_STOPPED.
1707          * While in TASK_STOPPED, we were considered "frozen enough".
1708          * Now that we woke up, it's crucial if we're supposed to be
1709          * frozen that we freeze now before running anything substantial.
1710          */
1711         try_to_freeze();
1712
1713         spin_lock_irq(&sighand->siglock);
1714         /*
1715          * Every stopped thread goes here after wakeup. Check to see if
1716          * we should notify the parent, prepare_signal(SIGCONT) encodes
1717          * the CLD_ si_code into SIGNAL_CLD_MASK bits.
1718          */
1719         if (unlikely(signal->flags & SIGNAL_CLD_MASK)) {
1720                 int why = (signal->flags & SIGNAL_STOP_CONTINUED)
1721                                 ? CLD_CONTINUED : CLD_STOPPED;
1722                 signal->flags &= ~SIGNAL_CLD_MASK;
1723                 spin_unlock_irq(&sighand->siglock);
1724
1725                 read_lock(&tasklist_lock);
1726                 do_notify_parent_cldstop(current->group_leader, why);
1727                 read_unlock(&tasklist_lock);
1728                 goto relock;
1729         }
1730
1731         for (;;) {
1732                 struct k_sigaction *ka;
1733
1734                 if (unlikely(signal->group_stop_count > 0) &&
1735                     do_signal_stop(0))
1736                         goto relock;
1737
1738                 signr = dequeue_signal(current, &current->blocked, info);
1739                 if (!signr)
1740                         break; /* will return 0 */
1741
1742                 if (signr != SIGKILL) {
1743                         signr = ptrace_signal(signr, info, regs, cookie);
1744                         if (!signr)
1745                                 continue;
1746                 }
1747
1748                 ka = &sighand->action[signr-1];
1749                 if (ka->sa.sa_handler == SIG_IGN) /* Do nothing.  */
1750                         continue;
1751                 if (ka->sa.sa_handler != SIG_DFL) {
1752                         /* Run the handler.  */
1753                         *return_ka = *ka;
1754
1755                         if (ka->sa.sa_flags & SA_ONESHOT)
1756                                 ka->sa.sa_handler = SIG_DFL;
1757
1758                         break; /* will return non-zero "signr" value */
1759                 }
1760
1761                 /*
1762                  * Now we are doing the default action for this signal.
1763                  */
1764                 if (sig_kernel_ignore(signr)) /* Default is nothing. */
1765                         continue;
1766
1767                 /*
1768                  * Global init gets no signals it doesn't want.
1769                  */
1770                 if (unlikely(signal->flags & SIGNAL_UNKILLABLE) &&
1771                     !signal_group_exit(signal))
1772                         continue;
1773
1774                 if (sig_kernel_stop(signr)) {
1775                         /*
1776                          * The default action is to stop all threads in
1777                          * the thread group.  The job control signals
1778                          * do nothing in an orphaned pgrp, but SIGSTOP
1779                          * always works.  Note that siglock needs to be
1780                          * dropped during the call to is_orphaned_pgrp()
1781                          * because of lock ordering with tasklist_lock.
1782                          * This allows an intervening SIGCONT to be posted.
1783                          * We need to check for that and bail out if necessary.
1784                          */
1785                         if (signr != SIGSTOP) {
1786                                 spin_unlock_irq(&sighand->siglock);
1787
1788                                 /* signals can be posted during this window */
1789
1790                                 if (is_current_pgrp_orphaned())
1791                                         goto relock;
1792
1793                                 spin_lock_irq(&sighand->siglock);
1794                         }
1795
1796                         if (likely(do_signal_stop(signr))) {
1797                                 /* It released the siglock.  */
1798                                 goto relock;
1799                         }
1800
1801                         /*
1802                          * We didn't actually stop, due to a race
1803                          * with SIGCONT or something like that.
1804                          */
1805                         continue;
1806                 }
1807
1808                 spin_unlock_irq(&sighand->siglock);
1809
1810                 /*
1811                  * Anything else is fatal, maybe with a core dump.
1812                  */
1813                 current->flags |= PF_SIGNALED;
1814
1815                 if (sig_kernel_coredump(signr)) {
1816                         if (print_fatal_signals)
1817                                 print_fatal_signal(regs, signr);
1818                         /*
1819                          * If it was able to dump core, this kills all
1820                          * other threads in the group and synchronizes with
1821                          * their demise.  If we lost the race with another
1822                          * thread getting here, it set group_exit_code
1823                          * first and our do_group_exit call below will use
1824                          * that value and ignore the one we pass it.
1825                          */
1826                         do_coredump((long)signr, signr, regs);
1827                 }
1828
1829                 /*
1830                  * Death signals, no core dump.
1831                  */
1832                 do_group_exit(signr);
1833                 /* NOTREACHED */
1834         }
1835         spin_unlock_irq(&sighand->siglock);
1836         return signr;
1837 }
1838
1839 void exit_signals(struct task_struct *tsk)
1840 {
1841         int group_stop = 0;
1842         struct task_struct *t;
1843
1844         if (thread_group_empty(tsk) || signal_group_exit(tsk->signal)) {
1845                 tsk->flags |= PF_EXITING;
1846                 return;
1847         }
1848
1849         spin_lock_irq(&tsk->sighand->siglock);
1850         /*
1851          * From now this task is not visible for group-wide signals,
1852          * see wants_signal(), do_signal_stop().
1853          */
1854         tsk->flags |= PF_EXITING;
1855         if (!signal_pending(tsk))
1856                 goto out;
1857
1858         /* It could be that __group_complete_signal() choose us to
1859          * notify about group-wide signal. Another thread should be
1860          * woken now to take the signal since we will not.
1861          */
1862         for (t = tsk; (t = next_thread(t)) != tsk; )
1863                 if (!signal_pending(t) && !(t->flags & PF_EXITING))
1864                         recalc_sigpending_and_wake(t);
1865
1866         if (unlikely(tsk->signal->group_stop_count) &&
1867                         !--tsk->signal->group_stop_count) {
1868                 tsk->signal->flags = SIGNAL_STOP_STOPPED;
1869                 group_stop = 1;
1870         }
1871 out:
1872         spin_unlock_irq(&tsk->sighand->siglock);
1873
1874         if (unlikely(group_stop)) {
1875                 read_lock(&tasklist_lock);
1876                 do_notify_parent_cldstop(tsk, CLD_STOPPED);
1877                 read_unlock(&tasklist_lock);
1878         }
1879 }
1880
1881 EXPORT_SYMBOL(recalc_sigpending);
1882 EXPORT_SYMBOL_GPL(dequeue_signal);
1883 EXPORT_SYMBOL(flush_signals);
1884 EXPORT_SYMBOL(force_sig);
1885 EXPORT_SYMBOL(kill_proc);
1886 EXPORT_SYMBOL(ptrace_notify);
1887 EXPORT_SYMBOL(send_sig);
1888 EXPORT_SYMBOL(send_sig_info);
1889 EXPORT_SYMBOL(sigprocmask);
1890 EXPORT_SYMBOL(block_all_signals);
1891 EXPORT_SYMBOL(unblock_all_signals);
1892
1893
1894 /*
1895  * System call entry points.
1896  */
1897
1898 asmlinkage long sys_restart_syscall(void)
1899 {
1900         struct restart_block *restart = &current_thread_info()->restart_block;
1901         return restart->fn(restart);
1902 }
1903
1904 long do_no_restart_syscall(struct restart_block *param)
1905 {
1906         return -EINTR;
1907 }
1908
1909 /*
1910  * We don't need to get the kernel lock - this is all local to this
1911  * particular thread.. (and that's good, because this is _heavily_
1912  * used by various programs)
1913  */
1914
1915 /*
1916  * This is also useful for kernel threads that want to temporarily
1917  * (or permanently) block certain signals.
1918  *
1919  * NOTE! Unlike the user-mode sys_sigprocmask(), the kernel
1920  * interface happily blocks "unblockable" signals like SIGKILL
1921  * and friends.
1922  */
1923 int sigprocmask(int how, sigset_t *set, sigset_t *oldset)
1924 {
1925         int error;
1926
1927         spin_lock_irq(&current->sighand->siglock);
1928         if (oldset)
1929                 *oldset = current->blocked;
1930
1931         error = 0;
1932         switch (how) {
1933         case SIG_BLOCK:
1934                 sigorsets(&current->blocked, &current->blocked, set);
1935                 break;
1936         case SIG_UNBLOCK:
1937                 signandsets(&current->blocked, &current->blocked, set);
1938                 break;
1939         case SIG_SETMASK:
1940                 current->blocked = *set;
1941                 break;
1942         default:
1943                 error = -EINVAL;
1944         }
1945         recalc_sigpending();
1946         spin_unlock_irq(&current->sighand->siglock);
1947
1948         return error;
1949 }
1950
1951 asmlinkage long
1952 sys_rt_sigprocmask(int how, sigset_t __user *set, sigset_t __user *oset, size_t sigsetsize)
1953 {
1954         int error = -EINVAL;
1955         sigset_t old_set, new_set;
1956
1957         /* XXX: Don't preclude handling different sized sigset_t's.  */
1958         if (sigsetsize != sizeof(sigset_t))
1959                 goto out;
1960
1961         if (set) {
1962                 error = -EFAULT;
1963                 if (copy_from_user(&new_set, set, sizeof(*set)))
1964                         goto out;
1965                 sigdelsetmask(&new_set, sigmask(SIGKILL)|sigmask(SIGSTOP));
1966
1967                 error = sigprocmask(how, &new_set, &old_set);
1968                 if (error)
1969                         goto out;
1970                 if (oset)
1971                         goto set_old;
1972         } else if (oset) {
1973                 spin_lock_irq(&current->sighand->siglock);
1974                 old_set = current->blocked;
1975                 spin_unlock_irq(&current->sighand->siglock);
1976
1977         set_old:
1978                 error = -EFAULT;
1979                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
1980                         goto out;
1981         }
1982         error = 0;
1983 out:
1984         return error;
1985 }
1986
1987 long do_sigpending(void __user *set, unsigned long sigsetsize)
1988 {
1989         long error = -EINVAL;
1990         sigset_t pending;
1991
1992         if (sigsetsize > sizeof(sigset_t))
1993                 goto out;
1994
1995         spin_lock_irq(&current->sighand->siglock);
1996         sigorsets(&pending, &current->pending.signal,
1997                   &current->signal->shared_pending.signal);
1998         spin_unlock_irq(&current->sighand->siglock);
1999
2000         /* Outside the lock because only this thread touches it.  */
2001         sigandsets(&pending, &current->blocked, &pending);
2002
2003         error = -EFAULT;
2004         if (!copy_to_user(set, &pending, sigsetsize))
2005                 error = 0;
2006
2007 out:
2008         return error;
2009 }       
2010
2011 asmlinkage long
2012 sys_rt_sigpending(sigset_t __user *set, size_t sigsetsize)
2013 {
2014         return do_sigpending(set, sigsetsize);
2015 }
2016
2017 #ifndef HAVE_ARCH_COPY_SIGINFO_TO_USER
2018
2019 int copy_siginfo_to_user(siginfo_t __user *to, siginfo_t *from)
2020 {
2021         int err;
2022
2023         if (!access_ok (VERIFY_WRITE, to, sizeof(siginfo_t)))
2024                 return -EFAULT;
2025         if (from->si_code < 0)
2026                 return __copy_to_user(to, from, sizeof(siginfo_t))
2027                         ? -EFAULT : 0;
2028         /*
2029          * If you change siginfo_t structure, please be sure
2030          * this code is fixed accordingly.
2031          * Please remember to update the signalfd_copyinfo() function
2032          * inside fs/signalfd.c too, in case siginfo_t changes.
2033          * It should never copy any pad contained in the structure
2034          * to avoid security leaks, but must copy the generic
2035          * 3 ints plus the relevant union member.
2036          */
2037         err = __put_user(from->si_signo, &to->si_signo);
2038         err |= __put_user(from->si_errno, &to->si_errno);
2039         err |= __put_user((short)from->si_code, &to->si_code);
2040         switch (from->si_code & __SI_MASK) {
2041         case __SI_KILL:
2042                 err |= __put_user(from->si_pid, &to->si_pid);
2043                 err |= __put_user(from->si_uid, &to->si_uid);
2044                 break;
2045         case __SI_TIMER:
2046                  err |= __put_user(from->si_tid, &to->si_tid);
2047                  err |= __put_user(from->si_overrun, &to->si_overrun);
2048                  err |= __put_user(from->si_ptr, &to->si_ptr);
2049                 break;
2050         case __SI_POLL:
2051                 err |= __put_user(from->si_band, &to->si_band);
2052                 err |= __put_user(from->si_fd, &to->si_fd);
2053                 break;
2054         case __SI_FAULT:
2055                 err |= __put_user(from->si_addr, &to->si_addr);
2056 #ifdef __ARCH_SI_TRAPNO
2057                 err |= __put_user(from->si_trapno, &to->si_trapno);
2058 #endif
2059                 break;
2060         case __SI_CHLD:
2061                 err |= __put_user(from->si_pid, &to->si_pid);
2062                 err |= __put_user(from->si_uid, &to->si_uid);
2063                 err |= __put_user(from->si_status, &to->si_status);
2064                 err |= __put_user(from->si_utime, &to->si_utime);
2065                 err |= __put_user(from->si_stime, &to->si_stime);
2066                 break;
2067         case __SI_RT: /* This is not generated by the kernel as of now. */
2068         case __SI_MESGQ: /* But this is */
2069                 err |= __put_user(from->si_pid, &to->si_pid);
2070                 err |= __put_user(from->si_uid, &to->si_uid);
2071                 err |= __put_user(from->si_ptr, &to->si_ptr);
2072                 break;
2073         default: /* this is just in case for now ... */
2074                 err |= __put_user(from->si_pid, &to->si_pid);
2075                 err |= __put_user(from->si_uid, &to->si_uid);
2076                 break;
2077         }
2078         return err;
2079 }
2080
2081 #endif
2082
2083 asmlinkage long
2084 sys_rt_sigtimedwait(const sigset_t __user *uthese,
2085                     siginfo_t __user *uinfo,
2086                     const struct timespec __user *uts,
2087                     size_t sigsetsize)
2088 {
2089         int ret, sig;
2090         sigset_t these;
2091         struct timespec ts;
2092         siginfo_t info;
2093         long timeout = 0;
2094
2095         /* XXX: Don't preclude handling different sized sigset_t's.  */
2096         if (sigsetsize != sizeof(sigset_t))
2097                 return -EINVAL;
2098
2099         if (copy_from_user(&these, uthese, sizeof(these)))
2100                 return -EFAULT;
2101                 
2102         /*
2103          * Invert the set of allowed signals to get those we
2104          * want to block.
2105          */
2106         sigdelsetmask(&these, sigmask(SIGKILL)|sigmask(SIGSTOP));
2107         signotset(&these);
2108
2109         if (uts) {
2110                 if (copy_from_user(&ts, uts, sizeof(ts)))
2111                         return -EFAULT;
2112                 if (ts.tv_nsec >= 1000000000L || ts.tv_nsec < 0
2113                     || ts.tv_sec < 0)
2114                         return -EINVAL;
2115         }
2116
2117         spin_lock_irq(&current->sighand->siglock);
2118         sig = dequeue_signal(current, &these, &info);
2119         if (!sig) {
2120                 timeout = MAX_SCHEDULE_TIMEOUT;
2121                 if (uts)
2122                         timeout = (timespec_to_jiffies(&ts)
2123                                    + (ts.tv_sec || ts.tv_nsec));
2124
2125                 if (timeout) {
2126                         /* None ready -- temporarily unblock those we're
2127                          * interested while we are sleeping in so that we'll
2128                          * be awakened when they arrive.  */
2129                         current->real_blocked = current->blocked;
2130                         sigandsets(&current->blocked, &current->blocked, &these);
2131                         recalc_sigpending();
2132                         spin_unlock_irq(&current->sighand->siglock);
2133
2134                         timeout = schedule_timeout_interruptible(timeout);
2135
2136                         spin_lock_irq(&current->sighand->siglock);
2137                         sig = dequeue_signal(current, &these, &info);
2138                         current->blocked = current->real_blocked;
2139                         siginitset(&current->real_blocked, 0);
2140                         recalc_sigpending();
2141                 }
2142         }
2143         spin_unlock_irq(&current->sighand->siglock);
2144
2145         if (sig) {
2146                 ret = sig;
2147                 if (uinfo) {
2148                         if (copy_siginfo_to_user(uinfo, &info))
2149                                 ret = -EFAULT;
2150                 }
2151         } else {
2152                 ret = -EAGAIN;
2153                 if (timeout)
2154                         ret = -EINTR;
2155         }
2156
2157         return ret;
2158 }
2159
2160 asmlinkage long
2161 sys_kill(int pid, int sig)
2162 {
2163         struct siginfo info;
2164
2165         info.si_signo = sig;
2166         info.si_errno = 0;
2167         info.si_code = SI_USER;
2168         info.si_pid = task_tgid_vnr(current);
2169         info.si_uid = current->uid;
2170
2171         return kill_something_info(sig, &info, pid);
2172 }
2173
2174 static int do_tkill(int tgid, int pid, int sig)
2175 {
2176         int error;
2177         struct siginfo info;
2178         struct task_struct *p;
2179         unsigned long flags;
2180
2181         error = -ESRCH;
2182         info.si_signo = sig;
2183         info.si_errno = 0;
2184         info.si_code = SI_TKILL;
2185         info.si_pid = task_tgid_vnr(current);
2186         info.si_uid = current->uid;
2187
2188         rcu_read_lock();
2189         p = find_task_by_vpid(pid);
2190         if (p && (tgid <= 0 || task_tgid_vnr(p) == tgid)) {
2191                 error = check_kill_permission(sig, &info, p);
2192                 /*
2193                  * The null signal is a permissions and process existence
2194                  * probe.  No signal is actually delivered.
2195                  *
2196                  * If lock_task_sighand() fails we pretend the task dies
2197                  * after receiving the signal. The window is tiny, and the
2198                  * signal is private anyway.
2199                  */
2200                 if (!error && sig && lock_task_sighand(p, &flags)) {
2201                         error = specific_send_sig_info(sig, &info, p);
2202                         unlock_task_sighand(p, &flags);
2203                 }
2204         }
2205         rcu_read_unlock();
2206
2207         return error;
2208 }
2209
2210 /**
2211  *  sys_tgkill - send signal to one specific thread
2212  *  @tgid: the thread group ID of the thread
2213  *  @pid: the PID of the thread
2214  *  @sig: signal to be sent
2215  *
2216  *  This syscall also checks the @tgid and returns -ESRCH even if the PID
2217  *  exists but it's not belonging to the target process anymore. This
2218  *  method solves the problem of threads exiting and PIDs getting reused.
2219  */
2220 asmlinkage long sys_tgkill(int tgid, int pid, int sig)
2221 {
2222         /* This is only valid for single tasks */
2223         if (pid <= 0 || tgid <= 0)
2224                 return -EINVAL;
2225
2226         return do_tkill(tgid, pid, sig);
2227 }
2228
2229 /*
2230  *  Send a signal to only one task, even if it's a CLONE_THREAD task.
2231  */
2232 asmlinkage long
2233 sys_tkill(int pid, int sig)
2234 {
2235         /* This is only valid for single tasks */
2236         if (pid <= 0)
2237                 return -EINVAL;
2238
2239         return do_tkill(0, pid, sig);
2240 }
2241
2242 asmlinkage long
2243 sys_rt_sigqueueinfo(int pid, int sig, siginfo_t __user *uinfo)
2244 {
2245         siginfo_t info;
2246
2247         if (copy_from_user(&info, uinfo, sizeof(siginfo_t)))
2248                 return -EFAULT;
2249
2250         /* Not even root can pretend to send signals from the kernel.
2251            Nor can they impersonate a kill(), which adds source info.  */
2252         if (info.si_code >= 0)
2253                 return -EPERM;
2254         info.si_signo = sig;
2255
2256         /* POSIX.1b doesn't mention process groups.  */
2257         return kill_proc_info(sig, &info, pid);
2258 }
2259
2260 int do_sigaction(int sig, struct k_sigaction *act, struct k_sigaction *oact)
2261 {
2262         struct task_struct *t = current;
2263         struct k_sigaction *k;
2264         sigset_t mask;
2265
2266         if (!valid_signal(sig) || sig < 1 || (act && sig_kernel_only(sig)))
2267                 return -EINVAL;
2268
2269         k = &t->sighand->action[sig-1];
2270
2271         spin_lock_irq(&current->sighand->siglock);
2272         if (oact)
2273                 *oact = *k;
2274
2275         if (act) {
2276                 sigdelsetmask(&act->sa.sa_mask,
2277                               sigmask(SIGKILL) | sigmask(SIGSTOP));
2278                 *k = *act;
2279                 /*
2280                  * POSIX 3.3.1.3:
2281                  *  "Setting a signal action to SIG_IGN for a signal that is
2282                  *   pending shall cause the pending signal to be discarded,
2283                  *   whether or not it is blocked."
2284                  *
2285                  *  "Setting a signal action to SIG_DFL for a signal that is
2286                  *   pending and whose default action is to ignore the signal
2287                  *   (for example, SIGCHLD), shall cause the pending signal to
2288                  *   be discarded, whether or not it is blocked"
2289                  */
2290                 if (__sig_ignored(t, sig)) {
2291                         sigemptyset(&mask);
2292                         sigaddset(&mask, sig);
2293                         rm_from_queue_full(&mask, &t->signal->shared_pending);
2294                         do {
2295                                 rm_from_queue_full(&mask, &t->pending);
2296                                 t = next_thread(t);
2297                         } while (t != current);
2298                 }
2299         }
2300
2301         spin_unlock_irq(&current->sighand->siglock);
2302         return 0;
2303 }
2304
2305 int 
2306 do_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, unsigned long sp)
2307 {
2308         stack_t oss;
2309         int error;
2310
2311         if (uoss) {
2312                 oss.ss_sp = (void __user *) current->sas_ss_sp;
2313                 oss.ss_size = current->sas_ss_size;
2314                 oss.ss_flags = sas_ss_flags(sp);
2315         }
2316
2317         if (uss) {
2318                 void __user *ss_sp;
2319                 size_t ss_size;
2320                 int ss_flags;
2321
2322                 error = -EFAULT;
2323                 if (!access_ok(VERIFY_READ, uss, sizeof(*uss))
2324                     || __get_user(ss_sp, &uss->ss_sp)
2325                     || __get_user(ss_flags, &uss->ss_flags)
2326                     || __get_user(ss_size, &uss->ss_size))
2327                         goto out;
2328
2329                 error = -EPERM;
2330                 if (on_sig_stack(sp))
2331                         goto out;
2332
2333                 error = -EINVAL;
2334                 /*
2335                  *
2336                  * Note - this code used to test ss_flags incorrectly
2337                  *        old code may have been written using ss_flags==0
2338                  *        to mean ss_flags==SS_ONSTACK (as this was the only
2339                  *        way that worked) - this fix preserves that older
2340                  *        mechanism
2341                  */
2342                 if (ss_flags != SS_DISABLE && ss_flags != SS_ONSTACK && ss_flags != 0)
2343                         goto out;
2344
2345                 if (ss_flags == SS_DISABLE) {
2346                         ss_size = 0;
2347                         ss_sp = NULL;
2348                 } else {
2349                         error = -ENOMEM;
2350                         if (ss_size < MINSIGSTKSZ)
2351                                 goto out;
2352                 }
2353
2354                 current->sas_ss_sp = (unsigned long) ss_sp;
2355                 current->sas_ss_size = ss_size;
2356         }
2357
2358         if (uoss) {
2359                 error = -EFAULT;
2360                 if (copy_to_user(uoss, &oss, sizeof(oss)))
2361                         goto out;
2362         }
2363
2364         error = 0;
2365 out:
2366         return error;
2367 }
2368
2369 #ifdef __ARCH_WANT_SYS_SIGPENDING
2370
2371 asmlinkage long
2372 sys_sigpending(old_sigset_t __user *set)
2373 {
2374         return do_sigpending(set, sizeof(*set));
2375 }
2376
2377 #endif
2378
2379 #ifdef __ARCH_WANT_SYS_SIGPROCMASK
2380 /* Some platforms have their own version with special arguments others
2381    support only sys_rt_sigprocmask.  */
2382
2383 asmlinkage long
2384 sys_sigprocmask(int how, old_sigset_t __user *set, old_sigset_t __user *oset)
2385 {
2386         int error;
2387         old_sigset_t old_set, new_set;
2388
2389         if (set) {
2390                 error = -EFAULT;
2391                 if (copy_from_user(&new_set, set, sizeof(*set)))
2392                         goto out;
2393                 new_set &= ~(sigmask(SIGKILL) | sigmask(SIGSTOP));
2394
2395                 spin_lock_irq(&current->sighand->siglock);
2396                 old_set = current->blocked.sig[0];
2397
2398                 error = 0;
2399                 switch (how) {
2400                 default:
2401                         error = -EINVAL;
2402                         break;
2403                 case SIG_BLOCK:
2404                         sigaddsetmask(&current->blocked, new_set);
2405                         break;
2406                 case SIG_UNBLOCK:
2407                         sigdelsetmask(&current->blocked, new_set);
2408                         break;
2409                 case SIG_SETMASK:
2410                         current->blocked.sig[0] = new_set;
2411                         break;
2412                 }
2413
2414                 recalc_sigpending();
2415                 spin_unlock_irq(&current->sighand->siglock);
2416                 if (error)
2417                         goto out;
2418                 if (oset)
2419                         goto set_old;
2420         } else if (oset) {
2421                 old_set = current->blocked.sig[0];
2422         set_old:
2423                 error = -EFAULT;
2424                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2425                         goto out;
2426         }
2427         error = 0;
2428 out:
2429         return error;
2430 }
2431 #endif /* __ARCH_WANT_SYS_SIGPROCMASK */
2432
2433 #ifdef __ARCH_WANT_SYS_RT_SIGACTION
2434 asmlinkage long
2435 sys_rt_sigaction(int sig,
2436                  const struct sigaction __user *act,
2437                  struct sigaction __user *oact,
2438                  size_t sigsetsize)
2439 {
2440         struct k_sigaction new_sa, old_sa;
2441         int ret = -EINVAL;
2442
2443         /* XXX: Don't preclude handling different sized sigset_t's.  */
2444         if (sigsetsize != sizeof(sigset_t))
2445                 goto out;
2446
2447         if (act) {
2448                 if (copy_from_user(&new_sa.sa, act, sizeof(new_sa.sa)))
2449                         return -EFAULT;
2450         }
2451
2452         ret = do_sigaction(sig, act ? &new_sa : NULL, oact ? &old_sa : NULL);
2453
2454         if (!ret && oact) {
2455                 if (copy_to_user(oact, &old_sa.sa, sizeof(old_sa.sa)))
2456                         return -EFAULT;
2457         }
2458 out:
2459         return ret;
2460 }
2461 #endif /* __ARCH_WANT_SYS_RT_SIGACTION */
2462
2463 #ifdef __ARCH_WANT_SYS_SGETMASK
2464
2465 /*
2466  * For backwards compatibility.  Functionality superseded by sigprocmask.
2467  */
2468 asmlinkage long
2469 sys_sgetmask(void)
2470 {
2471         /* SMP safe */
2472         return current->blocked.sig[0];
2473 }
2474
2475 asmlinkage long
2476 sys_ssetmask(int newmask)
2477 {
2478         int old;
2479
2480         spin_lock_irq(&current->sighand->siglock);
2481         old = current->blocked.sig[0];
2482
2483         siginitset(&current->blocked, newmask & ~(sigmask(SIGKILL)|
2484                                                   sigmask(SIGSTOP)));
2485         recalc_sigpending();
2486         spin_unlock_irq(&current->sighand->siglock);
2487
2488         return old;
2489 }
2490 #endif /* __ARCH_WANT_SGETMASK */
2491
2492 #ifdef __ARCH_WANT_SYS_SIGNAL
2493 /*
2494  * For backwards compatibility.  Functionality superseded by sigaction.
2495  */
2496 asmlinkage unsigned long
2497 sys_signal(int sig, __sighandler_t handler)
2498 {
2499         struct k_sigaction new_sa, old_sa;
2500         int ret;
2501
2502         new_sa.sa.sa_handler = handler;
2503         new_sa.sa.sa_flags = SA_ONESHOT | SA_NOMASK;
2504         sigemptyset(&new_sa.sa.sa_mask);
2505
2506         ret = do_sigaction(sig, &new_sa, &old_sa);
2507
2508         return ret ? ret : (unsigned long)old_sa.sa.sa_handler;
2509 }
2510 #endif /* __ARCH_WANT_SYS_SIGNAL */
2511
2512 #ifdef __ARCH_WANT_SYS_PAUSE
2513
2514 asmlinkage long
2515 sys_pause(void)
2516 {
2517         current->state = TASK_INTERRUPTIBLE;
2518         schedule();
2519         return -ERESTARTNOHAND;
2520 }
2521
2522 #endif
2523
2524 #ifdef __ARCH_WANT_SYS_RT_SIGSUSPEND
2525 asmlinkage long sys_rt_sigsuspend(sigset_t __user *unewset, size_t sigsetsize)
2526 {
2527         sigset_t newset;
2528
2529         /* XXX: Don't preclude handling different sized sigset_t's.  */
2530         if (sigsetsize != sizeof(sigset_t))
2531                 return -EINVAL;
2532
2533         if (copy_from_user(&newset, unewset, sizeof(newset)))
2534                 return -EFAULT;
2535         sigdelsetmask(&newset, sigmask(SIGKILL)|sigmask(SIGSTOP));
2536
2537         spin_lock_irq(&current->sighand->siglock);
2538         current->saved_sigmask = current->blocked;
2539         current->blocked = newset;
2540         recalc_sigpending();
2541         spin_unlock_irq(&current->sighand->siglock);
2542
2543         current->state = TASK_INTERRUPTIBLE;
2544         schedule();
2545         set_restore_sigmask();
2546         return -ERESTARTNOHAND;
2547 }
2548 #endif /* __ARCH_WANT_SYS_RT_SIGSUSPEND */
2549
2550 __attribute__((weak)) const char *arch_vma_name(struct vm_area_struct *vma)
2551 {
2552         return NULL;
2553 }
2554
2555 void __init signals_init(void)
2556 {
2557         sigqueue_cachep = KMEM_CACHE(sigqueue, SLAB_PANIC);
2558 }