Merge git://git.kernel.org/pub/scm/linux/kernel/git/davem/sparc-2.6
[pandora-kernel.git] / fs / compat.c
1 /*
2  *  linux/fs/compat.c
3  *
4  *  Kernel compatibililty routines for e.g. 32 bit syscall support
5  *  on 64 bit kernels.
6  *
7  *  Copyright (C) 2002       Stephen Rothwell, IBM Corporation
8  *  Copyright (C) 1997-2000  Jakub Jelinek  (jakub@redhat.com)
9  *  Copyright (C) 1998       Eddie C. Dost  (ecd@skynet.be)
10  *  Copyright (C) 2001,2002  Andi Kleen, SuSE Labs 
11  *  Copyright (C) 2003       Pavel Machek (pavel@ucw.cz)
12  *
13  *  This program is free software; you can redistribute it and/or modify
14  *  it under the terms of the GNU General Public License version 2 as
15  *  published by the Free Software Foundation.
16  */
17
18 #include <linux/stddef.h>
19 #include <linux/kernel.h>
20 #include <linux/linkage.h>
21 #include <linux/compat.h>
22 #include <linux/errno.h>
23 #include <linux/time.h>
24 #include <linux/fs.h>
25 #include <linux/fcntl.h>
26 #include <linux/namei.h>
27 #include <linux/file.h>
28 #include <linux/fdtable.h>
29 #include <linux/vfs.h>
30 #include <linux/ioctl.h>
31 #include <linux/init.h>
32 #include <linux/ncp_mount.h>
33 #include <linux/nfs4_mount.h>
34 #include <linux/syscalls.h>
35 #include <linux/ctype.h>
36 #include <linux/module.h>
37 #include <linux/dirent.h>
38 #include <linux/fsnotify.h>
39 #include <linux/highuid.h>
40 #include <linux/nfsd/syscall.h>
41 #include <linux/personality.h>
42 #include <linux/rwsem.h>
43 #include <linux/tsacct_kern.h>
44 #include <linux/security.h>
45 #include <linux/highmem.h>
46 #include <linux/signal.h>
47 #include <linux/poll.h>
48 #include <linux/mm.h>
49 #include <linux/eventpoll.h>
50 #include <linux/fs_struct.h>
51 #include <linux/slab.h>
52
53 #include <asm/uaccess.h>
54 #include <asm/mmu_context.h>
55 #include <asm/ioctls.h>
56 #include "internal.h"
57
58 int compat_log = 1;
59
60 int compat_printk(const char *fmt, ...)
61 {
62         va_list ap;
63         int ret;
64         if (!compat_log)
65                 return 0;
66         va_start(ap, fmt);
67         ret = vprintk(fmt, ap);
68         va_end(ap);
69         return ret;
70 }
71
72 #include "read_write.h"
73
74 /*
75  * Not all architectures have sys_utime, so implement this in terms
76  * of sys_utimes.
77  */
78 asmlinkage long compat_sys_utime(const char __user *filename,
79                                  struct compat_utimbuf __user *t)
80 {
81         struct timespec tv[2];
82
83         if (t) {
84                 if (get_user(tv[0].tv_sec, &t->actime) ||
85                     get_user(tv[1].tv_sec, &t->modtime))
86                         return -EFAULT;
87                 tv[0].tv_nsec = 0;
88                 tv[1].tv_nsec = 0;
89         }
90         return do_utimes(AT_FDCWD, filename, t ? tv : NULL, 0);
91 }
92
93 asmlinkage long compat_sys_utimensat(unsigned int dfd, const char __user *filename, struct compat_timespec __user *t, int flags)
94 {
95         struct timespec tv[2];
96
97         if  (t) {
98                 if (get_compat_timespec(&tv[0], &t[0]) ||
99                     get_compat_timespec(&tv[1], &t[1]))
100                         return -EFAULT;
101
102                 if (tv[0].tv_nsec == UTIME_OMIT && tv[1].tv_nsec == UTIME_OMIT)
103                         return 0;
104         }
105         return do_utimes(dfd, filename, t ? tv : NULL, flags);
106 }
107
108 asmlinkage long compat_sys_futimesat(unsigned int dfd, const char __user *filename, struct compat_timeval __user *t)
109 {
110         struct timespec tv[2];
111
112         if (t) {
113                 if (get_user(tv[0].tv_sec, &t[0].tv_sec) ||
114                     get_user(tv[0].tv_nsec, &t[0].tv_usec) ||
115                     get_user(tv[1].tv_sec, &t[1].tv_sec) ||
116                     get_user(tv[1].tv_nsec, &t[1].tv_usec))
117                         return -EFAULT;
118                 if (tv[0].tv_nsec >= 1000000 || tv[0].tv_nsec < 0 ||
119                     tv[1].tv_nsec >= 1000000 || tv[1].tv_nsec < 0)
120                         return -EINVAL;
121                 tv[0].tv_nsec *= 1000;
122                 tv[1].tv_nsec *= 1000;
123         }
124         return do_utimes(dfd, filename, t ? tv : NULL, 0);
125 }
126
127 asmlinkage long compat_sys_utimes(const char __user *filename, struct compat_timeval __user *t)
128 {
129         return compat_sys_futimesat(AT_FDCWD, filename, t);
130 }
131
132 static int cp_compat_stat(struct kstat *stat, struct compat_stat __user *ubuf)
133 {
134         compat_ino_t ino = stat->ino;
135         typeof(ubuf->st_uid) uid = 0;
136         typeof(ubuf->st_gid) gid = 0;
137         int err;
138
139         SET_UID(uid, stat->uid);
140         SET_GID(gid, stat->gid);
141
142         if ((u64) stat->size > MAX_NON_LFS ||
143             !old_valid_dev(stat->dev) ||
144             !old_valid_dev(stat->rdev))
145                 return -EOVERFLOW;
146         if (sizeof(ino) < sizeof(stat->ino) && ino != stat->ino)
147                 return -EOVERFLOW;
148
149         if (clear_user(ubuf, sizeof(*ubuf)))
150                 return -EFAULT;
151
152         err  = __put_user(old_encode_dev(stat->dev), &ubuf->st_dev);
153         err |= __put_user(ino, &ubuf->st_ino);
154         err |= __put_user(stat->mode, &ubuf->st_mode);
155         err |= __put_user(stat->nlink, &ubuf->st_nlink);
156         err |= __put_user(uid, &ubuf->st_uid);
157         err |= __put_user(gid, &ubuf->st_gid);
158         err |= __put_user(old_encode_dev(stat->rdev), &ubuf->st_rdev);
159         err |= __put_user(stat->size, &ubuf->st_size);
160         err |= __put_user(stat->atime.tv_sec, &ubuf->st_atime);
161         err |= __put_user(stat->atime.tv_nsec, &ubuf->st_atime_nsec);
162         err |= __put_user(stat->mtime.tv_sec, &ubuf->st_mtime);
163         err |= __put_user(stat->mtime.tv_nsec, &ubuf->st_mtime_nsec);
164         err |= __put_user(stat->ctime.tv_sec, &ubuf->st_ctime);
165         err |= __put_user(stat->ctime.tv_nsec, &ubuf->st_ctime_nsec);
166         err |= __put_user(stat->blksize, &ubuf->st_blksize);
167         err |= __put_user(stat->blocks, &ubuf->st_blocks);
168         return err;
169 }
170
171 asmlinkage long compat_sys_newstat(const char __user * filename,
172                 struct compat_stat __user *statbuf)
173 {
174         struct kstat stat;
175         int error;
176
177         error = vfs_stat(filename, &stat);
178         if (error)
179                 return error;
180         return cp_compat_stat(&stat, statbuf);
181 }
182
183 asmlinkage long compat_sys_newlstat(const char __user * filename,
184                 struct compat_stat __user *statbuf)
185 {
186         struct kstat stat;
187         int error;
188
189         error = vfs_lstat(filename, &stat);
190         if (error)
191                 return error;
192         return cp_compat_stat(&stat, statbuf);
193 }
194
195 #ifndef __ARCH_WANT_STAT64
196 asmlinkage long compat_sys_newfstatat(unsigned int dfd,
197                 const char __user *filename,
198                 struct compat_stat __user *statbuf, int flag)
199 {
200         struct kstat stat;
201         int error;
202
203         error = vfs_fstatat(dfd, filename, &stat, flag);
204         if (error)
205                 return error;
206         return cp_compat_stat(&stat, statbuf);
207 }
208 #endif
209
210 asmlinkage long compat_sys_newfstat(unsigned int fd,
211                 struct compat_stat __user * statbuf)
212 {
213         struct kstat stat;
214         int error = vfs_fstat(fd, &stat);
215
216         if (!error)
217                 error = cp_compat_stat(&stat, statbuf);
218         return error;
219 }
220
221 static int put_compat_statfs(struct compat_statfs __user *ubuf, struct kstatfs *kbuf)
222 {
223         
224         if (sizeof ubuf->f_blocks == 4) {
225                 if ((kbuf->f_blocks | kbuf->f_bfree | kbuf->f_bavail |
226                      kbuf->f_bsize | kbuf->f_frsize) & 0xffffffff00000000ULL)
227                         return -EOVERFLOW;
228                 /* f_files and f_ffree may be -1; it's okay
229                  * to stuff that into 32 bits */
230                 if (kbuf->f_files != 0xffffffffffffffffULL
231                  && (kbuf->f_files & 0xffffffff00000000ULL))
232                         return -EOVERFLOW;
233                 if (kbuf->f_ffree != 0xffffffffffffffffULL
234                  && (kbuf->f_ffree & 0xffffffff00000000ULL))
235                         return -EOVERFLOW;
236         }
237         if (!access_ok(VERIFY_WRITE, ubuf, sizeof(*ubuf)) ||
238             __put_user(kbuf->f_type, &ubuf->f_type) ||
239             __put_user(kbuf->f_bsize, &ubuf->f_bsize) ||
240             __put_user(kbuf->f_blocks, &ubuf->f_blocks) ||
241             __put_user(kbuf->f_bfree, &ubuf->f_bfree) ||
242             __put_user(kbuf->f_bavail, &ubuf->f_bavail) ||
243             __put_user(kbuf->f_files, &ubuf->f_files) ||
244             __put_user(kbuf->f_ffree, &ubuf->f_ffree) ||
245             __put_user(kbuf->f_namelen, &ubuf->f_namelen) ||
246             __put_user(kbuf->f_fsid.val[0], &ubuf->f_fsid.val[0]) ||
247             __put_user(kbuf->f_fsid.val[1], &ubuf->f_fsid.val[1]) ||
248             __put_user(kbuf->f_frsize, &ubuf->f_frsize) ||
249             __put_user(0, &ubuf->f_spare[0]) || 
250             __put_user(0, &ubuf->f_spare[1]) || 
251             __put_user(0, &ubuf->f_spare[2]) || 
252             __put_user(0, &ubuf->f_spare[3]) || 
253             __put_user(0, &ubuf->f_spare[4]))
254                 return -EFAULT;
255         return 0;
256 }
257
258 /*
259  * The following statfs calls are copies of code from fs/open.c and
260  * should be checked against those from time to time
261  */
262 asmlinkage long compat_sys_statfs(const char __user *pathname, struct compat_statfs __user *buf)
263 {
264         struct path path;
265         int error;
266
267         error = user_path(pathname, &path);
268         if (!error) {
269                 struct kstatfs tmp;
270                 error = vfs_statfs(&path, &tmp);
271                 if (!error)
272                         error = put_compat_statfs(buf, &tmp);
273                 path_put(&path);
274         }
275         return error;
276 }
277
278 asmlinkage long compat_sys_fstatfs(unsigned int fd, struct compat_statfs __user *buf)
279 {
280         struct file * file;
281         struct kstatfs tmp;
282         int error;
283
284         error = -EBADF;
285         file = fget(fd);
286         if (!file)
287                 goto out;
288         error = vfs_statfs(&file->f_path, &tmp);
289         if (!error)
290                 error = put_compat_statfs(buf, &tmp);
291         fput(file);
292 out:
293         return error;
294 }
295
296 static int put_compat_statfs64(struct compat_statfs64 __user *ubuf, struct kstatfs *kbuf)
297 {
298         if (sizeof ubuf->f_blocks == 4) {
299                 if ((kbuf->f_blocks | kbuf->f_bfree | kbuf->f_bavail |
300                      kbuf->f_bsize | kbuf->f_frsize) & 0xffffffff00000000ULL)
301                         return -EOVERFLOW;
302                 /* f_files and f_ffree may be -1; it's okay
303                  * to stuff that into 32 bits */
304                 if (kbuf->f_files != 0xffffffffffffffffULL
305                  && (kbuf->f_files & 0xffffffff00000000ULL))
306                         return -EOVERFLOW;
307                 if (kbuf->f_ffree != 0xffffffffffffffffULL
308                  && (kbuf->f_ffree & 0xffffffff00000000ULL))
309                         return -EOVERFLOW;
310         }
311         if (!access_ok(VERIFY_WRITE, ubuf, sizeof(*ubuf)) ||
312             __put_user(kbuf->f_type, &ubuf->f_type) ||
313             __put_user(kbuf->f_bsize, &ubuf->f_bsize) ||
314             __put_user(kbuf->f_blocks, &ubuf->f_blocks) ||
315             __put_user(kbuf->f_bfree, &ubuf->f_bfree) ||
316             __put_user(kbuf->f_bavail, &ubuf->f_bavail) ||
317             __put_user(kbuf->f_files, &ubuf->f_files) ||
318             __put_user(kbuf->f_ffree, &ubuf->f_ffree) ||
319             __put_user(kbuf->f_namelen, &ubuf->f_namelen) ||
320             __put_user(kbuf->f_fsid.val[0], &ubuf->f_fsid.val[0]) ||
321             __put_user(kbuf->f_fsid.val[1], &ubuf->f_fsid.val[1]) ||
322             __put_user(kbuf->f_frsize, &ubuf->f_frsize))
323                 return -EFAULT;
324         return 0;
325 }
326
327 asmlinkage long compat_sys_statfs64(const char __user *pathname, compat_size_t sz, struct compat_statfs64 __user *buf)
328 {
329         struct path path;
330         int error;
331
332         if (sz != sizeof(*buf))
333                 return -EINVAL;
334
335         error = user_path(pathname, &path);
336         if (!error) {
337                 struct kstatfs tmp;
338                 error = vfs_statfs(&path, &tmp);
339                 if (!error)
340                         error = put_compat_statfs64(buf, &tmp);
341                 path_put(&path);
342         }
343         return error;
344 }
345
346 asmlinkage long compat_sys_fstatfs64(unsigned int fd, compat_size_t sz, struct compat_statfs64 __user *buf)
347 {
348         struct file * file;
349         struct kstatfs tmp;
350         int error;
351
352         if (sz != sizeof(*buf))
353                 return -EINVAL;
354
355         error = -EBADF;
356         file = fget(fd);
357         if (!file)
358                 goto out;
359         error = vfs_statfs(&file->f_path, &tmp);
360         if (!error)
361                 error = put_compat_statfs64(buf, &tmp);
362         fput(file);
363 out:
364         return error;
365 }
366
367 /*
368  * This is a copy of sys_ustat, just dealing with a structure layout.
369  * Given how simple this syscall is that apporach is more maintainable
370  * than the various conversion hacks.
371  */
372 asmlinkage long compat_sys_ustat(unsigned dev, struct compat_ustat __user *u)
373 {
374         struct super_block *sb;
375         struct compat_ustat tmp;
376         struct kstatfs sbuf;
377         int err;
378
379         sb = user_get_super(new_decode_dev(dev));
380         if (!sb)
381                 return -EINVAL;
382         err = statfs_by_dentry(sb->s_root, &sbuf);
383         drop_super(sb);
384         if (err)
385                 return err;
386
387         memset(&tmp, 0, sizeof(struct compat_ustat));
388         tmp.f_tfree = sbuf.f_bfree;
389         tmp.f_tinode = sbuf.f_ffree;
390         if (copy_to_user(u, &tmp, sizeof(struct compat_ustat)))
391                 return -EFAULT;
392         return 0;
393 }
394
395 static int get_compat_flock(struct flock *kfl, struct compat_flock __user *ufl)
396 {
397         if (!access_ok(VERIFY_READ, ufl, sizeof(*ufl)) ||
398             __get_user(kfl->l_type, &ufl->l_type) ||
399             __get_user(kfl->l_whence, &ufl->l_whence) ||
400             __get_user(kfl->l_start, &ufl->l_start) ||
401             __get_user(kfl->l_len, &ufl->l_len) ||
402             __get_user(kfl->l_pid, &ufl->l_pid))
403                 return -EFAULT;
404         return 0;
405 }
406
407 static int put_compat_flock(struct flock *kfl, struct compat_flock __user *ufl)
408 {
409         if (!access_ok(VERIFY_WRITE, ufl, sizeof(*ufl)) ||
410             __put_user(kfl->l_type, &ufl->l_type) ||
411             __put_user(kfl->l_whence, &ufl->l_whence) ||
412             __put_user(kfl->l_start, &ufl->l_start) ||
413             __put_user(kfl->l_len, &ufl->l_len) ||
414             __put_user(kfl->l_pid, &ufl->l_pid))
415                 return -EFAULT;
416         return 0;
417 }
418
419 #ifndef HAVE_ARCH_GET_COMPAT_FLOCK64
420 static int get_compat_flock64(struct flock *kfl, struct compat_flock64 __user *ufl)
421 {
422         if (!access_ok(VERIFY_READ, ufl, sizeof(*ufl)) ||
423             __get_user(kfl->l_type, &ufl->l_type) ||
424             __get_user(kfl->l_whence, &ufl->l_whence) ||
425             __get_user(kfl->l_start, &ufl->l_start) ||
426             __get_user(kfl->l_len, &ufl->l_len) ||
427             __get_user(kfl->l_pid, &ufl->l_pid))
428                 return -EFAULT;
429         return 0;
430 }
431 #endif
432
433 #ifndef HAVE_ARCH_PUT_COMPAT_FLOCK64
434 static int put_compat_flock64(struct flock *kfl, struct compat_flock64 __user *ufl)
435 {
436         if (!access_ok(VERIFY_WRITE, ufl, sizeof(*ufl)) ||
437             __put_user(kfl->l_type, &ufl->l_type) ||
438             __put_user(kfl->l_whence, &ufl->l_whence) ||
439             __put_user(kfl->l_start, &ufl->l_start) ||
440             __put_user(kfl->l_len, &ufl->l_len) ||
441             __put_user(kfl->l_pid, &ufl->l_pid))
442                 return -EFAULT;
443         return 0;
444 }
445 #endif
446
447 asmlinkage long compat_sys_fcntl64(unsigned int fd, unsigned int cmd,
448                 unsigned long arg)
449 {
450         mm_segment_t old_fs;
451         struct flock f;
452         long ret;
453
454         switch (cmd) {
455         case F_GETLK:
456         case F_SETLK:
457         case F_SETLKW:
458                 ret = get_compat_flock(&f, compat_ptr(arg));
459                 if (ret != 0)
460                         break;
461                 old_fs = get_fs();
462                 set_fs(KERNEL_DS);
463                 ret = sys_fcntl(fd, cmd, (unsigned long)&f);
464                 set_fs(old_fs);
465                 if (cmd == F_GETLK && ret == 0) {
466                         /* GETLK was successful and we need to return the data...
467                          * but it needs to fit in the compat structure.
468                          * l_start shouldn't be too big, unless the original
469                          * start + end is greater than COMPAT_OFF_T_MAX, in which
470                          * case the app was asking for trouble, so we return
471                          * -EOVERFLOW in that case.
472                          * l_len could be too big, in which case we just truncate it,
473                          * and only allow the app to see that part of the conflicting
474                          * lock that might make sense to it anyway
475                          */
476
477                         if (f.l_start > COMPAT_OFF_T_MAX)
478                                 ret = -EOVERFLOW;
479                         if (f.l_len > COMPAT_OFF_T_MAX)
480                                 f.l_len = COMPAT_OFF_T_MAX;
481                         if (ret == 0)
482                                 ret = put_compat_flock(&f, compat_ptr(arg));
483                 }
484                 break;
485
486         case F_GETLK64:
487         case F_SETLK64:
488         case F_SETLKW64:
489                 ret = get_compat_flock64(&f, compat_ptr(arg));
490                 if (ret != 0)
491                         break;
492                 old_fs = get_fs();
493                 set_fs(KERNEL_DS);
494                 ret = sys_fcntl(fd, (cmd == F_GETLK64) ? F_GETLK :
495                                 ((cmd == F_SETLK64) ? F_SETLK : F_SETLKW),
496                                 (unsigned long)&f);
497                 set_fs(old_fs);
498                 if (cmd == F_GETLK64 && ret == 0) {
499                         /* need to return lock information - see above for commentary */
500                         if (f.l_start > COMPAT_LOFF_T_MAX)
501                                 ret = -EOVERFLOW;
502                         if (f.l_len > COMPAT_LOFF_T_MAX)
503                                 f.l_len = COMPAT_LOFF_T_MAX;
504                         if (ret == 0)
505                                 ret = put_compat_flock64(&f, compat_ptr(arg));
506                 }
507                 break;
508
509         default:
510                 ret = sys_fcntl(fd, cmd, arg);
511                 break;
512         }
513         return ret;
514 }
515
516 asmlinkage long compat_sys_fcntl(unsigned int fd, unsigned int cmd,
517                 unsigned long arg)
518 {
519         if ((cmd == F_GETLK64) || (cmd == F_SETLK64) || (cmd == F_SETLKW64))
520                 return -EINVAL;
521         return compat_sys_fcntl64(fd, cmd, arg);
522 }
523
524 asmlinkage long
525 compat_sys_io_setup(unsigned nr_reqs, u32 __user *ctx32p)
526 {
527         long ret;
528         aio_context_t ctx64;
529
530         mm_segment_t oldfs = get_fs();
531         if (unlikely(get_user(ctx64, ctx32p)))
532                 return -EFAULT;
533
534         set_fs(KERNEL_DS);
535         /* The __user pointer cast is valid because of the set_fs() */
536         ret = sys_io_setup(nr_reqs, (aio_context_t __user *) &ctx64);
537         set_fs(oldfs);
538         /* truncating is ok because it's a user address */
539         if (!ret)
540                 ret = put_user((u32) ctx64, ctx32p);
541         return ret;
542 }
543
544 asmlinkage long
545 compat_sys_io_getevents(aio_context_t ctx_id,
546                                  unsigned long min_nr,
547                                  unsigned long nr,
548                                  struct io_event __user *events,
549                                  struct compat_timespec __user *timeout)
550 {
551         long ret;
552         struct timespec t;
553         struct timespec __user *ut = NULL;
554
555         ret = -EFAULT;
556         if (unlikely(!access_ok(VERIFY_WRITE, events, 
557                                 nr * sizeof(struct io_event))))
558                 goto out;
559         if (timeout) {
560                 if (get_compat_timespec(&t, timeout))
561                         goto out;
562
563                 ut = compat_alloc_user_space(sizeof(*ut));
564                 if (copy_to_user(ut, &t, sizeof(t)) )
565                         goto out;
566         } 
567         ret = sys_io_getevents(ctx_id, min_nr, nr, events, ut);
568 out:
569         return ret;
570 }
571
572 /* A write operation does a read from user space and vice versa */
573 #define vrfy_dir(type) ((type) == READ ? VERIFY_WRITE : VERIFY_READ)
574
575 ssize_t compat_rw_copy_check_uvector(int type,
576                 const struct compat_iovec __user *uvector, unsigned long nr_segs,
577                 unsigned long fast_segs, struct iovec *fast_pointer,
578                 struct iovec **ret_pointer)
579 {
580         compat_ssize_t tot_len;
581         struct iovec *iov = *ret_pointer = fast_pointer;
582         ssize_t ret = 0;
583         int seg;
584
585         /*
586          * SuS says "The readv() function *may* fail if the iovcnt argument
587          * was less than or equal to 0, or greater than {IOV_MAX}.  Linux has
588          * traditionally returned zero for zero segments, so...
589          */
590         if (nr_segs == 0)
591                 goto out;
592
593         ret = -EINVAL;
594         if (nr_segs > UIO_MAXIOV || nr_segs < 0)
595                 goto out;
596         if (nr_segs > fast_segs) {
597                 ret = -ENOMEM;
598                 iov = kmalloc(nr_segs*sizeof(struct iovec), GFP_KERNEL);
599                 if (iov == NULL) {
600                         *ret_pointer = fast_pointer;
601                         goto out;
602                 }
603         }
604         *ret_pointer = iov;
605
606         /*
607          * Single unix specification:
608          * We should -EINVAL if an element length is not >= 0 and fitting an
609          * ssize_t.  The total length is fitting an ssize_t
610          *
611          * Be careful here because iov_len is a size_t not an ssize_t
612          */
613         tot_len = 0;
614         ret = -EINVAL;
615         for (seg = 0; seg < nr_segs; seg++) {
616                 compat_ssize_t tmp = tot_len;
617                 compat_uptr_t buf;
618                 compat_ssize_t len;
619
620                 if (__get_user(len, &uvector->iov_len) ||
621                    __get_user(buf, &uvector->iov_base)) {
622                         ret = -EFAULT;
623                         goto out;
624                 }
625                 if (len < 0)    /* size_t not fitting in compat_ssize_t .. */
626                         goto out;
627                 tot_len += len;
628                 if (tot_len < tmp) /* maths overflow on the compat_ssize_t */
629                         goto out;
630                 if (!access_ok(vrfy_dir(type), compat_ptr(buf), len)) {
631                         ret = -EFAULT;
632                         goto out;
633                 }
634                 iov->iov_base = compat_ptr(buf);
635                 iov->iov_len = (compat_size_t) len;
636                 uvector++;
637                 iov++;
638         }
639         ret = tot_len;
640
641 out:
642         return ret;
643 }
644
645 static inline long
646 copy_iocb(long nr, u32 __user *ptr32, struct iocb __user * __user *ptr64)
647 {
648         compat_uptr_t uptr;
649         int i;
650
651         for (i = 0; i < nr; ++i) {
652                 if (get_user(uptr, ptr32 + i))
653                         return -EFAULT;
654                 if (put_user(compat_ptr(uptr), ptr64 + i))
655                         return -EFAULT;
656         }
657         return 0;
658 }
659
660 #define MAX_AIO_SUBMITS         (PAGE_SIZE/sizeof(struct iocb *))
661
662 asmlinkage long
663 compat_sys_io_submit(aio_context_t ctx_id, int nr, u32 __user *iocb)
664 {
665         struct iocb __user * __user *iocb64; 
666         long ret;
667
668         if (unlikely(nr < 0))
669                 return -EINVAL;
670
671         if (nr > MAX_AIO_SUBMITS)
672                 nr = MAX_AIO_SUBMITS;
673         
674         iocb64 = compat_alloc_user_space(nr * sizeof(*iocb64));
675         ret = copy_iocb(nr, iocb, iocb64);
676         if (!ret)
677                 ret = do_io_submit(ctx_id, nr, iocb64, 1);
678         return ret;
679 }
680
681 struct compat_ncp_mount_data {
682         compat_int_t version;
683         compat_uint_t ncp_fd;
684         __compat_uid_t mounted_uid;
685         compat_pid_t wdog_pid;
686         unsigned char mounted_vol[NCP_VOLNAME_LEN + 1];
687         compat_uint_t time_out;
688         compat_uint_t retry_count;
689         compat_uint_t flags;
690         __compat_uid_t uid;
691         __compat_gid_t gid;
692         compat_mode_t file_mode;
693         compat_mode_t dir_mode;
694 };
695
696 struct compat_ncp_mount_data_v4 {
697         compat_int_t version;
698         compat_ulong_t flags;
699         compat_ulong_t mounted_uid;
700         compat_long_t wdog_pid;
701         compat_uint_t ncp_fd;
702         compat_uint_t time_out;
703         compat_uint_t retry_count;
704         compat_ulong_t uid;
705         compat_ulong_t gid;
706         compat_ulong_t file_mode;
707         compat_ulong_t dir_mode;
708 };
709
710 static void *do_ncp_super_data_conv(void *raw_data)
711 {
712         int version = *(unsigned int *)raw_data;
713
714         if (version == 3) {
715                 struct compat_ncp_mount_data *c_n = raw_data;
716                 struct ncp_mount_data *n = raw_data;
717
718                 n->dir_mode = c_n->dir_mode;
719                 n->file_mode = c_n->file_mode;
720                 n->gid = c_n->gid;
721                 n->uid = c_n->uid;
722                 memmove (n->mounted_vol, c_n->mounted_vol, (sizeof (c_n->mounted_vol) + 3 * sizeof (unsigned int)));
723                 n->wdog_pid = c_n->wdog_pid;
724                 n->mounted_uid = c_n->mounted_uid;
725         } else if (version == 4) {
726                 struct compat_ncp_mount_data_v4 *c_n = raw_data;
727                 struct ncp_mount_data_v4 *n = raw_data;
728
729                 n->dir_mode = c_n->dir_mode;
730                 n->file_mode = c_n->file_mode;
731                 n->gid = c_n->gid;
732                 n->uid = c_n->uid;
733                 n->retry_count = c_n->retry_count;
734                 n->time_out = c_n->time_out;
735                 n->ncp_fd = c_n->ncp_fd;
736                 n->wdog_pid = c_n->wdog_pid;
737                 n->mounted_uid = c_n->mounted_uid;
738                 n->flags = c_n->flags;
739         } else if (version != 5) {
740                 return NULL;
741         }
742
743         return raw_data;
744 }
745
746
747 struct compat_nfs_string {
748         compat_uint_t len;
749         compat_uptr_t data;
750 };
751
752 static inline void compat_nfs_string(struct nfs_string *dst,
753                                      struct compat_nfs_string *src)
754 {
755         dst->data = compat_ptr(src->data);
756         dst->len = src->len;
757 }
758
759 struct compat_nfs4_mount_data_v1 {
760         compat_int_t version;
761         compat_int_t flags;
762         compat_int_t rsize;
763         compat_int_t wsize;
764         compat_int_t timeo;
765         compat_int_t retrans;
766         compat_int_t acregmin;
767         compat_int_t acregmax;
768         compat_int_t acdirmin;
769         compat_int_t acdirmax;
770         struct compat_nfs_string client_addr;
771         struct compat_nfs_string mnt_path;
772         struct compat_nfs_string hostname;
773         compat_uint_t host_addrlen;
774         compat_uptr_t host_addr;
775         compat_int_t proto;
776         compat_int_t auth_flavourlen;
777         compat_uptr_t auth_flavours;
778 };
779
780 static int do_nfs4_super_data_conv(void *raw_data)
781 {
782         int version = *(compat_uint_t *) raw_data;
783
784         if (version == 1) {
785                 struct compat_nfs4_mount_data_v1 *raw = raw_data;
786                 struct nfs4_mount_data *real = raw_data;
787
788                 /* copy the fields backwards */
789                 real->auth_flavours = compat_ptr(raw->auth_flavours);
790                 real->auth_flavourlen = raw->auth_flavourlen;
791                 real->proto = raw->proto;
792                 real->host_addr = compat_ptr(raw->host_addr);
793                 real->host_addrlen = raw->host_addrlen;
794                 compat_nfs_string(&real->hostname, &raw->hostname);
795                 compat_nfs_string(&real->mnt_path, &raw->mnt_path);
796                 compat_nfs_string(&real->client_addr, &raw->client_addr);
797                 real->acdirmax = raw->acdirmax;
798                 real->acdirmin = raw->acdirmin;
799                 real->acregmax = raw->acregmax;
800                 real->acregmin = raw->acregmin;
801                 real->retrans = raw->retrans;
802                 real->timeo = raw->timeo;
803                 real->wsize = raw->wsize;
804                 real->rsize = raw->rsize;
805                 real->flags = raw->flags;
806                 real->version = raw->version;
807         }
808
809         return 0;
810 }
811
812 #define NCPFS_NAME      "ncpfs"
813 #define NFS4_NAME       "nfs4"
814
815 asmlinkage long compat_sys_mount(const char __user * dev_name,
816                                  const char __user * dir_name,
817                                  const char __user * type, unsigned long flags,
818                                  const void __user * data)
819 {
820         char *kernel_type;
821         unsigned long data_page;
822         char *kernel_dev;
823         char *dir_page;
824         int retval;
825
826         retval = copy_mount_string(type, &kernel_type);
827         if (retval < 0)
828                 goto out;
829
830         dir_page = getname(dir_name);
831         retval = PTR_ERR(dir_page);
832         if (IS_ERR(dir_page))
833                 goto out1;
834
835         retval = copy_mount_string(dev_name, &kernel_dev);
836         if (retval < 0)
837                 goto out2;
838
839         retval = copy_mount_options(data, &data_page);
840         if (retval < 0)
841                 goto out3;
842
843         retval = -EINVAL;
844
845         if (kernel_type && data_page) {
846                 if (!strcmp(kernel_type, NCPFS_NAME)) {
847                         do_ncp_super_data_conv((void *)data_page);
848                 } else if (!strcmp(kernel_type, NFS4_NAME)) {
849                         if (do_nfs4_super_data_conv((void *) data_page))
850                                 goto out4;
851                 }
852         }
853
854         retval = do_mount(kernel_dev, dir_page, kernel_type,
855                         flags, (void*)data_page);
856
857  out4:
858         free_page(data_page);
859  out3:
860         kfree(kernel_dev);
861  out2:
862         putname(dir_page);
863  out1:
864         kfree(kernel_type);
865  out:
866         return retval;
867 }
868
869 struct compat_old_linux_dirent {
870         compat_ulong_t  d_ino;
871         compat_ulong_t  d_offset;
872         unsigned short  d_namlen;
873         char            d_name[1];
874 };
875
876 struct compat_readdir_callback {
877         struct compat_old_linux_dirent __user *dirent;
878         int result;
879 };
880
881 static int compat_fillonedir(void *__buf, const char *name, int namlen,
882                         loff_t offset, u64 ino, unsigned int d_type)
883 {
884         struct compat_readdir_callback *buf = __buf;
885         struct compat_old_linux_dirent __user *dirent;
886         compat_ulong_t d_ino;
887
888         if (buf->result)
889                 return -EINVAL;
890         d_ino = ino;
891         if (sizeof(d_ino) < sizeof(ino) && d_ino != ino) {
892                 buf->result = -EOVERFLOW;
893                 return -EOVERFLOW;
894         }
895         buf->result++;
896         dirent = buf->dirent;
897         if (!access_ok(VERIFY_WRITE, dirent,
898                         (unsigned long)(dirent->d_name + namlen + 1) -
899                                 (unsigned long)dirent))
900                 goto efault;
901         if (    __put_user(d_ino, &dirent->d_ino) ||
902                 __put_user(offset, &dirent->d_offset) ||
903                 __put_user(namlen, &dirent->d_namlen) ||
904                 __copy_to_user(dirent->d_name, name, namlen) ||
905                 __put_user(0, dirent->d_name + namlen))
906                 goto efault;
907         return 0;
908 efault:
909         buf->result = -EFAULT;
910         return -EFAULT;
911 }
912
913 asmlinkage long compat_sys_old_readdir(unsigned int fd,
914         struct compat_old_linux_dirent __user *dirent, unsigned int count)
915 {
916         int error;
917         struct file *file;
918         struct compat_readdir_callback buf;
919
920         error = -EBADF;
921         file = fget(fd);
922         if (!file)
923                 goto out;
924
925         buf.result = 0;
926         buf.dirent = dirent;
927
928         error = vfs_readdir(file, compat_fillonedir, &buf);
929         if (buf.result)
930                 error = buf.result;
931
932         fput(file);
933 out:
934         return error;
935 }
936
937 struct compat_linux_dirent {
938         compat_ulong_t  d_ino;
939         compat_ulong_t  d_off;
940         unsigned short  d_reclen;
941         char            d_name[1];
942 };
943
944 struct compat_getdents_callback {
945         struct compat_linux_dirent __user *current_dir;
946         struct compat_linux_dirent __user *previous;
947         int count;
948         int error;
949 };
950
951 static int compat_filldir(void *__buf, const char *name, int namlen,
952                 loff_t offset, u64 ino, unsigned int d_type)
953 {
954         struct compat_linux_dirent __user * dirent;
955         struct compat_getdents_callback *buf = __buf;
956         compat_ulong_t d_ino;
957         int reclen = ALIGN(offsetof(struct compat_linux_dirent, d_name) +
958                 namlen + 2, sizeof(compat_long_t));
959
960         buf->error = -EINVAL;   /* only used if we fail.. */
961         if (reclen > buf->count)
962                 return -EINVAL;
963         d_ino = ino;
964         if (sizeof(d_ino) < sizeof(ino) && d_ino != ino) {
965                 buf->error = -EOVERFLOW;
966                 return -EOVERFLOW;
967         }
968         dirent = buf->previous;
969         if (dirent) {
970                 if (__put_user(offset, &dirent->d_off))
971                         goto efault;
972         }
973         dirent = buf->current_dir;
974         if (__put_user(d_ino, &dirent->d_ino))
975                 goto efault;
976         if (__put_user(reclen, &dirent->d_reclen))
977                 goto efault;
978         if (copy_to_user(dirent->d_name, name, namlen))
979                 goto efault;
980         if (__put_user(0, dirent->d_name + namlen))
981                 goto efault;
982         if (__put_user(d_type, (char  __user *) dirent + reclen - 1))
983                 goto efault;
984         buf->previous = dirent;
985         dirent = (void __user *)dirent + reclen;
986         buf->current_dir = dirent;
987         buf->count -= reclen;
988         return 0;
989 efault:
990         buf->error = -EFAULT;
991         return -EFAULT;
992 }
993
994 asmlinkage long compat_sys_getdents(unsigned int fd,
995                 struct compat_linux_dirent __user *dirent, unsigned int count)
996 {
997         struct file * file;
998         struct compat_linux_dirent __user * lastdirent;
999         struct compat_getdents_callback buf;
1000         int error;
1001
1002         error = -EFAULT;
1003         if (!access_ok(VERIFY_WRITE, dirent, count))
1004                 goto out;
1005
1006         error = -EBADF;
1007         file = fget(fd);
1008         if (!file)
1009                 goto out;
1010
1011         buf.current_dir = dirent;
1012         buf.previous = NULL;
1013         buf.count = count;
1014         buf.error = 0;
1015
1016         error = vfs_readdir(file, compat_filldir, &buf);
1017         if (error >= 0)
1018                 error = buf.error;
1019         lastdirent = buf.previous;
1020         if (lastdirent) {
1021                 if (put_user(file->f_pos, &lastdirent->d_off))
1022                         error = -EFAULT;
1023                 else
1024                         error = count - buf.count;
1025         }
1026         fput(file);
1027 out:
1028         return error;
1029 }
1030
1031 #ifndef __ARCH_OMIT_COMPAT_SYS_GETDENTS64
1032
1033 struct compat_getdents_callback64 {
1034         struct linux_dirent64 __user *current_dir;
1035         struct linux_dirent64 __user *previous;
1036         int count;
1037         int error;
1038 };
1039
1040 static int compat_filldir64(void * __buf, const char * name, int namlen, loff_t offset,
1041                      u64 ino, unsigned int d_type)
1042 {
1043         struct linux_dirent64 __user *dirent;
1044         struct compat_getdents_callback64 *buf = __buf;
1045         int reclen = ALIGN(offsetof(struct linux_dirent64, d_name) + namlen + 1,
1046                 sizeof(u64));
1047         u64 off;
1048
1049         buf->error = -EINVAL;   /* only used if we fail.. */
1050         if (reclen > buf->count)
1051                 return -EINVAL;
1052         dirent = buf->previous;
1053
1054         if (dirent) {
1055                 if (__put_user_unaligned(offset, &dirent->d_off))
1056                         goto efault;
1057         }
1058         dirent = buf->current_dir;
1059         if (__put_user_unaligned(ino, &dirent->d_ino))
1060                 goto efault;
1061         off = 0;
1062         if (__put_user_unaligned(off, &dirent->d_off))
1063                 goto efault;
1064         if (__put_user(reclen, &dirent->d_reclen))
1065                 goto efault;
1066         if (__put_user(d_type, &dirent->d_type))
1067                 goto efault;
1068         if (copy_to_user(dirent->d_name, name, namlen))
1069                 goto efault;
1070         if (__put_user(0, dirent->d_name + namlen))
1071                 goto efault;
1072         buf->previous = dirent;
1073         dirent = (void __user *)dirent + reclen;
1074         buf->current_dir = dirent;
1075         buf->count -= reclen;
1076         return 0;
1077 efault:
1078         buf->error = -EFAULT;
1079         return -EFAULT;
1080 }
1081
1082 asmlinkage long compat_sys_getdents64(unsigned int fd,
1083                 struct linux_dirent64 __user * dirent, unsigned int count)
1084 {
1085         struct file * file;
1086         struct linux_dirent64 __user * lastdirent;
1087         struct compat_getdents_callback64 buf;
1088         int error;
1089
1090         error = -EFAULT;
1091         if (!access_ok(VERIFY_WRITE, dirent, count))
1092                 goto out;
1093
1094         error = -EBADF;
1095         file = fget(fd);
1096         if (!file)
1097                 goto out;
1098
1099         buf.current_dir = dirent;
1100         buf.previous = NULL;
1101         buf.count = count;
1102         buf.error = 0;
1103
1104         error = vfs_readdir(file, compat_filldir64, &buf);
1105         if (error >= 0)
1106                 error = buf.error;
1107         lastdirent = buf.previous;
1108         if (lastdirent) {
1109                 typeof(lastdirent->d_off) d_off = file->f_pos;
1110                 if (__put_user_unaligned(d_off, &lastdirent->d_off))
1111                         error = -EFAULT;
1112                 else
1113                         error = count - buf.count;
1114         }
1115         fput(file);
1116 out:
1117         return error;
1118 }
1119 #endif /* ! __ARCH_OMIT_COMPAT_SYS_GETDENTS64 */
1120
1121 static ssize_t compat_do_readv_writev(int type, struct file *file,
1122                                const struct compat_iovec __user *uvector,
1123                                unsigned long nr_segs, loff_t *pos)
1124 {
1125         compat_ssize_t tot_len;
1126         struct iovec iovstack[UIO_FASTIOV];
1127         struct iovec *iov = iovstack;
1128         ssize_t ret;
1129         io_fn_t fn;
1130         iov_fn_t fnv;
1131
1132         ret = -EINVAL;
1133         if (!file->f_op)
1134                 goto out;
1135
1136         ret = -EFAULT;
1137         if (!access_ok(VERIFY_READ, uvector, nr_segs*sizeof(*uvector)))
1138                 goto out;
1139
1140         tot_len = compat_rw_copy_check_uvector(type, uvector, nr_segs,
1141                                                UIO_FASTIOV, iovstack, &iov);
1142         if (tot_len == 0) {
1143                 ret = 0;
1144                 goto out;
1145         }
1146
1147         ret = rw_verify_area(type, file, pos, tot_len);
1148         if (ret < 0)
1149                 goto out;
1150
1151         fnv = NULL;
1152         if (type == READ) {
1153                 fn = file->f_op->read;
1154                 fnv = file->f_op->aio_read;
1155         } else {
1156                 fn = (io_fn_t)file->f_op->write;
1157                 fnv = file->f_op->aio_write;
1158         }
1159
1160         if (fnv)
1161                 ret = do_sync_readv_writev(file, iov, nr_segs, tot_len,
1162                                                 pos, fnv);
1163         else
1164                 ret = do_loop_readv_writev(file, iov, nr_segs, pos, fn);
1165
1166 out:
1167         if (iov != iovstack)
1168                 kfree(iov);
1169         if ((ret + (type == READ)) > 0) {
1170                 if (type == READ)
1171                         fsnotify_access(file);
1172                 else
1173                         fsnotify_modify(file);
1174         }
1175         return ret;
1176 }
1177
1178 static size_t compat_readv(struct file *file,
1179                            const struct compat_iovec __user *vec,
1180                            unsigned long vlen, loff_t *pos)
1181 {
1182         ssize_t ret = -EBADF;
1183
1184         if (!(file->f_mode & FMODE_READ))
1185                 goto out;
1186
1187         ret = -EINVAL;
1188         if (!file->f_op || (!file->f_op->aio_read && !file->f_op->read))
1189                 goto out;
1190
1191         ret = compat_do_readv_writev(READ, file, vec, vlen, pos);
1192
1193 out:
1194         if (ret > 0)
1195                 add_rchar(current, ret);
1196         inc_syscr(current);
1197         return ret;
1198 }
1199
1200 asmlinkage ssize_t
1201 compat_sys_readv(unsigned long fd, const struct compat_iovec __user *vec,
1202                  unsigned long vlen)
1203 {
1204         struct file *file;
1205         int fput_needed;
1206         ssize_t ret;
1207
1208         file = fget_light(fd, &fput_needed);
1209         if (!file)
1210                 return -EBADF;
1211         ret = compat_readv(file, vec, vlen, &file->f_pos);
1212         fput_light(file, fput_needed);
1213         return ret;
1214 }
1215
1216 asmlinkage ssize_t
1217 compat_sys_preadv(unsigned long fd, const struct compat_iovec __user *vec,
1218                   unsigned long vlen, u32 pos_low, u32 pos_high)
1219 {
1220         loff_t pos = ((loff_t)pos_high << 32) | pos_low;
1221         struct file *file;
1222         int fput_needed;
1223         ssize_t ret;
1224
1225         if (pos < 0)
1226                 return -EINVAL;
1227         file = fget_light(fd, &fput_needed);
1228         if (!file)
1229                 return -EBADF;
1230         ret = compat_readv(file, vec, vlen, &pos);
1231         fput_light(file, fput_needed);
1232         return ret;
1233 }
1234
1235 static size_t compat_writev(struct file *file,
1236                             const struct compat_iovec __user *vec,
1237                             unsigned long vlen, loff_t *pos)
1238 {
1239         ssize_t ret = -EBADF;
1240
1241         if (!(file->f_mode & FMODE_WRITE))
1242                 goto out;
1243
1244         ret = -EINVAL;
1245         if (!file->f_op || (!file->f_op->aio_write && !file->f_op->write))
1246                 goto out;
1247
1248         ret = compat_do_readv_writev(WRITE, file, vec, vlen, pos);
1249
1250 out:
1251         if (ret > 0)
1252                 add_wchar(current, ret);
1253         inc_syscw(current);
1254         return ret;
1255 }
1256
1257 asmlinkage ssize_t
1258 compat_sys_writev(unsigned long fd, const struct compat_iovec __user *vec,
1259                   unsigned long vlen)
1260 {
1261         struct file *file;
1262         int fput_needed;
1263         ssize_t ret;
1264
1265         file = fget_light(fd, &fput_needed);
1266         if (!file)
1267                 return -EBADF;
1268         ret = compat_writev(file, vec, vlen, &file->f_pos);
1269         fput_light(file, fput_needed);
1270         return ret;
1271 }
1272
1273 asmlinkage ssize_t
1274 compat_sys_pwritev(unsigned long fd, const struct compat_iovec __user *vec,
1275                    unsigned long vlen, u32 pos_low, u32 pos_high)
1276 {
1277         loff_t pos = ((loff_t)pos_high << 32) | pos_low;
1278         struct file *file;
1279         int fput_needed;
1280         ssize_t ret;
1281
1282         if (pos < 0)
1283                 return -EINVAL;
1284         file = fget_light(fd, &fput_needed);
1285         if (!file)
1286                 return -EBADF;
1287         ret = compat_writev(file, vec, vlen, &pos);
1288         fput_light(file, fput_needed);
1289         return ret;
1290 }
1291
1292 asmlinkage long
1293 compat_sys_vmsplice(int fd, const struct compat_iovec __user *iov32,
1294                     unsigned int nr_segs, unsigned int flags)
1295 {
1296         unsigned i;
1297         struct iovec __user *iov;
1298         if (nr_segs > UIO_MAXIOV)
1299                 return -EINVAL;
1300         iov = compat_alloc_user_space(nr_segs * sizeof(struct iovec));
1301         for (i = 0; i < nr_segs; i++) {
1302                 struct compat_iovec v;
1303                 if (get_user(v.iov_base, &iov32[i].iov_base) ||
1304                     get_user(v.iov_len, &iov32[i].iov_len) ||
1305                     put_user(compat_ptr(v.iov_base), &iov[i].iov_base) ||
1306                     put_user(v.iov_len, &iov[i].iov_len))
1307                         return -EFAULT;
1308         }
1309         return sys_vmsplice(fd, iov, nr_segs, flags);
1310 }
1311
1312 /*
1313  * Exactly like fs/open.c:sys_open(), except that it doesn't set the
1314  * O_LARGEFILE flag.
1315  */
1316 asmlinkage long
1317 compat_sys_open(const char __user *filename, int flags, int mode)
1318 {
1319         return do_sys_open(AT_FDCWD, filename, flags, mode);
1320 }
1321
1322 /*
1323  * Exactly like fs/open.c:sys_openat(), except that it doesn't set the
1324  * O_LARGEFILE flag.
1325  */
1326 asmlinkage long
1327 compat_sys_openat(unsigned int dfd, const char __user *filename, int flags, int mode)
1328 {
1329         return do_sys_open(dfd, filename, flags, mode);
1330 }
1331
1332 /*
1333  * compat_count() counts the number of arguments/envelopes. It is basically
1334  * a copy of count() from fs/exec.c, except that it works with 32 bit argv
1335  * and envp pointers.
1336  */
1337 static int compat_count(compat_uptr_t __user *argv, int max)
1338 {
1339         int i = 0;
1340
1341         if (argv != NULL) {
1342                 for (;;) {
1343                         compat_uptr_t p;
1344
1345                         if (get_user(p, argv))
1346                                 return -EFAULT;
1347                         if (!p)
1348                                 break;
1349                         argv++;
1350                         if (i++ >= max)
1351                                 return -E2BIG;
1352                 }
1353         }
1354         return i;
1355 }
1356
1357 /*
1358  * compat_copy_strings() is basically a copy of copy_strings() from fs/exec.c
1359  * except that it works with 32 bit argv and envp pointers.
1360  */
1361 static int compat_copy_strings(int argc, compat_uptr_t __user *argv,
1362                                 struct linux_binprm *bprm)
1363 {
1364         struct page *kmapped_page = NULL;
1365         char *kaddr = NULL;
1366         unsigned long kpos = 0;
1367         int ret;
1368
1369         while (argc-- > 0) {
1370                 compat_uptr_t str;
1371                 int len;
1372                 unsigned long pos;
1373
1374                 if (get_user(str, argv+argc) ||
1375                     !(len = strnlen_user(compat_ptr(str), MAX_ARG_STRLEN))) {
1376                         ret = -EFAULT;
1377                         goto out;
1378                 }
1379
1380                 if (len > MAX_ARG_STRLEN) {
1381                         ret = -E2BIG;
1382                         goto out;
1383                 }
1384
1385                 /* We're going to work our way backwords. */
1386                 pos = bprm->p;
1387                 str += len;
1388                 bprm->p -= len;
1389
1390                 while (len > 0) {
1391                         int offset, bytes_to_copy;
1392
1393                         offset = pos % PAGE_SIZE;
1394                         if (offset == 0)
1395                                 offset = PAGE_SIZE;
1396
1397                         bytes_to_copy = offset;
1398                         if (bytes_to_copy > len)
1399                                 bytes_to_copy = len;
1400
1401                         offset -= bytes_to_copy;
1402                         pos -= bytes_to_copy;
1403                         str -= bytes_to_copy;
1404                         len -= bytes_to_copy;
1405
1406                         if (!kmapped_page || kpos != (pos & PAGE_MASK)) {
1407                                 struct page *page;
1408
1409 #ifdef CONFIG_STACK_GROWSUP
1410                                 ret = expand_stack_downwards(bprm->vma, pos);
1411                                 if (ret < 0) {
1412                                         /* We've exceed the stack rlimit. */
1413                                         ret = -E2BIG;
1414                                         goto out;
1415                                 }
1416 #endif
1417                                 ret = get_user_pages(current, bprm->mm, pos,
1418                                                      1, 1, 1, &page, NULL);
1419                                 if (ret <= 0) {
1420                                         /* We've exceed the stack rlimit. */
1421                                         ret = -E2BIG;
1422                                         goto out;
1423                                 }
1424
1425                                 if (kmapped_page) {
1426                                         flush_kernel_dcache_page(kmapped_page);
1427                                         kunmap(kmapped_page);
1428                                         put_page(kmapped_page);
1429                                 }
1430                                 kmapped_page = page;
1431                                 kaddr = kmap(kmapped_page);
1432                                 kpos = pos & PAGE_MASK;
1433                                 flush_cache_page(bprm->vma, kpos,
1434                                                  page_to_pfn(kmapped_page));
1435                         }
1436                         if (copy_from_user(kaddr+offset, compat_ptr(str),
1437                                                 bytes_to_copy)) {
1438                                 ret = -EFAULT;
1439                                 goto out;
1440                         }
1441                 }
1442         }
1443         ret = 0;
1444 out:
1445         if (kmapped_page) {
1446                 flush_kernel_dcache_page(kmapped_page);
1447                 kunmap(kmapped_page);
1448                 put_page(kmapped_page);
1449         }
1450         return ret;
1451 }
1452
1453 /*
1454  * compat_do_execve() is mostly a copy of do_execve(), with the exception
1455  * that it processes 32 bit argv and envp pointers.
1456  */
1457 int compat_do_execve(char * filename,
1458         compat_uptr_t __user *argv,
1459         compat_uptr_t __user *envp,
1460         struct pt_regs * regs)
1461 {
1462         struct linux_binprm *bprm;
1463         struct file *file;
1464         struct files_struct *displaced;
1465         bool clear_in_exec;
1466         int retval;
1467
1468         retval = unshare_files(&displaced);
1469         if (retval)
1470                 goto out_ret;
1471
1472         retval = -ENOMEM;
1473         bprm = kzalloc(sizeof(*bprm), GFP_KERNEL);
1474         if (!bprm)
1475                 goto out_files;
1476
1477         retval = prepare_bprm_creds(bprm);
1478         if (retval)
1479                 goto out_free;
1480
1481         retval = check_unsafe_exec(bprm);
1482         if (retval < 0)
1483                 goto out_free;
1484         clear_in_exec = retval;
1485         current->in_execve = 1;
1486
1487         file = open_exec(filename);
1488         retval = PTR_ERR(file);
1489         if (IS_ERR(file))
1490                 goto out_unmark;
1491
1492         sched_exec();
1493
1494         bprm->file = file;
1495         bprm->filename = filename;
1496         bprm->interp = filename;
1497
1498         retval = bprm_mm_init(bprm);
1499         if (retval)
1500                 goto out_file;
1501
1502         bprm->argc = compat_count(argv, MAX_ARG_STRINGS);
1503         if ((retval = bprm->argc) < 0)
1504                 goto out;
1505
1506         bprm->envc = compat_count(envp, MAX_ARG_STRINGS);
1507         if ((retval = bprm->envc) < 0)
1508                 goto out;
1509
1510         retval = prepare_binprm(bprm);
1511         if (retval < 0)
1512                 goto out;
1513
1514         retval = copy_strings_kernel(1, &bprm->filename, bprm);
1515         if (retval < 0)
1516                 goto out;
1517
1518         bprm->exec = bprm->p;
1519         retval = compat_copy_strings(bprm->envc, envp, bprm);
1520         if (retval < 0)
1521                 goto out;
1522
1523         retval = compat_copy_strings(bprm->argc, argv, bprm);
1524         if (retval < 0)
1525                 goto out;
1526
1527         retval = search_binary_handler(bprm, regs);
1528         if (retval < 0)
1529                 goto out;
1530
1531         /* execve succeeded */
1532         current->fs->in_exec = 0;
1533         current->in_execve = 0;
1534         acct_update_integrals(current);
1535         free_bprm(bprm);
1536         if (displaced)
1537                 put_files_struct(displaced);
1538         return retval;
1539
1540 out:
1541         if (bprm->mm)
1542                 mmput(bprm->mm);
1543
1544 out_file:
1545         if (bprm->file) {
1546                 allow_write_access(bprm->file);
1547                 fput(bprm->file);
1548         }
1549
1550 out_unmark:
1551         if (clear_in_exec)
1552                 current->fs->in_exec = 0;
1553         current->in_execve = 0;
1554
1555 out_free:
1556         free_bprm(bprm);
1557
1558 out_files:
1559         if (displaced)
1560                 reset_files_struct(displaced);
1561 out_ret:
1562         return retval;
1563 }
1564
1565 #define __COMPAT_NFDBITS       (8 * sizeof(compat_ulong_t))
1566
1567 static int poll_select_copy_remaining(struct timespec *end_time, void __user *p,
1568                                       int timeval, int ret)
1569 {
1570         struct timespec ts;
1571
1572         if (!p)
1573                 return ret;
1574
1575         if (current->personality & STICKY_TIMEOUTS)
1576                 goto sticky;
1577
1578         /* No update for zero timeout */
1579         if (!end_time->tv_sec && !end_time->tv_nsec)
1580                 return ret;
1581
1582         ktime_get_ts(&ts);
1583         ts = timespec_sub(*end_time, ts);
1584         if (ts.tv_sec < 0)
1585                 ts.tv_sec = ts.tv_nsec = 0;
1586
1587         if (timeval) {
1588                 struct compat_timeval rtv;
1589
1590                 rtv.tv_sec = ts.tv_sec;
1591                 rtv.tv_usec = ts.tv_nsec / NSEC_PER_USEC;
1592
1593                 if (!copy_to_user(p, &rtv, sizeof(rtv)))
1594                         return ret;
1595         } else {
1596                 struct compat_timespec rts;
1597
1598                 rts.tv_sec = ts.tv_sec;
1599                 rts.tv_nsec = ts.tv_nsec;
1600
1601                 if (!copy_to_user(p, &rts, sizeof(rts)))
1602                         return ret;
1603         }
1604         /*
1605          * If an application puts its timeval in read-only memory, we
1606          * don't want the Linux-specific update to the timeval to
1607          * cause a fault after the select has completed
1608          * successfully. However, because we're not updating the
1609          * timeval, we can't restart the system call.
1610          */
1611
1612 sticky:
1613         if (ret == -ERESTARTNOHAND)
1614                 ret = -EINTR;
1615         return ret;
1616 }
1617
1618 /*
1619  * Ooo, nasty.  We need here to frob 32-bit unsigned longs to
1620  * 64-bit unsigned longs.
1621  */
1622 static
1623 int compat_get_fd_set(unsigned long nr, compat_ulong_t __user *ufdset,
1624                         unsigned long *fdset)
1625 {
1626         nr = DIV_ROUND_UP(nr, __COMPAT_NFDBITS);
1627         if (ufdset) {
1628                 unsigned long odd;
1629
1630                 if (!access_ok(VERIFY_WRITE, ufdset, nr*sizeof(compat_ulong_t)))
1631                         return -EFAULT;
1632
1633                 odd = nr & 1UL;
1634                 nr &= ~1UL;
1635                 while (nr) {
1636                         unsigned long h, l;
1637                         if (__get_user(l, ufdset) || __get_user(h, ufdset+1))
1638                                 return -EFAULT;
1639                         ufdset += 2;
1640                         *fdset++ = h << 32 | l;
1641                         nr -= 2;
1642                 }
1643                 if (odd && __get_user(*fdset, ufdset))
1644                         return -EFAULT;
1645         } else {
1646                 /* Tricky, must clear full unsigned long in the
1647                  * kernel fdset at the end, this makes sure that
1648                  * actually happens.
1649                  */
1650                 memset(fdset, 0, ((nr + 1) & ~1)*sizeof(compat_ulong_t));
1651         }
1652         return 0;
1653 }
1654
1655 static
1656 int compat_set_fd_set(unsigned long nr, compat_ulong_t __user *ufdset,
1657                       unsigned long *fdset)
1658 {
1659         unsigned long odd;
1660         nr = DIV_ROUND_UP(nr, __COMPAT_NFDBITS);
1661
1662         if (!ufdset)
1663                 return 0;
1664
1665         odd = nr & 1UL;
1666         nr &= ~1UL;
1667         while (nr) {
1668                 unsigned long h, l;
1669                 l = *fdset++;
1670                 h = l >> 32;
1671                 if (__put_user(l, ufdset) || __put_user(h, ufdset+1))
1672                         return -EFAULT;
1673                 ufdset += 2;
1674                 nr -= 2;
1675         }
1676         if (odd && __put_user(*fdset, ufdset))
1677                 return -EFAULT;
1678         return 0;
1679 }
1680
1681
1682 /*
1683  * This is a virtual copy of sys_select from fs/select.c and probably
1684  * should be compared to it from time to time
1685  */
1686
1687 /*
1688  * We can actually return ERESTARTSYS instead of EINTR, but I'd
1689  * like to be certain this leads to no problems. So I return
1690  * EINTR just for safety.
1691  *
1692  * Update: ERESTARTSYS breaks at least the xview clock binary, so
1693  * I'm trying ERESTARTNOHAND which restart only when you want to.
1694  */
1695 #define MAX_SELECT_SECONDS \
1696         ((unsigned long) (MAX_SCHEDULE_TIMEOUT / HZ)-1)
1697
1698 int compat_core_sys_select(int n, compat_ulong_t __user *inp,
1699         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1700         struct timespec *end_time)
1701 {
1702         fd_set_bits fds;
1703         void *bits;
1704         int size, max_fds, ret = -EINVAL;
1705         struct fdtable *fdt;
1706         long stack_fds[SELECT_STACK_ALLOC/sizeof(long)];
1707
1708         if (n < 0)
1709                 goto out_nofds;
1710
1711         /* max_fds can increase, so grab it once to avoid race */
1712         rcu_read_lock();
1713         fdt = files_fdtable(current->files);
1714         max_fds = fdt->max_fds;
1715         rcu_read_unlock();
1716         if (n > max_fds)
1717                 n = max_fds;
1718
1719         /*
1720          * We need 6 bitmaps (in/out/ex for both incoming and outgoing),
1721          * since we used fdset we need to allocate memory in units of
1722          * long-words.
1723          */
1724         size = FDS_BYTES(n);
1725         bits = stack_fds;
1726         if (size > sizeof(stack_fds) / 6) {
1727                 bits = kmalloc(6 * size, GFP_KERNEL);
1728                 ret = -ENOMEM;
1729                 if (!bits)
1730                         goto out_nofds;
1731         }
1732         fds.in      = (unsigned long *)  bits;
1733         fds.out     = (unsigned long *) (bits +   size);
1734         fds.ex      = (unsigned long *) (bits + 2*size);
1735         fds.res_in  = (unsigned long *) (bits + 3*size);
1736         fds.res_out = (unsigned long *) (bits + 4*size);
1737         fds.res_ex  = (unsigned long *) (bits + 5*size);
1738
1739         if ((ret = compat_get_fd_set(n, inp, fds.in)) ||
1740             (ret = compat_get_fd_set(n, outp, fds.out)) ||
1741             (ret = compat_get_fd_set(n, exp, fds.ex)))
1742                 goto out;
1743         zero_fd_set(n, fds.res_in);
1744         zero_fd_set(n, fds.res_out);
1745         zero_fd_set(n, fds.res_ex);
1746
1747         ret = do_select(n, &fds, end_time);
1748
1749         if (ret < 0)
1750                 goto out;
1751         if (!ret) {
1752                 ret = -ERESTARTNOHAND;
1753                 if (signal_pending(current))
1754                         goto out;
1755                 ret = 0;
1756         }
1757
1758         if (compat_set_fd_set(n, inp, fds.res_in) ||
1759             compat_set_fd_set(n, outp, fds.res_out) ||
1760             compat_set_fd_set(n, exp, fds.res_ex))
1761                 ret = -EFAULT;
1762 out:
1763         if (bits != stack_fds)
1764                 kfree(bits);
1765 out_nofds:
1766         return ret;
1767 }
1768
1769 asmlinkage long compat_sys_select(int n, compat_ulong_t __user *inp,
1770         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1771         struct compat_timeval __user *tvp)
1772 {
1773         struct timespec end_time, *to = NULL;
1774         struct compat_timeval tv;
1775         int ret;
1776
1777         if (tvp) {
1778                 if (copy_from_user(&tv, tvp, sizeof(tv)))
1779                         return -EFAULT;
1780
1781                 to = &end_time;
1782                 if (poll_select_set_timeout(to,
1783                                 tv.tv_sec + (tv.tv_usec / USEC_PER_SEC),
1784                                 (tv.tv_usec % USEC_PER_SEC) * NSEC_PER_USEC))
1785                         return -EINVAL;
1786         }
1787
1788         ret = compat_core_sys_select(n, inp, outp, exp, to);
1789         ret = poll_select_copy_remaining(&end_time, tvp, 1, ret);
1790
1791         return ret;
1792 }
1793
1794 struct compat_sel_arg_struct {
1795         compat_ulong_t n;
1796         compat_uptr_t inp;
1797         compat_uptr_t outp;
1798         compat_uptr_t exp;
1799         compat_uptr_t tvp;
1800 };
1801
1802 asmlinkage long compat_sys_old_select(struct compat_sel_arg_struct __user *arg)
1803 {
1804         struct compat_sel_arg_struct a;
1805
1806         if (copy_from_user(&a, arg, sizeof(a)))
1807                 return -EFAULT;
1808         return compat_sys_select(a.n, compat_ptr(a.inp), compat_ptr(a.outp),
1809                                  compat_ptr(a.exp), compat_ptr(a.tvp));
1810 }
1811
1812 #ifdef HAVE_SET_RESTORE_SIGMASK
1813 static long do_compat_pselect(int n, compat_ulong_t __user *inp,
1814         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1815         struct compat_timespec __user *tsp, compat_sigset_t __user *sigmask,
1816         compat_size_t sigsetsize)
1817 {
1818         compat_sigset_t ss32;
1819         sigset_t ksigmask, sigsaved;
1820         struct compat_timespec ts;
1821         struct timespec end_time, *to = NULL;
1822         int ret;
1823
1824         if (tsp) {
1825                 if (copy_from_user(&ts, tsp, sizeof(ts)))
1826                         return -EFAULT;
1827
1828                 to = &end_time;
1829                 if (poll_select_set_timeout(to, ts.tv_sec, ts.tv_nsec))
1830                         return -EINVAL;
1831         }
1832
1833         if (sigmask) {
1834                 if (sigsetsize != sizeof(compat_sigset_t))
1835                         return -EINVAL;
1836                 if (copy_from_user(&ss32, sigmask, sizeof(ss32)))
1837                         return -EFAULT;
1838                 sigset_from_compat(&ksigmask, &ss32);
1839
1840                 sigdelsetmask(&ksigmask, sigmask(SIGKILL)|sigmask(SIGSTOP));
1841                 sigprocmask(SIG_SETMASK, &ksigmask, &sigsaved);
1842         }
1843
1844         ret = compat_core_sys_select(n, inp, outp, exp, to);
1845         ret = poll_select_copy_remaining(&end_time, tsp, 0, ret);
1846
1847         if (ret == -ERESTARTNOHAND) {
1848                 /*
1849                  * Don't restore the signal mask yet. Let do_signal() deliver
1850                  * the signal on the way back to userspace, before the signal
1851                  * mask is restored.
1852                  */
1853                 if (sigmask) {
1854                         memcpy(&current->saved_sigmask, &sigsaved,
1855                                         sizeof(sigsaved));
1856                         set_restore_sigmask();
1857                 }
1858         } else if (sigmask)
1859                 sigprocmask(SIG_SETMASK, &sigsaved, NULL);
1860
1861         return ret;
1862 }
1863
1864 asmlinkage long compat_sys_pselect6(int n, compat_ulong_t __user *inp,
1865         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1866         struct compat_timespec __user *tsp, void __user *sig)
1867 {
1868         compat_size_t sigsetsize = 0;
1869         compat_uptr_t up = 0;
1870
1871         if (sig) {
1872                 if (!access_ok(VERIFY_READ, sig,
1873                                 sizeof(compat_uptr_t)+sizeof(compat_size_t)) ||
1874                         __get_user(up, (compat_uptr_t __user *)sig) ||
1875                         __get_user(sigsetsize,
1876                                 (compat_size_t __user *)(sig+sizeof(up))))
1877                         return -EFAULT;
1878         }
1879         return do_compat_pselect(n, inp, outp, exp, tsp, compat_ptr(up),
1880                                  sigsetsize);
1881 }
1882
1883 asmlinkage long compat_sys_ppoll(struct pollfd __user *ufds,
1884         unsigned int nfds, struct compat_timespec __user *tsp,
1885         const compat_sigset_t __user *sigmask, compat_size_t sigsetsize)
1886 {
1887         compat_sigset_t ss32;
1888         sigset_t ksigmask, sigsaved;
1889         struct compat_timespec ts;
1890         struct timespec end_time, *to = NULL;
1891         int ret;
1892
1893         if (tsp) {
1894                 if (copy_from_user(&ts, tsp, sizeof(ts)))
1895                         return -EFAULT;
1896
1897                 to = &end_time;
1898                 if (poll_select_set_timeout(to, ts.tv_sec, ts.tv_nsec))
1899                         return -EINVAL;
1900         }
1901
1902         if (sigmask) {
1903                 if (sigsetsize != sizeof(compat_sigset_t))
1904                         return -EINVAL;
1905                 if (copy_from_user(&ss32, sigmask, sizeof(ss32)))
1906                         return -EFAULT;
1907                 sigset_from_compat(&ksigmask, &ss32);
1908
1909                 sigdelsetmask(&ksigmask, sigmask(SIGKILL)|sigmask(SIGSTOP));
1910                 sigprocmask(SIG_SETMASK, &ksigmask, &sigsaved);
1911         }
1912
1913         ret = do_sys_poll(ufds, nfds, to);
1914
1915         /* We can restart this syscall, usually */
1916         if (ret == -EINTR) {
1917                 /*
1918                  * Don't restore the signal mask yet. Let do_signal() deliver
1919                  * the signal on the way back to userspace, before the signal
1920                  * mask is restored.
1921                  */
1922                 if (sigmask) {
1923                         memcpy(&current->saved_sigmask, &sigsaved,
1924                                 sizeof(sigsaved));
1925                         set_restore_sigmask();
1926                 }
1927                 ret = -ERESTARTNOHAND;
1928         } else if (sigmask)
1929                 sigprocmask(SIG_SETMASK, &sigsaved, NULL);
1930
1931         ret = poll_select_copy_remaining(&end_time, tsp, 0, ret);
1932
1933         return ret;
1934 }
1935 #endif /* HAVE_SET_RESTORE_SIGMASK */
1936
1937 #if (defined(CONFIG_NFSD) || defined(CONFIG_NFSD_MODULE)) && !defined(CONFIG_NFSD_DEPRECATED)
1938 /* Stuff for NFS server syscalls... */
1939 struct compat_nfsctl_svc {
1940         u16                     svc32_port;
1941         s32                     svc32_nthreads;
1942 };
1943
1944 struct compat_nfsctl_client {
1945         s8                      cl32_ident[NFSCLNT_IDMAX+1];
1946         s32                     cl32_naddr;
1947         struct in_addr          cl32_addrlist[NFSCLNT_ADDRMAX];
1948         s32                     cl32_fhkeytype;
1949         s32                     cl32_fhkeylen;
1950         u8                      cl32_fhkey[NFSCLNT_KEYMAX];
1951 };
1952
1953 struct compat_nfsctl_export {
1954         char            ex32_client[NFSCLNT_IDMAX+1];
1955         char            ex32_path[NFS_MAXPATHLEN+1];
1956         compat_dev_t    ex32_dev;
1957         compat_ino_t    ex32_ino;
1958         compat_int_t    ex32_flags;
1959         __compat_uid_t  ex32_anon_uid;
1960         __compat_gid_t  ex32_anon_gid;
1961 };
1962
1963 struct compat_nfsctl_fdparm {
1964         struct sockaddr         gd32_addr;
1965         s8                      gd32_path[NFS_MAXPATHLEN+1];
1966         compat_int_t            gd32_version;
1967 };
1968
1969 struct compat_nfsctl_fsparm {
1970         struct sockaddr         gd32_addr;
1971         s8                      gd32_path[NFS_MAXPATHLEN+1];
1972         compat_int_t            gd32_maxlen;
1973 };
1974
1975 struct compat_nfsctl_arg {
1976         compat_int_t            ca32_version;   /* safeguard */
1977         union {
1978                 struct compat_nfsctl_svc        u32_svc;
1979                 struct compat_nfsctl_client     u32_client;
1980                 struct compat_nfsctl_export     u32_export;
1981                 struct compat_nfsctl_fdparm     u32_getfd;
1982                 struct compat_nfsctl_fsparm     u32_getfs;
1983         } u;
1984 #define ca32_svc        u.u32_svc
1985 #define ca32_client     u.u32_client
1986 #define ca32_export     u.u32_export
1987 #define ca32_getfd      u.u32_getfd
1988 #define ca32_getfs      u.u32_getfs
1989 };
1990
1991 union compat_nfsctl_res {
1992         __u8                    cr32_getfh[NFS_FHSIZE];
1993         struct knfsd_fh         cr32_getfs;
1994 };
1995
1996 static int compat_nfs_svc_trans(struct nfsctl_arg *karg,
1997                                 struct compat_nfsctl_arg __user *arg)
1998 {
1999         if (!access_ok(VERIFY_READ, &arg->ca32_svc, sizeof(arg->ca32_svc)) ||
2000                 get_user(karg->ca_version, &arg->ca32_version) ||
2001                 __get_user(karg->ca_svc.svc_port, &arg->ca32_svc.svc32_port) ||
2002                 __get_user(karg->ca_svc.svc_nthreads,
2003                                 &arg->ca32_svc.svc32_nthreads))
2004                 return -EFAULT;
2005         return 0;
2006 }
2007
2008 static int compat_nfs_clnt_trans(struct nfsctl_arg *karg,
2009                                 struct compat_nfsctl_arg __user *arg)
2010 {
2011         if (!access_ok(VERIFY_READ, &arg->ca32_client,
2012                         sizeof(arg->ca32_client)) ||
2013                 get_user(karg->ca_version, &arg->ca32_version) ||
2014                 __copy_from_user(&karg->ca_client.cl_ident[0],
2015                                 &arg->ca32_client.cl32_ident[0],
2016                                 NFSCLNT_IDMAX) ||
2017                 __get_user(karg->ca_client.cl_naddr,
2018                                 &arg->ca32_client.cl32_naddr) ||
2019                 __copy_from_user(&karg->ca_client.cl_addrlist[0],
2020                                 &arg->ca32_client.cl32_addrlist[0],
2021                                 (sizeof(struct in_addr) * NFSCLNT_ADDRMAX)) ||
2022                 __get_user(karg->ca_client.cl_fhkeytype,
2023                                 &arg->ca32_client.cl32_fhkeytype) ||
2024                 __get_user(karg->ca_client.cl_fhkeylen,
2025                                 &arg->ca32_client.cl32_fhkeylen) ||
2026                 __copy_from_user(&karg->ca_client.cl_fhkey[0],
2027                                 &arg->ca32_client.cl32_fhkey[0],
2028                                 NFSCLNT_KEYMAX))
2029                 return -EFAULT;
2030
2031         return 0;
2032 }
2033
2034 static int compat_nfs_exp_trans(struct nfsctl_arg *karg,
2035                                 struct compat_nfsctl_arg __user *arg)
2036 {
2037         if (!access_ok(VERIFY_READ, &arg->ca32_export,
2038                                 sizeof(arg->ca32_export)) ||
2039                 get_user(karg->ca_version, &arg->ca32_version) ||
2040                 __copy_from_user(&karg->ca_export.ex_client[0],
2041                                 &arg->ca32_export.ex32_client[0],
2042                                 NFSCLNT_IDMAX) ||
2043                 __copy_from_user(&karg->ca_export.ex_path[0],
2044                                 &arg->ca32_export.ex32_path[0],
2045                                 NFS_MAXPATHLEN) ||
2046                 __get_user(karg->ca_export.ex_dev,
2047                                 &arg->ca32_export.ex32_dev) ||
2048                 __get_user(karg->ca_export.ex_ino,
2049                                 &arg->ca32_export.ex32_ino) ||
2050                 __get_user(karg->ca_export.ex_flags,
2051                                 &arg->ca32_export.ex32_flags) ||
2052                 __get_user(karg->ca_export.ex_anon_uid,
2053                                 &arg->ca32_export.ex32_anon_uid) ||
2054                 __get_user(karg->ca_export.ex_anon_gid,
2055                                 &arg->ca32_export.ex32_anon_gid))
2056                 return -EFAULT;
2057         SET_UID(karg->ca_export.ex_anon_uid, karg->ca_export.ex_anon_uid);
2058         SET_GID(karg->ca_export.ex_anon_gid, karg->ca_export.ex_anon_gid);
2059
2060         return 0;
2061 }
2062
2063 static int compat_nfs_getfd_trans(struct nfsctl_arg *karg,
2064                                 struct compat_nfsctl_arg __user *arg)
2065 {
2066         if (!access_ok(VERIFY_READ, &arg->ca32_getfd,
2067                         sizeof(arg->ca32_getfd)) ||
2068                 get_user(karg->ca_version, &arg->ca32_version) ||
2069                 __copy_from_user(&karg->ca_getfd.gd_addr,
2070                                 &arg->ca32_getfd.gd32_addr,
2071                                 (sizeof(struct sockaddr))) ||
2072                 __copy_from_user(&karg->ca_getfd.gd_path,
2073                                 &arg->ca32_getfd.gd32_path,
2074                                 (NFS_MAXPATHLEN+1)) ||
2075                 __get_user(karg->ca_getfd.gd_version,
2076                                 &arg->ca32_getfd.gd32_version))
2077                 return -EFAULT;
2078
2079         return 0;
2080 }
2081
2082 static int compat_nfs_getfs_trans(struct nfsctl_arg *karg,
2083                                 struct compat_nfsctl_arg __user *arg)
2084 {
2085         if (!access_ok(VERIFY_READ,&arg->ca32_getfs,sizeof(arg->ca32_getfs)) ||
2086                 get_user(karg->ca_version, &arg->ca32_version) ||
2087                 __copy_from_user(&karg->ca_getfs.gd_addr,
2088                                 &arg->ca32_getfs.gd32_addr,
2089                                 (sizeof(struct sockaddr))) ||
2090                 __copy_from_user(&karg->ca_getfs.gd_path,
2091                                 &arg->ca32_getfs.gd32_path,
2092                                 (NFS_MAXPATHLEN+1)) ||
2093                 __get_user(karg->ca_getfs.gd_maxlen,
2094                                 &arg->ca32_getfs.gd32_maxlen))
2095                 return -EFAULT;
2096
2097         return 0;
2098 }
2099
2100 /* This really doesn't need translations, we are only passing
2101  * back a union which contains opaque nfs file handle data.
2102  */
2103 static int compat_nfs_getfh_res_trans(union nfsctl_res *kres,
2104                                 union compat_nfsctl_res __user *res)
2105 {
2106         int err;
2107
2108         err = copy_to_user(res, kres, sizeof(*res));
2109
2110         return (err) ? -EFAULT : 0;
2111 }
2112
2113 asmlinkage long compat_sys_nfsservctl(int cmd,
2114                                 struct compat_nfsctl_arg __user *arg,
2115                                 union compat_nfsctl_res __user *res)
2116 {
2117         struct nfsctl_arg *karg;
2118         union nfsctl_res *kres;
2119         mm_segment_t oldfs;
2120         int err;
2121
2122         karg = kmalloc(sizeof(*karg), GFP_USER);
2123         kres = kmalloc(sizeof(*kres), GFP_USER);
2124         if(!karg || !kres) {
2125                 err = -ENOMEM;
2126                 goto done;
2127         }
2128
2129         switch(cmd) {
2130         case NFSCTL_SVC:
2131                 err = compat_nfs_svc_trans(karg, arg);
2132                 break;
2133
2134         case NFSCTL_ADDCLIENT:
2135                 err = compat_nfs_clnt_trans(karg, arg);
2136                 break;
2137
2138         case NFSCTL_DELCLIENT:
2139                 err = compat_nfs_clnt_trans(karg, arg);
2140                 break;
2141
2142         case NFSCTL_EXPORT:
2143         case NFSCTL_UNEXPORT:
2144                 err = compat_nfs_exp_trans(karg, arg);
2145                 break;
2146
2147         case NFSCTL_GETFD:
2148                 err = compat_nfs_getfd_trans(karg, arg);
2149                 break;
2150
2151         case NFSCTL_GETFS:
2152                 err = compat_nfs_getfs_trans(karg, arg);
2153                 break;
2154
2155         default:
2156                 err = -EINVAL;
2157                 break;
2158         }
2159
2160         if (err)
2161                 goto done;
2162
2163         oldfs = get_fs();
2164         set_fs(KERNEL_DS);
2165         /* The __user pointer casts are valid because of the set_fs() */
2166         err = sys_nfsservctl(cmd, (void __user *) karg, (void __user *) kres);
2167         set_fs(oldfs);
2168
2169         if (err)
2170                 goto done;
2171
2172         if((cmd == NFSCTL_GETFD) ||
2173            (cmd == NFSCTL_GETFS))
2174                 err = compat_nfs_getfh_res_trans(kres, res);
2175
2176 done:
2177         kfree(karg);
2178         kfree(kres);
2179         return err;
2180 }
2181 #else /* !NFSD */
2182 long asmlinkage compat_sys_nfsservctl(int cmd, void *notused, void *notused2)
2183 {
2184         return sys_ni_syscall();
2185 }
2186 #endif
2187
2188 #ifdef CONFIG_EPOLL
2189
2190 #ifdef HAVE_SET_RESTORE_SIGMASK
2191 asmlinkage long compat_sys_epoll_pwait(int epfd,
2192                         struct compat_epoll_event __user *events,
2193                         int maxevents, int timeout,
2194                         const compat_sigset_t __user *sigmask,
2195                         compat_size_t sigsetsize)
2196 {
2197         long err;
2198         compat_sigset_t csigmask;
2199         sigset_t ksigmask, sigsaved;
2200
2201         /*
2202          * If the caller wants a certain signal mask to be set during the wait,
2203          * we apply it here.
2204          */
2205         if (sigmask) {
2206                 if (sigsetsize != sizeof(compat_sigset_t))
2207                         return -EINVAL;
2208                 if (copy_from_user(&csigmask, sigmask, sizeof(csigmask)))
2209                         return -EFAULT;
2210                 sigset_from_compat(&ksigmask, &csigmask);
2211                 sigdelsetmask(&ksigmask, sigmask(SIGKILL) | sigmask(SIGSTOP));
2212                 sigprocmask(SIG_SETMASK, &ksigmask, &sigsaved);
2213         }
2214
2215         err = sys_epoll_wait(epfd, events, maxevents, timeout);
2216
2217         /*
2218          * If we changed the signal mask, we need to restore the original one.
2219          * In case we've got a signal while waiting, we do not restore the
2220          * signal mask yet, and we allow do_signal() to deliver the signal on
2221          * the way back to userspace, before the signal mask is restored.
2222          */
2223         if (sigmask) {
2224                 if (err == -EINTR) {
2225                         memcpy(&current->saved_sigmask, &sigsaved,
2226                                sizeof(sigsaved));
2227                         set_restore_sigmask();
2228                 } else
2229                         sigprocmask(SIG_SETMASK, &sigsaved, NULL);
2230         }
2231
2232         return err;
2233 }
2234 #endif /* HAVE_SET_RESTORE_SIGMASK */
2235
2236 #endif /* CONFIG_EPOLL */
2237
2238 #ifdef CONFIG_SIGNALFD
2239
2240 asmlinkage long compat_sys_signalfd4(int ufd,
2241                                      const compat_sigset_t __user *sigmask,
2242                                      compat_size_t sigsetsize, int flags)
2243 {
2244         compat_sigset_t ss32;
2245         sigset_t tmp;
2246         sigset_t __user *ksigmask;
2247
2248         if (sigsetsize != sizeof(compat_sigset_t))
2249                 return -EINVAL;
2250         if (copy_from_user(&ss32, sigmask, sizeof(ss32)))
2251                 return -EFAULT;
2252         sigset_from_compat(&tmp, &ss32);
2253         ksigmask = compat_alloc_user_space(sizeof(sigset_t));
2254         if (copy_to_user(ksigmask, &tmp, sizeof(sigset_t)))
2255                 return -EFAULT;
2256
2257         return sys_signalfd4(ufd, ksigmask, sizeof(sigset_t), flags);
2258 }
2259
2260 asmlinkage long compat_sys_signalfd(int ufd,
2261                                     const compat_sigset_t __user *sigmask,
2262                                     compat_size_t sigsetsize)
2263 {
2264         return compat_sys_signalfd4(ufd, sigmask, sigsetsize, 0);
2265 }
2266 #endif /* CONFIG_SIGNALFD */
2267
2268 #ifdef CONFIG_TIMERFD
2269
2270 asmlinkage long compat_sys_timerfd_settime(int ufd, int flags,
2271                                    const struct compat_itimerspec __user *utmr,
2272                                    struct compat_itimerspec __user *otmr)
2273 {
2274         int error;
2275         struct itimerspec t;
2276         struct itimerspec __user *ut;
2277
2278         if (get_compat_itimerspec(&t, utmr))
2279                 return -EFAULT;
2280         ut = compat_alloc_user_space(2 * sizeof(struct itimerspec));
2281         if (copy_to_user(&ut[0], &t, sizeof(t)))
2282                 return -EFAULT;
2283         error = sys_timerfd_settime(ufd, flags, &ut[0], &ut[1]);
2284         if (!error && otmr)
2285                 error = (copy_from_user(&t, &ut[1], sizeof(struct itimerspec)) ||
2286                          put_compat_itimerspec(otmr, &t)) ? -EFAULT: 0;
2287
2288         return error;
2289 }
2290
2291 asmlinkage long compat_sys_timerfd_gettime(int ufd,
2292                                    struct compat_itimerspec __user *otmr)
2293 {
2294         int error;
2295         struct itimerspec t;
2296         struct itimerspec __user *ut;
2297
2298         ut = compat_alloc_user_space(sizeof(struct itimerspec));
2299         error = sys_timerfd_gettime(ufd, ut);
2300         if (!error)
2301                 error = (copy_from_user(&t, ut, sizeof(struct itimerspec)) ||
2302                          put_compat_itimerspec(otmr, &t)) ? -EFAULT: 0;
2303
2304         return error;
2305 }
2306
2307 #endif /* CONFIG_TIMERFD */