fs: Use rename lock and RCU for multi-step operations
[pandora-kernel.git] / fs / nfs / namespace.c
1 /*
2  * linux/fs/nfs/namespace.c
3  *
4  * Copyright (C) 2005 Trond Myklebust <Trond.Myklebust@netapp.com>
5  * - Modified by David Howells <dhowells@redhat.com>
6  *
7  * NFS namespace
8  */
9
10 #include <linux/dcache.h>
11 #include <linux/gfp.h>
12 #include <linux/mount.h>
13 #include <linux/namei.h>
14 #include <linux/nfs_fs.h>
15 #include <linux/string.h>
16 #include <linux/sunrpc/clnt.h>
17 #include <linux/vfs.h>
18 #include "internal.h"
19
20 #define NFSDBG_FACILITY         NFSDBG_VFS
21
22 static void nfs_expire_automounts(struct work_struct *work);
23
24 static LIST_HEAD(nfs_automount_list);
25 static DECLARE_DELAYED_WORK(nfs_automount_task, nfs_expire_automounts);
26 int nfs_mountpoint_expiry_timeout = 500 * HZ;
27
28 static struct vfsmount *nfs_do_submount(const struct vfsmount *mnt_parent,
29                                         const struct dentry *dentry,
30                                         struct nfs_fh *fh,
31                                         struct nfs_fattr *fattr);
32
33 /*
34  * nfs_path - reconstruct the path given an arbitrary dentry
35  * @base - arbitrary string to prepend to the path
36  * @droot - pointer to root dentry for mountpoint
37  * @dentry - pointer to dentry
38  * @buffer - result buffer
39  * @buflen - length of buffer
40  *
41  * Helper function for constructing the path from the
42  * root dentry to an arbitrary hashed dentry.
43  *
44  * This is mainly for use in figuring out the path on the
45  * server side when automounting on top of an existing partition.
46  */
47 char *nfs_path(const char *base,
48                const struct dentry *droot,
49                const struct dentry *dentry,
50                char *buffer, ssize_t buflen)
51 {
52         char *end;
53         int namelen;
54         unsigned seq;
55
56 rename_retry:
57         end = buffer+buflen;
58         *--end = '\0';
59         buflen--;
60
61         seq = read_seqbegin(&rename_lock);
62         rcu_read_lock();
63         spin_lock(&dcache_lock);
64         while (!IS_ROOT(dentry) && dentry != droot) {
65                 namelen = dentry->d_name.len;
66                 buflen -= namelen + 1;
67                 if (buflen < 0)
68                         goto Elong_unlock;
69                 end -= namelen;
70                 memcpy(end, dentry->d_name.name, namelen);
71                 *--end = '/';
72                 dentry = dentry->d_parent;
73         }
74         spin_unlock(&dcache_lock);
75         rcu_read_unlock();
76         if (read_seqretry(&rename_lock, seq))
77                 goto rename_retry;
78         if (*end != '/') {
79                 if (--buflen < 0)
80                         goto Elong;
81                 *--end = '/';
82         }
83         namelen = strlen(base);
84         /* Strip off excess slashes in base string */
85         while (namelen > 0 && base[namelen - 1] == '/')
86                 namelen--;
87         buflen -= namelen;
88         if (buflen < 0)
89                 goto Elong;
90         end -= namelen;
91         memcpy(end, base, namelen);
92         return end;
93 Elong_unlock:
94         spin_unlock(&dcache_lock);
95         rcu_read_unlock();
96         if (read_seqretry(&rename_lock, seq))
97                 goto rename_retry;
98 Elong:
99         return ERR_PTR(-ENAMETOOLONG);
100 }
101
102 /*
103  * nfs_follow_mountpoint - handle crossing a mountpoint on the server
104  * @dentry - dentry of mountpoint
105  * @nd - nameidata info
106  *
107  * When we encounter a mountpoint on the server, we want to set up
108  * a mountpoint on the client too, to prevent inode numbers from
109  * colliding, and to allow "df" to work properly.
110  * On NFSv4, we also want to allow for the fact that different
111  * filesystems may be migrated to different servers in a failover
112  * situation, and that different filesystems may want to use
113  * different security flavours.
114  */
115 static void * nfs_follow_mountpoint(struct dentry *dentry, struct nameidata *nd)
116 {
117         struct vfsmount *mnt;
118         struct nfs_server *server = NFS_SERVER(dentry->d_inode);
119         struct dentry *parent;
120         struct nfs_fh *fh = NULL;
121         struct nfs_fattr *fattr = NULL;
122         int err;
123
124         dprintk("--> nfs_follow_mountpoint()\n");
125
126         err = -ESTALE;
127         if (IS_ROOT(dentry))
128                 goto out_err;
129
130         err = -ENOMEM;
131         fh = nfs_alloc_fhandle();
132         fattr = nfs_alloc_fattr();
133         if (fh == NULL || fattr == NULL)
134                 goto out_err;
135
136         dprintk("%s: enter\n", __func__);
137         dput(nd->path.dentry);
138         nd->path.dentry = dget(dentry);
139
140         /* Look it up again */
141         parent = dget_parent(nd->path.dentry);
142         err = server->nfs_client->rpc_ops->lookup(parent->d_inode,
143                                                   &nd->path.dentry->d_name,
144                                                   fh, fattr);
145         dput(parent);
146         if (err != 0)
147                 goto out_err;
148
149         if (fattr->valid & NFS_ATTR_FATTR_V4_REFERRAL)
150                 mnt = nfs_do_refmount(nd->path.mnt, nd->path.dentry);
151         else
152                 mnt = nfs_do_submount(nd->path.mnt, nd->path.dentry, fh,
153                                       fattr);
154         err = PTR_ERR(mnt);
155         if (IS_ERR(mnt))
156                 goto out_err;
157
158         mntget(mnt);
159         err = do_add_mount(mnt, &nd->path, nd->path.mnt->mnt_flags|MNT_SHRINKABLE,
160                            &nfs_automount_list);
161         if (err < 0) {
162                 mntput(mnt);
163                 if (err == -EBUSY)
164                         goto out_follow;
165                 goto out_err;
166         }
167         path_put(&nd->path);
168         nd->path.mnt = mnt;
169         nd->path.dentry = dget(mnt->mnt_root);
170         schedule_delayed_work(&nfs_automount_task, nfs_mountpoint_expiry_timeout);
171 out:
172         nfs_free_fattr(fattr);
173         nfs_free_fhandle(fh);
174         dprintk("%s: done, returned %d\n", __func__, err);
175
176         dprintk("<-- nfs_follow_mountpoint() = %d\n", err);
177         return ERR_PTR(err);
178 out_err:
179         path_put(&nd->path);
180         goto out;
181 out_follow:
182         while (d_mountpoint(nd->path.dentry) &&
183                follow_down(&nd->path))
184                 ;
185         err = 0;
186         goto out;
187 }
188
189 const struct inode_operations nfs_mountpoint_inode_operations = {
190         .follow_link    = nfs_follow_mountpoint,
191         .getattr        = nfs_getattr,
192 };
193
194 const struct inode_operations nfs_referral_inode_operations = {
195         .follow_link    = nfs_follow_mountpoint,
196 };
197
198 static void nfs_expire_automounts(struct work_struct *work)
199 {
200         struct list_head *list = &nfs_automount_list;
201
202         mark_mounts_for_expiry(list);
203         if (!list_empty(list))
204                 schedule_delayed_work(&nfs_automount_task, nfs_mountpoint_expiry_timeout);
205 }
206
207 void nfs_release_automount_timer(void)
208 {
209         if (list_empty(&nfs_automount_list))
210                 cancel_delayed_work(&nfs_automount_task);
211 }
212
213 /*
214  * Clone a mountpoint of the appropriate type
215  */
216 static struct vfsmount *nfs_do_clone_mount(struct nfs_server *server,
217                                            const char *devname,
218                                            struct nfs_clone_mount *mountdata)
219 {
220 #ifdef CONFIG_NFS_V4
221         struct vfsmount *mnt = ERR_PTR(-EINVAL);
222         switch (server->nfs_client->rpc_ops->version) {
223                 case 2:
224                 case 3:
225                         mnt = vfs_kern_mount(&nfs_xdev_fs_type, 0, devname, mountdata);
226                         break;
227                 case 4:
228                         mnt = vfs_kern_mount(&nfs4_xdev_fs_type, 0, devname, mountdata);
229         }
230         return mnt;
231 #else
232         return vfs_kern_mount(&nfs_xdev_fs_type, 0, devname, mountdata);
233 #endif
234 }
235
236 /**
237  * nfs_do_submount - set up mountpoint when crossing a filesystem boundary
238  * @mnt_parent - mountpoint of parent directory
239  * @dentry - parent directory
240  * @fh - filehandle for new root dentry
241  * @fattr - attributes for new root inode
242  *
243  */
244 static struct vfsmount *nfs_do_submount(const struct vfsmount *mnt_parent,
245                                         const struct dentry *dentry,
246                                         struct nfs_fh *fh,
247                                         struct nfs_fattr *fattr)
248 {
249         struct nfs_clone_mount mountdata = {
250                 .sb = mnt_parent->mnt_sb,
251                 .dentry = dentry,
252                 .fh = fh,
253                 .fattr = fattr,
254         };
255         struct vfsmount *mnt = ERR_PTR(-ENOMEM);
256         char *page = (char *) __get_free_page(GFP_USER);
257         char *devname;
258
259         dprintk("--> nfs_do_submount()\n");
260
261         dprintk("%s: submounting on %s/%s\n", __func__,
262                         dentry->d_parent->d_name.name,
263                         dentry->d_name.name);
264         if (page == NULL)
265                 goto out;
266         devname = nfs_devname(mnt_parent, dentry, page, PAGE_SIZE);
267         mnt = (struct vfsmount *)devname;
268         if (IS_ERR(devname))
269                 goto free_page;
270         mnt = nfs_do_clone_mount(NFS_SB(mnt_parent->mnt_sb), devname, &mountdata);
271 free_page:
272         free_page((unsigned long)page);
273 out:
274         dprintk("%s: done\n", __func__);
275
276         dprintk("<-- nfs_do_submount() = %p\n", mnt);
277         return mnt;
278 }