Merge branch 'vfs-scale-working' of git://git.kernel.org/pub/scm/linux/kernel/git...
[pandora-kernel.git] / fs / gfs2 / ops_inode.c
1 /*
2  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
3  * Copyright (C) 2004-2006 Red Hat, Inc.  All rights reserved.
4  *
5  * This copyrighted material is made available to anyone wishing to use,
6  * modify, copy, or redistribute it subject to the terms and conditions
7  * of the GNU General Public License version 2.
8  */
9
10 #include <linux/slab.h>
11 #include <linux/spinlock.h>
12 #include <linux/completion.h>
13 #include <linux/buffer_head.h>
14 #include <linux/namei.h>
15 #include <linux/mm.h>
16 #include <linux/xattr.h>
17 #include <linux/posix_acl.h>
18 #include <linux/gfs2_ondisk.h>
19 #include <linux/crc32.h>
20 #include <linux/fiemap.h>
21 #include <linux/swap.h>
22 #include <linux/falloc.h>
23 #include <asm/uaccess.h>
24
25 #include "gfs2.h"
26 #include "incore.h"
27 #include "acl.h"
28 #include "bmap.h"
29 #include "dir.h"
30 #include "xattr.h"
31 #include "glock.h"
32 #include "inode.h"
33 #include "meta_io.h"
34 #include "quota.h"
35 #include "rgrp.h"
36 #include "trans.h"
37 #include "util.h"
38 #include "super.h"
39
40 /**
41  * gfs2_create - Create a file
42  * @dir: The directory in which to create the file
43  * @dentry: The dentry of the new file
44  * @mode: The mode of the new file
45  *
46  * Returns: errno
47  */
48
49 static int gfs2_create(struct inode *dir, struct dentry *dentry,
50                        int mode, struct nameidata *nd)
51 {
52         struct gfs2_inode *dip = GFS2_I(dir);
53         struct gfs2_sbd *sdp = GFS2_SB(dir);
54         struct gfs2_holder ghs[2];
55         struct inode *inode;
56
57         gfs2_holder_init(dip->i_gl, 0, 0, ghs);
58
59         for (;;) {
60                 inode = gfs2_createi(ghs, &dentry->d_name, S_IFREG | mode, 0);
61                 if (!IS_ERR(inode)) {
62                         gfs2_trans_end(sdp);
63                         if (dip->i_alloc->al_rgd)
64                                 gfs2_inplace_release(dip);
65                         gfs2_quota_unlock(dip);
66                         gfs2_alloc_put(dip);
67                         gfs2_glock_dq_uninit_m(2, ghs);
68                         mark_inode_dirty(inode);
69                         break;
70                 } else if (PTR_ERR(inode) != -EEXIST ||
71                            (nd && nd->flags & LOOKUP_EXCL)) {
72                         gfs2_holder_uninit(ghs);
73                         return PTR_ERR(inode);
74                 }
75
76                 inode = gfs2_lookupi(dir, &dentry->d_name, 0);
77                 if (inode) {
78                         if (!IS_ERR(inode)) {
79                                 gfs2_holder_uninit(ghs);
80                                 break;
81                         } else {
82                                 gfs2_holder_uninit(ghs);
83                                 return PTR_ERR(inode);
84                         }
85                 }
86         }
87
88         d_instantiate(dentry, inode);
89
90         return 0;
91 }
92
93 /**
94  * gfs2_lookup - Look up a filename in a directory and return its inode
95  * @dir: The directory inode
96  * @dentry: The dentry of the new inode
97  * @nd: passed from Linux VFS, ignored by us
98  *
99  * Called by the VFS layer. Lock dir and call gfs2_lookupi()
100  *
101  * Returns: errno
102  */
103
104 static struct dentry *gfs2_lookup(struct inode *dir, struct dentry *dentry,
105                                   struct nameidata *nd)
106 {
107         struct inode *inode = NULL;
108
109         d_set_d_op(dentry, &gfs2_dops);
110
111         inode = gfs2_lookupi(dir, &dentry->d_name, 0);
112         if (inode && IS_ERR(inode))
113                 return ERR_CAST(inode);
114
115         if (inode) {
116                 struct gfs2_glock *gl = GFS2_I(inode)->i_gl;
117                 struct gfs2_holder gh;
118                 int error;
119                 error = gfs2_glock_nq_init(gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
120                 if (error) {
121                         iput(inode);
122                         return ERR_PTR(error);
123                 }
124                 gfs2_glock_dq_uninit(&gh);
125                 return d_splice_alias(inode, dentry);
126         }
127         d_add(dentry, inode);
128
129         return NULL;
130 }
131
132 /**
133  * gfs2_link - Link to a file
134  * @old_dentry: The inode to link
135  * @dir: Add link to this directory
136  * @dentry: The name of the link
137  *
138  * Link the inode in "old_dentry" into the directory "dir" with the
139  * name in "dentry".
140  *
141  * Returns: errno
142  */
143
144 static int gfs2_link(struct dentry *old_dentry, struct inode *dir,
145                      struct dentry *dentry)
146 {
147         struct gfs2_inode *dip = GFS2_I(dir);
148         struct gfs2_sbd *sdp = GFS2_SB(dir);
149         struct inode *inode = old_dentry->d_inode;
150         struct gfs2_inode *ip = GFS2_I(inode);
151         struct gfs2_holder ghs[2];
152         int alloc_required;
153         int error;
154
155         if (S_ISDIR(inode->i_mode))
156                 return -EPERM;
157
158         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
159         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + 1);
160
161         error = gfs2_glock_nq(ghs); /* parent */
162         if (error)
163                 goto out_parent;
164
165         error = gfs2_glock_nq(ghs + 1); /* child */
166         if (error)
167                 goto out_child;
168
169         error = gfs2_permission(dir, MAY_WRITE | MAY_EXEC, 0);
170         if (error)
171                 goto out_gunlock;
172
173         error = gfs2_dir_check(dir, &dentry->d_name, NULL);
174         switch (error) {
175         case -ENOENT:
176                 break;
177         case 0:
178                 error = -EEXIST;
179         default:
180                 goto out_gunlock;
181         }
182
183         error = -EINVAL;
184         if (!dip->i_inode.i_nlink)
185                 goto out_gunlock;
186         error = -EFBIG;
187         if (dip->i_entries == (u32)-1)
188                 goto out_gunlock;
189         error = -EPERM;
190         if (IS_IMMUTABLE(inode) || IS_APPEND(inode))
191                 goto out_gunlock;
192         error = -EINVAL;
193         if (!ip->i_inode.i_nlink)
194                 goto out_gunlock;
195         error = -EMLINK;
196         if (ip->i_inode.i_nlink == (u32)-1)
197                 goto out_gunlock;
198
199         alloc_required = error = gfs2_diradd_alloc_required(dir, &dentry->d_name);
200         if (error < 0)
201                 goto out_gunlock;
202         error = 0;
203
204         if (alloc_required) {
205                 struct gfs2_alloc *al = gfs2_alloc_get(dip);
206                 if (!al) {
207                         error = -ENOMEM;
208                         goto out_gunlock;
209                 }
210
211                 error = gfs2_quota_lock_check(dip);
212                 if (error)
213                         goto out_alloc;
214
215                 al->al_requested = sdp->sd_max_dirres;
216
217                 error = gfs2_inplace_reserve(dip);
218                 if (error)
219                         goto out_gunlock_q;
220
221                 error = gfs2_trans_begin(sdp, sdp->sd_max_dirres +
222                                          gfs2_rg_blocks(al) +
223                                          2 * RES_DINODE + RES_STATFS +
224                                          RES_QUOTA, 0);
225                 if (error)
226                         goto out_ipres;
227         } else {
228                 error = gfs2_trans_begin(sdp, 2 * RES_DINODE + RES_LEAF, 0);
229                 if (error)
230                         goto out_ipres;
231         }
232
233         error = gfs2_dir_add(dir, &dentry->d_name, ip, IF2DT(inode->i_mode));
234         if (error)
235                 goto out_end_trans;
236
237         error = gfs2_change_nlink(ip, +1);
238
239 out_end_trans:
240         gfs2_trans_end(sdp);
241 out_ipres:
242         if (alloc_required)
243                 gfs2_inplace_release(dip);
244 out_gunlock_q:
245         if (alloc_required)
246                 gfs2_quota_unlock(dip);
247 out_alloc:
248         if (alloc_required)
249                 gfs2_alloc_put(dip);
250 out_gunlock:
251         gfs2_glock_dq(ghs + 1);
252 out_child:
253         gfs2_glock_dq(ghs);
254 out_parent:
255         gfs2_holder_uninit(ghs);
256         gfs2_holder_uninit(ghs + 1);
257         if (!error) {
258                 ihold(inode);
259                 d_instantiate(dentry, inode);
260                 mark_inode_dirty(inode);
261         }
262         return error;
263 }
264
265 /*
266  * gfs2_unlink_ok - check to see that a inode is still in a directory
267  * @dip: the directory
268  * @name: the name of the file
269  * @ip: the inode
270  *
271  * Assumes that the lock on (at least) @dip is held.
272  *
273  * Returns: 0 if the parent/child relationship is correct, errno if it isn't
274  */
275
276 static int gfs2_unlink_ok(struct gfs2_inode *dip, const struct qstr *name,
277                           const struct gfs2_inode *ip)
278 {
279         int error;
280
281         if (IS_IMMUTABLE(&ip->i_inode) || IS_APPEND(&ip->i_inode))
282                 return -EPERM;
283
284         if ((dip->i_inode.i_mode & S_ISVTX) &&
285             dip->i_inode.i_uid != current_fsuid() &&
286             ip->i_inode.i_uid != current_fsuid() && !capable(CAP_FOWNER))
287                 return -EPERM;
288
289         if (IS_APPEND(&dip->i_inode))
290                 return -EPERM;
291
292         error = gfs2_permission(&dip->i_inode, MAY_WRITE | MAY_EXEC, 0);
293         if (error)
294                 return error;
295
296         error = gfs2_dir_check(&dip->i_inode, name, ip);
297         if (error)
298                 return error;
299
300         return 0;
301 }
302
303 /**
304  * gfs2_unlink - Unlink a file
305  * @dir: The inode of the directory containing the file to unlink
306  * @dentry: The file itself
307  *
308  * Unlink a file.  Call gfs2_unlinki()
309  *
310  * Returns: errno
311  */
312
313 static int gfs2_unlink(struct inode *dir, struct dentry *dentry)
314 {
315         struct gfs2_inode *dip = GFS2_I(dir);
316         struct gfs2_sbd *sdp = GFS2_SB(dir);
317         struct gfs2_inode *ip = GFS2_I(dentry->d_inode);
318         struct gfs2_holder ghs[3];
319         struct gfs2_rgrpd *rgd;
320         struct gfs2_holder ri_gh;
321         int error;
322
323         error = gfs2_rindex_hold(sdp, &ri_gh);
324         if (error)
325                 return error;
326
327         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
328         gfs2_holder_init(ip->i_gl,  LM_ST_EXCLUSIVE, 0, ghs + 1);
329
330         rgd = gfs2_blk2rgrpd(sdp, ip->i_no_addr);
331         gfs2_holder_init(rgd->rd_gl, LM_ST_EXCLUSIVE, 0, ghs + 2);
332
333
334         error = gfs2_glock_nq(ghs); /* parent */
335         if (error)
336                 goto out_parent;
337
338         error = gfs2_glock_nq(ghs + 1); /* child */
339         if (error)
340                 goto out_child;
341
342         error = gfs2_glock_nq(ghs + 2); /* rgrp */
343         if (error)
344                 goto out_rgrp;
345
346         error = gfs2_unlink_ok(dip, &dentry->d_name, ip);
347         if (error)
348                 goto out_gunlock;
349
350         error = gfs2_trans_begin(sdp, 2*RES_DINODE + RES_LEAF + RES_RG_BIT, 0);
351         if (error)
352                 goto out_gunlock;
353
354         error = gfs2_dir_del(dip, &dentry->d_name);
355         if (error)
356                 goto out_end_trans;
357
358         error = gfs2_change_nlink(ip, -1);
359
360 out_end_trans:
361         gfs2_trans_end(sdp);
362 out_gunlock:
363         gfs2_glock_dq(ghs + 2);
364 out_rgrp:
365         gfs2_holder_uninit(ghs + 2);
366         gfs2_glock_dq(ghs + 1);
367 out_child:
368         gfs2_holder_uninit(ghs + 1);
369         gfs2_glock_dq(ghs);
370 out_parent:
371         gfs2_holder_uninit(ghs);
372         gfs2_glock_dq_uninit(&ri_gh);
373         return error;
374 }
375
376 /**
377  * gfs2_symlink - Create a symlink
378  * @dir: The directory to create the symlink in
379  * @dentry: The dentry to put the symlink in
380  * @symname: The thing which the link points to
381  *
382  * Returns: errno
383  */
384
385 static int gfs2_symlink(struct inode *dir, struct dentry *dentry,
386                         const char *symname)
387 {
388         struct gfs2_inode *dip = GFS2_I(dir), *ip;
389         struct gfs2_sbd *sdp = GFS2_SB(dir);
390         struct gfs2_holder ghs[2];
391         struct inode *inode;
392         struct buffer_head *dibh;
393         int size;
394         int error;
395
396         /* Must be stuffed with a null terminator for gfs2_follow_link() */
397         size = strlen(symname);
398         if (size > sdp->sd_sb.sb_bsize - sizeof(struct gfs2_dinode) - 1)
399                 return -ENAMETOOLONG;
400
401         gfs2_holder_init(dip->i_gl, 0, 0, ghs);
402
403         inode = gfs2_createi(ghs, &dentry->d_name, S_IFLNK | S_IRWXUGO, 0);
404         if (IS_ERR(inode)) {
405                 gfs2_holder_uninit(ghs);
406                 return PTR_ERR(inode);
407         }
408
409         ip = ghs[1].gh_gl->gl_object;
410
411         i_size_write(inode, size);
412
413         error = gfs2_meta_inode_buffer(ip, &dibh);
414
415         if (!gfs2_assert_withdraw(sdp, !error)) {
416                 gfs2_dinode_out(ip, dibh->b_data);
417                 memcpy(dibh->b_data + sizeof(struct gfs2_dinode), symname,
418                        size);
419                 brelse(dibh);
420         }
421
422         gfs2_trans_end(sdp);
423         if (dip->i_alloc->al_rgd)
424                 gfs2_inplace_release(dip);
425         gfs2_quota_unlock(dip);
426         gfs2_alloc_put(dip);
427
428         gfs2_glock_dq_uninit_m(2, ghs);
429
430         d_instantiate(dentry, inode);
431         mark_inode_dirty(inode);
432
433         return 0;
434 }
435
436 /**
437  * gfs2_mkdir - Make a directory
438  * @dir: The parent directory of the new one
439  * @dentry: The dentry of the new directory
440  * @mode: The mode of the new directory
441  *
442  * Returns: errno
443  */
444
445 static int gfs2_mkdir(struct inode *dir, struct dentry *dentry, int mode)
446 {
447         struct gfs2_inode *dip = GFS2_I(dir), *ip;
448         struct gfs2_sbd *sdp = GFS2_SB(dir);
449         struct gfs2_holder ghs[2];
450         struct inode *inode;
451         struct buffer_head *dibh;
452         int error;
453
454         gfs2_holder_init(dip->i_gl, 0, 0, ghs);
455
456         inode = gfs2_createi(ghs, &dentry->d_name, S_IFDIR | mode, 0);
457         if (IS_ERR(inode)) {
458                 gfs2_holder_uninit(ghs);
459                 return PTR_ERR(inode);
460         }
461
462         ip = ghs[1].gh_gl->gl_object;
463
464         ip->i_inode.i_nlink = 2;
465         i_size_write(inode, sdp->sd_sb.sb_bsize - sizeof(struct gfs2_dinode));
466         ip->i_diskflags |= GFS2_DIF_JDATA;
467         ip->i_entries = 2;
468
469         error = gfs2_meta_inode_buffer(ip, &dibh);
470
471         if (!gfs2_assert_withdraw(sdp, !error)) {
472                 struct gfs2_dinode *di = (struct gfs2_dinode *)dibh->b_data;
473                 struct gfs2_dirent *dent = (struct gfs2_dirent *)(di+1);
474
475                 gfs2_trans_add_bh(ip->i_gl, dibh, 1);
476                 gfs2_qstr2dirent(&gfs2_qdot, GFS2_DIRENT_SIZE(gfs2_qdot.len), dent);
477                 dent->de_inum = di->di_num; /* already GFS2 endian */
478                 dent->de_type = cpu_to_be16(DT_DIR);
479                 di->di_entries = cpu_to_be32(1);
480
481                 dent = (struct gfs2_dirent *)((char*)dent + GFS2_DIRENT_SIZE(1));
482                 gfs2_qstr2dirent(&gfs2_qdotdot, dibh->b_size - GFS2_DIRENT_SIZE(1) - sizeof(struct gfs2_dinode), dent);
483
484                 gfs2_inum_out(dip, dent);
485                 dent->de_type = cpu_to_be16(DT_DIR);
486
487                 gfs2_dinode_out(ip, di);
488
489                 brelse(dibh);
490         }
491
492         error = gfs2_change_nlink(dip, +1);
493         gfs2_assert_withdraw(sdp, !error); /* dip already pinned */
494
495         gfs2_trans_end(sdp);
496         if (dip->i_alloc->al_rgd)
497                 gfs2_inplace_release(dip);
498         gfs2_quota_unlock(dip);
499         gfs2_alloc_put(dip);
500
501         gfs2_glock_dq_uninit_m(2, ghs);
502
503         d_instantiate(dentry, inode);
504         mark_inode_dirty(inode);
505
506         return 0;
507 }
508
509 /**
510  * gfs2_rmdiri - Remove a directory
511  * @dip: The parent directory of the directory to be removed
512  * @name: The name of the directory to be removed
513  * @ip: The GFS2 inode of the directory to be removed
514  *
515  * Assumes Glocks on dip and ip are held
516  *
517  * Returns: errno
518  */
519
520 static int gfs2_rmdiri(struct gfs2_inode *dip, const struct qstr *name,
521                        struct gfs2_inode *ip)
522 {
523         int error;
524
525         if (ip->i_entries != 2) {
526                 if (gfs2_consist_inode(ip))
527                         gfs2_dinode_print(ip);
528                 return -EIO;
529         }
530
531         error = gfs2_dir_del(dip, name);
532         if (error)
533                 return error;
534
535         error = gfs2_change_nlink(dip, -1);
536         if (error)
537                 return error;
538
539         error = gfs2_dir_del(ip, &gfs2_qdot);
540         if (error)
541                 return error;
542
543         error = gfs2_dir_del(ip, &gfs2_qdotdot);
544         if (error)
545                 return error;
546
547         /* It looks odd, but it really should be done twice */
548         error = gfs2_change_nlink(ip, -1);
549         if (error)
550                 return error;
551
552         error = gfs2_change_nlink(ip, -1);
553         if (error)
554                 return error;
555
556         return error;
557 }
558
559 /**
560  * gfs2_rmdir - Remove a directory
561  * @dir: The parent directory of the directory to be removed
562  * @dentry: The dentry of the directory to remove
563  *
564  * Remove a directory. Call gfs2_rmdiri()
565  *
566  * Returns: errno
567  */
568
569 static int gfs2_rmdir(struct inode *dir, struct dentry *dentry)
570 {
571         struct gfs2_inode *dip = GFS2_I(dir);
572         struct gfs2_sbd *sdp = GFS2_SB(dir);
573         struct gfs2_inode *ip = GFS2_I(dentry->d_inode);
574         struct gfs2_holder ghs[3];
575         struct gfs2_rgrpd *rgd;
576         struct gfs2_holder ri_gh;
577         int error;
578
579         error = gfs2_rindex_hold(sdp, &ri_gh);
580         if (error)
581                 return error;
582         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
583         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + 1);
584
585         rgd = gfs2_blk2rgrpd(sdp, ip->i_no_addr);
586         gfs2_holder_init(rgd->rd_gl, LM_ST_EXCLUSIVE, 0, ghs + 2);
587
588         error = gfs2_glock_nq(ghs); /* parent */
589         if (error)
590                 goto out_parent;
591
592         error = gfs2_glock_nq(ghs + 1); /* child */
593         if (error)
594                 goto out_child;
595
596         error = gfs2_glock_nq(ghs + 2); /* rgrp */
597         if (error)
598                 goto out_rgrp;
599
600         error = gfs2_unlink_ok(dip, &dentry->d_name, ip);
601         if (error)
602                 goto out_gunlock;
603
604         if (ip->i_entries < 2) {
605                 if (gfs2_consist_inode(ip))
606                         gfs2_dinode_print(ip);
607                 error = -EIO;
608                 goto out_gunlock;
609         }
610         if (ip->i_entries > 2) {
611                 error = -ENOTEMPTY;
612                 goto out_gunlock;
613         }
614
615         error = gfs2_trans_begin(sdp, 2 * RES_DINODE + 3 * RES_LEAF + RES_RG_BIT, 0);
616         if (error)
617                 goto out_gunlock;
618
619         error = gfs2_rmdiri(dip, &dentry->d_name, ip);
620
621         gfs2_trans_end(sdp);
622
623 out_gunlock:
624         gfs2_glock_dq(ghs + 2);
625 out_rgrp:
626         gfs2_holder_uninit(ghs + 2);
627         gfs2_glock_dq(ghs + 1);
628 out_child:
629         gfs2_holder_uninit(ghs + 1);
630         gfs2_glock_dq(ghs);
631 out_parent:
632         gfs2_holder_uninit(ghs);
633         gfs2_glock_dq_uninit(&ri_gh);
634         return error;
635 }
636
637 /**
638  * gfs2_mknod - Make a special file
639  * @dir: The directory in which the special file will reside
640  * @dentry: The dentry of the special file
641  * @mode: The mode of the special file
642  * @rdev: The device specification of the special file
643  *
644  */
645
646 static int gfs2_mknod(struct inode *dir, struct dentry *dentry, int mode,
647                       dev_t dev)
648 {
649         struct gfs2_inode *dip = GFS2_I(dir);
650         struct gfs2_sbd *sdp = GFS2_SB(dir);
651         struct gfs2_holder ghs[2];
652         struct inode *inode;
653
654         gfs2_holder_init(dip->i_gl, 0, 0, ghs);
655
656         inode = gfs2_createi(ghs, &dentry->d_name, mode, dev);
657         if (IS_ERR(inode)) {
658                 gfs2_holder_uninit(ghs);
659                 return PTR_ERR(inode);
660         }
661
662         gfs2_trans_end(sdp);
663         if (dip->i_alloc->al_rgd)
664                 gfs2_inplace_release(dip);
665         gfs2_quota_unlock(dip);
666         gfs2_alloc_put(dip);
667
668         gfs2_glock_dq_uninit_m(2, ghs);
669
670         d_instantiate(dentry, inode);
671         mark_inode_dirty(inode);
672
673         return 0;
674 }
675
676 /*
677  * gfs2_ok_to_move - check if it's ok to move a directory to another directory
678  * @this: move this
679  * @to: to here
680  *
681  * Follow @to back to the root and make sure we don't encounter @this
682  * Assumes we already hold the rename lock.
683  *
684  * Returns: errno
685  */
686
687 static int gfs2_ok_to_move(struct gfs2_inode *this, struct gfs2_inode *to)
688 {
689         struct inode *dir = &to->i_inode;
690         struct super_block *sb = dir->i_sb;
691         struct inode *tmp;
692         int error = 0;
693
694         igrab(dir);
695
696         for (;;) {
697                 if (dir == &this->i_inode) {
698                         error = -EINVAL;
699                         break;
700                 }
701                 if (dir == sb->s_root->d_inode) {
702                         error = 0;
703                         break;
704                 }
705
706                 tmp = gfs2_lookupi(dir, &gfs2_qdotdot, 1);
707                 if (IS_ERR(tmp)) {
708                         error = PTR_ERR(tmp);
709                         break;
710                 }
711
712                 iput(dir);
713                 dir = tmp;
714         }
715
716         iput(dir);
717
718         return error;
719 }
720
721 /**
722  * gfs2_rename - Rename a file
723  * @odir: Parent directory of old file name
724  * @odentry: The old dentry of the file
725  * @ndir: Parent directory of new file name
726  * @ndentry: The new dentry of the file
727  *
728  * Returns: errno
729  */
730
731 static int gfs2_rename(struct inode *odir, struct dentry *odentry,
732                        struct inode *ndir, struct dentry *ndentry)
733 {
734         struct gfs2_inode *odip = GFS2_I(odir);
735         struct gfs2_inode *ndip = GFS2_I(ndir);
736         struct gfs2_inode *ip = GFS2_I(odentry->d_inode);
737         struct gfs2_inode *nip = NULL;
738         struct gfs2_sbd *sdp = GFS2_SB(odir);
739         struct gfs2_holder ghs[5], r_gh = { .gh_gl = NULL, }, ri_gh;
740         struct gfs2_rgrpd *nrgd;
741         unsigned int num_gh;
742         int dir_rename = 0;
743         int alloc_required = 0;
744         unsigned int x;
745         int error;
746
747         if (ndentry->d_inode) {
748                 nip = GFS2_I(ndentry->d_inode);
749                 if (ip == nip)
750                         return 0;
751         }
752
753         error = gfs2_rindex_hold(sdp, &ri_gh);
754         if (error)
755                 return error;
756
757         if (odip != ndip) {
758                 error = gfs2_glock_nq_init(sdp->sd_rename_gl, LM_ST_EXCLUSIVE,
759                                            0, &r_gh);
760                 if (error)
761                         goto out;
762
763                 if (S_ISDIR(ip->i_inode.i_mode)) {
764                         dir_rename = 1;
765                         /* don't move a dirctory into it's subdir */
766                         error = gfs2_ok_to_move(ip, ndip);
767                         if (error)
768                                 goto out_gunlock_r;
769                 }
770         }
771
772         num_gh = 1;
773         gfs2_holder_init(odip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
774         if (odip != ndip) {
775                 gfs2_holder_init(ndip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh);
776                 num_gh++;
777         }
778         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh);
779         num_gh++;
780
781         if (nip) {
782                 gfs2_holder_init(nip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh);
783                 num_gh++;
784                 /* grab the resource lock for unlink flag twiddling 
785                  * this is the case of the target file already existing
786                  * so we unlink before doing the rename
787                  */
788                 nrgd = gfs2_blk2rgrpd(sdp, nip->i_no_addr);
789                 if (nrgd)
790                         gfs2_holder_init(nrgd->rd_gl, LM_ST_EXCLUSIVE, 0, ghs + num_gh++);
791         }
792
793         for (x = 0; x < num_gh; x++) {
794                 error = gfs2_glock_nq(ghs + x);
795                 if (error)
796                         goto out_gunlock;
797         }
798
799         /* Check out the old directory */
800
801         error = gfs2_unlink_ok(odip, &odentry->d_name, ip);
802         if (error)
803                 goto out_gunlock;
804
805         /* Check out the new directory */
806
807         if (nip) {
808                 error = gfs2_unlink_ok(ndip, &ndentry->d_name, nip);
809                 if (error)
810                         goto out_gunlock;
811
812                 if (S_ISDIR(nip->i_inode.i_mode)) {
813                         if (nip->i_entries < 2) {
814                                 if (gfs2_consist_inode(nip))
815                                         gfs2_dinode_print(nip);
816                                 error = -EIO;
817                                 goto out_gunlock;
818                         }
819                         if (nip->i_entries > 2) {
820                                 error = -ENOTEMPTY;
821                                 goto out_gunlock;
822                         }
823                 }
824         } else {
825                 error = gfs2_permission(ndir, MAY_WRITE | MAY_EXEC, 0);
826                 if (error)
827                         goto out_gunlock;
828
829                 error = gfs2_dir_check(ndir, &ndentry->d_name, NULL);
830                 switch (error) {
831                 case -ENOENT:
832                         error = 0;
833                         break;
834                 case 0:
835                         error = -EEXIST;
836                 default:
837                         goto out_gunlock;
838                 };
839
840                 if (odip != ndip) {
841                         if (!ndip->i_inode.i_nlink) {
842                                 error = -EINVAL;
843                                 goto out_gunlock;
844                         }
845                         if (ndip->i_entries == (u32)-1) {
846                                 error = -EFBIG;
847                                 goto out_gunlock;
848                         }
849                         if (S_ISDIR(ip->i_inode.i_mode) &&
850                             ndip->i_inode.i_nlink == (u32)-1) {
851                                 error = -EMLINK;
852                                 goto out_gunlock;
853                         }
854                 }
855         }
856
857         /* Check out the dir to be renamed */
858
859         if (dir_rename) {
860                 error = gfs2_permission(odentry->d_inode, MAY_WRITE, 0);
861                 if (error)
862                         goto out_gunlock;
863         }
864
865         if (nip == NULL)
866                 alloc_required = gfs2_diradd_alloc_required(ndir, &ndentry->d_name);
867         error = alloc_required;
868         if (error < 0)
869                 goto out_gunlock;
870         error = 0;
871
872         if (alloc_required) {
873                 struct gfs2_alloc *al = gfs2_alloc_get(ndip);
874                 if (!al) {
875                         error = -ENOMEM;
876                         goto out_gunlock;
877                 }
878
879                 error = gfs2_quota_lock_check(ndip);
880                 if (error)
881                         goto out_alloc;
882
883                 al->al_requested = sdp->sd_max_dirres;
884
885                 error = gfs2_inplace_reserve_ri(ndip);
886                 if (error)
887                         goto out_gunlock_q;
888
889                 error = gfs2_trans_begin(sdp, sdp->sd_max_dirres +
890                                          gfs2_rg_blocks(al) +
891                                          4 * RES_DINODE + 4 * RES_LEAF +
892                                          RES_STATFS + RES_QUOTA + 4, 0);
893                 if (error)
894                         goto out_ipreserv;
895         } else {
896                 error = gfs2_trans_begin(sdp, 4 * RES_DINODE +
897                                          5 * RES_LEAF + 4, 0);
898                 if (error)
899                         goto out_gunlock;
900         }
901
902         /* Remove the target file, if it exists */
903
904         if (nip) {
905                 if (S_ISDIR(nip->i_inode.i_mode))
906                         error = gfs2_rmdiri(ndip, &ndentry->d_name, nip);
907                 else {
908                         error = gfs2_dir_del(ndip, &ndentry->d_name);
909                         if (error)
910                                 goto out_end_trans;
911                         error = gfs2_change_nlink(nip, -1);
912                 }
913                 if (error)
914                         goto out_end_trans;
915         }
916
917         if (dir_rename) {
918                 error = gfs2_change_nlink(ndip, +1);
919                 if (error)
920                         goto out_end_trans;
921                 error = gfs2_change_nlink(odip, -1);
922                 if (error)
923                         goto out_end_trans;
924
925                 error = gfs2_dir_mvino(ip, &gfs2_qdotdot, ndip, DT_DIR);
926                 if (error)
927                         goto out_end_trans;
928         } else {
929                 struct buffer_head *dibh;
930                 error = gfs2_meta_inode_buffer(ip, &dibh);
931                 if (error)
932                         goto out_end_trans;
933                 ip->i_inode.i_ctime = CURRENT_TIME;
934                 gfs2_trans_add_bh(ip->i_gl, dibh, 1);
935                 gfs2_dinode_out(ip, dibh->b_data);
936                 brelse(dibh);
937         }
938
939         error = gfs2_dir_del(odip, &odentry->d_name);
940         if (error)
941                 goto out_end_trans;
942
943         error = gfs2_dir_add(ndir, &ndentry->d_name, ip, IF2DT(ip->i_inode.i_mode));
944         if (error)
945                 goto out_end_trans;
946
947 out_end_trans:
948         gfs2_trans_end(sdp);
949 out_ipreserv:
950         if (alloc_required)
951                 gfs2_inplace_release(ndip);
952 out_gunlock_q:
953         if (alloc_required)
954                 gfs2_quota_unlock(ndip);
955 out_alloc:
956         if (alloc_required)
957                 gfs2_alloc_put(ndip);
958 out_gunlock:
959         while (x--) {
960                 gfs2_glock_dq(ghs + x);
961                 gfs2_holder_uninit(ghs + x);
962         }
963 out_gunlock_r:
964         if (r_gh.gh_gl)
965                 gfs2_glock_dq_uninit(&r_gh);
966 out:
967         gfs2_glock_dq_uninit(&ri_gh);
968         return error;
969 }
970
971 /**
972  * gfs2_follow_link - Follow a symbolic link
973  * @dentry: The dentry of the link
974  * @nd: Data that we pass to vfs_follow_link()
975  *
976  * This can handle symlinks of any size.
977  *
978  * Returns: 0 on success or error code
979  */
980
981 static void *gfs2_follow_link(struct dentry *dentry, struct nameidata *nd)
982 {
983         struct gfs2_inode *ip = GFS2_I(dentry->d_inode);
984         struct gfs2_holder i_gh;
985         struct buffer_head *dibh;
986         unsigned int x, size;
987         char *buf;
988         int error;
989
990         gfs2_holder_init(ip->i_gl, LM_ST_SHARED, 0, &i_gh);
991         error = gfs2_glock_nq(&i_gh);
992         if (error) {
993                 gfs2_holder_uninit(&i_gh);
994                 nd_set_link(nd, ERR_PTR(error));
995                 return NULL;
996         }
997
998         size = (unsigned int)i_size_read(&ip->i_inode);
999         if (size == 0) {
1000                 gfs2_consist_inode(ip);
1001                 buf = ERR_PTR(-EIO);
1002                 goto out;
1003         }
1004
1005         error = gfs2_meta_inode_buffer(ip, &dibh);
1006         if (error) {
1007                 buf = ERR_PTR(error);
1008                 goto out;
1009         }
1010
1011         x = size + 1;
1012         buf = kmalloc(x, GFP_NOFS);
1013         if (!buf)
1014                 buf = ERR_PTR(-ENOMEM);
1015         else
1016                 memcpy(buf, dibh->b_data + sizeof(struct gfs2_dinode), x);
1017         brelse(dibh);
1018 out:
1019         gfs2_glock_dq_uninit(&i_gh);
1020         nd_set_link(nd, buf);
1021         return NULL;
1022 }
1023
1024 static void gfs2_put_link(struct dentry *dentry, struct nameidata *nd, void *p)
1025 {
1026         char *s = nd_get_link(nd);
1027         if (!IS_ERR(s))
1028                 kfree(s);
1029 }
1030
1031 /**
1032  * gfs2_permission -
1033  * @inode:
1034  * @mask:
1035  * @nd: passed from Linux VFS, ignored by us
1036  *
1037  * This may be called from the VFS directly, or from within GFS2 with the
1038  * inode locked, so we look to see if the glock is already locked and only
1039  * lock the glock if its not already been done.
1040  *
1041  * Returns: errno
1042  */
1043
1044 int gfs2_permission(struct inode *inode, int mask, unsigned int flags)
1045 {
1046         struct gfs2_inode *ip;
1047         struct gfs2_holder i_gh;
1048         int error;
1049         int unlock = 0;
1050
1051         if (flags & IPERM_FLAG_RCU)
1052                 return -ECHILD;
1053
1054         ip = GFS2_I(inode);
1055         if (gfs2_glock_is_locked_by_me(ip->i_gl) == NULL) {
1056                 error = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &i_gh);
1057                 if (error)
1058                         return error;
1059                 unlock = 1;
1060         }
1061
1062         if ((mask & MAY_WRITE) && IS_IMMUTABLE(inode))
1063                 error = -EACCES;
1064         else
1065                 error = generic_permission(inode, mask, flags, gfs2_check_acl);
1066         if (unlock)
1067                 gfs2_glock_dq_uninit(&i_gh);
1068
1069         return error;
1070 }
1071
1072 static int setattr_chown(struct inode *inode, struct iattr *attr)
1073 {
1074         struct gfs2_inode *ip = GFS2_I(inode);
1075         struct gfs2_sbd *sdp = GFS2_SB(inode);
1076         u32 ouid, ogid, nuid, ngid;
1077         int error;
1078
1079         ouid = inode->i_uid;
1080         ogid = inode->i_gid;
1081         nuid = attr->ia_uid;
1082         ngid = attr->ia_gid;
1083
1084         if (!(attr->ia_valid & ATTR_UID) || ouid == nuid)
1085                 ouid = nuid = NO_QUOTA_CHANGE;
1086         if (!(attr->ia_valid & ATTR_GID) || ogid == ngid)
1087                 ogid = ngid = NO_QUOTA_CHANGE;
1088
1089         if (!gfs2_alloc_get(ip))
1090                 return -ENOMEM;
1091
1092         error = gfs2_quota_lock(ip, nuid, ngid);
1093         if (error)
1094                 goto out_alloc;
1095
1096         if (ouid != NO_QUOTA_CHANGE || ogid != NO_QUOTA_CHANGE) {
1097                 error = gfs2_quota_check(ip, nuid, ngid);
1098                 if (error)
1099                         goto out_gunlock_q;
1100         }
1101
1102         error = gfs2_trans_begin(sdp, RES_DINODE + 2 * RES_QUOTA, 0);
1103         if (error)
1104                 goto out_gunlock_q;
1105
1106         error = gfs2_setattr_simple(ip, attr);
1107         if (error)
1108                 goto out_end_trans;
1109
1110         if (ouid != NO_QUOTA_CHANGE || ogid != NO_QUOTA_CHANGE) {
1111                 u64 blocks = gfs2_get_inode_blocks(&ip->i_inode);
1112                 gfs2_quota_change(ip, -blocks, ouid, ogid);
1113                 gfs2_quota_change(ip, blocks, nuid, ngid);
1114         }
1115
1116 out_end_trans:
1117         gfs2_trans_end(sdp);
1118 out_gunlock_q:
1119         gfs2_quota_unlock(ip);
1120 out_alloc:
1121         gfs2_alloc_put(ip);
1122         return error;
1123 }
1124
1125 /**
1126  * gfs2_setattr - Change attributes on an inode
1127  * @dentry: The dentry which is changing
1128  * @attr: The structure describing the change
1129  *
1130  * The VFS layer wants to change one or more of an inodes attributes.  Write
1131  * that change out to disk.
1132  *
1133  * Returns: errno
1134  */
1135
1136 static int gfs2_setattr(struct dentry *dentry, struct iattr *attr)
1137 {
1138         struct inode *inode = dentry->d_inode;
1139         struct gfs2_inode *ip = GFS2_I(inode);
1140         struct gfs2_holder i_gh;
1141         int error;
1142
1143         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &i_gh);
1144         if (error)
1145                 return error;
1146
1147         error = -EPERM;
1148         if (IS_IMMUTABLE(inode) || IS_APPEND(inode))
1149                 goto out;
1150
1151         error = inode_change_ok(inode, attr);
1152         if (error)
1153                 goto out;
1154
1155         if (attr->ia_valid & ATTR_SIZE)
1156                 error = gfs2_setattr_size(inode, attr->ia_size);
1157         else if (attr->ia_valid & (ATTR_UID | ATTR_GID))
1158                 error = setattr_chown(inode, attr);
1159         else if ((attr->ia_valid & ATTR_MODE) && IS_POSIXACL(inode))
1160                 error = gfs2_acl_chmod(ip, attr);
1161         else
1162                 error = gfs2_setattr_simple(ip, attr);
1163
1164 out:
1165         gfs2_glock_dq_uninit(&i_gh);
1166         if (!error)
1167                 mark_inode_dirty(inode);
1168         return error;
1169 }
1170
1171 /**
1172  * gfs2_getattr - Read out an inode's attributes
1173  * @mnt: The vfsmount the inode is being accessed from
1174  * @dentry: The dentry to stat
1175  * @stat: The inode's stats
1176  *
1177  * This may be called from the VFS directly, or from within GFS2 with the
1178  * inode locked, so we look to see if the glock is already locked and only
1179  * lock the glock if its not already been done. Note that its the NFS
1180  * readdirplus operation which causes this to be called (from filldir)
1181  * with the glock already held.
1182  *
1183  * Returns: errno
1184  */
1185
1186 static int gfs2_getattr(struct vfsmount *mnt, struct dentry *dentry,
1187                         struct kstat *stat)
1188 {
1189         struct inode *inode = dentry->d_inode;
1190         struct gfs2_inode *ip = GFS2_I(inode);
1191         struct gfs2_holder gh;
1192         int error;
1193         int unlock = 0;
1194
1195         if (gfs2_glock_is_locked_by_me(ip->i_gl) == NULL) {
1196                 error = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
1197                 if (error)
1198                         return error;
1199                 unlock = 1;
1200         }
1201
1202         generic_fillattr(inode, stat);
1203         if (unlock)
1204                 gfs2_glock_dq_uninit(&gh);
1205
1206         return 0;
1207 }
1208
1209 static int gfs2_setxattr(struct dentry *dentry, const char *name,
1210                          const void *data, size_t size, int flags)
1211 {
1212         struct inode *inode = dentry->d_inode;
1213         struct gfs2_inode *ip = GFS2_I(inode);
1214         struct gfs2_holder gh;
1215         int ret;
1216
1217         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &gh);
1218         ret = gfs2_glock_nq(&gh);
1219         if (ret == 0) {
1220                 ret = generic_setxattr(dentry, name, data, size, flags);
1221                 gfs2_glock_dq(&gh);
1222         }
1223         gfs2_holder_uninit(&gh);
1224         return ret;
1225 }
1226
1227 static ssize_t gfs2_getxattr(struct dentry *dentry, const char *name,
1228                              void *data, size_t size)
1229 {
1230         struct inode *inode = dentry->d_inode;
1231         struct gfs2_inode *ip = GFS2_I(inode);
1232         struct gfs2_holder gh;
1233         int ret;
1234
1235         gfs2_holder_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
1236         ret = gfs2_glock_nq(&gh);
1237         if (ret == 0) {
1238                 ret = generic_getxattr(dentry, name, data, size);
1239                 gfs2_glock_dq(&gh);
1240         }
1241         gfs2_holder_uninit(&gh);
1242         return ret;
1243 }
1244
1245 static int gfs2_removexattr(struct dentry *dentry, const char *name)
1246 {
1247         struct inode *inode = dentry->d_inode;
1248         struct gfs2_inode *ip = GFS2_I(inode);
1249         struct gfs2_holder gh;
1250         int ret;
1251
1252         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &gh);
1253         ret = gfs2_glock_nq(&gh);
1254         if (ret == 0) {
1255                 ret = generic_removexattr(dentry, name);
1256                 gfs2_glock_dq(&gh);
1257         }
1258         gfs2_holder_uninit(&gh);
1259         return ret;
1260 }
1261
1262 static void empty_write_end(struct page *page, unsigned from,
1263                            unsigned to)
1264 {
1265         struct gfs2_inode *ip = GFS2_I(page->mapping->host);
1266
1267         page_zero_new_buffers(page, from, to);
1268         flush_dcache_page(page);
1269         mark_page_accessed(page);
1270
1271         if (!gfs2_is_writeback(ip))
1272                 gfs2_page_add_databufs(ip, page, from, to);
1273
1274         block_commit_write(page, from, to);
1275 }
1276
1277
1278 static int write_empty_blocks(struct page *page, unsigned from, unsigned to)
1279 {
1280         unsigned start, end, next;
1281         struct buffer_head *bh, *head;
1282         int error;
1283
1284         if (!page_has_buffers(page)) {
1285                 error = __block_write_begin(page, from, to - from, gfs2_block_map);
1286                 if (unlikely(error))
1287                         return error;
1288
1289                 empty_write_end(page, from, to);
1290                 return 0;
1291         }
1292
1293         bh = head = page_buffers(page);
1294         next = end = 0;
1295         while (next < from) {
1296                 next += bh->b_size;
1297                 bh = bh->b_this_page;
1298         }
1299         start = next;
1300         do {
1301                 next += bh->b_size;
1302                 if (buffer_mapped(bh)) {
1303                         if (end) {
1304                                 error = __block_write_begin(page, start, end - start,
1305                                                             gfs2_block_map);
1306                                 if (unlikely(error))
1307                                         return error;
1308                                 empty_write_end(page, start, end);
1309                                 end = 0;
1310                         }
1311                         start = next;
1312                 }
1313                 else
1314                         end = next;
1315                 bh = bh->b_this_page;
1316         } while (next < to);
1317
1318         if (end) {
1319                 error = __block_write_begin(page, start, end - start, gfs2_block_map);
1320                 if (unlikely(error))
1321                         return error;
1322                 empty_write_end(page, start, end);
1323         }
1324
1325         return 0;
1326 }
1327
1328 static int fallocate_chunk(struct inode *inode, loff_t offset, loff_t len,
1329                            int mode)
1330 {
1331         struct gfs2_inode *ip = GFS2_I(inode);
1332         struct buffer_head *dibh;
1333         int error;
1334         u64 start = offset >> PAGE_CACHE_SHIFT;
1335         unsigned int start_offset = offset & ~PAGE_CACHE_MASK;
1336         u64 end = (offset + len - 1) >> PAGE_CACHE_SHIFT;
1337         pgoff_t curr;
1338         struct page *page;
1339         unsigned int end_offset = (offset + len) & ~PAGE_CACHE_MASK;
1340         unsigned int from, to;
1341
1342         if (!end_offset)
1343                 end_offset = PAGE_CACHE_SIZE;
1344
1345         error = gfs2_meta_inode_buffer(ip, &dibh);
1346         if (unlikely(error))
1347                 goto out;
1348
1349         gfs2_trans_add_bh(ip->i_gl, dibh, 1);
1350
1351         if (gfs2_is_stuffed(ip)) {
1352                 error = gfs2_unstuff_dinode(ip, NULL);
1353                 if (unlikely(error))
1354                         goto out;
1355         }
1356
1357         curr = start;
1358         offset = start << PAGE_CACHE_SHIFT;
1359         from = start_offset;
1360         to = PAGE_CACHE_SIZE;
1361         while (curr <= end) {
1362                 page = grab_cache_page_write_begin(inode->i_mapping, curr,
1363                                                    AOP_FLAG_NOFS);
1364                 if (unlikely(!page)) {
1365                         error = -ENOMEM;
1366                         goto out;
1367                 }
1368
1369                 if (curr == end)
1370                         to = end_offset;
1371                 error = write_empty_blocks(page, from, to);
1372                 if (!error && offset + to > inode->i_size &&
1373                     !(mode & FALLOC_FL_KEEP_SIZE)) {
1374                         i_size_write(inode, offset + to);
1375                 }
1376                 unlock_page(page);
1377                 page_cache_release(page);
1378                 if (error)
1379                         goto out;
1380                 curr++;
1381                 offset += PAGE_CACHE_SIZE;
1382                 from = 0;
1383         }
1384
1385         gfs2_dinode_out(ip, dibh->b_data);
1386         mark_inode_dirty(inode);
1387
1388         brelse(dibh);
1389
1390 out:
1391         return error;
1392 }
1393
1394 static void calc_max_reserv(struct gfs2_inode *ip, loff_t max, loff_t *len,
1395                             unsigned int *data_blocks, unsigned int *ind_blocks)
1396 {
1397         const struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
1398         unsigned int max_blocks = ip->i_alloc->al_rgd->rd_free_clone;
1399         unsigned int tmp, max_data = max_blocks - 3 * (sdp->sd_max_height - 1);
1400
1401         for (tmp = max_data; tmp > sdp->sd_diptrs;) {
1402                 tmp = DIV_ROUND_UP(tmp, sdp->sd_inptrs);
1403                 max_data -= tmp;
1404         }
1405         /* This calculation isn't the exact reverse of gfs2_write_calc_reserve,
1406            so it might end up with fewer data blocks */
1407         if (max_data <= *data_blocks)
1408                 return;
1409         *data_blocks = max_data;
1410         *ind_blocks = max_blocks - max_data;
1411         *len = ((loff_t)max_data - 3) << sdp->sd_sb.sb_bsize_shift;
1412         if (*len > max) {
1413                 *len = max;
1414                 gfs2_write_calc_reserv(ip, max, data_blocks, ind_blocks);
1415         }
1416 }
1417
1418 static long gfs2_fallocate(struct inode *inode, int mode, loff_t offset,
1419                            loff_t len)
1420 {
1421         struct gfs2_sbd *sdp = GFS2_SB(inode);
1422         struct gfs2_inode *ip = GFS2_I(inode);
1423         unsigned int data_blocks = 0, ind_blocks = 0, rblocks;
1424         loff_t bytes, max_bytes;
1425         struct gfs2_alloc *al;
1426         int error;
1427         loff_t next = (offset + len - 1) >> sdp->sd_sb.sb_bsize_shift;
1428         next = (next + 1) << sdp->sd_sb.sb_bsize_shift;
1429
1430         offset = (offset >> sdp->sd_sb.sb_bsize_shift) <<
1431                  sdp->sd_sb.sb_bsize_shift;
1432
1433         len = next - offset;
1434         bytes = sdp->sd_max_rg_data * sdp->sd_sb.sb_bsize / 2;
1435         if (!bytes)
1436                 bytes = UINT_MAX;
1437
1438         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &ip->i_gh);
1439         error = gfs2_glock_nq(&ip->i_gh);
1440         if (unlikely(error))
1441                 goto out_uninit;
1442
1443         if (!gfs2_write_alloc_required(ip, offset, len))
1444                 goto out_unlock;
1445
1446         while (len > 0) {
1447                 if (len < bytes)
1448                         bytes = len;
1449                 al = gfs2_alloc_get(ip);
1450                 if (!al) {
1451                         error = -ENOMEM;
1452                         goto out_unlock;
1453                 }
1454
1455                 error = gfs2_quota_lock_check(ip);
1456                 if (error)
1457                         goto out_alloc_put;
1458
1459 retry:
1460                 gfs2_write_calc_reserv(ip, bytes, &data_blocks, &ind_blocks);
1461
1462                 al->al_requested = data_blocks + ind_blocks;
1463                 error = gfs2_inplace_reserve(ip);
1464                 if (error) {
1465                         if (error == -ENOSPC && bytes > sdp->sd_sb.sb_bsize) {
1466                                 bytes >>= 1;
1467                                 goto retry;
1468                         }
1469                         goto out_qunlock;
1470                 }
1471                 max_bytes = bytes;
1472                 calc_max_reserv(ip, len, &max_bytes, &data_blocks, &ind_blocks);
1473                 al->al_requested = data_blocks + ind_blocks;
1474
1475                 rblocks = RES_DINODE + ind_blocks + RES_STATFS + RES_QUOTA +
1476                           RES_RG_HDR + gfs2_rg_blocks(al);
1477                 if (gfs2_is_jdata(ip))
1478                         rblocks += data_blocks ? data_blocks : 1;
1479
1480                 error = gfs2_trans_begin(sdp, rblocks,
1481                                          PAGE_CACHE_SIZE/sdp->sd_sb.sb_bsize);
1482                 if (error)
1483                         goto out_trans_fail;
1484
1485                 error = fallocate_chunk(inode, offset, max_bytes, mode);
1486                 gfs2_trans_end(sdp);
1487
1488                 if (error)
1489                         goto out_trans_fail;
1490
1491                 len -= max_bytes;
1492                 offset += max_bytes;
1493                 gfs2_inplace_release(ip);
1494                 gfs2_quota_unlock(ip);
1495                 gfs2_alloc_put(ip);
1496         }
1497         goto out_unlock;
1498
1499 out_trans_fail:
1500         gfs2_inplace_release(ip);
1501 out_qunlock:
1502         gfs2_quota_unlock(ip);
1503 out_alloc_put:
1504         gfs2_alloc_put(ip);
1505 out_unlock:
1506         gfs2_glock_dq(&ip->i_gh);
1507 out_uninit:
1508         gfs2_holder_uninit(&ip->i_gh);
1509         return error;
1510 }
1511
1512
1513 static int gfs2_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,
1514                        u64 start, u64 len)
1515 {
1516         struct gfs2_inode *ip = GFS2_I(inode);
1517         struct gfs2_holder gh;
1518         int ret;
1519
1520         ret = fiemap_check_flags(fieinfo, FIEMAP_FLAG_SYNC);
1521         if (ret)
1522                 return ret;
1523
1524         mutex_lock(&inode->i_mutex);
1525
1526         ret = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, 0, &gh);
1527         if (ret)
1528                 goto out;
1529
1530         if (gfs2_is_stuffed(ip)) {
1531                 u64 phys = ip->i_no_addr << inode->i_blkbits;
1532                 u64 size = i_size_read(inode);
1533                 u32 flags = FIEMAP_EXTENT_LAST|FIEMAP_EXTENT_NOT_ALIGNED|
1534                             FIEMAP_EXTENT_DATA_INLINE;
1535                 phys += sizeof(struct gfs2_dinode);
1536                 phys += start;
1537                 if (start + len > size)
1538                         len = size - start;
1539                 if (start < size)
1540                         ret = fiemap_fill_next_extent(fieinfo, start, phys,
1541                                                       len, flags);
1542                 if (ret == 1)
1543                         ret = 0;
1544         } else {
1545                 ret = __generic_block_fiemap(inode, fieinfo, start, len,
1546                                              gfs2_block_map);
1547         }
1548
1549         gfs2_glock_dq_uninit(&gh);
1550 out:
1551         mutex_unlock(&inode->i_mutex);
1552         return ret;
1553 }
1554
1555 const struct inode_operations gfs2_file_iops = {
1556         .permission = gfs2_permission,
1557         .setattr = gfs2_setattr,
1558         .getattr = gfs2_getattr,
1559         .setxattr = gfs2_setxattr,
1560         .getxattr = gfs2_getxattr,
1561         .listxattr = gfs2_listxattr,
1562         .removexattr = gfs2_removexattr,
1563         .fallocate = gfs2_fallocate,
1564         .fiemap = gfs2_fiemap,
1565 };
1566
1567 const struct inode_operations gfs2_dir_iops = {
1568         .create = gfs2_create,
1569         .lookup = gfs2_lookup,
1570         .link = gfs2_link,
1571         .unlink = gfs2_unlink,
1572         .symlink = gfs2_symlink,
1573         .mkdir = gfs2_mkdir,
1574         .rmdir = gfs2_rmdir,
1575         .mknod = gfs2_mknod,
1576         .rename = gfs2_rename,
1577         .permission = gfs2_permission,
1578         .setattr = gfs2_setattr,
1579         .getattr = gfs2_getattr,
1580         .setxattr = gfs2_setxattr,
1581         .getxattr = gfs2_getxattr,
1582         .listxattr = gfs2_listxattr,
1583         .removexattr = gfs2_removexattr,
1584         .fiemap = gfs2_fiemap,
1585 };
1586
1587 const struct inode_operations gfs2_symlink_iops = {
1588         .readlink = generic_readlink,
1589         .follow_link = gfs2_follow_link,
1590         .put_link = gfs2_put_link,
1591         .permission = gfs2_permission,
1592         .setattr = gfs2_setattr,
1593         .getattr = gfs2_getattr,
1594         .setxattr = gfs2_setxattr,
1595         .getxattr = gfs2_getxattr,
1596         .listxattr = gfs2_listxattr,
1597         .removexattr = gfs2_removexattr,
1598         .fiemap = gfs2_fiemap,
1599 };
1600