6f80cfdfbd88b800b0955194541f42dff7a06ff6
[pandora-kernel.git] / fs / xfs / xfs_rename.c
1 /*
2  * Copyright (c) 2000-2003,2005 Silicon Graphics, Inc.
3  * All Rights Reserved.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public License as
7  * published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it would be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write the Free Software Foundation,
16  * Inc.,  51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17  */
18 #include "xfs.h"
19 #include "xfs_fs.h"
20 #include "xfs_types.h"
21 #include "xfs_log.h"
22 #include "xfs_inum.h"
23 #include "xfs_trans.h"
24 #include "xfs_sb.h"
25 #include "xfs_ag.h"
26 #include "xfs_dir2.h"
27 #include "xfs_dmapi.h"
28 #include "xfs_mount.h"
29 #include "xfs_da_btree.h"
30 #include "xfs_bmap_btree.h"
31 #include "xfs_dir2_sf.h"
32 #include "xfs_attr_sf.h"
33 #include "xfs_dinode.h"
34 #include "xfs_inode.h"
35 #include "xfs_inode_item.h"
36 #include "xfs_bmap.h"
37 #include "xfs_error.h"
38 #include "xfs_quota.h"
39 #include "xfs_utils.h"
40 #include "xfs_trans_space.h"
41 #include "xfs_vnodeops.h"
42
43
44 /*
45  * Given an array of up to 4 inode pointers, unlock the pointed to inodes.
46  * If there are fewer than 4 entries in the array, the empty entries will
47  * be at the end and will have NULL pointers in them.
48  */
49 STATIC void
50 xfs_rename_unlock4(
51         xfs_inode_t     **i_tab,
52         uint            lock_mode)
53 {
54         int     i;
55
56         xfs_iunlock(i_tab[0], lock_mode);
57         for (i = 1; i < 4; i++) {
58                 if (i_tab[i] == NULL) {
59                         break;
60                 }
61                 /*
62                  * Watch out for duplicate entries in the table.
63                  */
64                 if (i_tab[i] != i_tab[i-1]) {
65                         xfs_iunlock(i_tab[i], lock_mode);
66                 }
67         }
68 }
69
70 #ifdef DEBUG
71 int xfs_rename_skip, xfs_rename_nskip;
72 #endif
73
74 /*
75  * The following routine will acquire the locks required for a rename
76  * operation. The code understands the semantics of renames and will
77  * validate that name1 exists under dp1 & that name2 may or may not
78  * exist under dp2.
79  *
80  * We are renaming dp1/name1 to dp2/name2.
81  *
82  * Return ENOENT if dp1 does not exist, other lookup errors, or 0 for success.
83  */
84 STATIC int
85 xfs_lock_for_rename(
86         xfs_inode_t     *dp1,   /* old (source) directory inode */
87         xfs_inode_t     *dp2,   /* new (target) directory inode */
88         bhv_vname_t     *vname1,/* old entry name */
89         bhv_vname_t     *vname2,/* new entry name */
90         xfs_inode_t     **ipp1, /* inode of old entry */
91         xfs_inode_t     **ipp2, /* inode of new entry, if it
92                                    already exists, NULL otherwise. */
93         xfs_inode_t     **i_tab,/* array of inode returned, sorted */
94         int             *num_inodes)  /* number of inodes in array */
95 {
96         xfs_inode_t             *ip1 = VNAME_TO_INODE(vname1);
97         xfs_inode_t             *ip2, *temp;
98         xfs_ino_t               inum1, inum2;
99         int                     error;
100         int                     i, j;
101         uint                    lock_mode;
102         int                     diff_dirs = (dp1 != dp2);
103
104         ip2 = NULL;
105
106         /*
107          * First, find out the current inums of the entries so that we
108          * can determine the initial locking order.  We'll have to
109          * sanity check stuff after all the locks have been acquired
110          * to see if we still have the right inodes, directories, etc.
111          */
112         lock_mode = xfs_ilock_map_shared(dp1);
113         IHOLD(ip1);
114         xfs_itrace_ref(ip1);
115
116         inum1 = ip1->i_ino;
117
118
119         /*
120          * Unlock dp1 and lock dp2 if they are different.
121          */
122
123         if (diff_dirs) {
124                 xfs_iunlock_map_shared(dp1, lock_mode);
125                 lock_mode = xfs_ilock_map_shared(dp2);
126         }
127
128         error = xfs_dir_lookup_int(dp2, lock_mode, vname2, &inum2, &ip2);
129         if (error == ENOENT) {          /* target does not need to exist. */
130                 inum2 = 0;
131         } else if (error) {
132                 /*
133                  * If dp2 and dp1 are the same, the next line unlocks dp1.
134                  * Got it?
135                  */
136                 xfs_iunlock_map_shared(dp2, lock_mode);
137                 IRELE (ip1);
138                 return error;
139         } else {
140                 xfs_itrace_ref(ip2);
141         }
142
143         /*
144          * i_tab contains a list of pointers to inodes.  We initialize
145          * the table here & we'll sort it.  We will then use it to
146          * order the acquisition of the inode locks.
147          *
148          * Note that the table may contain duplicates.  e.g., dp1 == dp2.
149          */
150         i_tab[0] = dp1;
151         i_tab[1] = dp2;
152         i_tab[2] = ip1;
153         if (inum2 == 0) {
154                 *num_inodes = 3;
155                 i_tab[3] = NULL;
156         } else {
157                 *num_inodes = 4;
158                 i_tab[3] = ip2;
159         }
160
161         /*
162          * Sort the elements via bubble sort.  (Remember, there are at
163          * most 4 elements to sort, so this is adequate.)
164          */
165         for (i=0; i < *num_inodes; i++) {
166                 for (j=1; j < *num_inodes; j++) {
167                         if (i_tab[j]->i_ino < i_tab[j-1]->i_ino) {
168                                 temp = i_tab[j];
169                                 i_tab[j] = i_tab[j-1];
170                                 i_tab[j-1] = temp;
171                         }
172                 }
173         }
174
175         /*
176          * We have dp2 locked. If it isn't first, unlock it.
177          * If it is first, tell xfs_lock_inodes so it can skip it
178          * when locking. if dp1 == dp2, xfs_lock_inodes will skip both
179          * since they are equal. xfs_lock_inodes needs all these inodes
180          * so that it can unlock and retry if there might be a dead-lock
181          * potential with the log.
182          */
183
184         if (i_tab[0] == dp2 && lock_mode == XFS_ILOCK_SHARED) {
185 #ifdef DEBUG
186                 xfs_rename_skip++;
187 #endif
188                 xfs_lock_inodes(i_tab, *num_inodes, 1, XFS_ILOCK_SHARED);
189         } else {
190 #ifdef DEBUG
191                 xfs_rename_nskip++;
192 #endif
193                 xfs_iunlock_map_shared(dp2, lock_mode);
194                 xfs_lock_inodes(i_tab, *num_inodes, 0, XFS_ILOCK_SHARED);
195         }
196
197         /*
198          * Set the return value. Null out any unused entries in i_tab.
199          */
200         *ipp1 = *ipp2 = NULL;
201         for (i=0; i < *num_inodes; i++) {
202                 if (i_tab[i]->i_ino == inum1) {
203                         *ipp1 = i_tab[i];
204                 }
205                 if (i_tab[i]->i_ino == inum2) {
206                         *ipp2 = i_tab[i];
207                 }
208         }
209         for (;i < 4; i++) {
210                 i_tab[i] = NULL;
211         }
212         return 0;
213 }
214
215 /*
216  * xfs_rename
217  */
218 int
219 xfs_rename(
220         xfs_inode_t     *src_dp,
221         bhv_vname_t     *src_vname,
222         bhv_vnode_t     *target_dir_vp,
223         bhv_vname_t     *target_vname)
224 {
225         bhv_vnode_t     *src_dir_vp = XFS_ITOV(src_dp);
226         xfs_trans_t     *tp;
227         xfs_inode_t     *target_dp, *src_ip, *target_ip;
228         xfs_mount_t     *mp = src_dp->i_mount;
229         int             new_parent;             /* moving to a new dir */
230         int             src_is_directory;       /* src_name is a directory */
231         int             error;
232         xfs_bmap_free_t free_list;
233         xfs_fsblock_t   first_block;
234         int             cancel_flags;
235         int             committed;
236         xfs_inode_t     *inodes[4];
237         int             target_ip_dropped = 0;  /* dropped target_ip link? */
238         int             spaceres;
239         int             target_link_zero = 0;
240         int             num_inodes;
241         char            *src_name = VNAME(src_vname);
242         char            *target_name = VNAME(target_vname);
243         int             src_namelen = VNAMELEN(src_vname);
244         int             target_namelen = VNAMELEN(target_vname);
245
246         xfs_itrace_entry(src_dp);
247         xfs_itrace_entry(xfs_vtoi(target_dir_vp));
248
249         /*
250          * Find the XFS behavior descriptor for the target directory
251          * vnode since it was not handed to us.
252          */
253         target_dp = xfs_vtoi(target_dir_vp);
254         if (target_dp == NULL) {
255                 return XFS_ERROR(EXDEV);
256         }
257
258         if (DM_EVENT_ENABLED(src_dp, DM_EVENT_RENAME) ||
259             DM_EVENT_ENABLED(target_dp, DM_EVENT_RENAME)) {
260                 error = XFS_SEND_NAMESP(mp, DM_EVENT_RENAME,
261                                         src_dp, DM_RIGHT_NULL,
262                                         target_dp, DM_RIGHT_NULL,
263                                         src_name, target_name,
264                                         0, 0, 0);
265                 if (error) {
266                         return error;
267                 }
268         }
269         /* Return through std_return after this point. */
270
271         /*
272          * Lock all the participating inodes. Depending upon whether
273          * the target_name exists in the target directory, and
274          * whether the target directory is the same as the source
275          * directory, we can lock from 2 to 4 inodes.
276          * xfs_lock_for_rename() will return ENOENT if src_name
277          * does not exist in the source directory.
278          */
279         tp = NULL;
280         error = xfs_lock_for_rename(src_dp, target_dp, src_vname,
281                         target_vname, &src_ip, &target_ip, inodes,
282                         &num_inodes);
283
284         if (error) {
285                 /*
286                  * We have nothing locked, no inode references, and
287                  * no transaction, so just get out.
288                  */
289                 goto std_return;
290         }
291
292         ASSERT(src_ip != NULL);
293
294         if ((src_ip->i_d.di_mode & S_IFMT) == S_IFDIR) {
295                 /*
296                  * Check for link count overflow on target_dp
297                  */
298                 if (target_ip == NULL && (src_dp != target_dp) &&
299                     target_dp->i_d.di_nlink >= XFS_MAXLINK) {
300                         error = XFS_ERROR(EMLINK);
301                         xfs_rename_unlock4(inodes, XFS_ILOCK_SHARED);
302                         goto rele_return;
303                 }
304         }
305
306         /*
307          * If we are using project inheritance, we only allow renames
308          * into our tree when the project IDs are the same; else the
309          * tree quota mechanism would be circumvented.
310          */
311         if (unlikely((target_dp->i_d.di_flags & XFS_DIFLAG_PROJINHERIT) &&
312                      (target_dp->i_d.di_projid != src_ip->i_d.di_projid))) {
313                 error = XFS_ERROR(EXDEV);
314                 xfs_rename_unlock4(inodes, XFS_ILOCK_SHARED);
315                 goto rele_return;
316         }
317
318         new_parent = (src_dp != target_dp);
319         src_is_directory = ((src_ip->i_d.di_mode & S_IFMT) == S_IFDIR);
320
321         /*
322          * Drop the locks on our inodes so that we can start the transaction.
323          */
324         xfs_rename_unlock4(inodes, XFS_ILOCK_SHARED);
325
326         XFS_BMAP_INIT(&free_list, &first_block);
327         tp = xfs_trans_alloc(mp, XFS_TRANS_RENAME);
328         cancel_flags = XFS_TRANS_RELEASE_LOG_RES;
329         spaceres = XFS_RENAME_SPACE_RES(mp, target_namelen);
330         error = xfs_trans_reserve(tp, spaceres, XFS_RENAME_LOG_RES(mp), 0,
331                         XFS_TRANS_PERM_LOG_RES, XFS_RENAME_LOG_COUNT);
332         if (error == ENOSPC) {
333                 spaceres = 0;
334                 error = xfs_trans_reserve(tp, 0, XFS_RENAME_LOG_RES(mp), 0,
335                                 XFS_TRANS_PERM_LOG_RES, XFS_RENAME_LOG_COUNT);
336         }
337         if (error) {
338                 xfs_trans_cancel(tp, 0);
339                 goto rele_return;
340         }
341
342         /*
343          * Attach the dquots to the inodes
344          */
345         if ((error = XFS_QM_DQVOPRENAME(mp, inodes))) {
346                 xfs_trans_cancel(tp, cancel_flags);
347                 goto rele_return;
348         }
349
350         /*
351          * Reacquire the inode locks we dropped above.
352          */
353         xfs_lock_inodes(inodes, num_inodes, 0, XFS_ILOCK_EXCL);
354
355         /*
356          * Join all the inodes to the transaction. From this point on,
357          * we can rely on either trans_commit or trans_cancel to unlock
358          * them.  Note that we need to add a vnode reference to the
359          * directories since trans_commit & trans_cancel will decrement
360          * them when they unlock the inodes.  Also, we need to be careful
361          * not to add an inode to the transaction more than once.
362          */
363         VN_HOLD(src_dir_vp);
364         xfs_trans_ijoin(tp, src_dp, XFS_ILOCK_EXCL);
365         if (new_parent) {
366                 VN_HOLD(target_dir_vp);
367                 xfs_trans_ijoin(tp, target_dp, XFS_ILOCK_EXCL);
368         }
369         if ((src_ip != src_dp) && (src_ip != target_dp)) {
370                 xfs_trans_ijoin(tp, src_ip, XFS_ILOCK_EXCL);
371         }
372         if ((target_ip != NULL) &&
373             (target_ip != src_ip) &&
374             (target_ip != src_dp) &&
375             (target_ip != target_dp)) {
376                 xfs_trans_ijoin(tp, target_ip, XFS_ILOCK_EXCL);
377         }
378
379         /*
380          * Set up the target.
381          */
382         if (target_ip == NULL) {
383                 /*
384                  * If there's no space reservation, check the entry will
385                  * fit before actually inserting it.
386                  */
387                 if (spaceres == 0 &&
388                     (error = xfs_dir_canenter(tp, target_dp, target_name,
389                                                 target_namelen)))
390                         goto error_return;
391                 /*
392                  * If target does not exist and the rename crosses
393                  * directories, adjust the target directory link count
394                  * to account for the ".." reference from the new entry.
395                  */
396                 error = xfs_dir_createname(tp, target_dp, target_name,
397                                            target_namelen, src_ip->i_ino,
398                                            &first_block, &free_list, spaceres);
399                 if (error == ENOSPC)
400                         goto error_return;
401                 if (error)
402                         goto abort_return;
403                 xfs_ichgtime(target_dp, XFS_ICHGTIME_MOD | XFS_ICHGTIME_CHG);
404
405                 if (new_parent && src_is_directory) {
406                         error = xfs_bumplink(tp, target_dp);
407                         if (error)
408                                 goto abort_return;
409                 }
410         } else { /* target_ip != NULL */
411                 /*
412                  * If target exists and it's a directory, check that both
413                  * target and source are directories and that target can be
414                  * destroyed, or that neither is a directory.
415                  */
416                 if ((target_ip->i_d.di_mode & S_IFMT) == S_IFDIR) {
417                         /*
418                          * Make sure target dir is empty.
419                          */
420                         if (!(xfs_dir_isempty(target_ip)) ||
421                             (target_ip->i_d.di_nlink > 2)) {
422                                 error = XFS_ERROR(EEXIST);
423                                 goto error_return;
424                         }
425                 }
426
427                 /*
428                  * Link the source inode under the target name.
429                  * If the source inode is a directory and we are moving
430                  * it across directories, its ".." entry will be
431                  * inconsistent until we replace that down below.
432                  *
433                  * In case there is already an entry with the same
434                  * name at the destination directory, remove it first.
435                  */
436                 error = xfs_dir_replace(tp, target_dp, target_name,
437                                         target_namelen, src_ip->i_ino,
438                                         &first_block, &free_list, spaceres);
439                 if (error)
440                         goto abort_return;
441                 xfs_ichgtime(target_dp, XFS_ICHGTIME_MOD | XFS_ICHGTIME_CHG);
442
443                 /*
444                  * Decrement the link count on the target since the target
445                  * dir no longer points to it.
446                  */
447                 error = xfs_droplink(tp, target_ip);
448                 if (error)
449                         goto abort_return;
450                 target_ip_dropped = 1;
451
452                 if (src_is_directory) {
453                         /*
454                          * Drop the link from the old "." entry.
455                          */
456                         error = xfs_droplink(tp, target_ip);
457                         if (error)
458                                 goto abort_return;
459                 }
460
461                 /* Do this test while we still hold the locks */
462                 target_link_zero = (target_ip)->i_d.di_nlink==0;
463
464         } /* target_ip != NULL */
465
466         /*
467          * Remove the source.
468          */
469         if (new_parent && src_is_directory) {
470                 /*
471                  * Rewrite the ".." entry to point to the new
472                  * directory.
473                  */
474                 error = xfs_dir_replace(tp, src_ip, "..", 2, target_dp->i_ino,
475                                         &first_block, &free_list, spaceres);
476                 ASSERT(error != EEXIST);
477                 if (error)
478                         goto abort_return;
479                 xfs_ichgtime(src_ip, XFS_ICHGTIME_MOD | XFS_ICHGTIME_CHG);
480
481         } else {
482                 /*
483                  * We always want to hit the ctime on the source inode.
484                  * We do it in the if clause above for the 'new_parent &&
485                  * src_is_directory' case, and here we get all the other
486                  * cases.  This isn't strictly required by the standards
487                  * since the source inode isn't really being changed,
488                  * but old unix file systems did it and some incremental
489                  * backup programs won't work without it.
490                  */
491                 xfs_ichgtime(src_ip, XFS_ICHGTIME_CHG);
492         }
493
494         /*
495          * Adjust the link count on src_dp.  This is necessary when
496          * renaming a directory, either within one parent when
497          * the target existed, or across two parent directories.
498          */
499         if (src_is_directory && (new_parent || target_ip != NULL)) {
500
501                 /*
502                  * Decrement link count on src_directory since the
503                  * entry that's moved no longer points to it.
504                  */
505                 error = xfs_droplink(tp, src_dp);
506                 if (error)
507                         goto abort_return;
508         }
509
510         error = xfs_dir_removename(tp, src_dp, src_name, src_namelen,
511                         src_ip->i_ino, &first_block, &free_list, spaceres);
512         if (error)
513                 goto abort_return;
514         xfs_ichgtime(src_dp, XFS_ICHGTIME_MOD | XFS_ICHGTIME_CHG);
515
516         /*
517          * Update the generation counts on all the directory inodes
518          * that we're modifying.
519          */
520         src_dp->i_gen++;
521         xfs_trans_log_inode(tp, src_dp, XFS_ILOG_CORE);
522
523         if (new_parent) {
524                 target_dp->i_gen++;
525                 xfs_trans_log_inode(tp, target_dp, XFS_ILOG_CORE);
526         }
527
528         /*
529          * If there was a target inode, take an extra reference on
530          * it here so that it doesn't go to xfs_inactive() from
531          * within the commit.
532          */
533         if (target_ip != NULL) {
534                 IHOLD(target_ip);
535         }
536
537         /*
538          * If this is a synchronous mount, make sure that the
539          * rename transaction goes to disk before returning to
540          * the user.
541          */
542         if (mp->m_flags & (XFS_MOUNT_WSYNC|XFS_MOUNT_DIRSYNC)) {
543                 xfs_trans_set_sync(tp);
544         }
545
546         /*
547          * Take refs. for vop_link_removed calls below.  No need to worry
548          * about directory refs. because the caller holds them.
549          *
550          * Do holds before the xfs_bmap_finish since it might rele them down
551          * to zero.
552          */
553
554         if (target_ip_dropped)
555                 IHOLD(target_ip);
556         IHOLD(src_ip);
557
558         error = xfs_bmap_finish(&tp, &free_list, &committed);
559         if (error) {
560                 xfs_bmap_cancel(&free_list);
561                 xfs_trans_cancel(tp, (XFS_TRANS_RELEASE_LOG_RES |
562                                  XFS_TRANS_ABORT));
563                 if (target_ip != NULL) {
564                         IRELE(target_ip);
565                 }
566                 if (target_ip_dropped) {
567                         IRELE(target_ip);
568                 }
569                 IRELE(src_ip);
570                 goto std_return;
571         }
572
573         /*
574          * trans_commit will unlock src_ip, target_ip & decrement
575          * the vnode references.
576          */
577         error = xfs_trans_commit(tp, XFS_TRANS_RELEASE_LOG_RES);
578         if (target_ip != NULL)
579                 IRELE(target_ip);
580         /*
581          * Let interposed file systems know about removed links.
582          */
583         if (target_ip_dropped)
584                 IRELE(target_ip);
585
586         IRELE(src_ip);
587
588         /* Fall through to std_return with error = 0 or errno from
589          * xfs_trans_commit      */
590 std_return:
591         if (DM_EVENT_ENABLED(src_dp, DM_EVENT_POSTRENAME) ||
592             DM_EVENT_ENABLED(target_dp, DM_EVENT_POSTRENAME)) {
593                 (void) XFS_SEND_NAMESP (mp, DM_EVENT_POSTRENAME,
594                                         src_dp, DM_RIGHT_NULL,
595                                         target_dp, DM_RIGHT_NULL,
596                                         src_name, target_name,
597                                         0, error, 0);
598         }
599         return error;
600
601  abort_return:
602         cancel_flags |= XFS_TRANS_ABORT;
603         /* FALLTHROUGH */
604  error_return:
605         xfs_bmap_cancel(&free_list);
606         xfs_trans_cancel(tp, cancel_flags);
607         goto std_return;
608
609  rele_return:
610         IRELE(src_ip);
611         if (target_ip != NULL) {
612                 IRELE(target_ip);
613         }
614         goto std_return;
615 }