ubifs: Fix regression in ubifs_readdir()
[pandora-kernel.git] / fs / ubifs / dir.c
1 /* * This file is part of UBIFS.
2  *
3  * Copyright (C) 2006-2008 Nokia Corporation.
4  * Copyright (C) 2006, 2007 University of Szeged, Hungary
5  *
6  * This program is free software; you can redistribute it and/or modify it
7  * under the terms of the GNU General Public License version 2 as published by
8  * the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but WITHOUT
11  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
12  * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
13  * more details.
14  *
15  * You should have received a copy of the GNU General Public License along with
16  * this program; if not, write to the Free Software Foundation, Inc., 51
17  * Franklin St, Fifth Floor, Boston, MA 02110-1301 USA
18  *
19  * Authors: Artem Bityutskiy (Битюцкий Артём)
20  *          Adrian Hunter
21  *          Zoltan Sogor
22  */
23
24 /*
25  * This file implements directory operations.
26  *
27  * All FS operations in this file allocate budget before writing anything to the
28  * media. If they fail to allocate it, the error is returned. The only
29  * exceptions are 'ubifs_unlink()' and 'ubifs_rmdir()' which keep working even
30  * if they unable to allocate the budget, because deletion %-ENOSPC failure is
31  * not what users are usually ready to get. UBIFS budgeting subsystem has some
32  * space reserved for these purposes.
33  *
34  * All operations in this file write all inodes which they change straight
35  * away, instead of marking them dirty. For example, 'ubifs_link()' changes
36  * @i_size of the parent inode and writes the parent inode together with the
37  * target inode. This was done to simplify file-system recovery which would
38  * otherwise be very difficult to do. The only exception is rename which marks
39  * the re-named inode dirty (because its @i_ctime is updated) but does not
40  * write it, but just marks it as dirty.
41  */
42
43 #include "ubifs.h"
44
45 /**
46  * inherit_flags - inherit flags of the parent inode.
47  * @dir: parent inode
48  * @mode: new inode mode flags
49  *
50  * This is a helper function for 'ubifs_new_inode()' which inherits flag of the
51  * parent directory inode @dir. UBIFS inodes inherit the following flags:
52  * o %UBIFS_COMPR_FL, which is useful to switch compression on/of on
53  *   sub-directory basis;
54  * o %UBIFS_SYNC_FL - useful for the same reasons;
55  * o %UBIFS_DIRSYNC_FL - similar, but relevant only to directories.
56  *
57  * This function returns the inherited flags.
58  */
59 static int inherit_flags(const struct inode *dir, int mode)
60 {
61         int flags;
62         const struct ubifs_inode *ui = ubifs_inode(dir);
63
64         if (!S_ISDIR(dir->i_mode))
65                 /*
66                  * The parent is not a directory, which means that an extended
67                  * attribute inode is being created. No flags.
68                  */
69                 return 0;
70
71         flags = ui->flags & (UBIFS_COMPR_FL | UBIFS_SYNC_FL | UBIFS_DIRSYNC_FL);
72         if (!S_ISDIR(mode))
73                 /* The "DIRSYNC" flag only applies to directories */
74                 flags &= ~UBIFS_DIRSYNC_FL;
75         return flags;
76 }
77
78 /**
79  * ubifs_new_inode - allocate new UBIFS inode object.
80  * @c: UBIFS file-system description object
81  * @dir: parent directory inode
82  * @mode: inode mode flags
83  *
84  * This function finds an unused inode number, allocates new inode and
85  * initializes it. Returns new inode in case of success and an error code in
86  * case of failure.
87  */
88 struct inode *ubifs_new_inode(struct ubifs_info *c, const struct inode *dir,
89                               int mode)
90 {
91         struct inode *inode;
92         struct ubifs_inode *ui;
93
94         inode = new_inode(c->vfs_sb);
95         ui = ubifs_inode(inode);
96         if (!inode)
97                 return ERR_PTR(-ENOMEM);
98
99         /*
100          * Set 'S_NOCMTIME' to prevent VFS form updating [mc]time of inodes and
101          * marking them dirty in file write path (see 'file_update_time()').
102          * UBIFS has to fully control "clean <-> dirty" transitions of inodes
103          * to make budgeting work.
104          */
105         inode->i_flags |= S_NOCMTIME;
106
107         inode_init_owner(inode, dir, mode);
108         inode->i_mtime = inode->i_atime = inode->i_ctime =
109                          ubifs_current_time(inode);
110         inode->i_mapping->nrpages = 0;
111         /* Disable readahead */
112         inode->i_mapping->backing_dev_info = &c->bdi;
113
114         switch (mode & S_IFMT) {
115         case S_IFREG:
116                 inode->i_mapping->a_ops = &ubifs_file_address_operations;
117                 inode->i_op = &ubifs_file_inode_operations;
118                 inode->i_fop = &ubifs_file_operations;
119                 break;
120         case S_IFDIR:
121                 inode->i_op  = &ubifs_dir_inode_operations;
122                 inode->i_fop = &ubifs_dir_operations;
123                 inode->i_size = ui->ui_size = UBIFS_INO_NODE_SZ;
124                 break;
125         case S_IFLNK:
126                 inode->i_op = &ubifs_symlink_inode_operations;
127                 break;
128         case S_IFSOCK:
129         case S_IFIFO:
130         case S_IFBLK:
131         case S_IFCHR:
132                 inode->i_op  = &ubifs_file_inode_operations;
133                 break;
134         default:
135                 BUG();
136         }
137
138         ui->flags = inherit_flags(dir, mode);
139         ubifs_set_inode_flags(inode);
140         if (S_ISREG(mode))
141                 ui->compr_type = c->default_compr;
142         else
143                 ui->compr_type = UBIFS_COMPR_NONE;
144         ui->synced_i_size = 0;
145
146         spin_lock(&c->cnt_lock);
147         /* Inode number overflow is currently not supported */
148         if (c->highest_inum >= INUM_WARN_WATERMARK) {
149                 if (c->highest_inum >= INUM_WATERMARK) {
150                         spin_unlock(&c->cnt_lock);
151                         ubifs_err("out of inode numbers");
152                         make_bad_inode(inode);
153                         iput(inode);
154                         return ERR_PTR(-EINVAL);
155                 }
156                 ubifs_warn("running out of inode numbers (current %lu, max %d)",
157                            (unsigned long)c->highest_inum, INUM_WATERMARK);
158         }
159
160         inode->i_ino = ++c->highest_inum;
161         /*
162          * The creation sequence number remains with this inode for its
163          * lifetime. All nodes for this inode have a greater sequence number,
164          * and so it is possible to distinguish obsolete nodes belonging to a
165          * previous incarnation of the same inode number - for example, for the
166          * purpose of rebuilding the index.
167          */
168         ui->creat_sqnum = ++c->max_sqnum;
169         spin_unlock(&c->cnt_lock);
170         return inode;
171 }
172
173 #ifdef CONFIG_UBIFS_FS_DEBUG
174
175 static int dbg_check_name(const struct ubifs_info *c,
176                           const struct ubifs_dent_node *dent,
177                           const struct qstr *nm)
178 {
179         if (!dbg_is_chk_gen(c))
180                 return 0;
181         if (le16_to_cpu(dent->nlen) != nm->len)
182                 return -EINVAL;
183         if (memcmp(dent->name, nm->name, nm->len))
184                 return -EINVAL;
185         return 0;
186 }
187
188 #else
189
190 #define dbg_check_name(c, dent, nm) 0
191
192 #endif
193
194 static struct dentry *ubifs_lookup(struct inode *dir, struct dentry *dentry,
195                                    struct nameidata *nd)
196 {
197         int err;
198         union ubifs_key key;
199         struct inode *inode = NULL;
200         struct ubifs_dent_node *dent;
201         struct ubifs_info *c = dir->i_sb->s_fs_info;
202
203         dbg_gen("'%.*s' in dir ino %lu",
204                 dentry->d_name.len, dentry->d_name.name, dir->i_ino);
205
206         if (dentry->d_name.len > UBIFS_MAX_NLEN)
207                 return ERR_PTR(-ENAMETOOLONG);
208
209         dent = kmalloc(UBIFS_MAX_DENT_NODE_SZ, GFP_NOFS);
210         if (!dent)
211                 return ERR_PTR(-ENOMEM);
212
213         dent_key_init(c, &key, dir->i_ino, &dentry->d_name);
214
215         err = ubifs_tnc_lookup_nm(c, &key, dent, &dentry->d_name);
216         if (err) {
217                 if (err == -ENOENT) {
218                         dbg_gen("not found");
219                         goto done;
220                 }
221                 goto out;
222         }
223
224         if (dbg_check_name(c, dent, &dentry->d_name)) {
225                 err = -EINVAL;
226                 goto out;
227         }
228
229         inode = ubifs_iget(dir->i_sb, le64_to_cpu(dent->inum));
230         if (IS_ERR(inode)) {
231                 /*
232                  * This should not happen. Probably the file-system needs
233                  * checking.
234                  */
235                 err = PTR_ERR(inode);
236                 ubifs_err("dead directory entry '%.*s', error %d",
237                           dentry->d_name.len, dentry->d_name.name, err);
238                 ubifs_ro_mode(c, err);
239                 goto out;
240         }
241
242 done:
243         kfree(dent);
244         /*
245          * Note, d_splice_alias() would be required instead if we supported
246          * NFS.
247          */
248         d_add(dentry, inode);
249         return NULL;
250
251 out:
252         kfree(dent);
253         return ERR_PTR(err);
254 }
255
256 static int ubifs_create(struct inode *dir, struct dentry *dentry, int mode,
257                         struct nameidata *nd)
258 {
259         struct inode *inode;
260         struct ubifs_info *c = dir->i_sb->s_fs_info;
261         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
262         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
263                                         .dirtied_ino = 1 };
264         struct ubifs_inode *dir_ui = ubifs_inode(dir);
265
266         /*
267          * Budget request settings: new inode, new direntry, changing the
268          * parent directory inode.
269          */
270
271         dbg_gen("dent '%.*s', mode %#x in dir ino %lu",
272                 dentry->d_name.len, dentry->d_name.name, mode, dir->i_ino);
273
274         err = ubifs_budget_space(c, &req);
275         if (err)
276                 return err;
277
278         inode = ubifs_new_inode(c, dir, mode);
279         if (IS_ERR(inode)) {
280                 err = PTR_ERR(inode);
281                 goto out_budg;
282         }
283
284         mutex_lock(&dir_ui->ui_mutex);
285         dir->i_size += sz_change;
286         dir_ui->ui_size = dir->i_size;
287         dir->i_mtime = dir->i_ctime = inode->i_ctime;
288         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
289         if (err)
290                 goto out_cancel;
291         mutex_unlock(&dir_ui->ui_mutex);
292
293         ubifs_release_budget(c, &req);
294         insert_inode_hash(inode);
295         d_instantiate(dentry, inode);
296         return 0;
297
298 out_cancel:
299         dir->i_size -= sz_change;
300         dir_ui->ui_size = dir->i_size;
301         mutex_unlock(&dir_ui->ui_mutex);
302         make_bad_inode(inode);
303         iput(inode);
304 out_budg:
305         ubifs_release_budget(c, &req);
306         ubifs_err("cannot create regular file, error %d", err);
307         return err;
308 }
309
310 /**
311  * vfs_dent_type - get VFS directory entry type.
312  * @type: UBIFS directory entry type
313  *
314  * This function converts UBIFS directory entry type into VFS directory entry
315  * type.
316  */
317 static unsigned int vfs_dent_type(uint8_t type)
318 {
319         switch (type) {
320         case UBIFS_ITYPE_REG:
321                 return DT_REG;
322         case UBIFS_ITYPE_DIR:
323                 return DT_DIR;
324         case UBIFS_ITYPE_LNK:
325                 return DT_LNK;
326         case UBIFS_ITYPE_BLK:
327                 return DT_BLK;
328         case UBIFS_ITYPE_CHR:
329                 return DT_CHR;
330         case UBIFS_ITYPE_FIFO:
331                 return DT_FIFO;
332         case UBIFS_ITYPE_SOCK:
333                 return DT_SOCK;
334         default:
335                 BUG();
336         }
337         return 0;
338 }
339
340 /*
341  * The classical Unix view for directory is that it is a linear array of
342  * (name, inode number) entries. Linux/VFS assumes this model as well.
343  * Particularly, 'readdir()' call wants us to return a directory entry offset
344  * which later may be used to continue 'readdir()'ing the directory or to
345  * 'seek()' to that specific direntry. Obviously UBIFS does not really fit this
346  * model because directory entries are identified by keys, which may collide.
347  *
348  * UBIFS uses directory entry hash value for directory offsets, so
349  * 'seekdir()'/'telldir()' may not always work because of possible key
350  * collisions. But UBIFS guarantees that consecutive 'readdir()' calls work
351  * properly by means of saving full directory entry name in the private field
352  * of the file description object.
353  *
354  * This means that UBIFS cannot support NFS which requires full
355  * 'seekdir()'/'telldir()' support.
356  */
357 static int ubifs_readdir(struct file *file, void *dirent, filldir_t filldir)
358 {
359         int err = 0, over = 0;
360         loff_t pos = file->f_pos;
361         struct qstr nm;
362         union ubifs_key key;
363         struct ubifs_dent_node *dent;
364         struct inode *dir = file->f_path.dentry->d_inode;
365         struct ubifs_info *c = dir->i_sb->s_fs_info;
366
367         dbg_gen("dir ino %lu, f_pos %#llx", dir->i_ino, pos);
368
369         if (pos > UBIFS_S_KEY_HASH_MASK || pos == 2)
370                 /*
371                  * The directory was seek'ed to a senseless position or there
372                  * are no more entries.
373                  */
374                 return 0;
375
376         if (file->f_version == 0) {
377                 /*
378                  * The file was seek'ed, which means that @file->private_data
379                  * is now invalid. This may also be just the first
380                  * 'ubifs_readdir()' invocation, in which case
381                  * @file->private_data is NULL, and the below code is
382                  * basically a no-op.
383                  */
384                 kfree(file->private_data);
385                 file->private_data = NULL;
386         }
387
388         /*
389          * 'generic_file_llseek()' unconditionally sets @file->f_version to
390          * zero, and we use this for detecting whether the file was seek'ed.
391          */
392         file->f_version = 1;
393
394         /* File positions 0 and 1 correspond to "." and ".." */
395         if (pos == 0) {
396                 ubifs_assert(!file->private_data);
397                 over = filldir(dirent, ".", 1, 0, dir->i_ino, DT_DIR);
398                 if (over)
399                         return 0;
400                 file->f_pos = pos = 1;
401         }
402
403         if (pos == 1) {
404                 ubifs_assert(!file->private_data);
405                 over = filldir(dirent, "..", 2, 1,
406                                parent_ino(file->f_path.dentry), DT_DIR);
407                 if (over)
408                         return 0;
409
410                 /* Find the first entry in TNC and save it */
411                 lowest_dent_key(c, &key, dir->i_ino);
412                 nm.name = NULL;
413                 dent = ubifs_tnc_next_ent(c, &key, &nm);
414                 if (IS_ERR(dent)) {
415                         err = PTR_ERR(dent);
416                         goto out;
417                 }
418
419                 file->f_pos = pos = key_hash_flash(c, &dent->key);
420                 file->private_data = dent;
421         }
422
423         dent = file->private_data;
424         if (!dent) {
425                 /*
426                  * The directory was seek'ed to and is now readdir'ed.
427                  * Find the entry corresponding to @pos or the closest one.
428                  */
429                 dent_key_init_hash(c, &key, dir->i_ino, pos);
430                 nm.name = NULL;
431                 dent = ubifs_tnc_next_ent(c, &key, &nm);
432                 if (IS_ERR(dent)) {
433                         err = PTR_ERR(dent);
434                         goto out;
435                 }
436                 file->f_pos = pos = key_hash_flash(c, &dent->key);
437                 file->private_data = dent;
438         }
439
440         while (1) {
441                 dbg_gen("feed '%s', ino %llu, new f_pos %#x",
442                         dent->name, (unsigned long long)le64_to_cpu(dent->inum),
443                         key_hash_flash(c, &dent->key));
444                 ubifs_assert(le64_to_cpu(dent->ch.sqnum) >
445                              ubifs_inode(dir)->creat_sqnum);
446
447                 nm.len = le16_to_cpu(dent->nlen);
448                 over = filldir(dirent, dent->name, nm.len, pos,
449                                le64_to_cpu(dent->inum),
450                                vfs_dent_type(dent->type));
451                 if (over)
452                         return 0;
453
454                 /* Switch to the next entry */
455                 key_read(c, &dent->key, &key);
456                 nm.name = dent->name;
457                 dent = ubifs_tnc_next_ent(c, &key, &nm);
458                 if (IS_ERR(dent)) {
459                         err = PTR_ERR(dent);
460                         goto out;
461                 }
462
463                 kfree(file->private_data);
464                 file->f_pos = pos = key_hash_flash(c, &dent->key);
465                 file->private_data = dent;
466                 cond_resched();
467
468                 if (file->f_version == 0)
469                         /*
470                          * The file was seek'ed meanwhile, lets return and start
471                          * reading direntries from the new position on the next
472                          * invocation.
473                          */
474                         return 0;
475         }
476
477 out:
478         if (err != -ENOENT)
479                 ubifs_err("cannot find next direntry, error %d", err);
480         else
481                 /*
482                  * -ENOENT is a non-fatal error in this context, the TNC uses
483                  * it to indicate that the cursor moved past the current directory
484                  * and readdir() has to stop.
485                  */
486                 err = 0;
487
488
489         kfree(file->private_data);
490         file->private_data = NULL;
491         /* 2 is a special value indicating that there are no more direntries */
492         file->f_pos = 2;
493         return err;
494 }
495
496 static loff_t ubifs_dir_llseek(struct file *file, loff_t offset, int origin)
497 {
498         return generic_file_llseek(file, offset, origin);
499 }
500
501 /* Free saved readdir() state when the directory is closed */
502 static int ubifs_dir_release(struct inode *dir, struct file *file)
503 {
504         kfree(file->private_data);
505         file->private_data = NULL;
506         return 0;
507 }
508
509 /**
510  * lock_2_inodes - a wrapper for locking two UBIFS inodes.
511  * @inode1: first inode
512  * @inode2: second inode
513  *
514  * We do not implement any tricks to guarantee strict lock ordering, because
515  * VFS has already done it for us on the @i_mutex. So this is just a simple
516  * wrapper function.
517  */
518 static void lock_2_inodes(struct inode *inode1, struct inode *inode2)
519 {
520         mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_1);
521         mutex_lock_nested(&ubifs_inode(inode2)->ui_mutex, WB_MUTEX_2);
522 }
523
524 /**
525  * unlock_2_inodes - a wrapper for unlocking two UBIFS inodes.
526  * @inode1: first inode
527  * @inode2: second inode
528  */
529 static void unlock_2_inodes(struct inode *inode1, struct inode *inode2)
530 {
531         mutex_unlock(&ubifs_inode(inode2)->ui_mutex);
532         mutex_unlock(&ubifs_inode(inode1)->ui_mutex);
533 }
534
535 static int ubifs_link(struct dentry *old_dentry, struct inode *dir,
536                       struct dentry *dentry)
537 {
538         struct ubifs_info *c = dir->i_sb->s_fs_info;
539         struct inode *inode = old_dentry->d_inode;
540         struct ubifs_inode *ui = ubifs_inode(inode);
541         struct ubifs_inode *dir_ui = ubifs_inode(dir);
542         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
543         struct ubifs_budget_req req = { .new_dent = 1, .dirtied_ino = 2,
544                                 .dirtied_ino_d = ALIGN(ui->data_len, 8) };
545
546         /*
547          * Budget request settings: new direntry, changing the target inode,
548          * changing the parent inode.
549          */
550
551         dbg_gen("dent '%.*s' to ino %lu (nlink %d) in dir ino %lu",
552                 dentry->d_name.len, dentry->d_name.name, inode->i_ino,
553                 inode->i_nlink, dir->i_ino);
554         ubifs_assert(mutex_is_locked(&dir->i_mutex));
555         ubifs_assert(mutex_is_locked(&inode->i_mutex));
556
557         err = dbg_check_synced_i_size(c, inode);
558         if (err)
559                 return err;
560
561         err = ubifs_budget_space(c, &req);
562         if (err)
563                 return err;
564
565         lock_2_inodes(dir, inode);
566         inc_nlink(inode);
567         ihold(inode);
568         inode->i_ctime = ubifs_current_time(inode);
569         dir->i_size += sz_change;
570         dir_ui->ui_size = dir->i_size;
571         dir->i_mtime = dir->i_ctime = inode->i_ctime;
572         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
573         if (err)
574                 goto out_cancel;
575         unlock_2_inodes(dir, inode);
576
577         ubifs_release_budget(c, &req);
578         d_instantiate(dentry, inode);
579         return 0;
580
581 out_cancel:
582         dir->i_size -= sz_change;
583         dir_ui->ui_size = dir->i_size;
584         drop_nlink(inode);
585         unlock_2_inodes(dir, inode);
586         ubifs_release_budget(c, &req);
587         iput(inode);
588         return err;
589 }
590
591 static int ubifs_unlink(struct inode *dir, struct dentry *dentry)
592 {
593         struct ubifs_info *c = dir->i_sb->s_fs_info;
594         struct inode *inode = dentry->d_inode;
595         struct ubifs_inode *dir_ui = ubifs_inode(dir);
596         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
597         int err, budgeted = 1;
598         struct ubifs_budget_req req = { .mod_dent = 1, .dirtied_ino = 2 };
599
600         /*
601          * Budget request settings: deletion direntry, deletion inode (+1 for
602          * @dirtied_ino), changing the parent directory inode. If budgeting
603          * fails, go ahead anyway because we have extra space reserved for
604          * deletions.
605          */
606
607         dbg_gen("dent '%.*s' from ino %lu (nlink %d) in dir ino %lu",
608                 dentry->d_name.len, dentry->d_name.name, inode->i_ino,
609                 inode->i_nlink, dir->i_ino);
610         ubifs_assert(mutex_is_locked(&dir->i_mutex));
611         ubifs_assert(mutex_is_locked(&inode->i_mutex));
612         err = dbg_check_synced_i_size(c, inode);
613         if (err)
614                 return err;
615
616         err = ubifs_budget_space(c, &req);
617         if (err) {
618                 if (err != -ENOSPC)
619                         return err;
620                 budgeted = 0;
621         }
622
623         lock_2_inodes(dir, inode);
624         inode->i_ctime = ubifs_current_time(dir);
625         drop_nlink(inode);
626         dir->i_size -= sz_change;
627         dir_ui->ui_size = dir->i_size;
628         dir->i_mtime = dir->i_ctime = inode->i_ctime;
629         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
630         if (err)
631                 goto out_cancel;
632         unlock_2_inodes(dir, inode);
633
634         if (budgeted)
635                 ubifs_release_budget(c, &req);
636         else {
637                 /* We've deleted something - clean the "no space" flags */
638                 c->bi.nospace = c->bi.nospace_rp = 0;
639                 smp_wmb();
640         }
641         return 0;
642
643 out_cancel:
644         dir->i_size += sz_change;
645         dir_ui->ui_size = dir->i_size;
646         inc_nlink(inode);
647         unlock_2_inodes(dir, inode);
648         if (budgeted)
649                 ubifs_release_budget(c, &req);
650         return err;
651 }
652
653 /**
654  * check_dir_empty - check if a directory is empty or not.
655  * @c: UBIFS file-system description object
656  * @dir: VFS inode object of the directory to check
657  *
658  * This function checks if directory @dir is empty. Returns zero if the
659  * directory is empty, %-ENOTEMPTY if it is not, and other negative error codes
660  * in case of of errors.
661  */
662 static int check_dir_empty(struct ubifs_info *c, struct inode *dir)
663 {
664         struct qstr nm = { .name = NULL };
665         struct ubifs_dent_node *dent;
666         union ubifs_key key;
667         int err;
668
669         lowest_dent_key(c, &key, dir->i_ino);
670         dent = ubifs_tnc_next_ent(c, &key, &nm);
671         if (IS_ERR(dent)) {
672                 err = PTR_ERR(dent);
673                 if (err == -ENOENT)
674                         err = 0;
675         } else {
676                 kfree(dent);
677                 err = -ENOTEMPTY;
678         }
679         return err;
680 }
681
682 static int ubifs_rmdir(struct inode *dir, struct dentry *dentry)
683 {
684         struct ubifs_info *c = dir->i_sb->s_fs_info;
685         struct inode *inode = dentry->d_inode;
686         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
687         int err, budgeted = 1;
688         struct ubifs_inode *dir_ui = ubifs_inode(dir);
689         struct ubifs_budget_req req = { .mod_dent = 1, .dirtied_ino = 2 };
690
691         /*
692          * Budget request settings: deletion direntry, deletion inode and
693          * changing the parent inode. If budgeting fails, go ahead anyway
694          * because we have extra space reserved for deletions.
695          */
696
697         dbg_gen("directory '%.*s', ino %lu in dir ino %lu", dentry->d_name.len,
698                 dentry->d_name.name, inode->i_ino, dir->i_ino);
699         ubifs_assert(mutex_is_locked(&dir->i_mutex));
700         ubifs_assert(mutex_is_locked(&inode->i_mutex));
701         err = check_dir_empty(c, dentry->d_inode);
702         if (err)
703                 return err;
704
705         err = ubifs_budget_space(c, &req);
706         if (err) {
707                 if (err != -ENOSPC)
708                         return err;
709                 budgeted = 0;
710         }
711
712         lock_2_inodes(dir, inode);
713         inode->i_ctime = ubifs_current_time(dir);
714         clear_nlink(inode);
715         drop_nlink(dir);
716         dir->i_size -= sz_change;
717         dir_ui->ui_size = dir->i_size;
718         dir->i_mtime = dir->i_ctime = inode->i_ctime;
719         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
720         if (err)
721                 goto out_cancel;
722         unlock_2_inodes(dir, inode);
723
724         if (budgeted)
725                 ubifs_release_budget(c, &req);
726         else {
727                 /* We've deleted something - clean the "no space" flags */
728                 c->bi.nospace = c->bi.nospace_rp = 0;
729                 smp_wmb();
730         }
731         return 0;
732
733 out_cancel:
734         dir->i_size += sz_change;
735         dir_ui->ui_size = dir->i_size;
736         inc_nlink(dir);
737         inc_nlink(inode);
738         inc_nlink(inode);
739         unlock_2_inodes(dir, inode);
740         if (budgeted)
741                 ubifs_release_budget(c, &req);
742         return err;
743 }
744
745 static int ubifs_mkdir(struct inode *dir, struct dentry *dentry, int mode)
746 {
747         struct inode *inode;
748         struct ubifs_inode *dir_ui = ubifs_inode(dir);
749         struct ubifs_info *c = dir->i_sb->s_fs_info;
750         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
751         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1 };
752
753         /*
754          * Budget request settings: new inode, new direntry and changing parent
755          * directory inode.
756          */
757
758         dbg_gen("dent '%.*s', mode %#x in dir ino %lu",
759                 dentry->d_name.len, dentry->d_name.name, mode, dir->i_ino);
760
761         err = ubifs_budget_space(c, &req);
762         if (err)
763                 return err;
764
765         inode = ubifs_new_inode(c, dir, S_IFDIR | mode);
766         if (IS_ERR(inode)) {
767                 err = PTR_ERR(inode);
768                 goto out_budg;
769         }
770
771         mutex_lock(&dir_ui->ui_mutex);
772         insert_inode_hash(inode);
773         inc_nlink(inode);
774         inc_nlink(dir);
775         dir->i_size += sz_change;
776         dir_ui->ui_size = dir->i_size;
777         dir->i_mtime = dir->i_ctime = inode->i_ctime;
778         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
779         if (err) {
780                 ubifs_err("cannot create directory, error %d", err);
781                 goto out_cancel;
782         }
783         mutex_unlock(&dir_ui->ui_mutex);
784
785         ubifs_release_budget(c, &req);
786         d_instantiate(dentry, inode);
787         return 0;
788
789 out_cancel:
790         dir->i_size -= sz_change;
791         dir_ui->ui_size = dir->i_size;
792         drop_nlink(dir);
793         mutex_unlock(&dir_ui->ui_mutex);
794         make_bad_inode(inode);
795         iput(inode);
796 out_budg:
797         ubifs_release_budget(c, &req);
798         return err;
799 }
800
801 static int ubifs_mknod(struct inode *dir, struct dentry *dentry,
802                        int mode, dev_t rdev)
803 {
804         struct inode *inode;
805         struct ubifs_inode *ui;
806         struct ubifs_inode *dir_ui = ubifs_inode(dir);
807         struct ubifs_info *c = dir->i_sb->s_fs_info;
808         union ubifs_dev_desc *dev = NULL;
809         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
810         int err, devlen = 0;
811         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
812                                         .new_ino_d = ALIGN(devlen, 8),
813                                         .dirtied_ino = 1 };
814
815         /*
816          * Budget request settings: new inode, new direntry and changing parent
817          * directory inode.
818          */
819
820         dbg_gen("dent '%.*s' in dir ino %lu",
821                 dentry->d_name.len, dentry->d_name.name, dir->i_ino);
822
823         if (!new_valid_dev(rdev))
824                 return -EINVAL;
825
826         if (S_ISBLK(mode) || S_ISCHR(mode)) {
827                 dev = kmalloc(sizeof(union ubifs_dev_desc), GFP_NOFS);
828                 if (!dev)
829                         return -ENOMEM;
830                 devlen = ubifs_encode_dev(dev, rdev);
831         }
832
833         err = ubifs_budget_space(c, &req);
834         if (err) {
835                 kfree(dev);
836                 return err;
837         }
838
839         inode = ubifs_new_inode(c, dir, mode);
840         if (IS_ERR(inode)) {
841                 kfree(dev);
842                 err = PTR_ERR(inode);
843                 goto out_budg;
844         }
845
846         init_special_inode(inode, inode->i_mode, rdev);
847         inode->i_size = ubifs_inode(inode)->ui_size = devlen;
848         ui = ubifs_inode(inode);
849         ui->data = dev;
850         ui->data_len = devlen;
851
852         mutex_lock(&dir_ui->ui_mutex);
853         dir->i_size += sz_change;
854         dir_ui->ui_size = dir->i_size;
855         dir->i_mtime = dir->i_ctime = inode->i_ctime;
856         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
857         if (err)
858                 goto out_cancel;
859         mutex_unlock(&dir_ui->ui_mutex);
860
861         ubifs_release_budget(c, &req);
862         insert_inode_hash(inode);
863         d_instantiate(dentry, inode);
864         return 0;
865
866 out_cancel:
867         dir->i_size -= sz_change;
868         dir_ui->ui_size = dir->i_size;
869         mutex_unlock(&dir_ui->ui_mutex);
870         make_bad_inode(inode);
871         iput(inode);
872 out_budg:
873         ubifs_release_budget(c, &req);
874         return err;
875 }
876
877 static int ubifs_symlink(struct inode *dir, struct dentry *dentry,
878                          const char *symname)
879 {
880         struct inode *inode;
881         struct ubifs_inode *ui;
882         struct ubifs_inode *dir_ui = ubifs_inode(dir);
883         struct ubifs_info *c = dir->i_sb->s_fs_info;
884         int err, len = strlen(symname);
885         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
886         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
887                                         .new_ino_d = ALIGN(len, 8),
888                                         .dirtied_ino = 1 };
889
890         /*
891          * Budget request settings: new inode, new direntry and changing parent
892          * directory inode.
893          */
894
895         dbg_gen("dent '%.*s', target '%s' in dir ino %lu", dentry->d_name.len,
896                 dentry->d_name.name, symname, dir->i_ino);
897
898         if (len > UBIFS_MAX_INO_DATA)
899                 return -ENAMETOOLONG;
900
901         err = ubifs_budget_space(c, &req);
902         if (err)
903                 return err;
904
905         inode = ubifs_new_inode(c, dir, S_IFLNK | S_IRWXUGO);
906         if (IS_ERR(inode)) {
907                 err = PTR_ERR(inode);
908                 goto out_budg;
909         }
910
911         ui = ubifs_inode(inode);
912         ui->data = kmalloc(len + 1, GFP_NOFS);
913         if (!ui->data) {
914                 err = -ENOMEM;
915                 goto out_inode;
916         }
917
918         memcpy(ui->data, symname, len);
919         ((char *)ui->data)[len] = '\0';
920         /*
921          * The terminating zero byte is not written to the flash media and it
922          * is put just to make later in-memory string processing simpler. Thus,
923          * data length is @len, not @len + %1.
924          */
925         ui->data_len = len;
926         inode->i_size = ubifs_inode(inode)->ui_size = len;
927
928         mutex_lock(&dir_ui->ui_mutex);
929         dir->i_size += sz_change;
930         dir_ui->ui_size = dir->i_size;
931         dir->i_mtime = dir->i_ctime = inode->i_ctime;
932         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
933         if (err)
934                 goto out_cancel;
935         mutex_unlock(&dir_ui->ui_mutex);
936
937         ubifs_release_budget(c, &req);
938         insert_inode_hash(inode);
939         d_instantiate(dentry, inode);
940         return 0;
941
942 out_cancel:
943         dir->i_size -= sz_change;
944         dir_ui->ui_size = dir->i_size;
945         mutex_unlock(&dir_ui->ui_mutex);
946 out_inode:
947         make_bad_inode(inode);
948         iput(inode);
949 out_budg:
950         ubifs_release_budget(c, &req);
951         return err;
952 }
953
954 /**
955  * lock_3_inodes - a wrapper for locking three UBIFS inodes.
956  * @inode1: first inode
957  * @inode2: second inode
958  * @inode3: third inode
959  *
960  * This function is used for 'ubifs_rename()' and @inode1 may be the same as
961  * @inode2 whereas @inode3 may be %NULL.
962  *
963  * We do not implement any tricks to guarantee strict lock ordering, because
964  * VFS has already done it for us on the @i_mutex. So this is just a simple
965  * wrapper function.
966  */
967 static void lock_3_inodes(struct inode *inode1, struct inode *inode2,
968                           struct inode *inode3)
969 {
970         mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_1);
971         if (inode2 != inode1)
972                 mutex_lock_nested(&ubifs_inode(inode2)->ui_mutex, WB_MUTEX_2);
973         if (inode3)
974                 mutex_lock_nested(&ubifs_inode(inode3)->ui_mutex, WB_MUTEX_3);
975 }
976
977 /**
978  * unlock_3_inodes - a wrapper for unlocking three UBIFS inodes for rename.
979  * @inode1: first inode
980  * @inode2: second inode
981  * @inode3: third inode
982  */
983 static void unlock_3_inodes(struct inode *inode1, struct inode *inode2,
984                             struct inode *inode3)
985 {
986         if (inode3)
987                 mutex_unlock(&ubifs_inode(inode3)->ui_mutex);
988         if (inode1 != inode2)
989                 mutex_unlock(&ubifs_inode(inode2)->ui_mutex);
990         mutex_unlock(&ubifs_inode(inode1)->ui_mutex);
991 }
992
993 static int ubifs_rename(struct inode *old_dir, struct dentry *old_dentry,
994                         struct inode *new_dir, struct dentry *new_dentry)
995 {
996         struct ubifs_info *c = old_dir->i_sb->s_fs_info;
997         struct inode *old_inode = old_dentry->d_inode;
998         struct inode *new_inode = new_dentry->d_inode;
999         struct ubifs_inode *old_inode_ui = ubifs_inode(old_inode);
1000         int err, release, sync = 0, move = (new_dir != old_dir);
1001         int is_dir = S_ISDIR(old_inode->i_mode);
1002         int unlink = !!new_inode;
1003         int new_sz = CALC_DENT_SIZE(new_dentry->d_name.len);
1004         int old_sz = CALC_DENT_SIZE(old_dentry->d_name.len);
1005         struct ubifs_budget_req req = { .new_dent = 1, .mod_dent = 1,
1006                                         .dirtied_ino = 3 };
1007         struct ubifs_budget_req ino_req = { .dirtied_ino = 1,
1008                         .dirtied_ino_d = ALIGN(old_inode_ui->data_len, 8) };
1009         struct timespec time;
1010
1011         /*
1012          * Budget request settings: deletion direntry, new direntry, removing
1013          * the old inode, and changing old and new parent directory inodes.
1014          *
1015          * However, this operation also marks the target inode as dirty and
1016          * does not write it, so we allocate budget for the target inode
1017          * separately.
1018          */
1019
1020         dbg_gen("dent '%.*s' ino %lu in dir ino %lu to dent '%.*s' in "
1021                 "dir ino %lu", old_dentry->d_name.len, old_dentry->d_name.name,
1022                 old_inode->i_ino, old_dir->i_ino, new_dentry->d_name.len,
1023                 new_dentry->d_name.name, new_dir->i_ino);
1024         ubifs_assert(mutex_is_locked(&old_dir->i_mutex));
1025         ubifs_assert(mutex_is_locked(&new_dir->i_mutex));
1026         if (unlink)
1027                 ubifs_assert(mutex_is_locked(&new_inode->i_mutex));
1028
1029
1030         if (unlink && is_dir) {
1031                 err = check_dir_empty(c, new_inode);
1032                 if (err)
1033                         return err;
1034         }
1035
1036         err = ubifs_budget_space(c, &req);
1037         if (err)
1038                 return err;
1039         err = ubifs_budget_space(c, &ino_req);
1040         if (err) {
1041                 ubifs_release_budget(c, &req);
1042                 return err;
1043         }
1044
1045         lock_3_inodes(old_dir, new_dir, new_inode);
1046
1047         /*
1048          * Like most other Unix systems, set the @i_ctime for inodes on a
1049          * rename.
1050          */
1051         time = ubifs_current_time(old_dir);
1052         old_inode->i_ctime = time;
1053
1054         /* We must adjust parent link count when renaming directories */
1055         if (is_dir) {
1056                 if (move) {
1057                         /*
1058                          * @old_dir loses a link because we are moving
1059                          * @old_inode to a different directory.
1060                          */
1061                         drop_nlink(old_dir);
1062                         /*
1063                          * @new_dir only gains a link if we are not also
1064                          * overwriting an existing directory.
1065                          */
1066                         if (!unlink)
1067                                 inc_nlink(new_dir);
1068                 } else {
1069                         /*
1070                          * @old_inode is not moving to a different directory,
1071                          * but @old_dir still loses a link if we are
1072                          * overwriting an existing directory.
1073                          */
1074                         if (unlink)
1075                                 drop_nlink(old_dir);
1076                 }
1077         }
1078
1079         old_dir->i_size -= old_sz;
1080         ubifs_inode(old_dir)->ui_size = old_dir->i_size;
1081         old_dir->i_mtime = old_dir->i_ctime = time;
1082         new_dir->i_mtime = new_dir->i_ctime = time;
1083
1084         /*
1085          * And finally, if we unlinked a direntry which happened to have the
1086          * same name as the moved direntry, we have to decrement @i_nlink of
1087          * the unlinked inode and change its ctime.
1088          */
1089         if (unlink) {
1090                 /*
1091                  * Directories cannot have hard-links, so if this is a
1092                  * directory, decrement its @i_nlink twice because an empty
1093                  * directory has @i_nlink 2.
1094                  */
1095                 if (is_dir)
1096                         drop_nlink(new_inode);
1097                 new_inode->i_ctime = time;
1098                 drop_nlink(new_inode);
1099         } else {
1100                 new_dir->i_size += new_sz;
1101                 ubifs_inode(new_dir)->ui_size = new_dir->i_size;
1102         }
1103
1104         /*
1105          * Do not ask 'ubifs_jnl_rename()' to flush write-buffer if @old_inode
1106          * is dirty, because this will be done later on at the end of
1107          * 'ubifs_rename()'.
1108          */
1109         if (IS_SYNC(old_inode)) {
1110                 sync = IS_DIRSYNC(old_dir) || IS_DIRSYNC(new_dir);
1111                 if (unlink && IS_SYNC(new_inode))
1112                         sync = 1;
1113         }
1114         err = ubifs_jnl_rename(c, old_dir, old_dentry, new_dir, new_dentry,
1115                                sync);
1116         if (err)
1117                 goto out_cancel;
1118
1119         unlock_3_inodes(old_dir, new_dir, new_inode);
1120         ubifs_release_budget(c, &req);
1121
1122         mutex_lock(&old_inode_ui->ui_mutex);
1123         release = old_inode_ui->dirty;
1124         mark_inode_dirty_sync(old_inode);
1125         mutex_unlock(&old_inode_ui->ui_mutex);
1126
1127         if (release)
1128                 ubifs_release_budget(c, &ino_req);
1129         if (IS_SYNC(old_inode))
1130                 err = old_inode->i_sb->s_op->write_inode(old_inode, NULL);
1131         return err;
1132
1133 out_cancel:
1134         if (unlink) {
1135                 if (is_dir)
1136                         inc_nlink(new_inode);
1137                 inc_nlink(new_inode);
1138         } else {
1139                 new_dir->i_size -= new_sz;
1140                 ubifs_inode(new_dir)->ui_size = new_dir->i_size;
1141         }
1142         old_dir->i_size += old_sz;
1143         ubifs_inode(old_dir)->ui_size = old_dir->i_size;
1144         if (is_dir) {
1145                 if (move) {
1146                         inc_nlink(old_dir);
1147                         if (!unlink)
1148                                 drop_nlink(new_dir);
1149                 } else {
1150                         if (unlink)
1151                                 inc_nlink(old_dir);
1152                 }
1153         }
1154         unlock_3_inodes(old_dir, new_dir, new_inode);
1155         ubifs_release_budget(c, &ino_req);
1156         ubifs_release_budget(c, &req);
1157         return err;
1158 }
1159
1160 int ubifs_getattr(struct vfsmount *mnt, struct dentry *dentry,
1161                   struct kstat *stat)
1162 {
1163         loff_t size;
1164         struct inode *inode = dentry->d_inode;
1165         struct ubifs_inode *ui = ubifs_inode(inode);
1166
1167         mutex_lock(&ui->ui_mutex);
1168         stat->dev = inode->i_sb->s_dev;
1169         stat->ino = inode->i_ino;
1170         stat->mode = inode->i_mode;
1171         stat->nlink = inode->i_nlink;
1172         stat->uid = inode->i_uid;
1173         stat->gid = inode->i_gid;
1174         stat->rdev = inode->i_rdev;
1175         stat->atime = inode->i_atime;
1176         stat->mtime = inode->i_mtime;
1177         stat->ctime = inode->i_ctime;
1178         stat->blksize = UBIFS_BLOCK_SIZE;
1179         stat->size = ui->ui_size;
1180
1181         /*
1182          * Unfortunately, the 'stat()' system call was designed for block
1183          * device based file systems, and it is not appropriate for UBIFS,
1184          * because UBIFS does not have notion of "block". For example, it is
1185          * difficult to tell how many block a directory takes - it actually
1186          * takes less than 300 bytes, but we have to round it to block size,
1187          * which introduces large mistake. This makes utilities like 'du' to
1188          * report completely senseless numbers. This is the reason why UBIFS
1189          * goes the same way as JFFS2 - it reports zero blocks for everything
1190          * but regular files, which makes more sense than reporting completely
1191          * wrong sizes.
1192          */
1193         if (S_ISREG(inode->i_mode)) {
1194                 size = ui->xattr_size;
1195                 size += stat->size;
1196                 size = ALIGN(size, UBIFS_BLOCK_SIZE);
1197                 /*
1198                  * Note, user-space expects 512-byte blocks count irrespectively
1199                  * of what was reported in @stat->size.
1200                  */
1201                 stat->blocks = size >> 9;
1202         } else
1203                 stat->blocks = 0;
1204         mutex_unlock(&ui->ui_mutex);
1205         return 0;
1206 }
1207
1208 const struct inode_operations ubifs_dir_inode_operations = {
1209         .lookup      = ubifs_lookup,
1210         .create      = ubifs_create,
1211         .link        = ubifs_link,
1212         .symlink     = ubifs_symlink,
1213         .unlink      = ubifs_unlink,
1214         .mkdir       = ubifs_mkdir,
1215         .rmdir       = ubifs_rmdir,
1216         .mknod       = ubifs_mknod,
1217         .rename      = ubifs_rename,
1218         .setattr     = ubifs_setattr,
1219         .getattr     = ubifs_getattr,
1220 #ifdef CONFIG_UBIFS_FS_XATTR
1221         .setxattr    = ubifs_setxattr,
1222         .getxattr    = ubifs_getxattr,
1223         .listxattr   = ubifs_listxattr,
1224         .removexattr = ubifs_removexattr,
1225 #endif
1226 };
1227
1228 const struct file_operations ubifs_dir_operations = {
1229         .llseek         = ubifs_dir_llseek,
1230         .release        = ubifs_dir_release,
1231         .read           = generic_read_dir,
1232         .readdir        = ubifs_readdir,
1233         .fsync          = ubifs_fsync,
1234         .unlocked_ioctl = ubifs_ioctl,
1235 #ifdef CONFIG_COMPAT
1236         .compat_ioctl   = ubifs_compat_ioctl,
1237 #endif
1238 };