[PATCH] ufs: directory and page cache: from blocks to pages
[pandora-kernel.git] / fs / ufs / dir.c
1 /*
2  *  linux/fs/ufs/ufs_dir.c
3  *
4  * Copyright (C) 1996
5  * Adrian Rodriguez (adrian@franklins-tower.rutgers.edu)
6  * Laboratory for Computer Science Research Computing Facility
7  * Rutgers, The State University of New Jersey
8  *
9  * swab support by Francois-Rene Rideau <fare@tunes.org> 19970406
10  *
11  * 4.4BSD (FreeBSD) support added on February 1st 1998 by
12  * Niels Kristian Bech Jensen <nkbj@image.dk> partially based
13  * on code by Martin von Loewis <martin@mira.isdn.cs.tu-berlin.de>.
14  *
15  * Migration to usage of "page cache" on May 2006 by
16  * Evgeniy Dushistov <dushistov@mail.ru> based on ext2 code base.
17  */
18
19 #include <linux/time.h>
20 #include <linux/fs.h>
21 #include <linux/ufs_fs.h>
22 #include <linux/smp_lock.h>
23 #include <linux/sched.h>
24
25 #include "swab.h"
26 #include "util.h"
27
28 #undef UFS_DIR_DEBUG
29
30 #ifdef UFS_DIR_DEBUG
31 #define UFSD(x) printk("(%s, %d), %s: ", __FILE__, __LINE__, __FUNCTION__); printk x;
32 #else
33 #define UFSD(x)
34 #endif
35
36 /*
37  * NOTE! unlike strncmp, ufs_match returns 1 for success, 0 for failure.
38  *
39  * len <= UFS_MAXNAMLEN and de != NULL are guaranteed by caller.
40  */
41 static inline int ufs_match(struct super_block *sb, int len,
42                 const char * const name, struct ufs_dir_entry * de)
43 {
44         if (len != ufs_get_de_namlen(sb, de))
45                 return 0;
46         if (!de->d_ino)
47                 return 0;
48         return !memcmp(name, de->d_name, len);
49 }
50
51 static int ufs_commit_chunk(struct page *page, unsigned from, unsigned to)
52 {
53         struct inode *dir = page->mapping->host;
54         int err = 0;
55         dir->i_version++;
56         page->mapping->a_ops->commit_write(NULL, page, from, to);
57         if (IS_DIRSYNC(dir))
58                 err = write_one_page(page, 1);
59         else
60                 unlock_page(page);
61         return err;
62 }
63
64 static inline void ufs_put_page(struct page *page)
65 {
66         kunmap(page);
67         page_cache_release(page);
68 }
69
70 static inline unsigned long ufs_dir_pages(struct inode *inode)
71 {
72         return (inode->i_size+PAGE_CACHE_SIZE-1)>>PAGE_CACHE_SHIFT;
73 }
74
75 ino_t ufs_inode_by_name(struct inode *dir, struct dentry *dentry)
76 {
77         ino_t res = 0;
78         struct ufs_dir_entry *de;
79         struct page *page;
80         
81         de = ufs_find_entry(dir, dentry, &page);
82         if (de) {
83                 res = fs32_to_cpu(dir->i_sb, de->d_ino);
84                 ufs_put_page(page);
85         }
86         return res;
87 }
88
89
90 /* Releases the page */
91 void ufs_set_link(struct inode *dir, struct ufs_dir_entry *de,
92                   struct page *page, struct inode *inode)
93 {
94         unsigned from = (char *) de - (char *) page_address(page);
95         unsigned to = from + fs16_to_cpu(dir->i_sb, de->d_reclen);
96         int err;
97
98         lock_page(page);
99         err = page->mapping->a_ops->prepare_write(NULL, page, from, to);
100         BUG_ON(err);
101         de->d_ino = cpu_to_fs32(dir->i_sb, inode->i_ino);
102         ufs_set_de_type(dir->i_sb, de, inode->i_mode);
103         err = ufs_commit_chunk(page, from, to);
104         ufs_put_page(page);
105         dir->i_mtime = dir->i_ctime = CURRENT_TIME_SEC;
106         mark_inode_dirty(dir);
107 }
108
109
110 static void ufs_check_page(struct page *page)
111 {
112         struct inode *dir = page->mapping->host;
113         struct super_block *sb = dir->i_sb;
114         char *kaddr = page_address(page);
115         unsigned offs, rec_len;
116         unsigned limit = PAGE_CACHE_SIZE;
117         struct ufs_dir_entry *p;
118         char *error;
119
120         if ((dir->i_size >> PAGE_CACHE_SHIFT) == page->index) {
121                 limit = dir->i_size & ~PAGE_CACHE_MASK;
122                 if (limit & (UFS_SECTOR_SIZE - 1))
123                         goto Ebadsize;
124                 if (!limit)
125                         goto out;
126         }
127         for (offs = 0; offs <= limit - UFS_DIR_REC_LEN(1); offs += rec_len) {
128                 p = (struct ufs_dir_entry *)(kaddr + offs);
129                 rec_len = fs16_to_cpu(sb, p->d_reclen);
130
131                 if (rec_len < UFS_DIR_REC_LEN(1))
132                         goto Eshort;
133                 if (rec_len & 3)
134                         goto Ealign;
135                 if (rec_len < UFS_DIR_REC_LEN(ufs_get_de_namlen(sb, p)))
136                         goto Enamelen;
137                 if (((offs + rec_len - 1) ^ offs) & ~(UFS_SECTOR_SIZE-1))
138                         goto Espan;
139                 if (fs32_to_cpu(sb, p->d_ino) > (UFS_SB(sb)->s_uspi->s_ipg *
140                                                   UFS_SB(sb)->s_uspi->s_ncg))
141                         goto Einumber;
142         }
143         if (offs != limit)
144                 goto Eend;
145 out:
146         SetPageChecked(page);
147         return;
148
149         /* Too bad, we had an error */
150
151 Ebadsize:
152         ufs_error(sb, "ufs_check_page",
153                   "size of directory #%lu is not a multiple of chunk size",
154                   dir->i_ino
155         );
156         goto fail;
157 Eshort:
158         error = "rec_len is smaller than minimal";
159         goto bad_entry;
160 Ealign:
161         error = "unaligned directory entry";
162         goto bad_entry;
163 Enamelen:
164         error = "rec_len is too small for name_len";
165         goto bad_entry;
166 Espan:
167         error = "directory entry across blocks";
168         goto bad_entry;
169 Einumber:
170         error = "inode out of bounds";
171 bad_entry:
172         ufs_error (sb, "ufs_check_page", "bad entry in directory #%lu: %s - "
173                    "offset=%lu, rec_len=%d, name_len=%d",
174                    dir->i_ino, error, (page->index<<PAGE_CACHE_SHIFT)+offs,
175                    rec_len, ufs_get_de_namlen(sb, p));
176         goto fail;
177 Eend:
178         p = (struct ufs_dir_entry *)(kaddr + offs);
179         ufs_error (sb, "ext2_check_page",
180                    "entry in directory #%lu spans the page boundary"
181                    "offset=%lu",
182                    dir->i_ino, (page->index<<PAGE_CACHE_SHIFT)+offs);
183 fail:
184         SetPageChecked(page);
185         SetPageError(page);
186 }
187
188 static struct page *ufs_get_page(struct inode *dir, unsigned long n)
189 {
190         struct address_space *mapping = dir->i_mapping;
191         struct page *page = read_cache_page(mapping, n,
192                                 (filler_t*)mapping->a_ops->readpage, NULL);
193         if (!IS_ERR(page)) {
194                 wait_on_page_locked(page);
195                 kmap(page);
196                 if (!PageUptodate(page))
197                         goto fail;
198                 if (!PageChecked(page))
199                         ufs_check_page(page);
200                 if (PageError(page))
201                         goto fail;
202         }
203         return page;
204
205 fail:
206         ufs_put_page(page);
207         return ERR_PTR(-EIO);
208 }
209
210 /*
211  * Return the offset into page `page_nr' of the last valid
212  * byte in that page, plus one.
213  */
214 static unsigned
215 ufs_last_byte(struct inode *inode, unsigned long page_nr)
216 {
217         unsigned last_byte = inode->i_size;
218
219         last_byte -= page_nr << PAGE_CACHE_SHIFT;
220         if (last_byte > PAGE_CACHE_SIZE)
221                 last_byte = PAGE_CACHE_SIZE;
222         return last_byte;
223 }
224
225 static inline struct ufs_dir_entry *
226 ufs_next_entry(struct super_block *sb, struct ufs_dir_entry *p)
227 {
228         return (struct ufs_dir_entry *)((char *)p +
229                                         fs16_to_cpu(sb, p->d_reclen));
230 }
231
232 struct ufs_dir_entry *ufs_dotdot(struct inode *dir, struct page **p)
233 {
234         struct page *page = ufs_get_page(dir, 0);
235         struct ufs_dir_entry *de = NULL;
236
237         if (!IS_ERR(page)) {
238                 de = ufs_next_entry(dir->i_sb,
239                                     (struct ufs_dir_entry *)page_address(page));
240                 *p = page;
241         }
242         return de;
243 }
244
245 /*
246  *      ufs_find_entry()
247  *
248  * finds an entry in the specified directory with the wanted name. It
249  * returns the page in which the entry was found, and the entry itself
250  * (as a parameter - res_dir). Page is returned mapped and unlocked.
251  * Entry is guaranteed to be valid.
252  */
253 struct ufs_dir_entry *ufs_find_entry(struct inode *dir, struct dentry *dentry,
254                                      struct page **res_page)
255 {
256         struct super_block *sb = dir->i_sb;
257         const char *name = dentry->d_name.name;
258         int namelen = dentry->d_name.len;
259         unsigned reclen = UFS_DIR_REC_LEN(namelen);
260         unsigned long start, n;
261         unsigned long npages = ufs_dir_pages(dir);
262         struct page *page = NULL;
263         struct ufs_dir_entry *de;
264
265         UFSD(("ENTER, dir_ino %lu, name %s, namlen %u\n", dir->i_ino, name, namelen));
266
267         if (npages == 0 || namelen > UFS_MAXNAMLEN)
268                 goto out;
269
270         /* OFFSET_CACHE */
271         *res_page = NULL;
272
273         /* start = ei->i_dir_start_lookup; */
274         start = 0;
275         if (start >= npages)
276                 start = 0;
277         n = start;
278         do {
279                 char *kaddr;
280                 page = ufs_get_page(dir, n);
281                 if (!IS_ERR(page)) {
282                         kaddr = page_address(page);
283                         de = (struct ufs_dir_entry *) kaddr;
284                         kaddr += ufs_last_byte(dir, n) - reclen;
285                         while ((char *) de <= kaddr) {
286                                 if (de->d_reclen == 0) {
287                                         ufs_error(dir->i_sb, __FUNCTION__,
288                                                   "zero-length directory entry");
289                                         ufs_put_page(page);
290                                         goto out;
291                                 }
292                                 if (ufs_match(sb, namelen, name, de))
293                                         goto found;
294                                 de = ufs_next_entry(sb, de);
295                         }
296                         ufs_put_page(page);
297                 }
298                 if (++n >= npages)
299                         n = 0;
300         } while (n != start);
301 out:
302         return NULL;
303
304 found:
305         *res_page = page;
306         /* ei->i_dir_start_lookup = n; */
307         return de;
308 }
309
310 /*
311  *      Parent is locked.
312  */
313 int ufs_add_link(struct dentry *dentry, struct inode *inode)
314 {
315         struct inode *dir = dentry->d_parent->d_inode;
316         const char *name = dentry->d_name.name;
317         int namelen = dentry->d_name.len;
318         struct super_block *sb = dir->i_sb;
319         unsigned reclen = UFS_DIR_REC_LEN(namelen);
320         unsigned short rec_len, name_len;
321         struct page *page = NULL;
322         struct ufs_dir_entry *de;
323         unsigned long npages = ufs_dir_pages(dir);
324         unsigned long n;
325         char *kaddr;
326         unsigned from, to;
327         int err;
328
329         UFSD(("ENTER, name %s, namelen %u\n", name, namelen));
330
331         /*
332          * We take care of directory expansion in the same loop.
333          * This code plays outside i_size, so it locks the page
334          * to protect that region.
335          */
336         for (n = 0; n <= npages; n++) {
337                 char *dir_end;
338
339                 page = ufs_get_page(dir, n);
340                 err = PTR_ERR(page);
341                 if (IS_ERR(page))
342                         goto out;
343                 lock_page(page);
344                 kaddr = page_address(page);
345                 dir_end = kaddr + ufs_last_byte(dir, n);
346                 de = (struct ufs_dir_entry *)kaddr;
347                 kaddr += PAGE_CACHE_SIZE - reclen;
348                 while ((char *)de <= kaddr) {
349                         if ((char *)de == dir_end) {
350                                 /* We hit i_size */
351                                 name_len = 0;
352                                 rec_len = UFS_SECTOR_SIZE;
353                                 de->d_reclen = cpu_to_fs16(sb, UFS_SECTOR_SIZE);
354                                 de->d_ino = 0;
355                                 goto got_it;
356                         }
357                         if (de->d_reclen == 0) {
358                                 ufs_error(dir->i_sb, __FUNCTION__,
359                                           "zero-length directory entry");
360                                 err = -EIO;
361                                 goto out_unlock;
362                         }
363                         err = -EEXIST;
364                         if (ufs_match(sb, namelen, name, de))
365                                 goto out_unlock;
366                         name_len = UFS_DIR_REC_LEN(ufs_get_de_namlen(sb, de));
367                         rec_len = fs16_to_cpu(sb, de->d_reclen);
368                         if (!de->d_ino && rec_len >= reclen)
369                                 goto got_it;
370                         if (rec_len >= name_len + reclen)
371                                 goto got_it;
372                         de = (struct ufs_dir_entry *) ((char *) de + rec_len);
373                 }
374                 unlock_page(page);
375                 ufs_put_page(page);
376         }
377         BUG();
378         return -EINVAL;
379
380 got_it:
381         from = (char*)de - (char*)page_address(page);
382         to = from + rec_len;
383         err = page->mapping->a_ops->prepare_write(NULL, page, from, to);
384         if (err)
385                 goto out_unlock;
386         if (de->d_ino) {
387                 struct ufs_dir_entry *de1 =
388                         (struct ufs_dir_entry *) ((char *) de + name_len);
389                 de1->d_reclen = cpu_to_fs16(sb, rec_len - name_len);
390                 de->d_reclen = cpu_to_fs16(sb, name_len);
391
392                 de = de1;
393         }
394
395         ufs_set_de_namlen(sb, de, namelen);
396         memcpy(de->d_name, name, namelen + 1);
397         de->d_ino = cpu_to_fs32(sb, inode->i_ino);
398         ufs_set_de_type(sb, de, inode->i_mode);
399
400         err = ufs_commit_chunk(page, from, to);
401         dir->i_mtime = dir->i_ctime = CURRENT_TIME_SEC;
402
403         mark_inode_dirty(dir);
404         /* OFFSET_CACHE */
405 out_put:
406         ufs_put_page(page);
407 out:
408         return err;
409 out_unlock:
410         unlock_page(page);
411         goto out_put;
412 }
413
414 static inline unsigned
415 ufs_validate_entry(struct super_block *sb, char *base,
416                    unsigned offset, unsigned mask)
417 {
418         struct ufs_dir_entry *de = (struct ufs_dir_entry*)(base + offset);
419         struct ufs_dir_entry *p = (struct ufs_dir_entry*)(base + (offset&mask));
420         while ((char*)p < (char*)de) {
421                 if (p->d_reclen == 0)
422                         break;
423                 p = ufs_next_entry(sb, p);
424         }
425         return (char *)p - base;
426 }
427
428
429 /*
430  * This is blatantly stolen from ext2fs
431  */
432 static int
433 ufs_readdir(struct file *filp, void *dirent, filldir_t filldir)
434 {
435         loff_t pos = filp->f_pos;
436         struct inode *inode = filp->f_dentry->d_inode;
437         struct super_block *sb = inode->i_sb;
438         unsigned int offset = pos & ~PAGE_CACHE_MASK;
439         unsigned long n = pos >> PAGE_CACHE_SHIFT;
440         unsigned long npages = ufs_dir_pages(inode);
441         unsigned chunk_mask = ~(UFS_SECTOR_SIZE - 1);
442         int need_revalidate = filp->f_version != inode->i_version;
443         unsigned flags = UFS_SB(sb)->s_flags;
444
445         UFSD(("BEGIN"));
446
447         if (pos > inode->i_size - UFS_DIR_REC_LEN(1))
448                 return 0;
449
450         for ( ; n < npages; n++, offset = 0) {
451                 char *kaddr, *limit;
452                 struct ufs_dir_entry *de;
453
454                 struct page *page = ufs_get_page(inode, n);
455
456                 if (IS_ERR(page)) {
457                         ufs_error(sb, __FUNCTION__,
458                                   "bad page in #%lu",
459                                   inode->i_ino);
460                         filp->f_pos += PAGE_CACHE_SIZE - offset;
461                         return -EIO;
462                 }
463                 kaddr = page_address(page);
464                 if (unlikely(need_revalidate)) {
465                         if (offset) {
466                                 offset = ufs_validate_entry(sb, kaddr, offset, chunk_mask);
467                                 filp->f_pos = (n<<PAGE_CACHE_SHIFT) + offset;
468                         }
469                         filp->f_version = inode->i_version;
470                         need_revalidate = 0;
471                 }
472                 de = (struct ufs_dir_entry *)(kaddr+offset);
473                 limit = kaddr + ufs_last_byte(inode, n) - UFS_DIR_REC_LEN(1);
474                 for ( ;(char*)de <= limit; de = ufs_next_entry(sb, de)) {
475                         if (de->d_reclen == 0) {
476                                 ufs_error(sb, __FUNCTION__,
477                                         "zero-length directory entry");
478                                 ufs_put_page(page);
479                                 return -EIO;
480                         }
481                         if (de->d_ino) {
482                                 int over;
483                                 unsigned char d_type = DT_UNKNOWN;
484
485                                 offset = (char *)de - kaddr;
486
487                                 UFSD(("filldir(%s,%u)\n", de->d_name,
488                                       fs32_to_cpu(sb, de->d_ino)));
489                                 UFSD(("namlen %u\n", ufs_get_de_namlen(sb, de)));
490
491                                 if ((flags & UFS_DE_MASK) == UFS_DE_44BSD)
492                                         d_type = de->d_u.d_44.d_type;
493
494                                 over = filldir(dirent, de->d_name,
495                                                ufs_get_de_namlen(sb, de),
496                                                 (n<<PAGE_CACHE_SHIFT) | offset,
497                                                fs32_to_cpu(sb, de->d_ino), d_type);
498                                 if (over) {
499                                         ufs_put_page(page);
500                                         return 0;
501                                 }
502                         }
503                         filp->f_pos += fs16_to_cpu(sb, de->d_reclen);
504                 }
505                 ufs_put_page(page);
506         }
507         return 0;
508 }
509
510
511 /*
512  * ufs_delete_entry deletes a directory entry by merging it with the
513  * previous entry.
514  */
515 int ufs_delete_entry(struct inode *inode, struct ufs_dir_entry *dir,
516                      struct page * page)
517 {
518         struct super_block *sb = inode->i_sb;
519         struct address_space *mapping = page->mapping;
520         char *kaddr = page_address(page);
521         unsigned from = ((char*)dir - kaddr) & ~(UFS_SECTOR_SIZE - 1);
522         unsigned to = ((char*)dir - kaddr) + fs16_to_cpu(sb, dir->d_reclen);
523         struct ufs_dir_entry *pde = NULL;
524         struct ufs_dir_entry *de = (struct ufs_dir_entry *) (kaddr + from);
525         int err;
526
527         UFSD(("ENTER\n"));
528
529         UFSD(("ino %u, reclen %u, namlen %u, name %s\n",
530               fs32_to_cpu(sb, de->d_ino),
531               fs16_to_cpu(sb, de->d_reclen),
532               ufs_get_de_namlen(sb, de), de->d_name));
533
534         while ((char*)de < (char*)dir) {
535                 if (de->d_reclen == 0) {
536                         ufs_error(inode->i_sb, __FUNCTION__,
537                                   "zero-length directory entry");
538                         err = -EIO;
539                         goto out;
540                 }
541                 pde = de;
542                 de = ufs_next_entry(sb, de);
543         }
544         if (pde)
545                 from = (char*)pde - (char*)page_address(page);
546         lock_page(page);
547         err = mapping->a_ops->prepare_write(NULL, page, from, to);
548         BUG_ON(err);
549         if (pde)
550                 pde->d_reclen = cpu_to_fs16(sb, to-from);
551         dir->d_ino = 0;
552         err = ufs_commit_chunk(page, from, to);
553         inode->i_ctime = inode->i_mtime = CURRENT_TIME_SEC;
554         mark_inode_dirty(inode);
555 out:
556         ufs_put_page(page);
557         UFSD(("EXIT\n"));
558         return err;
559 }
560
561 int ufs_make_empty(struct inode * inode, struct inode *dir)
562 {
563         struct super_block * sb = dir->i_sb;
564         struct address_space *mapping = inode->i_mapping;
565         struct page *page = grab_cache_page(mapping, 0);
566         struct ufs_dir_entry * de;
567         char *base;
568         int err;
569
570         if (!page)
571                 return -ENOMEM;
572         kmap(page);
573         err = mapping->a_ops->prepare_write(NULL, page, 0, UFS_SECTOR_SIZE);
574         if (err) {
575                 unlock_page(page);
576                 goto fail;
577         }
578
579
580         base = (char*)page_address(page);
581         memset(base, 0, PAGE_CACHE_SIZE);
582
583         de = (struct ufs_dir_entry *) base;
584
585         de->d_ino = cpu_to_fs32(sb, inode->i_ino);
586         ufs_set_de_type(sb, de, inode->i_mode);
587         ufs_set_de_namlen(sb, de, 1);
588         de->d_reclen = cpu_to_fs16(sb, UFS_DIR_REC_LEN(1));
589         strcpy (de->d_name, ".");
590         de = (struct ufs_dir_entry *)
591                 ((char *)de + fs16_to_cpu(sb, de->d_reclen));
592         de->d_ino = cpu_to_fs32(sb, dir->i_ino);
593         ufs_set_de_type(sb, de, dir->i_mode);
594         de->d_reclen = cpu_to_fs16(sb, UFS_SECTOR_SIZE - UFS_DIR_REC_LEN(1));
595         ufs_set_de_namlen(sb, de, 2);
596         strcpy (de->d_name, "..");
597
598         err = ufs_commit_chunk(page, 0, UFS_SECTOR_SIZE);
599 fail:
600         kunmap(page);
601         page_cache_release(page);
602         return err;
603 }
604
605 /*
606  * routine to check that the specified directory is empty (for rmdir)
607  */
608 int ufs_empty_dir(struct inode * inode)
609 {
610         struct super_block *sb = inode->i_sb;
611         struct page *page = NULL;
612         unsigned long i, npages = ufs_dir_pages(inode);
613
614         for (i = 0; i < npages; i++) {
615                 char *kaddr;
616                 struct ufs_dir_entry *de;
617                 page = ufs_get_page(inode, i);
618
619                 if (IS_ERR(page))
620                         continue;
621
622                 kaddr = page_address(page);
623                 de = (struct ufs_dir_entry *)kaddr;
624                 kaddr += ufs_last_byte(inode, i) - UFS_DIR_REC_LEN(1);
625
626                 while ((char *)de <= kaddr) {
627                         if (de->d_reclen == 0) {
628                                 ufs_error(inode->i_sb, __FUNCTION__,
629                                         "zero-length directory entry: "
630                                         "kaddr=%p, de=%p\n", kaddr, de);
631                                 goto not_empty;
632                         }
633                         if (de->d_ino) {
634                                 u16 namelen=ufs_get_de_namlen(sb, de);
635                                 /* check for . and .. */
636                                 if (de->d_name[0] != '.')
637                                         goto not_empty;
638                                 if (namelen > 2)
639                                         goto not_empty;
640                                 if (namelen < 2) {
641                                         if (inode->i_ino !=
642                                             fs32_to_cpu(sb, de->d_ino))
643                                                 goto not_empty;
644                                 } else if (de->d_name[1] != '.')
645                                         goto not_empty;
646                         }
647                         de = ufs_next_entry(sb, de);
648                 }
649                 ufs_put_page(page);
650         }
651         return 1;
652
653 not_empty:
654         ufs_put_page(page);
655         return 0;
656 }
657
658 const struct file_operations ufs_dir_operations = {
659         .read           = generic_read_dir,
660         .readdir        = ufs_readdir,
661         .fsync          = file_fsync,
662 };