ocfs2: remove ocfs2_local_alloc_in_range()
[pandora-kernel.git] / fs / ocfs2 / localalloc.c
1 /* -*- mode: c; c-basic-offset: 8; -*-
2  * vim: noexpandtab sw=8 ts=8 sts=0:
3  *
4  * localalloc.c
5  *
6  * Node local data allocation
7  *
8  * Copyright (C) 2002, 2004 Oracle.  All rights reserved.
9  *
10  * This program is free software; you can redistribute it and/or
11  * modify it under the terms of the GNU General Public
12  * License as published by the Free Software Foundation; either
13  * version 2 of the License, or (at your option) any later version.
14  *
15  * This program is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
18  * General Public License for more details.
19  *
20  * You should have received a copy of the GNU General Public
21  * License along with this program; if not, write to the
22  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
23  * Boston, MA 021110-1307, USA.
24  */
25
26 #include <linux/fs.h>
27 #include <linux/types.h>
28 #include <linux/slab.h>
29 #include <linux/highmem.h>
30 #include <linux/bitops.h>
31
32 #define MLOG_MASK_PREFIX ML_DISK_ALLOC
33 #include <cluster/masklog.h>
34
35 #include "ocfs2.h"
36
37 #include "alloc.h"
38 #include "blockcheck.h"
39 #include "dlmglue.h"
40 #include "inode.h"
41 #include "journal.h"
42 #include "localalloc.h"
43 #include "suballoc.h"
44 #include "super.h"
45 #include "sysfile.h"
46
47 #include "buffer_head_io.h"
48
49 #define OCFS2_LOCAL_ALLOC(dinode)       (&((dinode)->id2.i_lab))
50
51 static u32 ocfs2_local_alloc_count_bits(struct ocfs2_dinode *alloc);
52
53 static int ocfs2_local_alloc_find_clear_bits(struct ocfs2_super *osb,
54                                              struct ocfs2_dinode *alloc,
55                                              u32 *numbits,
56                                              struct ocfs2_alloc_reservation *resv);
57
58 static void ocfs2_clear_local_alloc(struct ocfs2_dinode *alloc);
59
60 static int ocfs2_sync_local_to_main(struct ocfs2_super *osb,
61                                     handle_t *handle,
62                                     struct ocfs2_dinode *alloc,
63                                     struct inode *main_bm_inode,
64                                     struct buffer_head *main_bm_bh);
65
66 static int ocfs2_local_alloc_reserve_for_window(struct ocfs2_super *osb,
67                                                 struct ocfs2_alloc_context **ac,
68                                                 struct inode **bitmap_inode,
69                                                 struct buffer_head **bitmap_bh);
70
71 static int ocfs2_local_alloc_new_window(struct ocfs2_super *osb,
72                                         handle_t *handle,
73                                         struct ocfs2_alloc_context *ac);
74
75 static int ocfs2_local_alloc_slide_window(struct ocfs2_super *osb,
76                                           struct inode *local_alloc_inode);
77
78 static inline int ocfs2_la_state_enabled(struct ocfs2_super *osb)
79 {
80         return (osb->local_alloc_state == OCFS2_LA_THROTTLED ||
81                 osb->local_alloc_state == OCFS2_LA_ENABLED);
82 }
83
84 void ocfs2_local_alloc_seen_free_bits(struct ocfs2_super *osb,
85                                       unsigned int num_clusters)
86 {
87         spin_lock(&osb->osb_lock);
88         if (osb->local_alloc_state == OCFS2_LA_DISABLED ||
89             osb->local_alloc_state == OCFS2_LA_THROTTLED)
90                 if (num_clusters >= osb->local_alloc_default_bits) {
91                         cancel_delayed_work(&osb->la_enable_wq);
92                         osb->local_alloc_state = OCFS2_LA_ENABLED;
93                 }
94         spin_unlock(&osb->osb_lock);
95 }
96
97 void ocfs2_la_enable_worker(struct work_struct *work)
98 {
99         struct ocfs2_super *osb =
100                 container_of(work, struct ocfs2_super,
101                              la_enable_wq.work);
102         spin_lock(&osb->osb_lock);
103         osb->local_alloc_state = OCFS2_LA_ENABLED;
104         spin_unlock(&osb->osb_lock);
105 }
106
107 /*
108  * Tell us whether a given allocation should use the local alloc
109  * file. Otherwise, it has to go to the main bitmap.
110  *
111  * This function does semi-dirty reads of local alloc size and state!
112  * This is ok however, as the values are re-checked once under mutex.
113  */
114 int ocfs2_alloc_should_use_local(struct ocfs2_super *osb, u64 bits)
115 {
116         int ret = 0;
117         int la_bits;
118
119         spin_lock(&osb->osb_lock);
120         la_bits = osb->local_alloc_bits;
121
122         if (!ocfs2_la_state_enabled(osb))
123                 goto bail;
124
125         /* la_bits should be at least twice the size (in clusters) of
126          * a new block group. We want to be sure block group
127          * allocations go through the local alloc, so allow an
128          * allocation to take up to half the bitmap. */
129         if (bits > (la_bits / 2))
130                 goto bail;
131
132         ret = 1;
133 bail:
134         mlog(0, "state=%d, bits=%llu, la_bits=%d, ret=%d\n",
135              osb->local_alloc_state, (unsigned long long)bits, la_bits, ret);
136         spin_unlock(&osb->osb_lock);
137         return ret;
138 }
139
140 int ocfs2_load_local_alloc(struct ocfs2_super *osb)
141 {
142         int status = 0;
143         struct ocfs2_dinode *alloc = NULL;
144         struct buffer_head *alloc_bh = NULL;
145         u32 num_used;
146         struct inode *inode = NULL;
147         struct ocfs2_local_alloc *la;
148
149         mlog_entry_void();
150
151         if (osb->local_alloc_bits == 0)
152                 goto bail;
153
154         if (osb->local_alloc_bits >= osb->bitmap_cpg) {
155                 mlog(ML_NOTICE, "Requested local alloc window %d is larger "
156                      "than max possible %u. Using defaults.\n",
157                      osb->local_alloc_bits, (osb->bitmap_cpg - 1));
158                 osb->local_alloc_bits =
159                         ocfs2_megabytes_to_clusters(osb->sb,
160                                                     OCFS2_DEFAULT_LOCAL_ALLOC_SIZE);
161         }
162
163         /* read the alloc off disk */
164         inode = ocfs2_get_system_file_inode(osb, LOCAL_ALLOC_SYSTEM_INODE,
165                                             osb->slot_num);
166         if (!inode) {
167                 status = -EINVAL;
168                 mlog_errno(status);
169                 goto bail;
170         }
171
172         status = ocfs2_read_inode_block_full(inode, &alloc_bh,
173                                              OCFS2_BH_IGNORE_CACHE);
174         if (status < 0) {
175                 mlog_errno(status);
176                 goto bail;
177         }
178
179         alloc = (struct ocfs2_dinode *) alloc_bh->b_data;
180         la = OCFS2_LOCAL_ALLOC(alloc);
181
182         if (!(le32_to_cpu(alloc->i_flags) &
183             (OCFS2_LOCAL_ALLOC_FL|OCFS2_BITMAP_FL))) {
184                 mlog(ML_ERROR, "Invalid local alloc inode, %llu\n",
185                      (unsigned long long)OCFS2_I(inode)->ip_blkno);
186                 status = -EINVAL;
187                 goto bail;
188         }
189
190         if ((la->la_size == 0) ||
191             (le16_to_cpu(la->la_size) > ocfs2_local_alloc_size(inode->i_sb))) {
192                 mlog(ML_ERROR, "Local alloc size is invalid (la_size = %u)\n",
193                      le16_to_cpu(la->la_size));
194                 status = -EINVAL;
195                 goto bail;
196         }
197
198         /* do a little verification. */
199         num_used = ocfs2_local_alloc_count_bits(alloc);
200
201         /* hopefully the local alloc has always been recovered before
202          * we load it. */
203         if (num_used
204             || alloc->id1.bitmap1.i_used
205             || alloc->id1.bitmap1.i_total
206             || la->la_bm_off)
207                 mlog(ML_ERROR, "Local alloc hasn't been recovered!\n"
208                      "found = %u, set = %u, taken = %u, off = %u\n",
209                      num_used, le32_to_cpu(alloc->id1.bitmap1.i_used),
210                      le32_to_cpu(alloc->id1.bitmap1.i_total),
211                      OCFS2_LOCAL_ALLOC(alloc)->la_bm_off);
212
213         osb->local_alloc_bh = alloc_bh;
214         osb->local_alloc_state = OCFS2_LA_ENABLED;
215
216 bail:
217         if (status < 0)
218                 brelse(alloc_bh);
219         if (inode)
220                 iput(inode);
221
222         mlog(0, "Local alloc window bits = %d\n", osb->local_alloc_bits);
223
224         mlog_exit(status);
225         return status;
226 }
227
228 /*
229  * return any unused bits to the bitmap and write out a clean
230  * local_alloc.
231  *
232  * local_alloc_bh is optional. If not passed, we will simply use the
233  * one off osb. If you do pass it however, be warned that it *will* be
234  * returned brelse'd and NULL'd out.*/
235 void ocfs2_shutdown_local_alloc(struct ocfs2_super *osb)
236 {
237         int status;
238         handle_t *handle;
239         struct inode *local_alloc_inode = NULL;
240         struct buffer_head *bh = NULL;
241         struct buffer_head *main_bm_bh = NULL;
242         struct inode *main_bm_inode = NULL;
243         struct ocfs2_dinode *alloc_copy = NULL;
244         struct ocfs2_dinode *alloc = NULL;
245
246         mlog_entry_void();
247
248         cancel_delayed_work(&osb->la_enable_wq);
249         flush_workqueue(ocfs2_wq);
250
251         if (osb->local_alloc_state == OCFS2_LA_UNUSED)
252                 goto out;
253
254         local_alloc_inode =
255                 ocfs2_get_system_file_inode(osb,
256                                             LOCAL_ALLOC_SYSTEM_INODE,
257                                             osb->slot_num);
258         if (!local_alloc_inode) {
259                 status = -ENOENT;
260                 mlog_errno(status);
261                 goto out;
262         }
263
264         osb->local_alloc_state = OCFS2_LA_DISABLED;
265
266         ocfs2_resmap_uninit(&osb->osb_la_resmap);
267
268         main_bm_inode = ocfs2_get_system_file_inode(osb,
269                                                     GLOBAL_BITMAP_SYSTEM_INODE,
270                                                     OCFS2_INVALID_SLOT);
271         if (!main_bm_inode) {
272                 status = -EINVAL;
273                 mlog_errno(status);
274                 goto out;
275         }
276
277         mutex_lock(&main_bm_inode->i_mutex);
278
279         status = ocfs2_inode_lock(main_bm_inode, &main_bm_bh, 1);
280         if (status < 0) {
281                 mlog_errno(status);
282                 goto out_mutex;
283         }
284
285         /* WINDOW_MOVE_CREDITS is a bit heavy... */
286         handle = ocfs2_start_trans(osb, OCFS2_WINDOW_MOVE_CREDITS);
287         if (IS_ERR(handle)) {
288                 mlog_errno(PTR_ERR(handle));
289                 handle = NULL;
290                 goto out_unlock;
291         }
292
293         bh = osb->local_alloc_bh;
294         alloc = (struct ocfs2_dinode *) bh->b_data;
295
296         alloc_copy = kmalloc(bh->b_size, GFP_NOFS);
297         if (!alloc_copy) {
298                 status = -ENOMEM;
299                 goto out_commit;
300         }
301         memcpy(alloc_copy, alloc, bh->b_size);
302
303         status = ocfs2_journal_access_di(handle, INODE_CACHE(local_alloc_inode),
304                                          bh, OCFS2_JOURNAL_ACCESS_WRITE);
305         if (status < 0) {
306                 mlog_errno(status);
307                 goto out_commit;
308         }
309
310         ocfs2_clear_local_alloc(alloc);
311         ocfs2_journal_dirty(handle, bh);
312
313         brelse(bh);
314         osb->local_alloc_bh = NULL;
315         osb->local_alloc_state = OCFS2_LA_UNUSED;
316
317         status = ocfs2_sync_local_to_main(osb, handle, alloc_copy,
318                                           main_bm_inode, main_bm_bh);
319         if (status < 0)
320                 mlog_errno(status);
321
322 out_commit:
323         ocfs2_commit_trans(osb, handle);
324
325 out_unlock:
326         brelse(main_bm_bh);
327
328         ocfs2_inode_unlock(main_bm_inode, 1);
329
330 out_mutex:
331         mutex_unlock(&main_bm_inode->i_mutex);
332         iput(main_bm_inode);
333
334 out:
335         if (local_alloc_inode)
336                 iput(local_alloc_inode);
337
338         if (alloc_copy)
339                 kfree(alloc_copy);
340
341         mlog_exit_void();
342 }
343
344 /*
345  * We want to free the bitmap bits outside of any recovery context as
346  * we'll need a cluster lock to do so, but we must clear the local
347  * alloc before giving up the recovered nodes journal. To solve this,
348  * we kmalloc a copy of the local alloc before it's change for the
349  * caller to process with ocfs2_complete_local_alloc_recovery
350  */
351 int ocfs2_begin_local_alloc_recovery(struct ocfs2_super *osb,
352                                      int slot_num,
353                                      struct ocfs2_dinode **alloc_copy)
354 {
355         int status = 0;
356         struct buffer_head *alloc_bh = NULL;
357         struct inode *inode = NULL;
358         struct ocfs2_dinode *alloc;
359
360         mlog_entry("(slot_num = %d)\n", slot_num);
361
362         *alloc_copy = NULL;
363
364         inode = ocfs2_get_system_file_inode(osb,
365                                             LOCAL_ALLOC_SYSTEM_INODE,
366                                             slot_num);
367         if (!inode) {
368                 status = -EINVAL;
369                 mlog_errno(status);
370                 goto bail;
371         }
372
373         mutex_lock(&inode->i_mutex);
374
375         status = ocfs2_read_inode_block_full(inode, &alloc_bh,
376                                              OCFS2_BH_IGNORE_CACHE);
377         if (status < 0) {
378                 mlog_errno(status);
379                 goto bail;
380         }
381
382         *alloc_copy = kmalloc(alloc_bh->b_size, GFP_KERNEL);
383         if (!(*alloc_copy)) {
384                 status = -ENOMEM;
385                 goto bail;
386         }
387         memcpy((*alloc_copy), alloc_bh->b_data, alloc_bh->b_size);
388
389         alloc = (struct ocfs2_dinode *) alloc_bh->b_data;
390         ocfs2_clear_local_alloc(alloc);
391
392         ocfs2_compute_meta_ecc(osb->sb, alloc_bh->b_data, &alloc->i_check);
393         status = ocfs2_write_block(osb, alloc_bh, INODE_CACHE(inode));
394         if (status < 0)
395                 mlog_errno(status);
396
397 bail:
398         if ((status < 0) && (*alloc_copy)) {
399                 kfree(*alloc_copy);
400                 *alloc_copy = NULL;
401         }
402
403         brelse(alloc_bh);
404
405         if (inode) {
406                 mutex_unlock(&inode->i_mutex);
407                 iput(inode);
408         }
409
410         mlog_exit(status);
411         return status;
412 }
413
414 /*
415  * Step 2: By now, we've completed the journal recovery, we've stamped
416  * a clean local alloc on disk and dropped the node out of the
417  * recovery map. Dlm locks will no longer stall, so lets clear out the
418  * main bitmap.
419  */
420 int ocfs2_complete_local_alloc_recovery(struct ocfs2_super *osb,
421                                         struct ocfs2_dinode *alloc)
422 {
423         int status;
424         handle_t *handle;
425         struct buffer_head *main_bm_bh = NULL;
426         struct inode *main_bm_inode;
427
428         mlog_entry_void();
429
430         main_bm_inode = ocfs2_get_system_file_inode(osb,
431                                                     GLOBAL_BITMAP_SYSTEM_INODE,
432                                                     OCFS2_INVALID_SLOT);
433         if (!main_bm_inode) {
434                 status = -EINVAL;
435                 mlog_errno(status);
436                 goto out;
437         }
438
439         mutex_lock(&main_bm_inode->i_mutex);
440
441         status = ocfs2_inode_lock(main_bm_inode, &main_bm_bh, 1);
442         if (status < 0) {
443                 mlog_errno(status);
444                 goto out_mutex;
445         }
446
447         handle = ocfs2_start_trans(osb, OCFS2_WINDOW_MOVE_CREDITS);
448         if (IS_ERR(handle)) {
449                 status = PTR_ERR(handle);
450                 handle = NULL;
451                 mlog_errno(status);
452                 goto out_unlock;
453         }
454
455         /* we want the bitmap change to be recorded on disk asap */
456         handle->h_sync = 1;
457
458         status = ocfs2_sync_local_to_main(osb, handle, alloc,
459                                           main_bm_inode, main_bm_bh);
460         if (status < 0)
461                 mlog_errno(status);
462
463         ocfs2_commit_trans(osb, handle);
464
465 out_unlock:
466         ocfs2_inode_unlock(main_bm_inode, 1);
467
468 out_mutex:
469         mutex_unlock(&main_bm_inode->i_mutex);
470
471         brelse(main_bm_bh);
472
473         iput(main_bm_inode);
474
475 out:
476         if (!status)
477                 ocfs2_init_steal_slots(osb);
478         mlog_exit(status);
479         return status;
480 }
481
482 /*
483  * make sure we've got at least bits_wanted contiguous bits in the
484  * local alloc. You lose them when you drop i_mutex.
485  *
486  * We will add ourselves to the transaction passed in, but may start
487  * our own in order to shift windows.
488  */
489 int ocfs2_reserve_local_alloc_bits(struct ocfs2_super *osb,
490                                    u32 bits_wanted,
491                                    struct ocfs2_alloc_context *ac)
492 {
493         int status;
494         struct ocfs2_dinode *alloc;
495         struct inode *local_alloc_inode;
496         unsigned int free_bits;
497
498         mlog_entry_void();
499
500         BUG_ON(!ac);
501
502         local_alloc_inode =
503                 ocfs2_get_system_file_inode(osb,
504                                             LOCAL_ALLOC_SYSTEM_INODE,
505                                             osb->slot_num);
506         if (!local_alloc_inode) {
507                 status = -ENOENT;
508                 mlog_errno(status);
509                 goto bail;
510         }
511
512         mutex_lock(&local_alloc_inode->i_mutex);
513
514         /*
515          * We must double check state and allocator bits because
516          * another process may have changed them while holding i_mutex.
517          */
518         spin_lock(&osb->osb_lock);
519         if (!ocfs2_la_state_enabled(osb) ||
520             (bits_wanted > osb->local_alloc_bits)) {
521                 spin_unlock(&osb->osb_lock);
522                 status = -ENOSPC;
523                 goto bail;
524         }
525         spin_unlock(&osb->osb_lock);
526
527         alloc = (struct ocfs2_dinode *) osb->local_alloc_bh->b_data;
528
529 #ifdef CONFIG_OCFS2_DEBUG_FS
530         if (le32_to_cpu(alloc->id1.bitmap1.i_used) !=
531             ocfs2_local_alloc_count_bits(alloc)) {
532                 ocfs2_error(osb->sb, "local alloc inode %llu says it has "
533                             "%u free bits, but a count shows %u",
534                             (unsigned long long)le64_to_cpu(alloc->i_blkno),
535                             le32_to_cpu(alloc->id1.bitmap1.i_used),
536                             ocfs2_local_alloc_count_bits(alloc));
537                 status = -EIO;
538                 goto bail;
539         }
540 #endif
541
542         free_bits = le32_to_cpu(alloc->id1.bitmap1.i_total) -
543                 le32_to_cpu(alloc->id1.bitmap1.i_used);
544         if (bits_wanted > free_bits) {
545                 /* uhoh, window change time. */
546                 status =
547                         ocfs2_local_alloc_slide_window(osb, local_alloc_inode);
548                 if (status < 0) {
549                         if (status != -ENOSPC)
550                                 mlog_errno(status);
551                         goto bail;
552                 }
553
554                 /*
555                  * Under certain conditions, the window slide code
556                  * might have reduced the number of bits available or
557                  * disabled the the local alloc entirely. Re-check
558                  * here and return -ENOSPC if necessary.
559                  */
560                 status = -ENOSPC;
561                 if (!ocfs2_la_state_enabled(osb))
562                         goto bail;
563
564                 free_bits = le32_to_cpu(alloc->id1.bitmap1.i_total) -
565                         le32_to_cpu(alloc->id1.bitmap1.i_used);
566                 if (bits_wanted > free_bits)
567                         goto bail;
568         }
569
570         if (ac->ac_max_block)
571                 mlog(0, "Calling in_range for max block %llu\n",
572                      (unsigned long long)ac->ac_max_block);
573
574         ac->ac_inode = local_alloc_inode;
575         /* We should never use localalloc from another slot */
576         ac->ac_alloc_slot = osb->slot_num;
577         ac->ac_which = OCFS2_AC_USE_LOCAL;
578         get_bh(osb->local_alloc_bh);
579         ac->ac_bh = osb->local_alloc_bh;
580         status = 0;
581 bail:
582         if (status < 0 && local_alloc_inode) {
583                 mutex_unlock(&local_alloc_inode->i_mutex);
584                 iput(local_alloc_inode);
585         }
586
587         mlog(0, "bits=%d, slot=%d, ret=%d\n", bits_wanted, osb->slot_num,
588              status);
589
590         mlog_exit(status);
591         return status;
592 }
593
594 int ocfs2_claim_local_alloc_bits(struct ocfs2_super *osb,
595                                  handle_t *handle,
596                                  struct ocfs2_alloc_context *ac,
597                                  u32 bits_wanted,
598                                  u32 *bit_off,
599                                  u32 *num_bits)
600 {
601         int status, start;
602         struct inode *local_alloc_inode;
603         void *bitmap;
604         struct ocfs2_dinode *alloc;
605         struct ocfs2_local_alloc *la;
606
607         mlog_entry_void();
608         BUG_ON(ac->ac_which != OCFS2_AC_USE_LOCAL);
609
610         local_alloc_inode = ac->ac_inode;
611         alloc = (struct ocfs2_dinode *) osb->local_alloc_bh->b_data;
612         la = OCFS2_LOCAL_ALLOC(alloc);
613
614         start = ocfs2_local_alloc_find_clear_bits(osb, alloc, &bits_wanted,
615                                                   ac->ac_resv);
616         if (start == -1) {
617                 /* TODO: Shouldn't we just BUG here? */
618                 status = -ENOSPC;
619                 mlog_errno(status);
620                 goto bail;
621         }
622
623         bitmap = la->la_bitmap;
624         *bit_off = le32_to_cpu(la->la_bm_off) + start;
625         *num_bits = bits_wanted;
626
627         status = ocfs2_journal_access_di(handle,
628                                          INODE_CACHE(local_alloc_inode),
629                                          osb->local_alloc_bh,
630                                          OCFS2_JOURNAL_ACCESS_WRITE);
631         if (status < 0) {
632                 mlog_errno(status);
633                 goto bail;
634         }
635
636         ocfs2_resmap_claimed_bits(&osb->osb_la_resmap, ac->ac_resv, start,
637                                   bits_wanted);
638
639         while(bits_wanted--)
640                 ocfs2_set_bit(start++, bitmap);
641
642         le32_add_cpu(&alloc->id1.bitmap1.i_used, *num_bits);
643         ocfs2_journal_dirty(handle, osb->local_alloc_bh);
644
645 bail:
646         mlog_exit(status);
647         return status;
648 }
649
650 static u32 ocfs2_local_alloc_count_bits(struct ocfs2_dinode *alloc)
651 {
652         int i;
653         u8 *buffer;
654         u32 count = 0;
655         struct ocfs2_local_alloc *la = OCFS2_LOCAL_ALLOC(alloc);
656
657         mlog_entry_void();
658
659         buffer = la->la_bitmap;
660         for (i = 0; i < le16_to_cpu(la->la_size); i++)
661                 count += hweight8(buffer[i]);
662
663         mlog_exit(count);
664         return count;
665 }
666
667 static int ocfs2_local_alloc_find_clear_bits(struct ocfs2_super *osb,
668                                      struct ocfs2_dinode *alloc,
669                                      u32 *numbits,
670                                      struct ocfs2_alloc_reservation *resv)
671 {
672         int numfound, bitoff, left, startoff, lastzero;
673         int local_resv = 0;
674         struct ocfs2_alloc_reservation r;
675         void *bitmap = NULL;
676         struct ocfs2_reservation_map *resmap = &osb->osb_la_resmap;
677
678         mlog_entry("(numbits wanted = %u)\n", *numbits);
679
680         if (!alloc->id1.bitmap1.i_total) {
681                 mlog(0, "No bits in my window!\n");
682                 bitoff = -1;
683                 goto bail;
684         }
685
686         if (!resv) {
687                 local_resv = 1;
688                 ocfs2_resv_init_once(&r);
689                 ocfs2_resv_set_type(&r, OCFS2_RESV_FLAG_TMP);
690                 resv = &r;
691         }
692
693         numfound = *numbits;
694         if (ocfs2_resmap_resv_bits(resmap, resv, &bitoff, &numfound) == 0) {
695                 if (numfound < *numbits)
696                         *numbits = numfound;
697                 goto bail;
698         }
699
700         /*
701          * Code error. While reservations are enabled, local
702          * allocation should _always_ go through them.
703          */
704         BUG_ON(osb->osb_resv_level != 0);
705
706         /*
707          * Reservations are disabled. Handle this the old way.
708          */
709
710         bitmap = OCFS2_LOCAL_ALLOC(alloc)->la_bitmap;
711
712         numfound = bitoff = startoff = 0;
713         lastzero = -1;
714         left = le32_to_cpu(alloc->id1.bitmap1.i_total);
715         while ((bitoff = ocfs2_find_next_zero_bit(bitmap, left, startoff)) != -1) {
716                 if (bitoff == left) {
717                         /* mlog(0, "bitoff (%d) == left", bitoff); */
718                         break;
719                 }
720                 /* mlog(0, "Found a zero: bitoff = %d, startoff = %d, "
721                    "numfound = %d\n", bitoff, startoff, numfound);*/
722
723                 /* Ok, we found a zero bit... is it contig. or do we
724                  * start over?*/
725                 if (bitoff == startoff) {
726                         /* we found a zero */
727                         numfound++;
728                         startoff++;
729                 } else {
730                         /* got a zero after some ones */
731                         numfound = 1;
732                         startoff = bitoff+1;
733                 }
734                 /* we got everything we needed */
735                 if (numfound == *numbits) {
736                         /* mlog(0, "Found it all!\n"); */
737                         break;
738                 }
739         }
740
741         mlog(0, "Exiting loop, bitoff = %d, numfound = %d\n", bitoff,
742              numfound);
743
744         if (numfound == *numbits) {
745                 bitoff = startoff - numfound;
746                 *numbits = numfound;
747         } else {
748                 numfound = 0;
749                 bitoff = -1;
750         }
751
752 bail:
753         if (local_resv)
754                 ocfs2_resv_discard(resmap, resv);
755
756         mlog_exit(bitoff);
757         return bitoff;
758 }
759
760 static void ocfs2_clear_local_alloc(struct ocfs2_dinode *alloc)
761 {
762         struct ocfs2_local_alloc *la = OCFS2_LOCAL_ALLOC(alloc);
763         int i;
764         mlog_entry_void();
765
766         alloc->id1.bitmap1.i_total = 0;
767         alloc->id1.bitmap1.i_used = 0;
768         la->la_bm_off = 0;
769         for(i = 0; i < le16_to_cpu(la->la_size); i++)
770                 la->la_bitmap[i] = 0;
771
772         mlog_exit_void();
773 }
774
775 #if 0
776 /* turn this on and uncomment below to aid debugging window shifts. */
777 static void ocfs2_verify_zero_bits(unsigned long *bitmap,
778                                    unsigned int start,
779                                    unsigned int count)
780 {
781         unsigned int tmp = count;
782         while(tmp--) {
783                 if (ocfs2_test_bit(start + tmp, bitmap)) {
784                         printk("ocfs2_verify_zero_bits: start = %u, count = "
785                                "%u\n", start, count);
786                         printk("ocfs2_verify_zero_bits: bit %u is set!",
787                                start + tmp);
788                         BUG();
789                 }
790         }
791 }
792 #endif
793
794 /*
795  * sync the local alloc to main bitmap.
796  *
797  * assumes you've already locked the main bitmap -- the bitmap inode
798  * passed is used for caching.
799  */
800 static int ocfs2_sync_local_to_main(struct ocfs2_super *osb,
801                                     handle_t *handle,
802                                     struct ocfs2_dinode *alloc,
803                                     struct inode *main_bm_inode,
804                                     struct buffer_head *main_bm_bh)
805 {
806         int status = 0;
807         int bit_off, left, count, start;
808         u64 la_start_blk;
809         u64 blkno;
810         void *bitmap;
811         struct ocfs2_local_alloc *la = OCFS2_LOCAL_ALLOC(alloc);
812
813         mlog_entry("total = %u, used = %u\n",
814                    le32_to_cpu(alloc->id1.bitmap1.i_total),
815                    le32_to_cpu(alloc->id1.bitmap1.i_used));
816
817         if (!alloc->id1.bitmap1.i_total) {
818                 mlog(0, "nothing to sync!\n");
819                 goto bail;
820         }
821
822         if (le32_to_cpu(alloc->id1.bitmap1.i_used) ==
823             le32_to_cpu(alloc->id1.bitmap1.i_total)) {
824                 mlog(0, "all bits were taken!\n");
825                 goto bail;
826         }
827
828         la_start_blk = ocfs2_clusters_to_blocks(osb->sb,
829                                                 le32_to_cpu(la->la_bm_off));
830         bitmap = la->la_bitmap;
831         start = count = bit_off = 0;
832         left = le32_to_cpu(alloc->id1.bitmap1.i_total);
833
834         while ((bit_off = ocfs2_find_next_zero_bit(bitmap, left, start))
835                != -1) {
836                 if ((bit_off < left) && (bit_off == start)) {
837                         count++;
838                         start++;
839                         continue;
840                 }
841                 if (count) {
842                         blkno = la_start_blk +
843                                 ocfs2_clusters_to_blocks(osb->sb,
844                                                          start - count);
845
846                         mlog(0, "freeing %u bits starting at local alloc bit "
847                              "%u (la_start_blk = %llu, blkno = %llu)\n",
848                              count, start - count,
849                              (unsigned long long)la_start_blk,
850                              (unsigned long long)blkno);
851
852                         status = ocfs2_release_clusters(handle,
853                                                         main_bm_inode,
854                                                         main_bm_bh, blkno,
855                                                         count);
856                         if (status < 0) {
857                                 mlog_errno(status);
858                                 goto bail;
859                         }
860                 }
861                 if (bit_off >= left)
862                         break;
863                 count = 1;
864                 start = bit_off + 1;
865         }
866
867 bail:
868         mlog_exit(status);
869         return status;
870 }
871
872 enum ocfs2_la_event {
873         OCFS2_LA_EVENT_SLIDE,           /* Normal window slide. */
874         OCFS2_LA_EVENT_FRAGMENTED,      /* The global bitmap has
875                                          * enough bits theoretically
876                                          * free, but a contiguous
877                                          * allocation could not be
878                                          * found. */
879         OCFS2_LA_EVENT_ENOSPC,          /* Global bitmap doesn't have
880                                          * enough bits free to satisfy
881                                          * our request. */
882 };
883 #define OCFS2_LA_ENABLE_INTERVAL (30 * HZ)
884 /*
885  * Given an event, calculate the size of our next local alloc window.
886  *
887  * This should always be called under i_mutex of the local alloc inode
888  * so that local alloc disabling doesn't race with processes trying to
889  * use the allocator.
890  *
891  * Returns the state which the local alloc was left in. This value can
892  * be ignored by some paths.
893  */
894 static int ocfs2_recalc_la_window(struct ocfs2_super *osb,
895                                   enum ocfs2_la_event event)
896 {
897         unsigned int bits;
898         int state;
899
900         spin_lock(&osb->osb_lock);
901         if (osb->local_alloc_state == OCFS2_LA_DISABLED) {
902                 WARN_ON_ONCE(osb->local_alloc_state == OCFS2_LA_DISABLED);
903                 goto out_unlock;
904         }
905
906         /*
907          * ENOSPC and fragmentation are treated similarly for now.
908          */
909         if (event == OCFS2_LA_EVENT_ENOSPC ||
910             event == OCFS2_LA_EVENT_FRAGMENTED) {
911                 /*
912                  * We ran out of contiguous space in the primary
913                  * bitmap. Drastically reduce the number of bits used
914                  * by local alloc until we have to disable it.
915                  */
916                 bits = osb->local_alloc_bits >> 1;
917                 if (bits > ocfs2_megabytes_to_clusters(osb->sb, 1)) {
918                         /*
919                          * By setting state to THROTTLED, we'll keep
920                          * the number of local alloc bits used down
921                          * until an event occurs which would give us
922                          * reason to assume the bitmap situation might
923                          * have changed.
924                          */
925                         osb->local_alloc_state = OCFS2_LA_THROTTLED;
926                         osb->local_alloc_bits = bits;
927                 } else {
928                         osb->local_alloc_state = OCFS2_LA_DISABLED;
929                 }
930                 queue_delayed_work(ocfs2_wq, &osb->la_enable_wq,
931                                    OCFS2_LA_ENABLE_INTERVAL);
932                 goto out_unlock;
933         }
934
935         /*
936          * Don't increase the size of the local alloc window until we
937          * know we might be able to fulfill the request. Otherwise, we
938          * risk bouncing around the global bitmap during periods of
939          * low space.
940          */
941         if (osb->local_alloc_state != OCFS2_LA_THROTTLED)
942                 osb->local_alloc_bits = osb->local_alloc_default_bits;
943
944 out_unlock:
945         state = osb->local_alloc_state;
946         spin_unlock(&osb->osb_lock);
947
948         return state;
949 }
950
951 static int ocfs2_local_alloc_reserve_for_window(struct ocfs2_super *osb,
952                                                 struct ocfs2_alloc_context **ac,
953                                                 struct inode **bitmap_inode,
954                                                 struct buffer_head **bitmap_bh)
955 {
956         int status;
957
958         *ac = kzalloc(sizeof(struct ocfs2_alloc_context), GFP_KERNEL);
959         if (!(*ac)) {
960                 status = -ENOMEM;
961                 mlog_errno(status);
962                 goto bail;
963         }
964
965 retry_enospc:
966         (*ac)->ac_bits_wanted = osb->local_alloc_default_bits;
967         status = ocfs2_reserve_cluster_bitmap_bits(osb, *ac);
968         if (status == -ENOSPC) {
969                 if (ocfs2_recalc_la_window(osb, OCFS2_LA_EVENT_ENOSPC) ==
970                     OCFS2_LA_DISABLED)
971                         goto bail;
972
973                 ocfs2_free_ac_resource(*ac);
974                 memset(*ac, 0, sizeof(struct ocfs2_alloc_context));
975                 goto retry_enospc;
976         }
977         if (status < 0) {
978                 mlog_errno(status);
979                 goto bail;
980         }
981
982         *bitmap_inode = (*ac)->ac_inode;
983         igrab(*bitmap_inode);
984         *bitmap_bh = (*ac)->ac_bh;
985         get_bh(*bitmap_bh);
986         status = 0;
987 bail:
988         if ((status < 0) && *ac) {
989                 ocfs2_free_alloc_context(*ac);
990                 *ac = NULL;
991         }
992
993         mlog_exit(status);
994         return status;
995 }
996
997 /*
998  * pass it the bitmap lock in lock_bh if you have it.
999  */
1000 static int ocfs2_local_alloc_new_window(struct ocfs2_super *osb,
1001                                         handle_t *handle,
1002                                         struct ocfs2_alloc_context *ac)
1003 {
1004         int status = 0;
1005         u32 cluster_off, cluster_count;
1006         struct ocfs2_dinode *alloc = NULL;
1007         struct ocfs2_local_alloc *la;
1008
1009         mlog_entry_void();
1010
1011         alloc = (struct ocfs2_dinode *) osb->local_alloc_bh->b_data;
1012         la = OCFS2_LOCAL_ALLOC(alloc);
1013
1014         if (alloc->id1.bitmap1.i_total)
1015                 mlog(0, "asking me to alloc a new window over a non-empty "
1016                      "one\n");
1017
1018         mlog(0, "Allocating %u clusters for a new window.\n",
1019              osb->local_alloc_bits);
1020
1021         /* Instruct the allocation code to try the most recently used
1022          * cluster group. We'll re-record the group used this pass
1023          * below. */
1024         ac->ac_last_group = osb->la_last_gd;
1025
1026         /* we used the generic suballoc reserve function, but we set
1027          * everything up nicely, so there's no reason why we can't use
1028          * the more specific cluster api to claim bits. */
1029         status = ocfs2_claim_clusters(osb, handle, ac, osb->local_alloc_bits,
1030                                       &cluster_off, &cluster_count);
1031         if (status == -ENOSPC) {
1032 retry_enospc:
1033                 /*
1034                  * Note: We could also try syncing the journal here to
1035                  * allow use of any free bits which the current
1036                  * transaction can't give us access to. --Mark
1037                  */
1038                 if (ocfs2_recalc_la_window(osb, OCFS2_LA_EVENT_FRAGMENTED) ==
1039                     OCFS2_LA_DISABLED)
1040                         goto bail;
1041
1042                 ac->ac_bits_wanted = osb->local_alloc_default_bits;
1043                 status = ocfs2_claim_clusters(osb, handle, ac,
1044                                               osb->local_alloc_bits,
1045                                               &cluster_off,
1046                                               &cluster_count);
1047                 if (status == -ENOSPC)
1048                         goto retry_enospc;
1049                 /*
1050                  * We only shrunk the *minimum* number of in our
1051                  * request - it's entirely possible that the allocator
1052                  * might give us more than we asked for.
1053                  */
1054                 if (status == 0) {
1055                         spin_lock(&osb->osb_lock);
1056                         osb->local_alloc_bits = cluster_count;
1057                         spin_unlock(&osb->osb_lock);
1058                 }
1059         }
1060         if (status < 0) {
1061                 if (status != -ENOSPC)
1062                         mlog_errno(status);
1063                 goto bail;
1064         }
1065
1066         osb->la_last_gd = ac->ac_last_group;
1067
1068         la->la_bm_off = cpu_to_le32(cluster_off);
1069         alloc->id1.bitmap1.i_total = cpu_to_le32(cluster_count);
1070         /* just in case... In the future when we find space ourselves,
1071          * we don't have to get all contiguous -- but we'll have to
1072          * set all previously used bits in bitmap and update
1073          * la_bits_set before setting the bits in the main bitmap. */
1074         alloc->id1.bitmap1.i_used = 0;
1075         memset(OCFS2_LOCAL_ALLOC(alloc)->la_bitmap, 0,
1076                le16_to_cpu(la->la_size));
1077
1078         ocfs2_resmap_restart(&osb->osb_la_resmap, cluster_count,
1079                              OCFS2_LOCAL_ALLOC(alloc)->la_bitmap);
1080
1081         mlog(0, "New window allocated:\n");
1082         mlog(0, "window la_bm_off = %u\n",
1083              OCFS2_LOCAL_ALLOC(alloc)->la_bm_off);
1084         mlog(0, "window bits = %u\n", le32_to_cpu(alloc->id1.bitmap1.i_total));
1085
1086 bail:
1087         mlog_exit(status);
1088         return status;
1089 }
1090
1091 /* Note that we do *NOT* lock the local alloc inode here as
1092  * it's been locked already for us. */
1093 static int ocfs2_local_alloc_slide_window(struct ocfs2_super *osb,
1094                                           struct inode *local_alloc_inode)
1095 {
1096         int status = 0;
1097         struct buffer_head *main_bm_bh = NULL;
1098         struct inode *main_bm_inode = NULL;
1099         handle_t *handle = NULL;
1100         struct ocfs2_dinode *alloc;
1101         struct ocfs2_dinode *alloc_copy = NULL;
1102         struct ocfs2_alloc_context *ac = NULL;
1103
1104         mlog_entry_void();
1105
1106         ocfs2_recalc_la_window(osb, OCFS2_LA_EVENT_SLIDE);
1107
1108         /* This will lock the main bitmap for us. */
1109         status = ocfs2_local_alloc_reserve_for_window(osb,
1110                                                       &ac,
1111                                                       &main_bm_inode,
1112                                                       &main_bm_bh);
1113         if (status < 0) {
1114                 if (status != -ENOSPC)
1115                         mlog_errno(status);
1116                 goto bail;
1117         }
1118
1119         handle = ocfs2_start_trans(osb, OCFS2_WINDOW_MOVE_CREDITS);
1120         if (IS_ERR(handle)) {
1121                 status = PTR_ERR(handle);
1122                 handle = NULL;
1123                 mlog_errno(status);
1124                 goto bail;
1125         }
1126
1127         alloc = (struct ocfs2_dinode *) osb->local_alloc_bh->b_data;
1128
1129         /* We want to clear the local alloc before doing anything
1130          * else, so that if we error later during this operation,
1131          * local alloc shutdown won't try to double free main bitmap
1132          * bits. Make a copy so the sync function knows which bits to
1133          * free. */
1134         alloc_copy = kmalloc(osb->local_alloc_bh->b_size, GFP_NOFS);
1135         if (!alloc_copy) {
1136                 status = -ENOMEM;
1137                 mlog_errno(status);
1138                 goto bail;
1139         }
1140         memcpy(alloc_copy, alloc, osb->local_alloc_bh->b_size);
1141
1142         status = ocfs2_journal_access_di(handle,
1143                                          INODE_CACHE(local_alloc_inode),
1144                                          osb->local_alloc_bh,
1145                                          OCFS2_JOURNAL_ACCESS_WRITE);
1146         if (status < 0) {
1147                 mlog_errno(status);
1148                 goto bail;
1149         }
1150
1151         ocfs2_clear_local_alloc(alloc);
1152         ocfs2_journal_dirty(handle, osb->local_alloc_bh);
1153
1154         status = ocfs2_sync_local_to_main(osb, handle, alloc_copy,
1155                                           main_bm_inode, main_bm_bh);
1156         if (status < 0) {
1157                 mlog_errno(status);
1158                 goto bail;
1159         }
1160
1161         status = ocfs2_local_alloc_new_window(osb, handle, ac);
1162         if (status < 0) {
1163                 if (status != -ENOSPC)
1164                         mlog_errno(status);
1165                 goto bail;
1166         }
1167
1168         atomic_inc(&osb->alloc_stats.moves);
1169
1170 bail:
1171         if (handle)
1172                 ocfs2_commit_trans(osb, handle);
1173
1174         brelse(main_bm_bh);
1175
1176         if (main_bm_inode)
1177                 iput(main_bm_inode);
1178
1179         if (alloc_copy)
1180                 kfree(alloc_copy);
1181
1182         if (ac)
1183                 ocfs2_free_alloc_context(ac);
1184
1185         mlog_exit(status);
1186         return status;
1187 }
1188