NTFS: Fix two nasty runlist merging bugs that had gone unnoticed so far.
[pandora-kernel.git] / fs / ntfs / runlist.c
1 /**
2  * runlist.c - NTFS runlist handling code.  Part of the Linux-NTFS project.
3  *
4  * Copyright (c) 2001-2005 Anton Altaparmakov
5  * Copyright (c) 2002 Richard Russon
6  *
7  * This program/include file is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License as published
9  * by the Free Software Foundation; either version 2 of the License, or
10  * (at your option) any later version.
11  *
12  * This program/include file is distributed in the hope that it will be
13  * useful, but WITHOUT ANY WARRANTY; without even the implied warranty
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with this program (in the main directory of the Linux-NTFS
19  * distribution in the file COPYING); if not, write to the Free Software
20  * Foundation,Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
21  */
22
23 #include "debug.h"
24 #include "dir.h"
25 #include "endian.h"
26 #include "malloc.h"
27 #include "ntfs.h"
28
29 /**
30  * ntfs_rl_mm - runlist memmove
31  *
32  * It is up to the caller to serialize access to the runlist @base.
33  */
34 static inline void ntfs_rl_mm(runlist_element *base, int dst, int src,
35                 int size)
36 {
37         if (likely((dst != src) && (size > 0)))
38                 memmove(base + dst, base + src, size * sizeof(*base));
39 }
40
41 /**
42  * ntfs_rl_mc - runlist memory copy
43  *
44  * It is up to the caller to serialize access to the runlists @dstbase and
45  * @srcbase.
46  */
47 static inline void ntfs_rl_mc(runlist_element *dstbase, int dst,
48                 runlist_element *srcbase, int src, int size)
49 {
50         if (likely(size > 0))
51                 memcpy(dstbase + dst, srcbase + src, size * sizeof(*dstbase));
52 }
53
54 /**
55  * ntfs_rl_realloc - Reallocate memory for runlists
56  * @rl:         original runlist
57  * @old_size:   number of runlist elements in the original runlist @rl
58  * @new_size:   number of runlist elements we need space for
59  *
60  * As the runlists grow, more memory will be required.  To prevent the
61  * kernel having to allocate and reallocate large numbers of small bits of
62  * memory, this function returns an entire page of memory.
63  *
64  * It is up to the caller to serialize access to the runlist @rl.
65  *
66  * N.B.  If the new allocation doesn't require a different number of pages in
67  *       memory, the function will return the original pointer.
68  *
69  * On success, return a pointer to the newly allocated, or recycled, memory.
70  * On error, return -errno. The following error codes are defined:
71  *      -ENOMEM - Not enough memory to allocate runlist array.
72  *      -EINVAL - Invalid parameters were passed in.
73  */
74 static inline runlist_element *ntfs_rl_realloc(runlist_element *rl,
75                 int old_size, int new_size)
76 {
77         runlist_element *new_rl;
78
79         old_size = PAGE_ALIGN(old_size * sizeof(*rl));
80         new_size = PAGE_ALIGN(new_size * sizeof(*rl));
81         if (old_size == new_size)
82                 return rl;
83
84         new_rl = ntfs_malloc_nofs(new_size);
85         if (unlikely(!new_rl))
86                 return ERR_PTR(-ENOMEM);
87
88         if (likely(rl != NULL)) {
89                 if (unlikely(old_size > new_size))
90                         old_size = new_size;
91                 memcpy(new_rl, rl, old_size);
92                 ntfs_free(rl);
93         }
94         return new_rl;
95 }
96
97 /**
98  * ntfs_rl_realloc_nofail - Reallocate memory for runlists
99  * @rl:         original runlist
100  * @old_size:   number of runlist elements in the original runlist @rl
101  * @new_size:   number of runlist elements we need space for
102  *
103  * As the runlists grow, more memory will be required.  To prevent the
104  * kernel having to allocate and reallocate large numbers of small bits of
105  * memory, this function returns an entire page of memory.
106  *
107  * This function guarantees that the allocation will succeed.  It will sleep
108  * for as long as it takes to complete the allocation.
109  *
110  * It is up to the caller to serialize access to the runlist @rl.
111  *
112  * N.B.  If the new allocation doesn't require a different number of pages in
113  *       memory, the function will return the original pointer.
114  *
115  * On success, return a pointer to the newly allocated, or recycled, memory.
116  * On error, return -errno. The following error codes are defined:
117  *      -ENOMEM - Not enough memory to allocate runlist array.
118  *      -EINVAL - Invalid parameters were passed in.
119  */
120 static inline runlist_element *ntfs_rl_realloc_nofail(runlist_element *rl,
121                 int old_size, int new_size)
122 {
123         runlist_element *new_rl;
124
125         old_size = PAGE_ALIGN(old_size * sizeof(*rl));
126         new_size = PAGE_ALIGN(new_size * sizeof(*rl));
127         if (old_size == new_size)
128                 return rl;
129
130         new_rl = ntfs_malloc_nofs_nofail(new_size);
131         BUG_ON(!new_rl);
132
133         if (likely(rl != NULL)) {
134                 if (unlikely(old_size > new_size))
135                         old_size = new_size;
136                 memcpy(new_rl, rl, old_size);
137                 ntfs_free(rl);
138         }
139         return new_rl;
140 }
141
142 /**
143  * ntfs_are_rl_mergeable - test if two runlists can be joined together
144  * @dst:        original runlist
145  * @src:        new runlist to test for mergeability with @dst
146  *
147  * Test if two runlists can be joined together. For this, their VCNs and LCNs
148  * must be adjacent.
149  *
150  * It is up to the caller to serialize access to the runlists @dst and @src.
151  *
152  * Return: TRUE   Success, the runlists can be merged.
153  *         FALSE  Failure, the runlists cannot be merged.
154  */
155 static inline BOOL ntfs_are_rl_mergeable(runlist_element *dst,
156                 runlist_element *src)
157 {
158         BUG_ON(!dst);
159         BUG_ON(!src);
160
161         if ((dst->lcn < 0) || (src->lcn < 0)) {   /* Are we merging holes? */
162                 if (dst->lcn == LCN_HOLE && src->lcn == LCN_HOLE)
163                         return TRUE;
164                 return FALSE;
165         }
166         if ((dst->lcn + dst->length) != src->lcn) /* Are the runs contiguous? */
167                 return FALSE;
168         if ((dst->vcn + dst->length) != src->vcn) /* Are the runs misaligned? */
169                 return FALSE;
170
171         return TRUE;
172 }
173
174 /**
175  * __ntfs_rl_merge - merge two runlists without testing if they can be merged
176  * @dst:        original, destination runlist
177  * @src:        new runlist to merge with @dst
178  *
179  * Merge the two runlists, writing into the destination runlist @dst. The
180  * caller must make sure the runlists can be merged or this will corrupt the
181  * destination runlist.
182  *
183  * It is up to the caller to serialize access to the runlists @dst and @src.
184  */
185 static inline void __ntfs_rl_merge(runlist_element *dst, runlist_element *src)
186 {
187         dst->length += src->length;
188 }
189
190 /**
191  * ntfs_rl_append - append a runlist after a given element
192  * @dst:        original runlist to be worked on
193  * @dsize:      number of elements in @dst (including end marker)
194  * @src:        runlist to be inserted into @dst
195  * @ssize:      number of elements in @src (excluding end marker)
196  * @loc:        append the new runlist @src after this element in @dst
197  *
198  * Append the runlist @src after element @loc in @dst.  Merge the right end of
199  * the new runlist, if necessary. Adjust the size of the hole before the
200  * appended runlist.
201  *
202  * It is up to the caller to serialize access to the runlists @dst and @src.
203  *
204  * On success, return a pointer to the new, combined, runlist. Note, both
205  * runlists @dst and @src are deallocated before returning so you cannot use
206  * the pointers for anything any more. (Strictly speaking the returned runlist
207  * may be the same as @dst but this is irrelevant.)
208  *
209  * On error, return -errno. Both runlists are left unmodified. The following
210  * error codes are defined:
211  *      -ENOMEM - Not enough memory to allocate runlist array.
212  *      -EINVAL - Invalid parameters were passed in.
213  */
214 static inline runlist_element *ntfs_rl_append(runlist_element *dst,
215                 int dsize, runlist_element *src, int ssize, int loc)
216 {
217         BOOL right;
218         int magic;
219
220         BUG_ON(!dst);
221         BUG_ON(!src);
222
223         /* First, check if the right hand end needs merging. */
224         right = ntfs_are_rl_mergeable(src + ssize - 1, dst + loc + 1);
225
226         /* Space required: @dst size + @src size, less one if we merged. */
227         dst = ntfs_rl_realloc(dst, dsize, dsize + ssize - right);
228         if (IS_ERR(dst))
229                 return dst;
230         /*
231          * We are guaranteed to succeed from here so can start modifying the
232          * original runlists.
233          */
234
235         /* First, merge the right hand end, if necessary. */
236         if (right)
237                 __ntfs_rl_merge(src + ssize - 1, dst + loc + 1);
238
239         magic = loc + ssize;
240
241         /* Move the tail of @dst out of the way, then copy in @src. */
242         ntfs_rl_mm(dst, magic + 1, loc + 1 + right, dsize - loc - 1 - right);
243         ntfs_rl_mc(dst, loc + 1, src, 0, ssize);
244
245         /* Adjust the size of the preceding hole. */
246         dst[loc].length = dst[loc + 1].vcn - dst[loc].vcn;
247
248         /* We may have changed the length of the file, so fix the end marker */
249         if (dst[magic + 1].lcn == LCN_ENOENT)
250                 dst[magic + 1].vcn = dst[magic].vcn + dst[magic].length;
251
252         return dst;
253 }
254
255 /**
256  * ntfs_rl_insert - insert a runlist into another
257  * @dst:        original runlist to be worked on
258  * @dsize:      number of elements in @dst (including end marker)
259  * @src:        new runlist to be inserted
260  * @ssize:      number of elements in @src (excluding end marker)
261  * @loc:        insert the new runlist @src before this element in @dst
262  *
263  * Insert the runlist @src before element @loc in the runlist @dst. Merge the
264  * left end of the new runlist, if necessary. Adjust the size of the hole
265  * after the inserted runlist.
266  *
267  * It is up to the caller to serialize access to the runlists @dst and @src.
268  *
269  * On success, return a pointer to the new, combined, runlist. Note, both
270  * runlists @dst and @src are deallocated before returning so you cannot use
271  * the pointers for anything any more. (Strictly speaking the returned runlist
272  * may be the same as @dst but this is irrelevant.)
273  *
274  * On error, return -errno. Both runlists are left unmodified. The following
275  * error codes are defined:
276  *      -ENOMEM - Not enough memory to allocate runlist array.
277  *      -EINVAL - Invalid parameters were passed in.
278  */
279 static inline runlist_element *ntfs_rl_insert(runlist_element *dst,
280                 int dsize, runlist_element *src, int ssize, int loc)
281 {
282         BOOL left = FALSE;
283         BOOL disc = FALSE;      /* Discontinuity */
284         BOOL hole = FALSE;      /* Following a hole */
285         int magic;
286
287         BUG_ON(!dst);
288         BUG_ON(!src);
289
290         /* disc => Discontinuity between the end of @dst and the start of @src.
291          *         This means we might need to insert a hole.
292          * hole => @dst ends with a hole or an unmapped region which we can
293          *         extend to match the discontinuity. */
294         if (loc == 0)
295                 disc = (src[0].vcn > 0);
296         else {
297                 s64 merged_length;
298
299                 left = ntfs_are_rl_mergeable(dst + loc - 1, src);
300
301                 merged_length = dst[loc - 1].length;
302                 if (left)
303                         merged_length += src->length;
304
305                 disc = (src[0].vcn > dst[loc - 1].vcn + merged_length);
306                 if (disc)
307                         hole = (dst[loc - 1].lcn == LCN_HOLE);
308         }
309
310         /* Space required: @dst size + @src size, less one if we merged, plus
311          * one if there was a discontinuity, less one for a trailing hole. */
312         dst = ntfs_rl_realloc(dst, dsize, dsize + ssize - left + disc - hole);
313         if (IS_ERR(dst))
314                 return dst;
315         /*
316          * We are guaranteed to succeed from here so can start modifying the
317          * original runlist.
318          */
319
320         if (left)
321                 __ntfs_rl_merge(dst + loc - 1, src);
322
323         magic = loc + ssize - left + disc - hole;
324
325         /* Move the tail of @dst out of the way, then copy in @src. */
326         ntfs_rl_mm(dst, magic, loc, dsize - loc);
327         ntfs_rl_mc(dst, loc + disc - hole, src, left, ssize - left);
328
329         /* Adjust the VCN of the last run ... */
330         if (dst[magic].lcn <= LCN_HOLE)
331                 dst[magic].vcn = dst[magic - 1].vcn + dst[magic - 1].length;
332         /* ... and the length. */
333         if (dst[magic].lcn == LCN_HOLE || dst[magic].lcn == LCN_RL_NOT_MAPPED)
334                 dst[magic].length = dst[magic + 1].vcn - dst[magic].vcn;
335
336         /* Writing beyond the end of the file and there's a discontinuity. */
337         if (disc) {
338                 if (hole)
339                         dst[loc - 1].length = dst[loc].vcn - dst[loc - 1].vcn;
340                 else {
341                         if (loc > 0) {
342                                 dst[loc].vcn = dst[loc - 1].vcn +
343                                                 dst[loc - 1].length;
344                                 dst[loc].length = dst[loc + 1].vcn -
345                                                 dst[loc].vcn;
346                         } else {
347                                 dst[loc].vcn = 0;
348                                 dst[loc].length = dst[loc + 1].vcn;
349                         }
350                         dst[loc].lcn = LCN_RL_NOT_MAPPED;
351                 }
352
353                 magic += hole;
354
355                 if (dst[magic].lcn == LCN_ENOENT)
356                         dst[magic].vcn = dst[magic - 1].vcn +
357                                         dst[magic - 1].length;
358         }
359         return dst;
360 }
361
362 /**
363  * ntfs_rl_replace - overwrite a runlist element with another runlist
364  * @dst:        original runlist to be worked on
365  * @dsize:      number of elements in @dst (including end marker)
366  * @src:        new runlist to be inserted
367  * @ssize:      number of elements in @src (excluding end marker)
368  * @loc:        index in runlist @dst to overwrite with @src
369  *
370  * Replace the runlist element @dst at @loc with @src. Merge the left and
371  * right ends of the inserted runlist, if necessary.
372  *
373  * It is up to the caller to serialize access to the runlists @dst and @src.
374  *
375  * On success, return a pointer to the new, combined, runlist. Note, both
376  * runlists @dst and @src are deallocated before returning so you cannot use
377  * the pointers for anything any more. (Strictly speaking the returned runlist
378  * may be the same as @dst but this is irrelevant.)
379  *
380  * On error, return -errno. Both runlists are left unmodified. The following
381  * error codes are defined:
382  *      -ENOMEM - Not enough memory to allocate runlist array.
383  *      -EINVAL - Invalid parameters were passed in.
384  */
385 static inline runlist_element *ntfs_rl_replace(runlist_element *dst,
386                 int dsize, runlist_element *src, int ssize, int loc)
387 {
388         BOOL left = FALSE;
389         BOOL right;
390         int magic;
391
392         BUG_ON(!dst);
393         BUG_ON(!src);
394
395         /* First, merge the left and right ends, if necessary. */
396         right = ntfs_are_rl_mergeable(src + ssize - 1, dst + loc + 1);
397         if (loc > 0)
398                 left = ntfs_are_rl_mergeable(dst + loc - 1, src);
399
400         /* Allocate some space. We'll need less if the left, right, or both
401          * ends were merged. */
402         dst = ntfs_rl_realloc(dst, dsize, dsize + ssize - left - right);
403         if (IS_ERR(dst))
404                 return dst;
405         /*
406          * We are guaranteed to succeed from here so can start modifying the
407          * original runlists.
408          */
409         if (right)
410                 __ntfs_rl_merge(src + ssize - 1, dst + loc + 1);
411         if (left)
412                 __ntfs_rl_merge(dst + loc - 1, src);
413
414         /* FIXME: What does this mean? (AIA) */
415         magic = loc + ssize - left;
416
417         /* Move the tail of @dst out of the way, then copy in @src. */
418         ntfs_rl_mm(dst, magic, loc + right + 1, dsize - loc - right - 1);
419         ntfs_rl_mc(dst, loc, src, left, ssize - left);
420
421         /* We may have changed the length of the file, so fix the end marker */
422         if (dst[magic].lcn == LCN_ENOENT)
423                 dst[magic].vcn = dst[magic - 1].vcn + dst[magic - 1].length;
424         return dst;
425 }
426
427 /**
428  * ntfs_rl_split - insert a runlist into the centre of a hole
429  * @dst:        original runlist to be worked on
430  * @dsize:      number of elements in @dst (including end marker)
431  * @src:        new runlist to be inserted
432  * @ssize:      number of elements in @src (excluding end marker)
433  * @loc:        index in runlist @dst at which to split and insert @src
434  *
435  * Split the runlist @dst at @loc into two and insert @new in between the two
436  * fragments. No merging of runlists is necessary. Adjust the size of the
437  * holes either side.
438  *
439  * It is up to the caller to serialize access to the runlists @dst and @src.
440  *
441  * On success, return a pointer to the new, combined, runlist. Note, both
442  * runlists @dst and @src are deallocated before returning so you cannot use
443  * the pointers for anything any more. (Strictly speaking the returned runlist
444  * may be the same as @dst but this is irrelevant.)
445  *
446  * On error, return -errno. Both runlists are left unmodified. The following
447  * error codes are defined:
448  *      -ENOMEM - Not enough memory to allocate runlist array.
449  *      -EINVAL - Invalid parameters were passed in.
450  */
451 static inline runlist_element *ntfs_rl_split(runlist_element *dst, int dsize,
452                 runlist_element *src, int ssize, int loc)
453 {
454         BUG_ON(!dst);
455         BUG_ON(!src);
456
457         /* Space required: @dst size + @src size + one new hole. */
458         dst = ntfs_rl_realloc(dst, dsize, dsize + ssize + 1);
459         if (IS_ERR(dst))
460                 return dst;
461         /*
462          * We are guaranteed to succeed from here so can start modifying the
463          * original runlists.
464          */
465
466         /* Move the tail of @dst out of the way, then copy in @src. */
467         ntfs_rl_mm(dst, loc + 1 + ssize, loc, dsize - loc);
468         ntfs_rl_mc(dst, loc + 1, src, 0, ssize);
469
470         /* Adjust the size of the holes either size of @src. */
471         dst[loc].length         = dst[loc+1].vcn       - dst[loc].vcn;
472         dst[loc+ssize+1].vcn    = dst[loc+ssize].vcn   + dst[loc+ssize].length;
473         dst[loc+ssize+1].length = dst[loc+ssize+2].vcn - dst[loc+ssize+1].vcn;
474
475         return dst;
476 }
477
478 /**
479  * ntfs_runlists_merge - merge two runlists into one
480  * @drl:        original runlist to be worked on
481  * @srl:        new runlist to be merged into @drl
482  *
483  * First we sanity check the two runlists @srl and @drl to make sure that they
484  * are sensible and can be merged. The runlist @srl must be either after the
485  * runlist @drl or completely within a hole (or unmapped region) in @drl.
486  *
487  * It is up to the caller to serialize access to the runlists @drl and @srl.
488  *
489  * Merging of runlists is necessary in two cases:
490  *   1. When attribute lists are used and a further extent is being mapped.
491  *   2. When new clusters are allocated to fill a hole or extend a file.
492  *
493  * There are four possible ways @srl can be merged. It can:
494  *      - be inserted at the beginning of a hole,
495  *      - split the hole in two and be inserted between the two fragments,
496  *      - be appended at the end of a hole, or it can
497  *      - replace the whole hole.
498  * It can also be appended to the end of the runlist, which is just a variant
499  * of the insert case.
500  *
501  * On success, return a pointer to the new, combined, runlist. Note, both
502  * runlists @drl and @srl are deallocated before returning so you cannot use
503  * the pointers for anything any more. (Strictly speaking the returned runlist
504  * may be the same as @dst but this is irrelevant.)
505  *
506  * On error, return -errno. Both runlists are left unmodified. The following
507  * error codes are defined:
508  *      -ENOMEM - Not enough memory to allocate runlist array.
509  *      -EINVAL - Invalid parameters were passed in.
510  *      -ERANGE - The runlists overlap and cannot be merged.
511  */
512 runlist_element *ntfs_runlists_merge(runlist_element *drl,
513                 runlist_element *srl)
514 {
515         int di, si;             /* Current index into @[ds]rl. */
516         int sstart;             /* First index with lcn > LCN_RL_NOT_MAPPED. */
517         int dins;               /* Index into @drl at which to insert @srl. */
518         int dend, send;         /* Last index into @[ds]rl. */
519         int dfinal, sfinal;     /* The last index into @[ds]rl with
520                                    lcn >= LCN_HOLE. */
521         int marker = 0;
522         VCN marker_vcn = 0;
523
524 #ifdef DEBUG
525         ntfs_debug("dst:");
526         ntfs_debug_dump_runlist(drl);
527         ntfs_debug("src:");
528         ntfs_debug_dump_runlist(srl);
529 #endif
530
531         /* Check for silly calling... */
532         if (unlikely(!srl))
533                 return drl;
534         if (IS_ERR(srl) || IS_ERR(drl))
535                 return ERR_PTR(-EINVAL);
536
537         /* Check for the case where the first mapping is being done now. */
538         if (unlikely(!drl)) {
539                 drl = srl;
540                 /* Complete the source runlist if necessary. */
541                 if (unlikely(drl[0].vcn)) {
542                         /* Scan to the end of the source runlist. */
543                         for (dend = 0; likely(drl[dend].length); dend++)
544                                 ;
545                         dend++;
546                         drl = ntfs_rl_realloc(drl, dend, dend + 1);
547                         if (IS_ERR(drl))
548                                 return drl;
549                         /* Insert start element at the front of the runlist. */
550                         ntfs_rl_mm(drl, 1, 0, dend);
551                         drl[0].vcn = 0;
552                         drl[0].lcn = LCN_RL_NOT_MAPPED;
553                         drl[0].length = drl[1].vcn;
554                 }
555                 goto finished;
556         }
557
558         si = di = 0;
559
560         /* Skip any unmapped start element(s) in the source runlist. */
561         while (srl[si].length && srl[si].lcn < LCN_HOLE)
562                 si++;
563
564         /* Can't have an entirely unmapped source runlist. */
565         BUG_ON(!srl[si].length);
566
567         /* Record the starting points. */
568         sstart = si;
569
570         /*
571          * Skip forward in @drl until we reach the position where @srl needs to
572          * be inserted. If we reach the end of @drl, @srl just needs to be
573          * appended to @drl.
574          */
575         for (; drl[di].length; di++) {
576                 if (drl[di].vcn + drl[di].length > srl[sstart].vcn)
577                         break;
578         }
579         dins = di;
580
581         /* Sanity check for illegal overlaps. */
582         if ((drl[di].vcn == srl[si].vcn) && (drl[di].lcn >= 0) &&
583                         (srl[si].lcn >= 0)) {
584                 ntfs_error(NULL, "Run lists overlap. Cannot merge!");
585                 return ERR_PTR(-ERANGE);
586         }
587
588         /* Scan to the end of both runlists in order to know their sizes. */
589         for (send = si; srl[send].length; send++)
590                 ;
591         for (dend = di; drl[dend].length; dend++)
592                 ;
593
594         if (srl[send].lcn == LCN_ENOENT)
595                 marker_vcn = srl[marker = send].vcn;
596
597         /* Scan to the last element with lcn >= LCN_HOLE. */
598         for (sfinal = send; sfinal >= 0 && srl[sfinal].lcn < LCN_HOLE; sfinal--)
599                 ;
600         for (dfinal = dend; dfinal >= 0 && drl[dfinal].lcn < LCN_HOLE; dfinal--)
601                 ;
602
603         {
604         BOOL start;
605         BOOL finish;
606         int ds = dend + 1;              /* Number of elements in drl & srl */
607         int ss = sfinal - sstart + 1;
608
609         start  = ((drl[dins].lcn <  LCN_RL_NOT_MAPPED) ||    /* End of file   */
610                   (drl[dins].vcn == srl[sstart].vcn));       /* Start of hole */
611         finish = ((drl[dins].lcn >= LCN_RL_NOT_MAPPED) &&    /* End of file   */
612                  ((drl[dins].vcn + drl[dins].length) <=      /* End of hole   */
613                   (srl[send - 1].vcn + srl[send - 1].length)));
614
615         /* Or we will lose an end marker. */
616         if (finish && !drl[dins].length)
617                 ss++;
618         if (marker && (drl[dins].vcn + drl[dins].length > srl[send - 1].vcn))
619                 finish = FALSE;
620 #if 0
621         ntfs_debug("dfinal = %i, dend = %i", dfinal, dend);
622         ntfs_debug("sstart = %i, sfinal = %i, send = %i", sstart, sfinal, send);
623         ntfs_debug("start = %i, finish = %i", start, finish);
624         ntfs_debug("ds = %i, ss = %i, dins = %i", ds, ss, dins);
625 #endif
626         if (start) {
627                 if (finish)
628                         drl = ntfs_rl_replace(drl, ds, srl + sstart, ss, dins);
629                 else
630                         drl = ntfs_rl_insert(drl, ds, srl + sstart, ss, dins);
631         } else {
632                 if (finish)
633                         drl = ntfs_rl_append(drl, ds, srl + sstart, ss, dins);
634                 else
635                         drl = ntfs_rl_split(drl, ds, srl + sstart, ss, dins);
636         }
637         if (IS_ERR(drl)) {
638                 ntfs_error(NULL, "Merge failed.");
639                 return drl;
640         }
641         ntfs_free(srl);
642         if (marker) {
643                 ntfs_debug("Triggering marker code.");
644                 for (ds = dend; drl[ds].length; ds++)
645                         ;
646                 /* We only need to care if @srl ended after @drl. */
647                 if (drl[ds].vcn <= marker_vcn) {
648                         int slots = 0;
649
650                         if (drl[ds].vcn == marker_vcn) {
651                                 ntfs_debug("Old marker = 0x%llx, replacing "
652                                                 "with LCN_ENOENT.",
653                                                 (unsigned long long)
654                                                 drl[ds].lcn);
655                                 drl[ds].lcn = LCN_ENOENT;
656                                 goto finished;
657                         }
658                         /*
659                          * We need to create an unmapped runlist element in
660                          * @drl or extend an existing one before adding the
661                          * ENOENT terminator.
662                          */
663                         if (drl[ds].lcn == LCN_ENOENT) {
664                                 ds--;
665                                 slots = 1;
666                         }
667                         if (drl[ds].lcn != LCN_RL_NOT_MAPPED) {
668                                 /* Add an unmapped runlist element. */
669                                 if (!slots) {
670                                         drl = ntfs_rl_realloc_nofail(drl, ds,
671                                                         ds + 2);
672                                         slots = 2;
673                                 }
674                                 ds++;
675                                 /* Need to set vcn if it isn't set already. */
676                                 if (slots != 1)
677                                         drl[ds].vcn = drl[ds - 1].vcn +
678                                                         drl[ds - 1].length;
679                                 drl[ds].lcn = LCN_RL_NOT_MAPPED;
680                                 /* We now used up a slot. */
681                                 slots--;
682                         }
683                         drl[ds].length = marker_vcn - drl[ds].vcn;
684                         /* Finally add the ENOENT terminator. */
685                         ds++;
686                         if (!slots)
687                                 drl = ntfs_rl_realloc_nofail(drl, ds, ds + 1);
688                         drl[ds].vcn = marker_vcn;
689                         drl[ds].lcn = LCN_ENOENT;
690                         drl[ds].length = (s64)0;
691                 }
692         }
693         }
694
695 finished:
696         /* The merge was completed successfully. */
697         ntfs_debug("Merged runlist:");
698         ntfs_debug_dump_runlist(drl);
699         return drl;
700 }
701
702 /**
703  * ntfs_mapping_pairs_decompress - convert mapping pairs array to runlist
704  * @vol:        ntfs volume on which the attribute resides
705  * @attr:       attribute record whose mapping pairs array to decompress
706  * @old_rl:     optional runlist in which to insert @attr's runlist
707  *
708  * It is up to the caller to serialize access to the runlist @old_rl.
709  *
710  * Decompress the attribute @attr's mapping pairs array into a runlist. On
711  * success, return the decompressed runlist.
712  *
713  * If @old_rl is not NULL, decompressed runlist is inserted into the
714  * appropriate place in @old_rl and the resultant, combined runlist is
715  * returned. The original @old_rl is deallocated.
716  *
717  * On error, return -errno. @old_rl is left unmodified in that case.
718  *
719  * The following error codes are defined:
720  *      -ENOMEM - Not enough memory to allocate runlist array.
721  *      -EIO    - Corrupt runlist.
722  *      -EINVAL - Invalid parameters were passed in.
723  *      -ERANGE - The two runlists overlap.
724  *
725  * FIXME: For now we take the conceptionally simplest approach of creating the
726  * new runlist disregarding the already existing one and then splicing the
727  * two into one, if that is possible (we check for overlap and discard the new
728  * runlist if overlap present before returning ERR_PTR(-ERANGE)).
729  */
730 runlist_element *ntfs_mapping_pairs_decompress(const ntfs_volume *vol,
731                 const ATTR_RECORD *attr, runlist_element *old_rl)
732 {
733         VCN vcn;                /* Current vcn. */
734         LCN lcn;                /* Current lcn. */
735         s64 deltaxcn;           /* Change in [vl]cn. */
736         runlist_element *rl;    /* The output runlist. */
737         u8 *buf;                /* Current position in mapping pairs array. */
738         u8 *attr_end;           /* End of attribute. */
739         int rlsize;             /* Size of runlist buffer. */
740         u16 rlpos;              /* Current runlist position in units of
741                                    runlist_elements. */
742         u8 b;                   /* Current byte offset in buf. */
743
744 #ifdef DEBUG
745         /* Make sure attr exists and is non-resident. */
746         if (!attr || !attr->non_resident || sle64_to_cpu(
747                         attr->data.non_resident.lowest_vcn) < (VCN)0) {
748                 ntfs_error(vol->sb, "Invalid arguments.");
749                 return ERR_PTR(-EINVAL);
750         }
751 #endif
752         /* Start at vcn = lowest_vcn and lcn 0. */
753         vcn = sle64_to_cpu(attr->data.non_resident.lowest_vcn);
754         lcn = 0;
755         /* Get start of the mapping pairs array. */
756         buf = (u8*)attr + le16_to_cpu(
757                         attr->data.non_resident.mapping_pairs_offset);
758         attr_end = (u8*)attr + le32_to_cpu(attr->length);
759         if (unlikely(buf < (u8*)attr || buf > attr_end)) {
760                 ntfs_error(vol->sb, "Corrupt attribute.");
761                 return ERR_PTR(-EIO);
762         }
763         /* Current position in runlist array. */
764         rlpos = 0;
765         /* Allocate first page and set current runlist size to one page. */
766         rl = ntfs_malloc_nofs(rlsize = PAGE_SIZE);
767         if (unlikely(!rl))
768                 return ERR_PTR(-ENOMEM);
769         /* Insert unmapped starting element if necessary. */
770         if (vcn) {
771                 rl->vcn = 0;
772                 rl->lcn = LCN_RL_NOT_MAPPED;
773                 rl->length = vcn;
774                 rlpos++;
775         }
776         while (buf < attr_end && *buf) {
777                 /*
778                  * Allocate more memory if needed, including space for the
779                  * not-mapped and terminator elements. ntfs_malloc_nofs()
780                  * operates on whole pages only.
781                  */
782                 if (((rlpos + 3) * sizeof(*old_rl)) > rlsize) {
783                         runlist_element *rl2;
784
785                         rl2 = ntfs_malloc_nofs(rlsize + (int)PAGE_SIZE);
786                         if (unlikely(!rl2)) {
787                                 ntfs_free(rl);
788                                 return ERR_PTR(-ENOMEM);
789                         }
790                         memcpy(rl2, rl, rlsize);
791                         ntfs_free(rl);
792                         rl = rl2;
793                         rlsize += PAGE_SIZE;
794                 }
795                 /* Enter the current vcn into the current runlist element. */
796                 rl[rlpos].vcn = vcn;
797                 /*
798                  * Get the change in vcn, i.e. the run length in clusters.
799                  * Doing it this way ensures that we signextend negative values.
800                  * A negative run length doesn't make any sense, but hey, I
801                  * didn't make up the NTFS specs and Windows NT4 treats the run
802                  * length as a signed value so that's how it is...
803                  */
804                 b = *buf & 0xf;
805                 if (b) {
806                         if (unlikely(buf + b > attr_end))
807                                 goto io_error;
808                         for (deltaxcn = (s8)buf[b--]; b; b--)
809                                 deltaxcn = (deltaxcn << 8) + buf[b];
810                 } else { /* The length entry is compulsory. */
811                         ntfs_error(vol->sb, "Missing length entry in mapping "
812                                         "pairs array.");
813                         deltaxcn = (s64)-1;
814                 }
815                 /*
816                  * Assume a negative length to indicate data corruption and
817                  * hence clean-up and return NULL.
818                  */
819                 if (unlikely(deltaxcn < 0)) {
820                         ntfs_error(vol->sb, "Invalid length in mapping pairs "
821                                         "array.");
822                         goto err_out;
823                 }
824                 /*
825                  * Enter the current run length into the current runlist
826                  * element.
827                  */
828                 rl[rlpos].length = deltaxcn;
829                 /* Increment the current vcn by the current run length. */
830                 vcn += deltaxcn;
831                 /*
832                  * There might be no lcn change at all, as is the case for
833                  * sparse clusters on NTFS 3.0+, in which case we set the lcn
834                  * to LCN_HOLE.
835                  */
836                 if (!(*buf & 0xf0))
837                         rl[rlpos].lcn = LCN_HOLE;
838                 else {
839                         /* Get the lcn change which really can be negative. */
840                         u8 b2 = *buf & 0xf;
841                         b = b2 + ((*buf >> 4) & 0xf);
842                         if (buf + b > attr_end)
843                                 goto io_error;
844                         for (deltaxcn = (s8)buf[b--]; b > b2; b--)
845                                 deltaxcn = (deltaxcn << 8) + buf[b];
846                         /* Change the current lcn to its new value. */
847                         lcn += deltaxcn;
848 #ifdef DEBUG
849                         /*
850                          * On NTFS 1.2-, apparently can have lcn == -1 to
851                          * indicate a hole. But we haven't verified ourselves
852                          * whether it is really the lcn or the deltaxcn that is
853                          * -1. So if either is found give us a message so we
854                          * can investigate it further!
855                          */
856                         if (vol->major_ver < 3) {
857                                 if (unlikely(deltaxcn == (LCN)-1))
858                                         ntfs_error(vol->sb, "lcn delta == -1");
859                                 if (unlikely(lcn == (LCN)-1))
860                                         ntfs_error(vol->sb, "lcn == -1");
861                         }
862 #endif
863                         /* Check lcn is not below -1. */
864                         if (unlikely(lcn < (LCN)-1)) {
865                                 ntfs_error(vol->sb, "Invalid LCN < -1 in "
866                                                 "mapping pairs array.");
867                                 goto err_out;
868                         }
869                         /* Enter the current lcn into the runlist element. */
870                         rl[rlpos].lcn = lcn;
871                 }
872                 /* Get to the next runlist element. */
873                 rlpos++;
874                 /* Increment the buffer position to the next mapping pair. */
875                 buf += (*buf & 0xf) + ((*buf >> 4) & 0xf) + 1;
876         }
877         if (unlikely(buf >= attr_end))
878                 goto io_error;
879         /*
880          * If there is a highest_vcn specified, it must be equal to the final
881          * vcn in the runlist - 1, or something has gone badly wrong.
882          */
883         deltaxcn = sle64_to_cpu(attr->data.non_resident.highest_vcn);
884         if (unlikely(deltaxcn && vcn - 1 != deltaxcn)) {
885 mpa_err:
886                 ntfs_error(vol->sb, "Corrupt mapping pairs array in "
887                                 "non-resident attribute.");
888                 goto err_out;
889         }
890         /* Setup not mapped runlist element if this is the base extent. */
891         if (!attr->data.non_resident.lowest_vcn) {
892                 VCN max_cluster;
893
894                 max_cluster = ((sle64_to_cpu(
895                                 attr->data.non_resident.allocated_size) +
896                                 vol->cluster_size - 1) >>
897                                 vol->cluster_size_bits) - 1;
898                 /*
899                  * A highest_vcn of zero means this is a single extent
900                  * attribute so simply terminate the runlist with LCN_ENOENT).
901                  */
902                 if (deltaxcn) {
903                         /*
904                          * If there is a difference between the highest_vcn and
905                          * the highest cluster, the runlist is either corrupt
906                          * or, more likely, there are more extents following
907                          * this one.
908                          */
909                         if (deltaxcn < max_cluster) {
910                                 ntfs_debug("More extents to follow; deltaxcn "
911                                                 "= 0x%llx, max_cluster = "
912                                                 "0x%llx",
913                                                 (unsigned long long)deltaxcn,
914                                                 (unsigned long long)
915                                                 max_cluster);
916                                 rl[rlpos].vcn = vcn;
917                                 vcn += rl[rlpos].length = max_cluster -
918                                                 deltaxcn;
919                                 rl[rlpos].lcn = LCN_RL_NOT_MAPPED;
920                                 rlpos++;
921                         } else if (unlikely(deltaxcn > max_cluster)) {
922                                 ntfs_error(vol->sb, "Corrupt attribute.  "
923                                                 "deltaxcn = 0x%llx, "
924                                                 "max_cluster = 0x%llx",
925                                                 (unsigned long long)deltaxcn,
926                                                 (unsigned long long)
927                                                 max_cluster);
928                                 goto mpa_err;
929                         }
930                 }
931                 rl[rlpos].lcn = LCN_ENOENT;
932         } else /* Not the base extent. There may be more extents to follow. */
933                 rl[rlpos].lcn = LCN_RL_NOT_MAPPED;
934
935         /* Setup terminating runlist element. */
936         rl[rlpos].vcn = vcn;
937         rl[rlpos].length = (s64)0;
938         /* If no existing runlist was specified, we are done. */
939         if (!old_rl) {
940                 ntfs_debug("Mapping pairs array successfully decompressed:");
941                 ntfs_debug_dump_runlist(rl);
942                 return rl;
943         }
944         /* Now combine the new and old runlists checking for overlaps. */
945         old_rl = ntfs_runlists_merge(old_rl, rl);
946         if (likely(!IS_ERR(old_rl)))
947                 return old_rl;
948         ntfs_free(rl);
949         ntfs_error(vol->sb, "Failed to merge runlists.");
950         return old_rl;
951 io_error:
952         ntfs_error(vol->sb, "Corrupt attribute.");
953 err_out:
954         ntfs_free(rl);
955         return ERR_PTR(-EIO);
956 }
957
958 /**
959  * ntfs_rl_vcn_to_lcn - convert a vcn into a lcn given a runlist
960  * @rl:         runlist to use for conversion
961  * @vcn:        vcn to convert
962  *
963  * Convert the virtual cluster number @vcn of an attribute into a logical
964  * cluster number (lcn) of a device using the runlist @rl to map vcns to their
965  * corresponding lcns.
966  *
967  * It is up to the caller to serialize access to the runlist @rl.
968  *
969  * Since lcns must be >= 0, we use negative return codes with special meaning:
970  *
971  * Return code          Meaning / Description
972  * ==================================================
973  *  LCN_HOLE            Hole / not allocated on disk.
974  *  LCN_RL_NOT_MAPPED   This is part of the runlist which has not been
975  *                      inserted into the runlist yet.
976  *  LCN_ENOENT          There is no such vcn in the attribute.
977  *
978  * Locking: - The caller must have locked the runlist (for reading or writing).
979  *          - This function does not touch the lock, nor does it modify the
980  *            runlist.
981  */
982 LCN ntfs_rl_vcn_to_lcn(const runlist_element *rl, const VCN vcn)
983 {
984         int i;
985
986         BUG_ON(vcn < 0);
987         /*
988          * If rl is NULL, assume that we have found an unmapped runlist. The
989          * caller can then attempt to map it and fail appropriately if
990          * necessary.
991          */
992         if (unlikely(!rl))
993                 return LCN_RL_NOT_MAPPED;
994
995         /* Catch out of lower bounds vcn. */
996         if (unlikely(vcn < rl[0].vcn))
997                 return LCN_ENOENT;
998
999         for (i = 0; likely(rl[i].length); i++) {
1000                 if (unlikely(vcn < rl[i+1].vcn)) {
1001                         if (likely(rl[i].lcn >= (LCN)0))
1002                                 return rl[i].lcn + (vcn - rl[i].vcn);
1003                         return rl[i].lcn;
1004                 }
1005         }
1006         /*
1007          * The terminator element is setup to the correct value, i.e. one of
1008          * LCN_HOLE, LCN_RL_NOT_MAPPED, or LCN_ENOENT.
1009          */
1010         if (likely(rl[i].lcn < (LCN)0))
1011                 return rl[i].lcn;
1012         /* Just in case... We could replace this with BUG() some day. */
1013         return LCN_ENOENT;
1014 }
1015
1016 #ifdef NTFS_RW
1017
1018 /**
1019  * ntfs_rl_find_vcn_nolock - find a vcn in a runlist
1020  * @rl:         runlist to search
1021  * @vcn:        vcn to find
1022  *
1023  * Find the virtual cluster number @vcn in the runlist @rl and return the
1024  * address of the runlist element containing the @vcn on success.
1025  *
1026  * Return NULL if @rl is NULL or @vcn is in an unmapped part/out of bounds of
1027  * the runlist.
1028  *
1029  * Locking: The runlist must be locked on entry.
1030  */
1031 runlist_element *ntfs_rl_find_vcn_nolock(runlist_element *rl, const VCN vcn)
1032 {
1033         BUG_ON(vcn < 0);
1034         if (unlikely(!rl || vcn < rl[0].vcn))
1035                 return NULL;
1036         while (likely(rl->length)) {
1037                 if (unlikely(vcn < rl[1].vcn)) {
1038                         if (likely(rl->lcn >= LCN_HOLE))
1039                                 return rl;
1040                         return NULL;
1041                 }
1042                 rl++;
1043         }
1044         if (likely(rl->lcn == LCN_ENOENT))
1045                 return rl;
1046         return NULL;
1047 }
1048
1049 /**
1050  * ntfs_get_nr_significant_bytes - get number of bytes needed to store a number
1051  * @n:          number for which to get the number of bytes for
1052  *
1053  * Return the number of bytes required to store @n unambiguously as
1054  * a signed number.
1055  *
1056  * This is used in the context of the mapping pairs array to determine how
1057  * many bytes will be needed in the array to store a given logical cluster
1058  * number (lcn) or a specific run length.
1059  *
1060  * Return the number of bytes written.  This function cannot fail.
1061  */
1062 static inline int ntfs_get_nr_significant_bytes(const s64 n)
1063 {
1064         s64 l = n;
1065         int i;
1066         s8 j;
1067
1068         i = 0;
1069         do {
1070                 l >>= 8;
1071                 i++;
1072         } while (l != 0 && l != -1);
1073         j = (n >> 8 * (i - 1)) & 0xff;
1074         /* If the sign bit is wrong, we need an extra byte. */
1075         if ((n < 0 && j >= 0) || (n > 0 && j < 0))
1076                 i++;
1077         return i;
1078 }
1079
1080 /**
1081  * ntfs_get_size_for_mapping_pairs - get bytes needed for mapping pairs array
1082  * @vol:        ntfs volume (needed for the ntfs version)
1083  * @rl:         locked runlist to determine the size of the mapping pairs of
1084  * @first_vcn:  first vcn which to include in the mapping pairs array
1085  * @last_vcn:   last vcn which to include in the mapping pairs array
1086  *
1087  * Walk the locked runlist @rl and calculate the size in bytes of the mapping
1088  * pairs array corresponding to the runlist @rl, starting at vcn @first_vcn and
1089  * finishing with vcn @last_vcn.
1090  *
1091  * A @last_vcn of -1 means end of runlist and in that case the size of the
1092  * mapping pairs array corresponding to the runlist starting at vcn @first_vcn
1093  * and finishing at the end of the runlist is determined.
1094  *
1095  * This for example allows us to allocate a buffer of the right size when
1096  * building the mapping pairs array.
1097  *
1098  * If @rl is NULL, just return 1 (for the single terminator byte).
1099  *
1100  * Return the calculated size in bytes on success.  On error, return -errno.
1101  * The following error codes are defined:
1102  *      -EINVAL - Run list contains unmapped elements.  Make sure to only pass
1103  *                fully mapped runlists to this function.
1104  *      -EIO    - The runlist is corrupt.
1105  *
1106  * Locking: @rl must be locked on entry (either for reading or writing), it
1107  *          remains locked throughout, and is left locked upon return.
1108  */
1109 int ntfs_get_size_for_mapping_pairs(const ntfs_volume *vol,
1110                 const runlist_element *rl, const VCN first_vcn,
1111                 const VCN last_vcn)
1112 {
1113         LCN prev_lcn;
1114         int rls;
1115         BOOL the_end = FALSE;
1116
1117         BUG_ON(first_vcn < 0);
1118         BUG_ON(last_vcn < -1);
1119         BUG_ON(last_vcn >= 0 && first_vcn > last_vcn);
1120         if (!rl) {
1121                 BUG_ON(first_vcn);
1122                 BUG_ON(last_vcn > 0);
1123                 return 1;
1124         }
1125         /* Skip to runlist element containing @first_vcn. */
1126         while (rl->length && first_vcn >= rl[1].vcn)
1127                 rl++;
1128         if (unlikely((!rl->length && first_vcn > rl->vcn) ||
1129                         first_vcn < rl->vcn))
1130                 return -EINVAL;
1131         prev_lcn = 0;
1132         /* Always need the termining zero byte. */
1133         rls = 1;
1134         /* Do the first partial run if present. */
1135         if (first_vcn > rl->vcn) {
1136                 s64 delta, length = rl->length;
1137
1138                 /* We know rl->length != 0 already. */
1139                 if (unlikely(length < 0 || rl->lcn < LCN_HOLE))
1140                         goto err_out;
1141                 /*
1142                  * If @stop_vcn is given and finishes inside this run, cap the
1143                  * run length.
1144                  */
1145                 if (unlikely(last_vcn >= 0 && rl[1].vcn > last_vcn)) {
1146                         s64 s1 = last_vcn + 1;
1147                         if (unlikely(rl[1].vcn > s1))
1148                                 length = s1 - rl->vcn;
1149                         the_end = TRUE;
1150                 }
1151                 delta = first_vcn - rl->vcn;
1152                 /* Header byte + length. */
1153                 rls += 1 + ntfs_get_nr_significant_bytes(length - delta);
1154                 /*
1155                  * If the logical cluster number (lcn) denotes a hole and we
1156                  * are on NTFS 3.0+, we don't store it at all, i.e. we need
1157                  * zero space.  On earlier NTFS versions we just store the lcn.
1158                  * Note: this assumes that on NTFS 1.2-, holes are stored with
1159                  * an lcn of -1 and not a delta_lcn of -1 (unless both are -1).
1160                  */
1161                 if (likely(rl->lcn >= 0 || vol->major_ver < 3)) {
1162                         prev_lcn = rl->lcn;
1163                         if (likely(rl->lcn >= 0))
1164                                 prev_lcn += delta;
1165                         /* Change in lcn. */
1166                         rls += ntfs_get_nr_significant_bytes(prev_lcn);
1167                 }
1168                 /* Go to next runlist element. */
1169                 rl++;
1170         }
1171         /* Do the full runs. */
1172         for (; rl->length && !the_end; rl++) {
1173                 s64 length = rl->length;
1174
1175                 if (unlikely(length < 0 || rl->lcn < LCN_HOLE))
1176                         goto err_out;
1177                 /*
1178                  * If @stop_vcn is given and finishes inside this run, cap the
1179                  * run length.
1180                  */
1181                 if (unlikely(last_vcn >= 0 && rl[1].vcn > last_vcn)) {
1182                         s64 s1 = last_vcn + 1;
1183                         if (unlikely(rl[1].vcn > s1))
1184                                 length = s1 - rl->vcn;
1185                         the_end = TRUE;
1186                 }
1187                 /* Header byte + length. */
1188                 rls += 1 + ntfs_get_nr_significant_bytes(length);
1189                 /*
1190                  * If the logical cluster number (lcn) denotes a hole and we
1191                  * are on NTFS 3.0+, we don't store it at all, i.e. we need
1192                  * zero space.  On earlier NTFS versions we just store the lcn.
1193                  * Note: this assumes that on NTFS 1.2-, holes are stored with
1194                  * an lcn of -1 and not a delta_lcn of -1 (unless both are -1).
1195                  */
1196                 if (likely(rl->lcn >= 0 || vol->major_ver < 3)) {
1197                         /* Change in lcn. */
1198                         rls += ntfs_get_nr_significant_bytes(rl->lcn -
1199                                         prev_lcn);
1200                         prev_lcn = rl->lcn;
1201                 }
1202         }
1203         return rls;
1204 err_out:
1205         if (rl->lcn == LCN_RL_NOT_MAPPED)
1206                 rls = -EINVAL;
1207         else
1208                 rls = -EIO;
1209         return rls;
1210 }
1211
1212 /**
1213  * ntfs_write_significant_bytes - write the significant bytes of a number
1214  * @dst:        destination buffer to write to
1215  * @dst_max:    pointer to last byte of destination buffer for bounds checking
1216  * @n:          number whose significant bytes to write
1217  *
1218  * Store in @dst, the minimum bytes of the number @n which are required to
1219  * identify @n unambiguously as a signed number, taking care not to exceed
1220  * @dest_max, the maximum position within @dst to which we are allowed to
1221  * write.
1222  *
1223  * This is used when building the mapping pairs array of a runlist to compress
1224  * a given logical cluster number (lcn) or a specific run length to the minumum
1225  * size possible.
1226  *
1227  * Return the number of bytes written on success.  On error, i.e. the
1228  * destination buffer @dst is too small, return -ENOSPC.
1229  */
1230 static inline int ntfs_write_significant_bytes(s8 *dst, const s8 *dst_max,
1231                 const s64 n)
1232 {
1233         s64 l = n;
1234         int i;
1235         s8 j;
1236
1237         i = 0;
1238         do {
1239                 if (unlikely(dst > dst_max))
1240                         goto err_out;
1241                 *dst++ = l & 0xffll;
1242                 l >>= 8;
1243                 i++;
1244         } while (l != 0 && l != -1);
1245         j = (n >> 8 * (i - 1)) & 0xff;
1246         /* If the sign bit is wrong, we need an extra byte. */
1247         if (n < 0 && j >= 0) {
1248                 if (unlikely(dst > dst_max))
1249                         goto err_out;
1250                 i++;
1251                 *dst = (s8)-1;
1252         } else if (n > 0 && j < 0) {
1253                 if (unlikely(dst > dst_max))
1254                         goto err_out;
1255                 i++;
1256                 *dst = (s8)0;
1257         }
1258         return i;
1259 err_out:
1260         return -ENOSPC;
1261 }
1262
1263 /**
1264  * ntfs_mapping_pairs_build - build the mapping pairs array from a runlist
1265  * @vol:        ntfs volume (needed for the ntfs version)
1266  * @dst:        destination buffer to which to write the mapping pairs array
1267  * @dst_len:    size of destination buffer @dst in bytes
1268  * @rl:         locked runlist for which to build the mapping pairs array
1269  * @first_vcn:  first vcn which to include in the mapping pairs array
1270  * @last_vcn:   last vcn which to include in the mapping pairs array
1271  * @stop_vcn:   first vcn outside destination buffer on success or -ENOSPC
1272  *
1273  * Create the mapping pairs array from the locked runlist @rl, starting at vcn
1274  * @first_vcn and finishing with vcn @last_vcn and save the array in @dst.
1275  * @dst_len is the size of @dst in bytes and it should be at least equal to the
1276  * value obtained by calling ntfs_get_size_for_mapping_pairs().
1277  *
1278  * A @last_vcn of -1 means end of runlist and in that case the mapping pairs
1279  * array corresponding to the runlist starting at vcn @first_vcn and finishing
1280  * at the end of the runlist is created.
1281  *
1282  * If @rl is NULL, just write a single terminator byte to @dst.
1283  *
1284  * On success or -ENOSPC error, if @stop_vcn is not NULL, *@stop_vcn is set to
1285  * the first vcn outside the destination buffer.  Note that on error, @dst has
1286  * been filled with all the mapping pairs that will fit, thus it can be treated
1287  * as partial success, in that a new attribute extent needs to be created or
1288  * the next extent has to be used and the mapping pairs build has to be
1289  * continued with @first_vcn set to *@stop_vcn.
1290  *
1291  * Return 0 on success and -errno on error.  The following error codes are
1292  * defined:
1293  *      -EINVAL - Run list contains unmapped elements.  Make sure to only pass
1294  *                fully mapped runlists to this function.
1295  *      -EIO    - The runlist is corrupt.
1296  *      -ENOSPC - The destination buffer is too small.
1297  *
1298  * Locking: @rl must be locked on entry (either for reading or writing), it
1299  *          remains locked throughout, and is left locked upon return.
1300  */
1301 int ntfs_mapping_pairs_build(const ntfs_volume *vol, s8 *dst,
1302                 const int dst_len, const runlist_element *rl,
1303                 const VCN first_vcn, const VCN last_vcn, VCN *const stop_vcn)
1304 {
1305         LCN prev_lcn;
1306         s8 *dst_max, *dst_next;
1307         int err = -ENOSPC;
1308         BOOL the_end = FALSE;
1309         s8 len_len, lcn_len;
1310
1311         BUG_ON(first_vcn < 0);
1312         BUG_ON(last_vcn < -1);
1313         BUG_ON(last_vcn >= 0 && first_vcn > last_vcn);
1314         BUG_ON(dst_len < 1);
1315         if (!rl) {
1316                 BUG_ON(first_vcn);
1317                 BUG_ON(last_vcn > 0);
1318                 if (stop_vcn)
1319                         *stop_vcn = 0;
1320                 /* Terminator byte. */
1321                 *dst = 0;
1322                 return 0;
1323         }
1324         /* Skip to runlist element containing @first_vcn. */
1325         while (rl->length && first_vcn >= rl[1].vcn)
1326                 rl++;
1327         if (unlikely((!rl->length && first_vcn > rl->vcn) ||
1328                         first_vcn < rl->vcn))
1329                 return -EINVAL;
1330         /*
1331          * @dst_max is used for bounds checking in
1332          * ntfs_write_significant_bytes().
1333          */
1334         dst_max = dst + dst_len - 1;
1335         prev_lcn = 0;
1336         /* Do the first partial run if present. */
1337         if (first_vcn > rl->vcn) {
1338                 s64 delta, length = rl->length;
1339
1340                 /* We know rl->length != 0 already. */
1341                 if (unlikely(length < 0 || rl->lcn < LCN_HOLE))
1342                         goto err_out;
1343                 /*
1344                  * If @stop_vcn is given and finishes inside this run, cap the
1345                  * run length.
1346                  */
1347                 if (unlikely(last_vcn >= 0 && rl[1].vcn > last_vcn)) {
1348                         s64 s1 = last_vcn + 1;
1349                         if (unlikely(rl[1].vcn > s1))
1350                                 length = s1 - rl->vcn;
1351                         the_end = TRUE;
1352                 }
1353                 delta = first_vcn - rl->vcn;
1354                 /* Write length. */
1355                 len_len = ntfs_write_significant_bytes(dst + 1, dst_max,
1356                                 length - delta);
1357                 if (unlikely(len_len < 0))
1358                         goto size_err;
1359                 /*
1360                  * If the logical cluster number (lcn) denotes a hole and we
1361                  * are on NTFS 3.0+, we don't store it at all, i.e. we need
1362                  * zero space.  On earlier NTFS versions we just write the lcn
1363                  * change.  FIXME: Do we need to write the lcn change or just
1364                  * the lcn in that case?  Not sure as I have never seen this
1365                  * case on NT4. - We assume that we just need to write the lcn
1366                  * change until someone tells us otherwise... (AIA)
1367                  */
1368                 if (likely(rl->lcn >= 0 || vol->major_ver < 3)) {
1369                         prev_lcn = rl->lcn;
1370                         if (likely(rl->lcn >= 0))
1371                                 prev_lcn += delta;
1372                         /* Write change in lcn. */
1373                         lcn_len = ntfs_write_significant_bytes(dst + 1 +
1374                                         len_len, dst_max, prev_lcn);
1375                         if (unlikely(lcn_len < 0))
1376                                 goto size_err;
1377                 } else
1378                         lcn_len = 0;
1379                 dst_next = dst + len_len + lcn_len + 1;
1380                 if (unlikely(dst_next > dst_max))
1381                         goto size_err;
1382                 /* Update header byte. */
1383                 *dst = lcn_len << 4 | len_len;
1384                 /* Position at next mapping pairs array element. */
1385                 dst = dst_next;
1386                 /* Go to next runlist element. */
1387                 rl++;
1388         }
1389         /* Do the full runs. */
1390         for (; rl->length && !the_end; rl++) {
1391                 s64 length = rl->length;
1392
1393                 if (unlikely(length < 0 || rl->lcn < LCN_HOLE))
1394                         goto err_out;
1395                 /*
1396                  * If @stop_vcn is given and finishes inside this run, cap the
1397                  * run length.
1398                  */
1399                 if (unlikely(last_vcn >= 0 && rl[1].vcn > last_vcn)) {
1400                         s64 s1 = last_vcn + 1;
1401                         if (unlikely(rl[1].vcn > s1))
1402                                 length = s1 - rl->vcn;
1403                         the_end = TRUE;
1404                 }
1405                 /* Write length. */
1406                 len_len = ntfs_write_significant_bytes(dst + 1, dst_max,
1407                                 length);
1408                 if (unlikely(len_len < 0))
1409                         goto size_err;
1410                 /*
1411                  * If the logical cluster number (lcn) denotes a hole and we
1412                  * are on NTFS 3.0+, we don't store it at all, i.e. we need
1413                  * zero space.  On earlier NTFS versions we just write the lcn
1414                  * change.  FIXME: Do we need to write the lcn change or just
1415                  * the lcn in that case?  Not sure as I have never seen this
1416                  * case on NT4. - We assume that we just need to write the lcn
1417                  * change until someone tells us otherwise... (AIA)
1418                  */
1419                 if (likely(rl->lcn >= 0 || vol->major_ver < 3)) {
1420                         /* Write change in lcn. */
1421                         lcn_len = ntfs_write_significant_bytes(dst + 1 +
1422                                         len_len, dst_max, rl->lcn - prev_lcn);
1423                         if (unlikely(lcn_len < 0))
1424                                 goto size_err;
1425                         prev_lcn = rl->lcn;
1426                 } else
1427                         lcn_len = 0;
1428                 dst_next = dst + len_len + lcn_len + 1;
1429                 if (unlikely(dst_next > dst_max))
1430                         goto size_err;
1431                 /* Update header byte. */
1432                 *dst = lcn_len << 4 | len_len;
1433                 /* Position at next mapping pairs array element. */
1434                 dst = dst_next;
1435         }
1436         /* Success. */
1437         err = 0;
1438 size_err:
1439         /* Set stop vcn. */
1440         if (stop_vcn)
1441                 *stop_vcn = rl->vcn;
1442         /* Add terminator byte. */
1443         *dst = 0;
1444         return err;
1445 err_out:
1446         if (rl->lcn == LCN_RL_NOT_MAPPED)
1447                 err = -EINVAL;
1448         else
1449                 err = -EIO;
1450         return err;
1451 }
1452
1453 /**
1454  * ntfs_rl_truncate_nolock - truncate a runlist starting at a specified vcn
1455  * @runlist:    runlist to truncate
1456  * @new_length: the new length of the runlist in VCNs
1457  *
1458  * Truncate the runlist described by @runlist as well as the memory buffer
1459  * holding the runlist elements to a length of @new_length VCNs.
1460  *
1461  * If @new_length lies within the runlist, the runlist elements with VCNs of
1462  * @new_length and above are discarded.
1463  *
1464  * If @new_length lies beyond the runlist, a sparse runlist element is added to
1465  * the end of the runlist @runlist or if the last runlist element is a sparse
1466  * one already, this is extended.
1467  *
1468  * Return 0 on success and -errno on error.
1469  *
1470  * Locking: The caller must hold @runlist->lock for writing.
1471  */
1472 int ntfs_rl_truncate_nolock(const ntfs_volume *vol, runlist *const runlist,
1473                 const s64 new_length)
1474 {
1475         runlist_element *rl;
1476         int old_size;
1477
1478         ntfs_debug("Entering for new_length 0x%llx.", (long long)new_length);
1479         BUG_ON(!runlist);
1480         BUG_ON(new_length < 0);
1481         rl = runlist->rl;
1482         if (unlikely(!rl)) {
1483                 /*
1484                  * Create a runlist consisting of a sparse runlist element of
1485                  * length @new_length followed by a terminator runlist element.
1486                  */
1487                 rl = ntfs_malloc_nofs(PAGE_SIZE);
1488                 if (unlikely(!rl)) {
1489                         ntfs_error(vol->sb, "Not enough memory to allocate "
1490                                         "runlist element buffer.");
1491                         return -ENOMEM;
1492                 }
1493                 runlist->rl = rl;
1494                 rl[1].length = rl->vcn = 0;
1495                 rl->lcn = LCN_HOLE;
1496                 rl[1].vcn = rl->length = new_length;
1497                 rl[1].lcn = LCN_ENOENT;
1498                 return 0;
1499         }
1500         BUG_ON(new_length < rl->vcn);
1501         /* Find @new_length in the runlist. */
1502         while (likely(rl->length && new_length >= rl[1].vcn))
1503                 rl++;
1504         /*
1505          * If not at the end of the runlist we need to shrink it.
1506          * If at the end of the runlist we need to expand it.
1507          */
1508         if (rl->length) {
1509                 runlist_element *trl;
1510                 BOOL is_end;
1511
1512                 ntfs_debug("Shrinking runlist.");
1513                 /* Determine the runlist size. */
1514                 trl = rl + 1;
1515                 while (likely(trl->length))
1516                         trl++;
1517                 old_size = trl - runlist->rl + 1;
1518                 /* Truncate the run. */
1519                 rl->length = new_length - rl->vcn;
1520                 /*
1521                  * If a run was partially truncated, make the following runlist
1522                  * element a terminator.
1523                  */
1524                 is_end = FALSE;
1525                 if (rl->length) {
1526                         rl++;
1527                         if (!rl->length)
1528                                 is_end = TRUE;
1529                         rl->vcn = new_length;
1530                         rl->length = 0;
1531                 }
1532                 rl->lcn = LCN_ENOENT;
1533                 /* Reallocate memory if necessary. */
1534                 if (!is_end) {
1535                         int new_size = rl - runlist->rl + 1;
1536                         rl = ntfs_rl_realloc(runlist->rl, old_size, new_size);
1537                         if (IS_ERR(rl))
1538                                 ntfs_warning(vol->sb, "Failed to shrink "
1539                                                 "runlist buffer.  This just "
1540                                                 "wastes a bit of memory "
1541                                                 "temporarily so we ignore it "
1542                                                 "and return success.");
1543                         else
1544                                 runlist->rl = rl;
1545                 }
1546         } else if (likely(/* !rl->length && */ new_length > rl->vcn)) {
1547                 ntfs_debug("Expanding runlist.");
1548                 /*
1549                  * If there is a previous runlist element and it is a sparse
1550                  * one, extend it.  Otherwise need to add a new, sparse runlist
1551                  * element.
1552                  */
1553                 if ((rl > runlist->rl) && ((rl - 1)->lcn == LCN_HOLE))
1554                         (rl - 1)->length = new_length - (rl - 1)->vcn;
1555                 else {
1556                         /* Determine the runlist size. */
1557                         old_size = rl - runlist->rl + 1;
1558                         /* Reallocate memory if necessary. */
1559                         rl = ntfs_rl_realloc(runlist->rl, old_size,
1560                                         old_size + 1);
1561                         if (IS_ERR(rl)) {
1562                                 ntfs_error(vol->sb, "Failed to expand runlist "
1563                                                 "buffer, aborting.");
1564                                 return PTR_ERR(rl);
1565                         }
1566                         runlist->rl = rl;
1567                         /*
1568                          * Set @rl to the same runlist element in the new
1569                          * runlist as before in the old runlist.
1570                          */
1571                         rl += old_size - 1;
1572                         /* Add a new, sparse runlist element. */
1573                         rl->lcn = LCN_HOLE;
1574                         rl->length = new_length - rl->vcn;
1575                         /* Add a new terminator runlist element. */
1576                         rl++;
1577                         rl->length = 0;
1578                 }
1579                 rl->vcn = new_length;
1580                 rl->lcn = LCN_ENOENT;
1581         } else /* if (unlikely(!rl->length && new_length == rl->vcn)) */ {
1582                 /* Runlist already has same size as requested. */
1583                 rl->lcn = LCN_ENOENT;
1584         }
1585         ntfs_debug("Done.");
1586         return 0;
1587 }
1588
1589 #endif /* NTFS_RW */