x86, amd: Avoid cache aliasing penalties on AMD family 15h
[pandora-kernel.git] / arch / x86 / kernel / sys_x86_64.c
1 #include <linux/errno.h>
2 #include <linux/sched.h>
3 #include <linux/syscalls.h>
4 #include <linux/mm.h>
5 #include <linux/fs.h>
6 #include <linux/smp.h>
7 #include <linux/sem.h>
8 #include <linux/msg.h>
9 #include <linux/shm.h>
10 #include <linux/stat.h>
11 #include <linux/mman.h>
12 #include <linux/file.h>
13 #include <linux/utsname.h>
14 #include <linux/personality.h>
15 #include <linux/random.h>
16 #include <linux/uaccess.h>
17
18 #include <asm/ia32.h>
19 #include <asm/syscalls.h>
20
21 struct __read_mostly va_alignment va_align = {
22         .flags = -1,
23 };
24
25 /*
26  * Align a virtual address to avoid aliasing in the I$ on AMD F15h.
27  *
28  * @flags denotes the allocation direction - bottomup or topdown -
29  * or vDSO; see call sites below.
30  */
31 unsigned long align_addr(unsigned long addr, struct file *filp,
32                          enum align_flags flags)
33 {
34         unsigned long tmp_addr;
35
36         /* handle 32- and 64-bit case with a single conditional */
37         if (va_align.flags < 0 || !(va_align.flags & (2 - mmap_is_ia32())))
38                 return addr;
39
40         if (!(current->flags & PF_RANDOMIZE))
41                 return addr;
42
43         if (!((flags & ALIGN_VDSO) || filp))
44                 return addr;
45
46         tmp_addr = addr;
47
48         /*
49          * We need an address which is <= than the original
50          * one only when in topdown direction.
51          */
52         if (!(flags & ALIGN_TOPDOWN))
53                 tmp_addr += va_align.mask;
54
55         tmp_addr &= ~va_align.mask;
56
57         return tmp_addr;
58 }
59
60 static int __init control_va_addr_alignment(char *str)
61 {
62         /* guard against enabling this on other CPU families */
63         if (va_align.flags < 0)
64                 return 1;
65
66         if (*str == 0)
67                 return 1;
68
69         if (*str == '=')
70                 str++;
71
72         if (!strcmp(str, "32"))
73                 va_align.flags = ALIGN_VA_32;
74         else if (!strcmp(str, "64"))
75                 va_align.flags = ALIGN_VA_64;
76         else if (!strcmp(str, "off"))
77                 va_align.flags = 0;
78         else if (!strcmp(str, "on"))
79                 va_align.flags = ALIGN_VA_32 | ALIGN_VA_64;
80         else
81                 return 0;
82
83         return 1;
84 }
85 __setup("align_va_addr", control_va_addr_alignment);
86
87 SYSCALL_DEFINE6(mmap, unsigned long, addr, unsigned long, len,
88                 unsigned long, prot, unsigned long, flags,
89                 unsigned long, fd, unsigned long, off)
90 {
91         long error;
92         error = -EINVAL;
93         if (off & ~PAGE_MASK)
94                 goto out;
95
96         error = sys_mmap_pgoff(addr, len, prot, flags, fd, off >> PAGE_SHIFT);
97 out:
98         return error;
99 }
100
101 static void find_start_end(unsigned long flags, unsigned long *begin,
102                            unsigned long *end)
103 {
104         if (!test_thread_flag(TIF_IA32) && (flags & MAP_32BIT)) {
105                 unsigned long new_begin;
106                 /* This is usually used needed to map code in small
107                    model, so it needs to be in the first 31bit. Limit
108                    it to that.  This means we need to move the
109                    unmapped base down for this case. This can give
110                    conflicts with the heap, but we assume that glibc
111                    malloc knows how to fall back to mmap. Give it 1GB
112                    of playground for now. -AK */
113                 *begin = 0x40000000;
114                 *end = 0x80000000;
115                 if (current->flags & PF_RANDOMIZE) {
116                         new_begin = randomize_range(*begin, *begin + 0x02000000, 0);
117                         if (new_begin)
118                                 *begin = new_begin;
119                 }
120         } else {
121                 *begin = TASK_UNMAPPED_BASE;
122                 *end = TASK_SIZE;
123         }
124 }
125
126 unsigned long
127 arch_get_unmapped_area(struct file *filp, unsigned long addr,
128                 unsigned long len, unsigned long pgoff, unsigned long flags)
129 {
130         struct mm_struct *mm = current->mm;
131         struct vm_area_struct *vma;
132         unsigned long start_addr;
133         unsigned long begin, end;
134
135         if (flags & MAP_FIXED)
136                 return addr;
137
138         find_start_end(flags, &begin, &end);
139
140         if (len > end)
141                 return -ENOMEM;
142
143         if (addr) {
144                 addr = PAGE_ALIGN(addr);
145                 vma = find_vma(mm, addr);
146                 if (end - len >= addr &&
147                     (!vma || addr + len <= vma->vm_start))
148                         return addr;
149         }
150         if (((flags & MAP_32BIT) || test_thread_flag(TIF_IA32))
151             && len <= mm->cached_hole_size) {
152                 mm->cached_hole_size = 0;
153                 mm->free_area_cache = begin;
154         }
155         addr = mm->free_area_cache;
156         if (addr < begin)
157                 addr = begin;
158         start_addr = addr;
159
160 full_search:
161
162         addr = align_addr(addr, filp, 0);
163
164         for (vma = find_vma(mm, addr); ; vma = vma->vm_next) {
165                 /* At this point:  (!vma || addr < vma->vm_end). */
166                 if (end - len < addr) {
167                         /*
168                          * Start a new search - just in case we missed
169                          * some holes.
170                          */
171                         if (start_addr != begin) {
172                                 start_addr = addr = begin;
173                                 mm->cached_hole_size = 0;
174                                 goto full_search;
175                         }
176                         return -ENOMEM;
177                 }
178                 if (!vma || addr + len <= vma->vm_start) {
179                         /*
180                          * Remember the place where we stopped the search:
181                          */
182                         mm->free_area_cache = addr + len;
183                         return addr;
184                 }
185                 if (addr + mm->cached_hole_size < vma->vm_start)
186                         mm->cached_hole_size = vma->vm_start - addr;
187
188                 addr = vma->vm_end;
189                 addr = align_addr(addr, filp, 0);
190         }
191 }
192
193
194 unsigned long
195 arch_get_unmapped_area_topdown(struct file *filp, const unsigned long addr0,
196                           const unsigned long len, const unsigned long pgoff,
197                           const unsigned long flags)
198 {
199         struct vm_area_struct *vma;
200         struct mm_struct *mm = current->mm;
201         unsigned long addr = addr0;
202
203         /* requested length too big for entire address space */
204         if (len > TASK_SIZE)
205                 return -ENOMEM;
206
207         if (flags & MAP_FIXED)
208                 return addr;
209
210         /* for MAP_32BIT mappings we force the legact mmap base */
211         if (!test_thread_flag(TIF_IA32) && (flags & MAP_32BIT))
212                 goto bottomup;
213
214         /* requesting a specific address */
215         if (addr) {
216                 addr = PAGE_ALIGN(addr);
217                 vma = find_vma(mm, addr);
218                 if (TASK_SIZE - len >= addr &&
219                                 (!vma || addr + len <= vma->vm_start))
220                         return addr;
221         }
222
223         /* check if free_area_cache is useful for us */
224         if (len <= mm->cached_hole_size) {
225                 mm->cached_hole_size = 0;
226                 mm->free_area_cache = mm->mmap_base;
227         }
228
229         /* either no address requested or can't fit in requested address hole */
230         addr = mm->free_area_cache;
231
232         /* make sure it can fit in the remaining address space */
233         if (addr > len) {
234                 unsigned long tmp_addr = align_addr(addr - len, filp,
235                                                     ALIGN_TOPDOWN);
236
237                 vma = find_vma(mm, tmp_addr);
238                 if (!vma || tmp_addr + len <= vma->vm_start)
239                         /* remember the address as a hint for next time */
240                         return mm->free_area_cache = tmp_addr;
241         }
242
243         if (mm->mmap_base < len)
244                 goto bottomup;
245
246         addr = mm->mmap_base-len;
247
248         do {
249                 addr = align_addr(addr, filp, ALIGN_TOPDOWN);
250
251                 /*
252                  * Lookup failure means no vma is above this address,
253                  * else if new region fits below vma->vm_start,
254                  * return with success:
255                  */
256                 vma = find_vma(mm, addr);
257                 if (!vma || addr+len <= vma->vm_start)
258                         /* remember the address as a hint for next time */
259                         return mm->free_area_cache = addr;
260
261                 /* remember the largest hole we saw so far */
262                 if (addr + mm->cached_hole_size < vma->vm_start)
263                         mm->cached_hole_size = vma->vm_start - addr;
264
265                 /* try just below the current vma->vm_start */
266                 addr = vma->vm_start-len;
267         } while (len < vma->vm_start);
268
269 bottomup:
270         /*
271          * A failed mmap() very likely causes application failure,
272          * so fall back to the bottom-up function here. This scenario
273          * can happen with large stack limits and large mmap()
274          * allocations.
275          */
276         mm->cached_hole_size = ~0UL;
277         mm->free_area_cache = TASK_UNMAPPED_BASE;
278         addr = arch_get_unmapped_area(filp, addr0, len, pgoff, flags);
279         /*
280          * Restore the topdown base:
281          */
282         mm->free_area_cache = mm->mmap_base;
283         mm->cached_hole_size = ~0UL;
284
285         return addr;
286 }