Merge branches 'x86/acpi', 'x86/asm', 'x86/cpudetect', 'x86/crashdump', 'x86/debug...
[pandora-kernel.git] / arch / x86 / include / asm / pgtable.h
1 #ifndef _ASM_X86_PGTABLE_H
2 #define _ASM_X86_PGTABLE_H
3
4 #include <asm/page.h>
5
6 #define FIRST_USER_ADDRESS      0
7
8 #define _PAGE_BIT_PRESENT       0       /* is present */
9 #define _PAGE_BIT_RW            1       /* writeable */
10 #define _PAGE_BIT_USER          2       /* userspace addressable */
11 #define _PAGE_BIT_PWT           3       /* page write through */
12 #define _PAGE_BIT_PCD           4       /* page cache disabled */
13 #define _PAGE_BIT_ACCESSED      5       /* was accessed (raised by CPU) */
14 #define _PAGE_BIT_DIRTY         6       /* was written to (raised by CPU) */
15 #define _PAGE_BIT_PSE           7       /* 4 MB (or 2MB) page */
16 #define _PAGE_BIT_PAT           7       /* on 4KB pages */
17 #define _PAGE_BIT_GLOBAL        8       /* Global TLB entry PPro+ */
18 #define _PAGE_BIT_UNUSED1       9       /* available for programmer */
19 #define _PAGE_BIT_IOMAP         10      /* flag used to indicate IO mapping */
20 #define _PAGE_BIT_UNUSED3       11
21 #define _PAGE_BIT_PAT_LARGE     12      /* On 2MB or 1GB pages */
22 #define _PAGE_BIT_SPECIAL       _PAGE_BIT_UNUSED1
23 #define _PAGE_BIT_CPA_TEST      _PAGE_BIT_UNUSED1
24 #define _PAGE_BIT_NX           63       /* No execute: only valid after cpuid check */
25
26 /* If _PAGE_BIT_PRESENT is clear, we use these: */
27 /* - if the user mapped it with PROT_NONE; pte_present gives true */
28 #define _PAGE_BIT_PROTNONE      _PAGE_BIT_GLOBAL
29 /* - set: nonlinear file mapping, saved PTE; unset:swap */
30 #define _PAGE_BIT_FILE          _PAGE_BIT_DIRTY
31
32 #define _PAGE_PRESENT   (_AT(pteval_t, 1) << _PAGE_BIT_PRESENT)
33 #define _PAGE_RW        (_AT(pteval_t, 1) << _PAGE_BIT_RW)
34 #define _PAGE_USER      (_AT(pteval_t, 1) << _PAGE_BIT_USER)
35 #define _PAGE_PWT       (_AT(pteval_t, 1) << _PAGE_BIT_PWT)
36 #define _PAGE_PCD       (_AT(pteval_t, 1) << _PAGE_BIT_PCD)
37 #define _PAGE_ACCESSED  (_AT(pteval_t, 1) << _PAGE_BIT_ACCESSED)
38 #define _PAGE_DIRTY     (_AT(pteval_t, 1) << _PAGE_BIT_DIRTY)
39 #define _PAGE_PSE       (_AT(pteval_t, 1) << _PAGE_BIT_PSE)
40 #define _PAGE_GLOBAL    (_AT(pteval_t, 1) << _PAGE_BIT_GLOBAL)
41 #define _PAGE_UNUSED1   (_AT(pteval_t, 1) << _PAGE_BIT_UNUSED1)
42 #define _PAGE_IOMAP     (_AT(pteval_t, 1) << _PAGE_BIT_IOMAP)
43 #define _PAGE_UNUSED3   (_AT(pteval_t, 1) << _PAGE_BIT_UNUSED3)
44 #define _PAGE_PAT       (_AT(pteval_t, 1) << _PAGE_BIT_PAT)
45 #define _PAGE_PAT_LARGE (_AT(pteval_t, 1) << _PAGE_BIT_PAT_LARGE)
46 #define _PAGE_SPECIAL   (_AT(pteval_t, 1) << _PAGE_BIT_SPECIAL)
47 #define _PAGE_CPA_TEST  (_AT(pteval_t, 1) << _PAGE_BIT_CPA_TEST)
48 #define __HAVE_ARCH_PTE_SPECIAL
49
50 #if defined(CONFIG_X86_64) || defined(CONFIG_X86_PAE)
51 #define _PAGE_NX        (_AT(pteval_t, 1) << _PAGE_BIT_NX)
52 #else
53 #define _PAGE_NX        (_AT(pteval_t, 0))
54 #endif
55
56 #define _PAGE_FILE      (_AT(pteval_t, 1) << _PAGE_BIT_FILE)
57 #define _PAGE_PROTNONE  (_AT(pteval_t, 1) << _PAGE_BIT_PROTNONE)
58
59 #define _PAGE_TABLE     (_PAGE_PRESENT | _PAGE_RW | _PAGE_USER |        \
60                          _PAGE_ACCESSED | _PAGE_DIRTY)
61 #define _KERNPG_TABLE   (_PAGE_PRESENT | _PAGE_RW | _PAGE_ACCESSED |    \
62                          _PAGE_DIRTY)
63
64 /* Set of bits not changed in pte_modify */
65 #define _PAGE_CHG_MASK  (PTE_PFN_MASK | _PAGE_PCD | _PAGE_PWT |         \
66                          _PAGE_SPECIAL | _PAGE_ACCESSED | _PAGE_DIRTY)
67
68 #define _PAGE_CACHE_MASK        (_PAGE_PCD | _PAGE_PWT)
69 #define _PAGE_CACHE_WB          (0)
70 #define _PAGE_CACHE_WC          (_PAGE_PWT)
71 #define _PAGE_CACHE_UC_MINUS    (_PAGE_PCD)
72 #define _PAGE_CACHE_UC          (_PAGE_PCD | _PAGE_PWT)
73
74 #define PAGE_NONE       __pgprot(_PAGE_PROTNONE | _PAGE_ACCESSED)
75 #define PAGE_SHARED     __pgprot(_PAGE_PRESENT | _PAGE_RW | _PAGE_USER | \
76                                  _PAGE_ACCESSED | _PAGE_NX)
77
78 #define PAGE_SHARED_EXEC        __pgprot(_PAGE_PRESENT | _PAGE_RW |     \
79                                          _PAGE_USER | _PAGE_ACCESSED)
80 #define PAGE_COPY_NOEXEC        __pgprot(_PAGE_PRESENT | _PAGE_USER |   \
81                                          _PAGE_ACCESSED | _PAGE_NX)
82 #define PAGE_COPY_EXEC          __pgprot(_PAGE_PRESENT | _PAGE_USER |   \
83                                          _PAGE_ACCESSED)
84 #define PAGE_COPY               PAGE_COPY_NOEXEC
85 #define PAGE_READONLY           __pgprot(_PAGE_PRESENT | _PAGE_USER |   \
86                                          _PAGE_ACCESSED | _PAGE_NX)
87 #define PAGE_READONLY_EXEC      __pgprot(_PAGE_PRESENT | _PAGE_USER |   \
88                                          _PAGE_ACCESSED)
89
90 #define __PAGE_KERNEL_EXEC                                              \
91         (_PAGE_PRESENT | _PAGE_RW | _PAGE_DIRTY | _PAGE_ACCESSED | _PAGE_GLOBAL)
92 #define __PAGE_KERNEL           (__PAGE_KERNEL_EXEC | _PAGE_NX)
93
94 #define __PAGE_KERNEL_RO                (__PAGE_KERNEL & ~_PAGE_RW)
95 #define __PAGE_KERNEL_RX                (__PAGE_KERNEL_EXEC & ~_PAGE_RW)
96 #define __PAGE_KERNEL_EXEC_NOCACHE      (__PAGE_KERNEL_EXEC | _PAGE_PCD | _PAGE_PWT)
97 #define __PAGE_KERNEL_WC                (__PAGE_KERNEL | _PAGE_CACHE_WC)
98 #define __PAGE_KERNEL_NOCACHE           (__PAGE_KERNEL | _PAGE_PCD | _PAGE_PWT)
99 #define __PAGE_KERNEL_UC_MINUS          (__PAGE_KERNEL | _PAGE_PCD)
100 #define __PAGE_KERNEL_VSYSCALL          (__PAGE_KERNEL_RX | _PAGE_USER)
101 #define __PAGE_KERNEL_VSYSCALL_NOCACHE  (__PAGE_KERNEL_VSYSCALL | _PAGE_PCD | _PAGE_PWT)
102 #define __PAGE_KERNEL_LARGE             (__PAGE_KERNEL | _PAGE_PSE)
103 #define __PAGE_KERNEL_LARGE_NOCACHE     (__PAGE_KERNEL | _PAGE_CACHE_UC | _PAGE_PSE)
104 #define __PAGE_KERNEL_LARGE_EXEC        (__PAGE_KERNEL_EXEC | _PAGE_PSE)
105
106 #define __PAGE_KERNEL_IO                (__PAGE_KERNEL | _PAGE_IOMAP)
107 #define __PAGE_KERNEL_IO_NOCACHE        (__PAGE_KERNEL_NOCACHE | _PAGE_IOMAP)
108 #define __PAGE_KERNEL_IO_UC_MINUS       (__PAGE_KERNEL_UC_MINUS | _PAGE_IOMAP)
109 #define __PAGE_KERNEL_IO_WC             (__PAGE_KERNEL_WC | _PAGE_IOMAP)
110
111 #define PAGE_KERNEL                     __pgprot(__PAGE_KERNEL)
112 #define PAGE_KERNEL_RO                  __pgprot(__PAGE_KERNEL_RO)
113 #define PAGE_KERNEL_EXEC                __pgprot(__PAGE_KERNEL_EXEC)
114 #define PAGE_KERNEL_RX                  __pgprot(__PAGE_KERNEL_RX)
115 #define PAGE_KERNEL_WC                  __pgprot(__PAGE_KERNEL_WC)
116 #define PAGE_KERNEL_NOCACHE             __pgprot(__PAGE_KERNEL_NOCACHE)
117 #define PAGE_KERNEL_UC_MINUS            __pgprot(__PAGE_KERNEL_UC_MINUS)
118 #define PAGE_KERNEL_EXEC_NOCACHE        __pgprot(__PAGE_KERNEL_EXEC_NOCACHE)
119 #define PAGE_KERNEL_LARGE               __pgprot(__PAGE_KERNEL_LARGE)
120 #define PAGE_KERNEL_LARGE_NOCACHE       __pgprot(__PAGE_KERNEL_LARGE_NOCACHE)
121 #define PAGE_KERNEL_LARGE_EXEC          __pgprot(__PAGE_KERNEL_LARGE_EXEC)
122 #define PAGE_KERNEL_VSYSCALL            __pgprot(__PAGE_KERNEL_VSYSCALL)
123 #define PAGE_KERNEL_VSYSCALL_NOCACHE    __pgprot(__PAGE_KERNEL_VSYSCALL_NOCACHE)
124
125 #define PAGE_KERNEL_IO                  __pgprot(__PAGE_KERNEL_IO)
126 #define PAGE_KERNEL_IO_NOCACHE          __pgprot(__PAGE_KERNEL_IO_NOCACHE)
127 #define PAGE_KERNEL_IO_UC_MINUS         __pgprot(__PAGE_KERNEL_IO_UC_MINUS)
128 #define PAGE_KERNEL_IO_WC               __pgprot(__PAGE_KERNEL_IO_WC)
129
130 /*         xwr */
131 #define __P000  PAGE_NONE
132 #define __P001  PAGE_READONLY
133 #define __P010  PAGE_COPY
134 #define __P011  PAGE_COPY
135 #define __P100  PAGE_READONLY_EXEC
136 #define __P101  PAGE_READONLY_EXEC
137 #define __P110  PAGE_COPY_EXEC
138 #define __P111  PAGE_COPY_EXEC
139
140 #define __S000  PAGE_NONE
141 #define __S001  PAGE_READONLY
142 #define __S010  PAGE_SHARED
143 #define __S011  PAGE_SHARED
144 #define __S100  PAGE_READONLY_EXEC
145 #define __S101  PAGE_READONLY_EXEC
146 #define __S110  PAGE_SHARED_EXEC
147 #define __S111  PAGE_SHARED_EXEC
148
149 /*
150  * early identity mapping  pte attrib macros.
151  */
152 #ifdef CONFIG_X86_64
153 #define __PAGE_KERNEL_IDENT_LARGE_EXEC  __PAGE_KERNEL_LARGE_EXEC
154 #else
155 /*
156  * For PDE_IDENT_ATTR include USER bit. As the PDE and PTE protection
157  * bits are combined, this will alow user to access the high address mapped
158  * VDSO in the presence of CONFIG_COMPAT_VDSO
159  */
160 #define PTE_IDENT_ATTR   0x003          /* PRESENT+RW */
161 #define PDE_IDENT_ATTR   0x067          /* PRESENT+RW+USER+DIRTY+ACCESSED */
162 #define PGD_IDENT_ATTR   0x001          /* PRESENT (no other attributes) */
163 #endif
164
165 /*
166  * Macro to mark a page protection value as UC-
167  */
168 #define pgprot_noncached(prot)                                  \
169         ((boot_cpu_data.x86 > 3)                                \
170          ? (__pgprot(pgprot_val(prot) | _PAGE_CACHE_UC_MINUS))  \
171          : (prot))
172
173 #ifndef __ASSEMBLY__
174
175 #define pgprot_writecombine     pgprot_writecombine
176 extern pgprot_t pgprot_writecombine(pgprot_t prot);
177
178 /*
179  * ZERO_PAGE is a global shared page that is always zero: used
180  * for zero-mapped memory areas etc..
181  */
182 extern unsigned long empty_zero_page[PAGE_SIZE / sizeof(unsigned long)];
183 #define ZERO_PAGE(vaddr) (virt_to_page(empty_zero_page))
184
185 extern spinlock_t pgd_lock;
186 extern struct list_head pgd_list;
187
188 /*
189  * The following only work if pte_present() is true.
190  * Undefined behaviour if not..
191  */
192 static inline int pte_dirty(pte_t pte)
193 {
194         return pte_flags(pte) & _PAGE_DIRTY;
195 }
196
197 static inline int pte_young(pte_t pte)
198 {
199         return pte_flags(pte) & _PAGE_ACCESSED;
200 }
201
202 static inline int pte_write(pte_t pte)
203 {
204         return pte_flags(pte) & _PAGE_RW;
205 }
206
207 static inline int pte_file(pte_t pte)
208 {
209         return pte_flags(pte) & _PAGE_FILE;
210 }
211
212 static inline int pte_huge(pte_t pte)
213 {
214         return pte_flags(pte) & _PAGE_PSE;
215 }
216
217 static inline int pte_global(pte_t pte)
218 {
219         return pte_flags(pte) & _PAGE_GLOBAL;
220 }
221
222 static inline int pte_exec(pte_t pte)
223 {
224         return !(pte_flags(pte) & _PAGE_NX);
225 }
226
227 static inline int pte_special(pte_t pte)
228 {
229         return pte_flags(pte) & _PAGE_SPECIAL;
230 }
231
232 static inline unsigned long pte_pfn(pte_t pte)
233 {
234         return (pte_val(pte) & PTE_PFN_MASK) >> PAGE_SHIFT;
235 }
236
237 #define pte_page(pte)   pfn_to_page(pte_pfn(pte))
238
239 static inline int pmd_large(pmd_t pte)
240 {
241         return (pmd_flags(pte) & (_PAGE_PSE | _PAGE_PRESENT)) ==
242                 (_PAGE_PSE | _PAGE_PRESENT);
243 }
244
245 static inline pte_t pte_set_flags(pte_t pte, pteval_t set)
246 {
247         pteval_t v = native_pte_val(pte);
248
249         return native_make_pte(v | set);
250 }
251
252 static inline pte_t pte_clear_flags(pte_t pte, pteval_t clear)
253 {
254         pteval_t v = native_pte_val(pte);
255
256         return native_make_pte(v & ~clear);
257 }
258
259 static inline pte_t pte_mkclean(pte_t pte)
260 {
261         return pte_clear_flags(pte, _PAGE_DIRTY);
262 }
263
264 static inline pte_t pte_mkold(pte_t pte)
265 {
266         return pte_clear_flags(pte, _PAGE_ACCESSED);
267 }
268
269 static inline pte_t pte_wrprotect(pte_t pte)
270 {
271         return pte_clear_flags(pte, _PAGE_RW);
272 }
273
274 static inline pte_t pte_mkexec(pte_t pte)
275 {
276         return pte_clear_flags(pte, _PAGE_NX);
277 }
278
279 static inline pte_t pte_mkdirty(pte_t pte)
280 {
281         return pte_set_flags(pte, _PAGE_DIRTY);
282 }
283
284 static inline pte_t pte_mkyoung(pte_t pte)
285 {
286         return pte_set_flags(pte, _PAGE_ACCESSED);
287 }
288
289 static inline pte_t pte_mkwrite(pte_t pte)
290 {
291         return pte_set_flags(pte, _PAGE_RW);
292 }
293
294 static inline pte_t pte_mkhuge(pte_t pte)
295 {
296         return pte_set_flags(pte, _PAGE_PSE);
297 }
298
299 static inline pte_t pte_clrhuge(pte_t pte)
300 {
301         return pte_clear_flags(pte, _PAGE_PSE);
302 }
303
304 static inline pte_t pte_mkglobal(pte_t pte)
305 {
306         return pte_set_flags(pte, _PAGE_GLOBAL);
307 }
308
309 static inline pte_t pte_clrglobal(pte_t pte)
310 {
311         return pte_clear_flags(pte, _PAGE_GLOBAL);
312 }
313
314 static inline pte_t pte_mkspecial(pte_t pte)
315 {
316         return pte_set_flags(pte, _PAGE_SPECIAL);
317 }
318
319 extern pteval_t __supported_pte_mask;
320
321 /*
322  * Mask out unsupported bits in a present pgprot.  Non-present pgprots
323  * can use those bits for other purposes, so leave them be.
324  */
325 static inline pgprotval_t massage_pgprot(pgprot_t pgprot)
326 {
327         pgprotval_t protval = pgprot_val(pgprot);
328
329         if (protval & _PAGE_PRESENT)
330                 protval &= __supported_pte_mask;
331
332         return protval;
333 }
334
335 static inline pte_t pfn_pte(unsigned long page_nr, pgprot_t pgprot)
336 {
337         return __pte(((phys_addr_t)page_nr << PAGE_SHIFT) |
338                      massage_pgprot(pgprot));
339 }
340
341 static inline pmd_t pfn_pmd(unsigned long page_nr, pgprot_t pgprot)
342 {
343         return __pmd(((phys_addr_t)page_nr << PAGE_SHIFT) |
344                      massage_pgprot(pgprot));
345 }
346
347 static inline pte_t pte_modify(pte_t pte, pgprot_t newprot)
348 {
349         pteval_t val = pte_val(pte);
350
351         /*
352          * Chop off the NX bit (if present), and add the NX portion of
353          * the newprot (if present):
354          */
355         val &= _PAGE_CHG_MASK;
356         val |= massage_pgprot(newprot) & ~_PAGE_CHG_MASK;
357
358         return __pte(val);
359 }
360
361 /* mprotect needs to preserve PAT bits when updating vm_page_prot */
362 #define pgprot_modify pgprot_modify
363 static inline pgprot_t pgprot_modify(pgprot_t oldprot, pgprot_t newprot)
364 {
365         pgprotval_t preservebits = pgprot_val(oldprot) & _PAGE_CHG_MASK;
366         pgprotval_t addbits = pgprot_val(newprot);
367         return __pgprot(preservebits | addbits);
368 }
369
370 #define pte_pgprot(x) __pgprot(pte_flags(x) & PTE_FLAGS_MASK)
371
372 #define canon_pgprot(p) __pgprot(massage_pgprot(p))
373
374 static inline int is_new_memtype_allowed(unsigned long flags,
375                                                 unsigned long new_flags)
376 {
377         /*
378          * Certain new memtypes are not allowed with certain
379          * requested memtype:
380          * - request is uncached, return cannot be write-back
381          * - request is write-combine, return cannot be write-back
382          */
383         if ((flags == _PAGE_CACHE_UC_MINUS &&
384              new_flags == _PAGE_CACHE_WB) ||
385             (flags == _PAGE_CACHE_WC &&
386              new_flags == _PAGE_CACHE_WB)) {
387                 return 0;
388         }
389
390         return 1;
391 }
392
393 #ifndef __ASSEMBLY__
394 /* Indicate that x86 has its own track and untrack pfn vma functions */
395 #define __HAVE_PFNMAP_TRACKING
396
397 #define __HAVE_PHYS_MEM_ACCESS_PROT
398 struct file;
399 pgprot_t phys_mem_access_prot(struct file *file, unsigned long pfn,
400                               unsigned long size, pgprot_t vma_prot);
401 int phys_mem_access_prot_allowed(struct file *file, unsigned long pfn,
402                               unsigned long size, pgprot_t *vma_prot);
403 #endif
404
405 /* Install a pte for a particular vaddr in kernel space. */
406 void set_pte_vaddr(unsigned long vaddr, pte_t pte);
407
408 #ifdef CONFIG_X86_32
409 extern void native_pagetable_setup_start(pgd_t *base);
410 extern void native_pagetable_setup_done(pgd_t *base);
411 #else
412 static inline void native_pagetable_setup_start(pgd_t *base) {}
413 static inline void native_pagetable_setup_done(pgd_t *base) {}
414 #endif
415
416 struct seq_file;
417 extern void arch_report_meminfo(struct seq_file *m);
418
419 #ifdef CONFIG_PARAVIRT
420 #include <asm/paravirt.h>
421 #else  /* !CONFIG_PARAVIRT */
422 #define set_pte(ptep, pte)              native_set_pte(ptep, pte)
423 #define set_pte_at(mm, addr, ptep, pte) native_set_pte_at(mm, addr, ptep, pte)
424
425 #define set_pte_present(mm, addr, ptep, pte)                            \
426         native_set_pte_present(mm, addr, ptep, pte)
427 #define set_pte_atomic(ptep, pte)                                       \
428         native_set_pte_atomic(ptep, pte)
429
430 #define set_pmd(pmdp, pmd)              native_set_pmd(pmdp, pmd)
431
432 #ifndef __PAGETABLE_PUD_FOLDED
433 #define set_pgd(pgdp, pgd)              native_set_pgd(pgdp, pgd)
434 #define pgd_clear(pgd)                  native_pgd_clear(pgd)
435 #endif
436
437 #ifndef set_pud
438 # define set_pud(pudp, pud)             native_set_pud(pudp, pud)
439 #endif
440
441 #ifndef __PAGETABLE_PMD_FOLDED
442 #define pud_clear(pud)                  native_pud_clear(pud)
443 #endif
444
445 #define pte_clear(mm, addr, ptep)       native_pte_clear(mm, addr, ptep)
446 #define pmd_clear(pmd)                  native_pmd_clear(pmd)
447
448 #define pte_update(mm, addr, ptep)              do { } while (0)
449 #define pte_update_defer(mm, addr, ptep)        do { } while (0)
450
451 static inline void __init paravirt_pagetable_setup_start(pgd_t *base)
452 {
453         native_pagetable_setup_start(base);
454 }
455
456 static inline void __init paravirt_pagetable_setup_done(pgd_t *base)
457 {
458         native_pagetable_setup_done(base);
459 }
460 #endif  /* CONFIG_PARAVIRT */
461
462 #endif  /* __ASSEMBLY__ */
463
464 #ifdef CONFIG_X86_32
465 # include "pgtable_32.h"
466 #else
467 # include "pgtable_64.h"
468 #endif
469
470 #ifndef __ASSEMBLY__
471 #include <linux/mm_types.h>
472
473 static inline int pte_none(pte_t pte)
474 {
475         return !pte.pte;
476 }
477
478 #define __HAVE_ARCH_PTE_SAME
479 static inline int pte_same(pte_t a, pte_t b)
480 {
481         return a.pte == b.pte;
482 }
483
484 static inline int pte_present(pte_t a)
485 {
486         return pte_flags(a) & (_PAGE_PRESENT | _PAGE_PROTNONE);
487 }
488
489 static inline int pmd_present(pmd_t pmd)
490 {
491         return pmd_flags(pmd) & _PAGE_PRESENT;
492 }
493
494 static inline int pmd_none(pmd_t pmd)
495 {
496         /* Only check low word on 32-bit platforms, since it might be
497            out of sync with upper half. */
498         return (unsigned long)native_pmd_val(pmd) == 0;
499 }
500
501 static inline unsigned long pmd_page_vaddr(pmd_t pmd)
502 {
503         return (unsigned long)__va(pmd_val(pmd) & PTE_PFN_MASK);
504 }
505
506 /*
507  * Currently stuck as a macro due to indirect forward reference to
508  * linux/mmzone.h's __section_mem_map_addr() definition:
509  */
510 #define pmd_page(pmd)   pfn_to_page(pmd_val(pmd) >> PAGE_SHIFT)
511
512 /*
513  * the pmd page can be thought of an array like this: pmd_t[PTRS_PER_PMD]
514  *
515  * this macro returns the index of the entry in the pmd page which would
516  * control the given virtual address
517  */
518 static inline unsigned pmd_index(unsigned long address)
519 {
520         return (address >> PMD_SHIFT) & (PTRS_PER_PMD - 1);
521 }
522
523 /*
524  * Conversion functions: convert a page and protection to a page entry,
525  * and a page entry and page directory to the page they refer to.
526  *
527  * (Currently stuck as a macro because of indirect forward reference
528  * to linux/mm.h:page_to_nid())
529  */
530 #define mk_pte(page, pgprot)   pfn_pte(page_to_pfn(page), (pgprot))
531
532 /*
533  * the pte page can be thought of an array like this: pte_t[PTRS_PER_PTE]
534  *
535  * this function returns the index of the entry in the pte page which would
536  * control the given virtual address
537  */
538 static inline unsigned pte_index(unsigned long address)
539 {
540         return (address >> PAGE_SHIFT) & (PTRS_PER_PTE - 1);
541 }
542
543 static inline pte_t *pte_offset_kernel(pmd_t *pmd, unsigned long address)
544 {
545         return (pte_t *)pmd_page_vaddr(*pmd) + pte_index(address);
546 }
547
548 static inline int pmd_bad(pmd_t pmd)
549 {
550         return (pmd_flags(pmd) & ~_PAGE_USER) != _KERNPG_TABLE;
551 }
552
553 static inline unsigned long pages_to_mb(unsigned long npg)
554 {
555         return npg >> (20 - PAGE_SHIFT);
556 }
557
558 #define io_remap_pfn_range(vma, vaddr, pfn, size, prot) \
559         remap_pfn_range(vma, vaddr, pfn, size, prot)
560
561 #if PAGETABLE_LEVELS == 2
562 static inline int pud_large(pud_t pud)
563 {
564         return 0;
565 }
566 #endif
567
568 #if PAGETABLE_LEVELS > 2
569 static inline int pud_none(pud_t pud)
570 {
571         return native_pud_val(pud) == 0;
572 }
573
574 static inline int pud_present(pud_t pud)
575 {
576         return pud_flags(pud) & _PAGE_PRESENT;
577 }
578
579 static inline unsigned long pud_page_vaddr(pud_t pud)
580 {
581         return (unsigned long)__va((unsigned long)pud_val(pud) & PTE_PFN_MASK);
582 }
583
584 /*
585  * Currently stuck as a macro due to indirect forward reference to
586  * linux/mmzone.h's __section_mem_map_addr() definition:
587  */
588 #define pud_page(pud)           pfn_to_page(pud_val(pud) >> PAGE_SHIFT)
589
590 /* Find an entry in the second-level page table.. */
591 static inline pmd_t *pmd_offset(pud_t *pud, unsigned long address)
592 {
593         return (pmd_t *)pud_page_vaddr(*pud) + pmd_index(address);
594 }
595
596 static inline unsigned long pmd_pfn(pmd_t pmd)
597 {
598         return (pmd_val(pmd) & PTE_PFN_MASK) >> PAGE_SHIFT;
599 }
600
601 static inline int pud_large(pud_t pud)
602 {
603         return (pud_flags(pud) & (_PAGE_PSE | _PAGE_PRESENT)) ==
604                 (_PAGE_PSE | _PAGE_PRESENT);
605 }
606
607 static inline int pud_bad(pud_t pud)
608 {
609         return (pud_flags(pud) & ~(_KERNPG_TABLE | _PAGE_USER)) != 0;
610 }
611 #endif  /* PAGETABLE_LEVELS > 2 */
612
613 #if PAGETABLE_LEVELS > 3
614 static inline int pgd_present(pgd_t pgd)
615 {
616         return pgd_flags(pgd) & _PAGE_PRESENT;
617 }
618
619 static inline unsigned long pgd_page_vaddr(pgd_t pgd)
620 {
621         return (unsigned long)__va((unsigned long)pgd_val(pgd) & PTE_PFN_MASK);
622 }
623
624 /*
625  * Currently stuck as a macro due to indirect forward reference to
626  * linux/mmzone.h's __section_mem_map_addr() definition:
627  */
628 #define pgd_page(pgd)           pfn_to_page(pgd_val(pgd) >> PAGE_SHIFT)
629
630 /* to find an entry in a page-table-directory. */
631 static inline unsigned pud_index(unsigned long address)
632 {
633         return (address >> PUD_SHIFT) & (PTRS_PER_PUD - 1);
634 }
635
636 static inline pud_t *pud_offset(pgd_t *pgd, unsigned long address)
637 {
638         return (pud_t *)pgd_page_vaddr(*pgd) + pud_index(address);
639 }
640
641 static inline int pgd_bad(pgd_t pgd)
642 {
643         return (pgd_flags(pgd) & ~_PAGE_USER) != _KERNPG_TABLE;
644 }
645
646 static inline int pgd_none(pgd_t pgd)
647 {
648         return !native_pgd_val(pgd);
649 }
650 #endif  /* PAGETABLE_LEVELS > 3 */
651
652 #endif  /* __ASSEMBLY__ */
653
654 /*
655  * the pgd page can be thought of an array like this: pgd_t[PTRS_PER_PGD]
656  *
657  * this macro returns the index of the entry in the pgd page which would
658  * control the given virtual address
659  */
660 #define pgd_index(address) (((address) >> PGDIR_SHIFT) & (PTRS_PER_PGD - 1))
661
662 /*
663  * pgd_offset() returns a (pgd_t *)
664  * pgd_index() is used get the offset into the pgd page's array of pgd_t's;
665  */
666 #define pgd_offset(mm, address) ((mm)->pgd + pgd_index((address)))
667 /*
668  * a shortcut which implies the use of the kernel's pgd, instead
669  * of a process's
670  */
671 #define pgd_offset_k(address) pgd_offset(&init_mm, (address))
672
673
674 #define KERNEL_PGD_BOUNDARY     pgd_index(PAGE_OFFSET)
675 #define KERNEL_PGD_PTRS         (PTRS_PER_PGD - KERNEL_PGD_BOUNDARY)
676
677 #ifndef __ASSEMBLY__
678
679 enum {
680         PG_LEVEL_NONE,
681         PG_LEVEL_4K,
682         PG_LEVEL_2M,
683         PG_LEVEL_1G,
684         PG_LEVEL_NUM
685 };
686
687 #ifdef CONFIG_PROC_FS
688 extern void update_page_count(int level, unsigned long pages);
689 #else
690 static inline void update_page_count(int level, unsigned long pages) { }
691 #endif
692
693 /*
694  * Helper function that returns the kernel pagetable entry controlling
695  * the virtual address 'address'. NULL means no pagetable entry present.
696  * NOTE: the return type is pte_t but if the pmd is PSE then we return it
697  * as a pte too.
698  */
699 extern pte_t *lookup_address(unsigned long address, unsigned int *level);
700
701 /* local pte updates need not use xchg for locking */
702 static inline pte_t native_local_ptep_get_and_clear(pte_t *ptep)
703 {
704         pte_t res = *ptep;
705
706         /* Pure native function needs no input for mm, addr */
707         native_pte_clear(NULL, 0, ptep);
708         return res;
709 }
710
711 static inline void native_set_pte_at(struct mm_struct *mm, unsigned long addr,
712                                      pte_t *ptep , pte_t pte)
713 {
714         native_set_pte(ptep, pte);
715 }
716
717 #ifndef CONFIG_PARAVIRT
718 /*
719  * Rules for using pte_update - it must be called after any PTE update which
720  * has not been done using the set_pte / clear_pte interfaces.  It is used by
721  * shadow mode hypervisors to resynchronize the shadow page tables.  Kernel PTE
722  * updates should either be sets, clears, or set_pte_atomic for P->P
723  * transitions, which means this hook should only be called for user PTEs.
724  * This hook implies a P->P protection or access change has taken place, which
725  * requires a subsequent TLB flush.  The notification can optionally be delayed
726  * until the TLB flush event by using the pte_update_defer form of the
727  * interface, but care must be taken to assure that the flush happens while
728  * still holding the same page table lock so that the shadow and primary pages
729  * do not become out of sync on SMP.
730  */
731 #define pte_update(mm, addr, ptep)              do { } while (0)
732 #define pte_update_defer(mm, addr, ptep)        do { } while (0)
733 #endif
734
735 /*
736  * We only update the dirty/accessed state if we set
737  * the dirty bit by hand in the kernel, since the hardware
738  * will do the accessed bit for us, and we don't want to
739  * race with other CPU's that might be updating the dirty
740  * bit at the same time.
741  */
742 struct vm_area_struct;
743
744 #define  __HAVE_ARCH_PTEP_SET_ACCESS_FLAGS
745 extern int ptep_set_access_flags(struct vm_area_struct *vma,
746                                  unsigned long address, pte_t *ptep,
747                                  pte_t entry, int dirty);
748
749 #define __HAVE_ARCH_PTEP_TEST_AND_CLEAR_YOUNG
750 extern int ptep_test_and_clear_young(struct vm_area_struct *vma,
751                                      unsigned long addr, pte_t *ptep);
752
753 #define __HAVE_ARCH_PTEP_CLEAR_YOUNG_FLUSH
754 extern int ptep_clear_flush_young(struct vm_area_struct *vma,
755                                   unsigned long address, pte_t *ptep);
756
757 #define __HAVE_ARCH_PTEP_GET_AND_CLEAR
758 static inline pte_t ptep_get_and_clear(struct mm_struct *mm, unsigned long addr,
759                                        pte_t *ptep)
760 {
761         pte_t pte = native_ptep_get_and_clear(ptep);
762         pte_update(mm, addr, ptep);
763         return pte;
764 }
765
766 #define __HAVE_ARCH_PTEP_GET_AND_CLEAR_FULL
767 static inline pte_t ptep_get_and_clear_full(struct mm_struct *mm,
768                                             unsigned long addr, pte_t *ptep,
769                                             int full)
770 {
771         pte_t pte;
772         if (full) {
773                 /*
774                  * Full address destruction in progress; paravirt does not
775                  * care about updates and native needs no locking
776                  */
777                 pte = native_local_ptep_get_and_clear(ptep);
778         } else {
779                 pte = ptep_get_and_clear(mm, addr, ptep);
780         }
781         return pte;
782 }
783
784 #define __HAVE_ARCH_PTEP_SET_WRPROTECT
785 static inline void ptep_set_wrprotect(struct mm_struct *mm,
786                                       unsigned long addr, pte_t *ptep)
787 {
788         clear_bit(_PAGE_BIT_RW, (unsigned long *)&ptep->pte);
789         pte_update(mm, addr, ptep);
790 }
791
792 /*
793  * clone_pgd_range(pgd_t *dst, pgd_t *src, int count);
794  *
795  *  dst - pointer to pgd range anwhere on a pgd page
796  *  src - ""
797  *  count - the number of pgds to copy.
798  *
799  * dst and src can be on the same page, but the range must not overlap,
800  * and must not cross a page boundary.
801  */
802 static inline void clone_pgd_range(pgd_t *dst, pgd_t *src, int count)
803 {
804        memcpy(dst, src, count * sizeof(pgd_t));
805 }
806
807
808 #include <asm-generic/pgtable.h>
809 #endif  /* __ASSEMBLY__ */
810
811 #endif /* _ASM_X86_PGTABLE_H */