ACPI, APEI, Generic Hardware Error Source memory error support
authorHuang Ying <ying.huang@intel.com>
Tue, 18 May 2010 06:35:20 +0000 (14:35 +0800)
committerLen Brown <len.brown@intel.com>
Thu, 20 May 2010 02:41:16 +0000 (22:41 -0400)
commitd334a49113a4a33109fd24e46073280ecd1bea0d
treee6fd9acf0d143559186876173a3345d940ba0870
parent06d65deade9aabba58e0518df86dcd324e86b832
ACPI, APEI, Generic Hardware Error Source memory error support

Generic Hardware Error Source provides a way to report platform
hardware errors (such as that from chipset). It works in so called
"Firmware First" mode, that is, hardware errors are reported to
firmware firstly, then reported to Linux by firmware. This way, some
non-standard hardware error registers or non-standard hardware link
can be checked by firmware to produce more valuable hardware error
information for Linux.

Now, only SCI notification type and memory errors are supported. More
notification type and hardware error type will be added later. These
memory errors are reported to user space through /dev/mcelog via
faking a corrected Machine Check, so that the error memory page can be
offlined by /sbin/mcelog if the error count for one page is beyond the
threshold.

On some machines, Machine Check can not report physical address for
some corrected memory errors, but GHES can do that. So this simplified
GHES is implemented firstly.

Signed-off-by: Huang Ying <ying.huang@intel.com>
Signed-off-by: Andi Kleen <ak@linux.intel.com>
Signed-off-by: Len Brown <len.brown@intel.com>
arch/x86/include/asm/mce.h
arch/x86/kernel/cpu/mcheck/Makefile
arch/x86/kernel/cpu/mcheck/mce-apei.c [new file with mode: 0644]
drivers/acpi/apei/Kconfig
drivers/acpi/apei/Makefile
drivers/acpi/apei/ghes.c [new file with mode: 0644]