Merge branch 'oprofile-for-linus' of git://git.kernel.org/pub/scm/linux/kernel/git...
[pandora-kernel.git] / drivers / infiniband / hw / mthca / mthca_catas.c
1 /*
2  * Copyright (c) 2005 Cisco Systems.  All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  */
32
33 #include <linux/jiffies.h>
34 #include <linux/timer.h>
35 #include <linux/workqueue.h>
36
37 #include "mthca_dev.h"
38
39 enum {
40         MTHCA_CATAS_POLL_INTERVAL       = 5 * HZ,
41
42         MTHCA_CATAS_TYPE_INTERNAL       = 0,
43         MTHCA_CATAS_TYPE_UPLINK         = 3,
44         MTHCA_CATAS_TYPE_DDR            = 4,
45         MTHCA_CATAS_TYPE_PARITY         = 5,
46 };
47
48 static DEFINE_SPINLOCK(catas_lock);
49
50 static LIST_HEAD(catas_list);
51 static struct workqueue_struct *catas_wq;
52 static struct work_struct catas_work;
53
54 static int catas_reset_disable;
55 module_param_named(catas_reset_disable, catas_reset_disable, int, 0644);
56 MODULE_PARM_DESC(catas_reset_disable, "disable reset on catastrophic event if nonzero");
57
58 static void catas_reset(struct work_struct *work)
59 {
60         struct mthca_dev *dev, *tmpdev;
61         LIST_HEAD(tlist);
62         int ret;
63
64         mutex_lock(&mthca_device_mutex);
65
66         spin_lock_irq(&catas_lock);
67         list_splice_init(&catas_list, &tlist);
68         spin_unlock_irq(&catas_lock);
69
70         list_for_each_entry_safe(dev, tmpdev, &tlist, catas_err.list) {
71                 ret = __mthca_restart_one(dev->pdev);
72                 if (ret)
73                         mthca_err(dev, "Reset failed (%d)\n", ret);
74                 else
75                         mthca_dbg(dev, "Reset succeeded\n");
76         }
77
78         mutex_unlock(&mthca_device_mutex);
79 }
80
81 static void handle_catas(struct mthca_dev *dev)
82 {
83         struct ib_event event;
84         unsigned long flags;
85         const char *type;
86         int i;
87
88         event.device = &dev->ib_dev;
89         event.event  = IB_EVENT_DEVICE_FATAL;
90         event.element.port_num = 0;
91         dev->active = false;
92
93         ib_dispatch_event(&event);
94
95         switch (swab32(readl(dev->catas_err.map)) >> 24) {
96         case MTHCA_CATAS_TYPE_INTERNAL:
97                 type = "internal error";
98                 break;
99         case MTHCA_CATAS_TYPE_UPLINK:
100                 type = "uplink bus error";
101                 break;
102         case MTHCA_CATAS_TYPE_DDR:
103                 type = "DDR data error";
104                 break;
105         case MTHCA_CATAS_TYPE_PARITY:
106                 type = "internal parity error";
107                 break;
108         default:
109                 type = "unknown error";
110                 break;
111         }
112
113         mthca_err(dev, "Catastrophic error detected: %s\n", type);
114         for (i = 0; i < dev->catas_err.size; ++i)
115                 mthca_err(dev, "  buf[%02x]: %08x\n",
116                           i, swab32(readl(dev->catas_err.map + i)));
117
118         if (catas_reset_disable)
119                 return;
120
121         spin_lock_irqsave(&catas_lock, flags);
122         list_add(&dev->catas_err.list, &catas_list);
123         queue_work(catas_wq, &catas_work);
124         spin_unlock_irqrestore(&catas_lock, flags);
125 }
126
127 static void poll_catas(unsigned long dev_ptr)
128 {
129         struct mthca_dev *dev = (struct mthca_dev *) dev_ptr;
130         int i;
131
132         for (i = 0; i < dev->catas_err.size; ++i)
133                 if (readl(dev->catas_err.map + i)) {
134                         handle_catas(dev);
135                         return;
136                 }
137
138         mod_timer(&dev->catas_err.timer,
139                   round_jiffies(jiffies + MTHCA_CATAS_POLL_INTERVAL));
140 }
141
142 void mthca_start_catas_poll(struct mthca_dev *dev)
143 {
144         unsigned long addr;
145
146         init_timer(&dev->catas_err.timer);
147         dev->catas_err.map  = NULL;
148
149         addr = pci_resource_start(dev->pdev, 0) +
150                 ((pci_resource_len(dev->pdev, 0) - 1) &
151                  dev->catas_err.addr);
152
153         dev->catas_err.map = ioremap(addr, dev->catas_err.size * 4);
154         if (!dev->catas_err.map) {
155                 mthca_warn(dev, "couldn't map catastrophic error region "
156                            "at 0x%lx/0x%x\n", addr, dev->catas_err.size * 4);
157                 return;
158         }
159
160         dev->catas_err.timer.data     = (unsigned long) dev;
161         dev->catas_err.timer.function = poll_catas;
162         dev->catas_err.timer.expires  = jiffies + MTHCA_CATAS_POLL_INTERVAL;
163         INIT_LIST_HEAD(&dev->catas_err.list);
164         add_timer(&dev->catas_err.timer);
165 }
166
167 void mthca_stop_catas_poll(struct mthca_dev *dev)
168 {
169         del_timer_sync(&dev->catas_err.timer);
170
171         if (dev->catas_err.map)
172                 iounmap(dev->catas_err.map);
173
174         spin_lock_irq(&catas_lock);
175         list_del(&dev->catas_err.list);
176         spin_unlock_irq(&catas_lock);
177 }
178
179 int __init mthca_catas_init(void)
180 {
181         INIT_WORK(&catas_work, catas_reset);
182
183         catas_wq = create_singlethread_workqueue("mthca_catas");
184         if (!catas_wq)
185                 return -ENOMEM;
186
187         return 0;
188 }
189
190 void mthca_catas_cleanup(void)
191 {
192         destroy_workqueue(catas_wq);
193 }