IB/mlx4: Add support for IBoE
[pandora-kernel.git] / drivers / infiniband / hw / mlx4 / ah.c
1 /*
2  * Copyright (c) 2007 Cisco Systems, Inc. All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  */
32
33 #include <rdma/ib_addr.h>
34
35 #include <linux/slab.h>
36 #include <linux/inet.h>
37 #include <linux/string.h>
38
39 #include "mlx4_ib.h"
40
41 int mlx4_ib_resolve_grh(struct mlx4_ib_dev *dev, const struct ib_ah_attr *ah_attr,
42                         u8 *mac, int *is_mcast, u8 port)
43 {
44         struct in6_addr in6;
45
46         *is_mcast = 0;
47
48         memcpy(&in6, ah_attr->grh.dgid.raw, sizeof in6);
49         if (rdma_link_local_addr(&in6))
50                 rdma_get_ll_mac(&in6, mac);
51         else if (rdma_is_multicast_addr(&in6)) {
52                 rdma_get_mcast_mac(&in6, mac);
53                 *is_mcast = 1;
54         } else
55                 return -EINVAL;
56
57         return 0;
58 }
59
60 static struct ib_ah *create_ib_ah(struct ib_pd *pd, struct ib_ah_attr *ah_attr,
61                                   struct mlx4_ib_ah *ah)
62 {
63         struct mlx4_dev *dev = to_mdev(pd->device)->dev;
64
65         ah->av.ib.port_pd = cpu_to_be32(to_mpd(pd)->pdn | (ah_attr->port_num << 24));
66         ah->av.ib.g_slid  = ah_attr->src_path_bits;
67         if (ah_attr->ah_flags & IB_AH_GRH) {
68                 ah->av.ib.g_slid   |= 0x80;
69                 ah->av.ib.gid_index = ah_attr->grh.sgid_index;
70                 ah->av.ib.hop_limit = ah_attr->grh.hop_limit;
71                 ah->av.ib.sl_tclass_flowlabel |=
72                         cpu_to_be32((ah_attr->grh.traffic_class << 20) |
73                                     ah_attr->grh.flow_label);
74                 memcpy(ah->av.ib.dgid, ah_attr->grh.dgid.raw, 16);
75         }
76
77         ah->av.ib.dlid    = cpu_to_be16(ah_attr->dlid);
78         if (ah_attr->static_rate) {
79                 ah->av.ib.stat_rate = ah_attr->static_rate + MLX4_STAT_RATE_OFFSET;
80                 while (ah->av.ib.stat_rate > IB_RATE_2_5_GBPS + MLX4_STAT_RATE_OFFSET &&
81                        !(1 << ah->av.ib.stat_rate & dev->caps.stat_rate_support))
82                         --ah->av.ib.stat_rate;
83         }
84         ah->av.ib.sl_tclass_flowlabel = cpu_to_be32(ah_attr->sl << 28);
85
86         return &ah->ibah;
87 }
88
89 static struct ib_ah *create_iboe_ah(struct ib_pd *pd, struct ib_ah_attr *ah_attr,
90                                     struct mlx4_ib_ah *ah)
91 {
92         struct mlx4_ib_dev *ibdev = to_mdev(pd->device);
93         struct mlx4_dev *dev = ibdev->dev;
94         u8 mac[6];
95         int err;
96         int is_mcast;
97
98         err = mlx4_ib_resolve_grh(ibdev, ah_attr, mac, &is_mcast, ah_attr->port_num);
99         if (err)
100                 return ERR_PTR(err);
101
102         memcpy(ah->av.eth.mac, mac, 6);
103         ah->av.eth.port_pd = cpu_to_be32(to_mpd(pd)->pdn | (ah_attr->port_num << 24));
104         ah->av.eth.gid_index = ah_attr->grh.sgid_index;
105         if (ah_attr->static_rate) {
106                 ah->av.eth.stat_rate = ah_attr->static_rate + MLX4_STAT_RATE_OFFSET;
107                 while (ah->av.eth.stat_rate > IB_RATE_2_5_GBPS + MLX4_STAT_RATE_OFFSET &&
108                        !(1 << ah->av.eth.stat_rate & dev->caps.stat_rate_support))
109                         --ah->av.eth.stat_rate;
110         }
111
112         /*
113          * HW requires multicast LID so we just choose one.
114          */
115         if (is_mcast)
116                 ah->av.ib.dlid = cpu_to_be16(0xc000);
117
118         memcpy(ah->av.eth.dgid, ah_attr->grh.dgid.raw, 16);
119         ah->av.eth.sl_tclass_flowlabel = cpu_to_be32(ah_attr->sl << 28);
120
121         return &ah->ibah;
122 }
123
124 struct ib_ah *mlx4_ib_create_ah(struct ib_pd *pd, struct ib_ah_attr *ah_attr)
125 {
126         struct mlx4_ib_ah *ah;
127         struct ib_ah *ret;
128
129         ah = kzalloc(sizeof *ah, GFP_ATOMIC);
130         if (!ah)
131                 return ERR_PTR(-ENOMEM);
132
133         if (rdma_port_get_link_layer(pd->device, ah_attr->port_num) == IB_LINK_LAYER_ETHERNET) {
134                 if (!(ah_attr->ah_flags & IB_AH_GRH)) {
135                         ret = ERR_PTR(-EINVAL);
136                 } else {
137                         /*
138                          * TBD: need to handle the case when we get
139                          * called in an atomic context and there we
140                          * might sleep.  We don't expect this
141                          * currently since we're working with link
142                          * local addresses which we can translate
143                          * without going to sleep.
144                          */
145                         ret = create_iboe_ah(pd, ah_attr, ah);
146                 }
147
148                 if (IS_ERR(ret))
149                         kfree(ah);
150
151                 return ret;
152         } else
153                 return create_ib_ah(pd, ah_attr, ah); /* never fails */
154 }
155
156 int mlx4_ib_query_ah(struct ib_ah *ibah, struct ib_ah_attr *ah_attr)
157 {
158         struct mlx4_ib_ah *ah = to_mah(ibah);
159         enum rdma_link_layer ll;
160
161         memset(ah_attr, 0, sizeof *ah_attr);
162         ah_attr->sl = be32_to_cpu(ah->av.ib.sl_tclass_flowlabel) >> 28;
163         ah_attr->port_num = be32_to_cpu(ah->av.ib.port_pd) >> 24;
164         ll = rdma_port_get_link_layer(ibah->device, ah_attr->port_num);
165         ah_attr->dlid = ll == IB_LINK_LAYER_INFINIBAND ? be16_to_cpu(ah->av.ib.dlid) : 0;
166         if (ah->av.ib.stat_rate)
167                 ah_attr->static_rate = ah->av.ib.stat_rate - MLX4_STAT_RATE_OFFSET;
168         ah_attr->src_path_bits = ah->av.ib.g_slid & 0x7F;
169
170         if (mlx4_ib_ah_grh_present(ah)) {
171                 ah_attr->ah_flags = IB_AH_GRH;
172
173                 ah_attr->grh.traffic_class =
174                         be32_to_cpu(ah->av.ib.sl_tclass_flowlabel) >> 20;
175                 ah_attr->grh.flow_label =
176                         be32_to_cpu(ah->av.ib.sl_tclass_flowlabel) & 0xfffff;
177                 ah_attr->grh.hop_limit  = ah->av.ib.hop_limit;
178                 ah_attr->grh.sgid_index = ah->av.ib.gid_index;
179                 memcpy(ah_attr->grh.dgid.raw, ah->av.ib.dgid, 16);
180         }
181
182         return 0;
183 }
184
185 int mlx4_ib_destroy_ah(struct ib_ah *ah)
186 {
187         kfree(to_mah(ah));
188         return 0;
189 }