drbd: merge_bvec_fn: properly remap bvm->bi_bdev
[pandora-kernel.git] / drivers / pci / probe.c
1 /*
2  * probe.c - PCI detection and setup code
3  */
4
5 #include <linux/kernel.h>
6 #include <linux/delay.h>
7 #include <linux/init.h>
8 #include <linux/pci.h>
9 #include <linux/slab.h>
10 #include <linux/module.h>
11 #include <linux/cpumask.h>
12 #include <linux/pci-aspm.h>
13 #include "pci.h"
14
15 #define CARDBUS_LATENCY_TIMER   176     /* secondary latency timer */
16 #define CARDBUS_RESERVE_BUSNR   3
17
18 /* Ugh.  Need to stop exporting this to modules. */
19 LIST_HEAD(pci_root_buses);
20 EXPORT_SYMBOL(pci_root_buses);
21
22
23 static int find_anything(struct device *dev, void *data)
24 {
25         return 1;
26 }
27
28 /*
29  * Some device drivers need know if pci is initiated.
30  * Basically, we think pci is not initiated when there
31  * is no device to be found on the pci_bus_type.
32  */
33 int no_pci_devices(void)
34 {
35         struct device *dev;
36         int no_devices;
37
38         dev = bus_find_device(&pci_bus_type, NULL, NULL, find_anything);
39         no_devices = (dev == NULL);
40         put_device(dev);
41         return no_devices;
42 }
43 EXPORT_SYMBOL(no_pci_devices);
44
45 /*
46  * PCI Bus Class
47  */
48 static void release_pcibus_dev(struct device *dev)
49 {
50         struct pci_bus *pci_bus = to_pci_bus(dev);
51
52         if (pci_bus->bridge)
53                 put_device(pci_bus->bridge);
54         pci_bus_remove_resources(pci_bus);
55         pci_release_bus_of_node(pci_bus);
56         kfree(pci_bus);
57 }
58
59 static struct class pcibus_class = {
60         .name           = "pci_bus",
61         .dev_release    = &release_pcibus_dev,
62         .dev_attrs      = pcibus_dev_attrs,
63 };
64
65 static int __init pcibus_class_init(void)
66 {
67         return class_register(&pcibus_class);
68 }
69 postcore_initcall(pcibus_class_init);
70
71 static u64 pci_size(u64 base, u64 maxbase, u64 mask)
72 {
73         u64 size = mask & maxbase;      /* Find the significant bits */
74         if (!size)
75                 return 0;
76
77         /* Get the lowest of them to find the decode size, and
78            from that the extent.  */
79         size = (size & ~(size-1)) - 1;
80
81         /* base == maxbase can be valid only if the BAR has
82            already been programmed with all 1s.  */
83         if (base == maxbase && ((base | size) & mask) != mask)
84                 return 0;
85
86         return size;
87 }
88
89 static inline unsigned long decode_bar(struct pci_dev *dev, u32 bar)
90 {
91         u32 mem_type;
92         unsigned long flags;
93
94         if ((bar & PCI_BASE_ADDRESS_SPACE) == PCI_BASE_ADDRESS_SPACE_IO) {
95                 flags = bar & ~PCI_BASE_ADDRESS_IO_MASK;
96                 flags |= IORESOURCE_IO;
97                 return flags;
98         }
99
100         flags = bar & ~PCI_BASE_ADDRESS_MEM_MASK;
101         flags |= IORESOURCE_MEM;
102         if (flags & PCI_BASE_ADDRESS_MEM_PREFETCH)
103                 flags |= IORESOURCE_PREFETCH;
104
105         mem_type = bar & PCI_BASE_ADDRESS_MEM_TYPE_MASK;
106         switch (mem_type) {
107         case PCI_BASE_ADDRESS_MEM_TYPE_32:
108                 break;
109         case PCI_BASE_ADDRESS_MEM_TYPE_1M:
110                 dev_info(&dev->dev, "1M mem BAR treated as 32-bit BAR\n");
111                 break;
112         case PCI_BASE_ADDRESS_MEM_TYPE_64:
113                 flags |= IORESOURCE_MEM_64;
114                 break;
115         default:
116                 dev_warn(&dev->dev,
117                          "mem unknown type %x treated as 32-bit BAR\n",
118                          mem_type);
119                 break;
120         }
121         return flags;
122 }
123
124 /**
125  * pci_read_base - read a PCI BAR
126  * @dev: the PCI device
127  * @type: type of the BAR
128  * @res: resource buffer to be filled in
129  * @pos: BAR position in the config space
130  *
131  * Returns 1 if the BAR is 64-bit, or 0 if 32-bit.
132  */
133 int __pci_read_base(struct pci_dev *dev, enum pci_bar_type type,
134                         struct resource *res, unsigned int pos)
135 {
136         u32 l, sz, mask;
137         u16 orig_cmd;
138
139         mask = type ? PCI_ROM_ADDRESS_MASK : ~0;
140
141         if (!dev->mmio_always_on) {
142                 pci_read_config_word(dev, PCI_COMMAND, &orig_cmd);
143                 pci_write_config_word(dev, PCI_COMMAND,
144                         orig_cmd & ~(PCI_COMMAND_MEMORY | PCI_COMMAND_IO));
145         }
146
147         res->name = pci_name(dev);
148
149         pci_read_config_dword(dev, pos, &l);
150         pci_write_config_dword(dev, pos, l | mask);
151         pci_read_config_dword(dev, pos, &sz);
152         pci_write_config_dword(dev, pos, l);
153
154         if (!dev->mmio_always_on)
155                 pci_write_config_word(dev, PCI_COMMAND, orig_cmd);
156
157         /*
158          * All bits set in sz means the device isn't working properly.
159          * If the BAR isn't implemented, all bits must be 0.  If it's a
160          * memory BAR or a ROM, bit 0 must be clear; if it's an io BAR, bit
161          * 1 must be clear.
162          */
163         if (!sz || sz == 0xffffffff)
164                 goto fail;
165
166         /*
167          * I don't know how l can have all bits set.  Copied from old code.
168          * Maybe it fixes a bug on some ancient platform.
169          */
170         if (l == 0xffffffff)
171                 l = 0;
172
173         if (type == pci_bar_unknown) {
174                 res->flags = decode_bar(dev, l);
175                 res->flags |= IORESOURCE_SIZEALIGN;
176                 if (res->flags & IORESOURCE_IO) {
177                         l &= PCI_BASE_ADDRESS_IO_MASK;
178                         mask = PCI_BASE_ADDRESS_IO_MASK & (u32) IO_SPACE_LIMIT;
179                 } else {
180                         l &= PCI_BASE_ADDRESS_MEM_MASK;
181                         mask = (u32)PCI_BASE_ADDRESS_MEM_MASK;
182                 }
183         } else {
184                 res->flags |= (l & IORESOURCE_ROM_ENABLE);
185                 l &= PCI_ROM_ADDRESS_MASK;
186                 mask = (u32)PCI_ROM_ADDRESS_MASK;
187         }
188
189         if (res->flags & IORESOURCE_MEM_64) {
190                 u64 l64 = l;
191                 u64 sz64 = sz;
192                 u64 mask64 = mask | (u64)~0 << 32;
193
194                 pci_read_config_dword(dev, pos + 4, &l);
195                 pci_write_config_dword(dev, pos + 4, ~0);
196                 pci_read_config_dword(dev, pos + 4, &sz);
197                 pci_write_config_dword(dev, pos + 4, l);
198
199                 l64 |= ((u64)l << 32);
200                 sz64 |= ((u64)sz << 32);
201
202                 sz64 = pci_size(l64, sz64, mask64);
203
204                 if (!sz64)
205                         goto fail;
206
207                 if ((sizeof(resource_size_t) < 8) && (sz64 > 0x100000000ULL)) {
208                         dev_err(&dev->dev, "reg %x: can't handle 64-bit BAR\n",
209                                 pos);
210                         goto fail;
211                 }
212
213                 if ((sizeof(resource_size_t) < 8) && l) {
214                         /* Address above 32-bit boundary; disable the BAR */
215                         pci_write_config_dword(dev, pos, 0);
216                         pci_write_config_dword(dev, pos + 4, 0);
217                         res->start = 0;
218                         res->end = sz64;
219                 } else {
220                         res->start = l64;
221                         res->end = l64 + sz64;
222                         dev_printk(KERN_DEBUG, &dev->dev, "reg %x: %pR\n",
223                                    pos, res);
224                 }
225         } else {
226                 sz = pci_size(l, sz, mask);
227
228                 if (!sz)
229                         goto fail;
230
231                 res->start = l;
232                 res->end = l + sz;
233
234                 dev_printk(KERN_DEBUG, &dev->dev, "reg %x: %pR\n", pos, res);
235         }
236
237  out:
238         return (res->flags & IORESOURCE_MEM_64) ? 1 : 0;
239  fail:
240         res->flags = 0;
241         goto out;
242 }
243
244 static void pci_read_bases(struct pci_dev *dev, unsigned int howmany, int rom)
245 {
246         unsigned int pos, reg;
247
248         for (pos = 0; pos < howmany; pos++) {
249                 struct resource *res = &dev->resource[pos];
250                 reg = PCI_BASE_ADDRESS_0 + (pos << 2);
251                 pos += __pci_read_base(dev, pci_bar_unknown, res, reg);
252         }
253
254         if (rom) {
255                 struct resource *res = &dev->resource[PCI_ROM_RESOURCE];
256                 dev->rom_base_reg = rom;
257                 res->flags = IORESOURCE_MEM | IORESOURCE_PREFETCH |
258                                 IORESOURCE_READONLY | IORESOURCE_CACHEABLE |
259                                 IORESOURCE_SIZEALIGN;
260                 __pci_read_base(dev, pci_bar_mem32, res, rom);
261         }
262 }
263
264 static void __devinit pci_read_bridge_io(struct pci_bus *child)
265 {
266         struct pci_dev *dev = child->self;
267         u8 io_base_lo, io_limit_lo;
268         unsigned long base, limit;
269         struct resource *res;
270
271         res = child->resource[0];
272         pci_read_config_byte(dev, PCI_IO_BASE, &io_base_lo);
273         pci_read_config_byte(dev, PCI_IO_LIMIT, &io_limit_lo);
274         base = (io_base_lo & PCI_IO_RANGE_MASK) << 8;
275         limit = (io_limit_lo & PCI_IO_RANGE_MASK) << 8;
276
277         if ((io_base_lo & PCI_IO_RANGE_TYPE_MASK) == PCI_IO_RANGE_TYPE_32) {
278                 u16 io_base_hi, io_limit_hi;
279                 pci_read_config_word(dev, PCI_IO_BASE_UPPER16, &io_base_hi);
280                 pci_read_config_word(dev, PCI_IO_LIMIT_UPPER16, &io_limit_hi);
281                 base |= (io_base_hi << 16);
282                 limit |= (io_limit_hi << 16);
283         }
284
285         if (base && base <= limit) {
286                 res->flags = (io_base_lo & PCI_IO_RANGE_TYPE_MASK) | IORESOURCE_IO;
287                 if (!res->start)
288                         res->start = base;
289                 if (!res->end)
290                         res->end = limit + 0xfff;
291                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
292         }
293 }
294
295 static void __devinit pci_read_bridge_mmio(struct pci_bus *child)
296 {
297         struct pci_dev *dev = child->self;
298         u16 mem_base_lo, mem_limit_lo;
299         unsigned long base, limit;
300         struct resource *res;
301
302         res = child->resource[1];
303         pci_read_config_word(dev, PCI_MEMORY_BASE, &mem_base_lo);
304         pci_read_config_word(dev, PCI_MEMORY_LIMIT, &mem_limit_lo);
305         base = (mem_base_lo & PCI_MEMORY_RANGE_MASK) << 16;
306         limit = (mem_limit_lo & PCI_MEMORY_RANGE_MASK) << 16;
307         if (base && base <= limit) {
308                 res->flags = (mem_base_lo & PCI_MEMORY_RANGE_TYPE_MASK) | IORESOURCE_MEM;
309                 res->start = base;
310                 res->end = limit + 0xfffff;
311                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
312         }
313 }
314
315 static void __devinit pci_read_bridge_mmio_pref(struct pci_bus *child)
316 {
317         struct pci_dev *dev = child->self;
318         u16 mem_base_lo, mem_limit_lo;
319         unsigned long base, limit;
320         struct resource *res;
321
322         res = child->resource[2];
323         pci_read_config_word(dev, PCI_PREF_MEMORY_BASE, &mem_base_lo);
324         pci_read_config_word(dev, PCI_PREF_MEMORY_LIMIT, &mem_limit_lo);
325         base = (mem_base_lo & PCI_PREF_RANGE_MASK) << 16;
326         limit = (mem_limit_lo & PCI_PREF_RANGE_MASK) << 16;
327
328         if ((mem_base_lo & PCI_PREF_RANGE_TYPE_MASK) == PCI_PREF_RANGE_TYPE_64) {
329                 u32 mem_base_hi, mem_limit_hi;
330                 pci_read_config_dword(dev, PCI_PREF_BASE_UPPER32, &mem_base_hi);
331                 pci_read_config_dword(dev, PCI_PREF_LIMIT_UPPER32, &mem_limit_hi);
332
333                 /*
334                  * Some bridges set the base > limit by default, and some
335                  * (broken) BIOSes do not initialize them.  If we find
336                  * this, just assume they are not being used.
337                  */
338                 if (mem_base_hi <= mem_limit_hi) {
339 #if BITS_PER_LONG == 64
340                         base |= ((long) mem_base_hi) << 32;
341                         limit |= ((long) mem_limit_hi) << 32;
342 #else
343                         if (mem_base_hi || mem_limit_hi) {
344                                 dev_err(&dev->dev, "can't handle 64-bit "
345                                         "address space for bridge\n");
346                                 return;
347                         }
348 #endif
349                 }
350         }
351         if (base && base <= limit) {
352                 res->flags = (mem_base_lo & PCI_PREF_RANGE_TYPE_MASK) |
353                                          IORESOURCE_MEM | IORESOURCE_PREFETCH;
354                 if (res->flags & PCI_PREF_RANGE_TYPE_64)
355                         res->flags |= IORESOURCE_MEM_64;
356                 res->start = base;
357                 res->end = limit + 0xfffff;
358                 dev_printk(KERN_DEBUG, &dev->dev, "  bridge window %pR\n", res);
359         }
360 }
361
362 void __devinit pci_read_bridge_bases(struct pci_bus *child)
363 {
364         struct pci_dev *dev = child->self;
365         struct resource *res;
366         int i;
367
368         if (pci_is_root_bus(child))     /* It's a host bus, nothing to read */
369                 return;
370
371         dev_info(&dev->dev, "PCI bridge to [bus %02x-%02x]%s\n",
372                  child->secondary, child->subordinate,
373                  dev->transparent ? " (subtractive decode)" : "");
374
375         pci_bus_remove_resources(child);
376         for (i = 0; i < PCI_BRIDGE_RESOURCE_NUM; i++)
377                 child->resource[i] = &dev->resource[PCI_BRIDGE_RESOURCES+i];
378
379         pci_read_bridge_io(child);
380         pci_read_bridge_mmio(child);
381         pci_read_bridge_mmio_pref(child);
382
383         if (dev->transparent) {
384                 pci_bus_for_each_resource(child->parent, res, i) {
385                         if (res) {
386                                 pci_bus_add_resource(child, res,
387                                                      PCI_SUBTRACTIVE_DECODE);
388                                 dev_printk(KERN_DEBUG, &dev->dev,
389                                            "  bridge window %pR (subtractive decode)\n",
390                                            res);
391                         }
392                 }
393         }
394 }
395
396 static struct pci_bus * pci_alloc_bus(void)
397 {
398         struct pci_bus *b;
399
400         b = kzalloc(sizeof(*b), GFP_KERNEL);
401         if (b) {
402                 INIT_LIST_HEAD(&b->node);
403                 INIT_LIST_HEAD(&b->children);
404                 INIT_LIST_HEAD(&b->devices);
405                 INIT_LIST_HEAD(&b->slots);
406                 INIT_LIST_HEAD(&b->resources);
407                 b->max_bus_speed = PCI_SPEED_UNKNOWN;
408                 b->cur_bus_speed = PCI_SPEED_UNKNOWN;
409         }
410         return b;
411 }
412
413 static unsigned char pcix_bus_speed[] = {
414         PCI_SPEED_UNKNOWN,              /* 0 */
415         PCI_SPEED_66MHz_PCIX,           /* 1 */
416         PCI_SPEED_100MHz_PCIX,          /* 2 */
417         PCI_SPEED_133MHz_PCIX,          /* 3 */
418         PCI_SPEED_UNKNOWN,              /* 4 */
419         PCI_SPEED_66MHz_PCIX_ECC,       /* 5 */
420         PCI_SPEED_100MHz_PCIX_ECC,      /* 6 */
421         PCI_SPEED_133MHz_PCIX_ECC,      /* 7 */
422         PCI_SPEED_UNKNOWN,              /* 8 */
423         PCI_SPEED_66MHz_PCIX_266,       /* 9 */
424         PCI_SPEED_100MHz_PCIX_266,      /* A */
425         PCI_SPEED_133MHz_PCIX_266,      /* B */
426         PCI_SPEED_UNKNOWN,              /* C */
427         PCI_SPEED_66MHz_PCIX_533,       /* D */
428         PCI_SPEED_100MHz_PCIX_533,      /* E */
429         PCI_SPEED_133MHz_PCIX_533       /* F */
430 };
431
432 static unsigned char pcie_link_speed[] = {
433         PCI_SPEED_UNKNOWN,              /* 0 */
434         PCIE_SPEED_2_5GT,               /* 1 */
435         PCIE_SPEED_5_0GT,               /* 2 */
436         PCIE_SPEED_8_0GT,               /* 3 */
437         PCI_SPEED_UNKNOWN,              /* 4 */
438         PCI_SPEED_UNKNOWN,              /* 5 */
439         PCI_SPEED_UNKNOWN,              /* 6 */
440         PCI_SPEED_UNKNOWN,              /* 7 */
441         PCI_SPEED_UNKNOWN,              /* 8 */
442         PCI_SPEED_UNKNOWN,              /* 9 */
443         PCI_SPEED_UNKNOWN,              /* A */
444         PCI_SPEED_UNKNOWN,              /* B */
445         PCI_SPEED_UNKNOWN,              /* C */
446         PCI_SPEED_UNKNOWN,              /* D */
447         PCI_SPEED_UNKNOWN,              /* E */
448         PCI_SPEED_UNKNOWN               /* F */
449 };
450
451 void pcie_update_link_speed(struct pci_bus *bus, u16 linksta)
452 {
453         bus->cur_bus_speed = pcie_link_speed[linksta & 0xf];
454 }
455 EXPORT_SYMBOL_GPL(pcie_update_link_speed);
456
457 static unsigned char agp_speeds[] = {
458         AGP_UNKNOWN,
459         AGP_1X,
460         AGP_2X,
461         AGP_4X,
462         AGP_8X
463 };
464
465 static enum pci_bus_speed agp_speed(int agp3, int agpstat)
466 {
467         int index = 0;
468
469         if (agpstat & 4)
470                 index = 3;
471         else if (agpstat & 2)
472                 index = 2;
473         else if (agpstat & 1)
474                 index = 1;
475         else
476                 goto out;
477         
478         if (agp3) {
479                 index += 2;
480                 if (index == 5)
481                         index = 0;
482         }
483
484  out:
485         return agp_speeds[index];
486 }
487
488
489 static void pci_set_bus_speed(struct pci_bus *bus)
490 {
491         struct pci_dev *bridge = bus->self;
492         int pos;
493
494         pos = pci_find_capability(bridge, PCI_CAP_ID_AGP);
495         if (!pos)
496                 pos = pci_find_capability(bridge, PCI_CAP_ID_AGP3);
497         if (pos) {
498                 u32 agpstat, agpcmd;
499
500                 pci_read_config_dword(bridge, pos + PCI_AGP_STATUS, &agpstat);
501                 bus->max_bus_speed = agp_speed(agpstat & 8, agpstat & 7);
502
503                 pci_read_config_dword(bridge, pos + PCI_AGP_COMMAND, &agpcmd);
504                 bus->cur_bus_speed = agp_speed(agpstat & 8, agpcmd & 7);
505         }
506
507         pos = pci_find_capability(bridge, PCI_CAP_ID_PCIX);
508         if (pos) {
509                 u16 status;
510                 enum pci_bus_speed max;
511                 pci_read_config_word(bridge, pos + 2, &status);
512
513                 if (status & 0x8000) {
514                         max = PCI_SPEED_133MHz_PCIX_533;
515                 } else if (status & 0x4000) {
516                         max = PCI_SPEED_133MHz_PCIX_266;
517                 } else if (status & 0x0002) {
518                         if (((status >> 12) & 0x3) == 2) {
519                                 max = PCI_SPEED_133MHz_PCIX_ECC;
520                         } else {
521                                 max = PCI_SPEED_133MHz_PCIX;
522                         }
523                 } else {
524                         max = PCI_SPEED_66MHz_PCIX;
525                 }
526
527                 bus->max_bus_speed = max;
528                 bus->cur_bus_speed = pcix_bus_speed[(status >> 6) & 0xf];
529
530                 return;
531         }
532
533         pos = pci_find_capability(bridge, PCI_CAP_ID_EXP);
534         if (pos) {
535                 u32 linkcap;
536                 u16 linksta;
537
538                 pci_read_config_dword(bridge, pos + PCI_EXP_LNKCAP, &linkcap);
539                 bus->max_bus_speed = pcie_link_speed[linkcap & 0xf];
540
541                 pci_read_config_word(bridge, pos + PCI_EXP_LNKSTA, &linksta);
542                 pcie_update_link_speed(bus, linksta);
543         }
544 }
545
546
547 static struct pci_bus *pci_alloc_child_bus(struct pci_bus *parent,
548                                            struct pci_dev *bridge, int busnr)
549 {
550         struct pci_bus *child;
551         int i;
552
553         /*
554          * Allocate a new bus, and inherit stuff from the parent..
555          */
556         child = pci_alloc_bus();
557         if (!child)
558                 return NULL;
559
560         child->parent = parent;
561         child->ops = parent->ops;
562         child->sysdata = parent->sysdata;
563         child->bus_flags = parent->bus_flags;
564
565         /* initialize some portions of the bus device, but don't register it
566          * now as the parent is not properly set up yet.  This device will get
567          * registered later in pci_bus_add_devices()
568          */
569         child->dev.class = &pcibus_class;
570         dev_set_name(&child->dev, "%04x:%02x", pci_domain_nr(child), busnr);
571
572         /*
573          * Set up the primary, secondary and subordinate
574          * bus numbers.
575          */
576         child->number = child->secondary = busnr;
577         child->primary = parent->secondary;
578         child->subordinate = 0xff;
579
580         if (!bridge)
581                 return child;
582
583         child->self = bridge;
584         child->bridge = get_device(&bridge->dev);
585         pci_set_bus_of_node(child);
586         pci_set_bus_speed(child);
587
588         /* Set up default resource pointers and names.. */
589         for (i = 0; i < PCI_BRIDGE_RESOURCE_NUM; i++) {
590                 child->resource[i] = &bridge->resource[PCI_BRIDGE_RESOURCES+i];
591                 child->resource[i]->name = child->name;
592         }
593         bridge->subordinate = child;
594
595         return child;
596 }
597
598 struct pci_bus *__ref pci_add_new_bus(struct pci_bus *parent, struct pci_dev *dev, int busnr)
599 {
600         struct pci_bus *child;
601
602         child = pci_alloc_child_bus(parent, dev, busnr);
603         if (child) {
604                 down_write(&pci_bus_sem);
605                 list_add_tail(&child->node, &parent->children);
606                 up_write(&pci_bus_sem);
607         }
608         return child;
609 }
610
611 static void pci_fixup_parent_subordinate_busnr(struct pci_bus *child, int max)
612 {
613         struct pci_bus *parent = child->parent;
614
615         /* Attempts to fix that up are really dangerous unless
616            we're going to re-assign all bus numbers. */
617         if (!pcibios_assign_all_busses())
618                 return;
619
620         while (parent->parent && parent->subordinate < max) {
621                 parent->subordinate = max;
622                 pci_write_config_byte(parent->self, PCI_SUBORDINATE_BUS, max);
623                 parent = parent->parent;
624         }
625 }
626
627 /*
628  * If it's a bridge, configure it and scan the bus behind it.
629  * For CardBus bridges, we don't scan behind as the devices will
630  * be handled by the bridge driver itself.
631  *
632  * We need to process bridges in two passes -- first we scan those
633  * already configured by the BIOS and after we are done with all of
634  * them, we proceed to assigning numbers to the remaining buses in
635  * order to avoid overlaps between old and new bus numbers.
636  */
637 int __devinit pci_scan_bridge(struct pci_bus *bus, struct pci_dev *dev, int max, int pass)
638 {
639         struct pci_bus *child;
640         int is_cardbus = (dev->hdr_type == PCI_HEADER_TYPE_CARDBUS);
641         u32 buses, i, j = 0;
642         u16 bctl;
643         u8 primary, secondary, subordinate;
644         int broken = 0;
645
646         pci_read_config_dword(dev, PCI_PRIMARY_BUS, &buses);
647         primary = buses & 0xFF;
648         secondary = (buses >> 8) & 0xFF;
649         subordinate = (buses >> 16) & 0xFF;
650
651         dev_dbg(&dev->dev, "scanning [bus %02x-%02x] behind bridge, pass %d\n",
652                 secondary, subordinate, pass);
653
654         if (!primary && (primary != bus->number) && secondary && subordinate) {
655                 dev_warn(&dev->dev, "Primary bus is hard wired to 0\n");
656                 primary = bus->number;
657         }
658
659         /* Check if setup is sensible at all */
660         if (!pass &&
661             (primary != bus->number || secondary <= bus->number ||
662              secondary > subordinate)) {
663                 dev_info(&dev->dev, "bridge configuration invalid ([bus %02x-%02x]), reconfiguring\n",
664                          secondary, subordinate);
665                 broken = 1;
666         }
667
668         /* Disable MasterAbortMode during probing to avoid reporting
669            of bus errors (in some architectures) */ 
670         pci_read_config_word(dev, PCI_BRIDGE_CONTROL, &bctl);
671         pci_write_config_word(dev, PCI_BRIDGE_CONTROL,
672                               bctl & ~PCI_BRIDGE_CTL_MASTER_ABORT);
673
674         if ((secondary || subordinate) && !pcibios_assign_all_busses() &&
675             !is_cardbus && !broken) {
676                 unsigned int cmax;
677                 /*
678                  * Bus already configured by firmware, process it in the first
679                  * pass and just note the configuration.
680                  */
681                 if (pass)
682                         goto out;
683
684                 /*
685                  * If we already got to this bus through a different bridge,
686                  * don't re-add it. This can happen with the i450NX chipset.
687                  *
688                  * However, we continue to descend down the hierarchy and
689                  * scan remaining child buses.
690                  */
691                 child = pci_find_bus(pci_domain_nr(bus), secondary);
692                 if (!child) {
693                         child = pci_add_new_bus(bus, dev, secondary);
694                         if (!child)
695                                 goto out;
696                         child->primary = primary;
697                         child->subordinate = subordinate;
698                         child->bridge_ctl = bctl;
699                 }
700
701                 cmax = pci_scan_child_bus(child);
702                 if (cmax > max)
703                         max = cmax;
704                 if (child->subordinate > max)
705                         max = child->subordinate;
706         } else {
707                 /*
708                  * We need to assign a number to this bus which we always
709                  * do in the second pass.
710                  */
711                 if (!pass) {
712                         if (pcibios_assign_all_busses() || broken)
713                                 /* Temporarily disable forwarding of the
714                                    configuration cycles on all bridges in
715                                    this bus segment to avoid possible
716                                    conflicts in the second pass between two
717                                    bridges programmed with overlapping
718                                    bus ranges. */
719                                 pci_write_config_dword(dev, PCI_PRIMARY_BUS,
720                                                        buses & ~0xffffff);
721                         goto out;
722                 }
723
724                 /* Clear errors */
725                 pci_write_config_word(dev, PCI_STATUS, 0xffff);
726
727                 /* Prevent assigning a bus number that already exists.
728                  * This can happen when a bridge is hot-plugged, so in
729                  * this case we only re-scan this bus. */
730                 child = pci_find_bus(pci_domain_nr(bus), max+1);
731                 if (!child) {
732                         child = pci_add_new_bus(bus, dev, ++max);
733                         if (!child)
734                                 goto out;
735                 }
736                 buses = (buses & 0xff000000)
737                       | ((unsigned int)(child->primary)     <<  0)
738                       | ((unsigned int)(child->secondary)   <<  8)
739                       | ((unsigned int)(child->subordinate) << 16);
740
741                 /*
742                  * yenta.c forces a secondary latency timer of 176.
743                  * Copy that behaviour here.
744                  */
745                 if (is_cardbus) {
746                         buses &= ~0xff000000;
747                         buses |= CARDBUS_LATENCY_TIMER << 24;
748                 }
749
750                 /*
751                  * We need to blast all three values with a single write.
752                  */
753                 pci_write_config_dword(dev, PCI_PRIMARY_BUS, buses);
754
755                 if (!is_cardbus) {
756                         child->bridge_ctl = bctl;
757                         /*
758                          * Adjust subordinate busnr in parent buses.
759                          * We do this before scanning for children because
760                          * some devices may not be detected if the bios
761                          * was lazy.
762                          */
763                         pci_fixup_parent_subordinate_busnr(child, max);
764                         /* Now we can scan all subordinate buses... */
765                         max = pci_scan_child_bus(child);
766                         /*
767                          * now fix it up again since we have found
768                          * the real value of max.
769                          */
770                         pci_fixup_parent_subordinate_busnr(child, max);
771                 } else {
772                         /*
773                          * For CardBus bridges, we leave 4 bus numbers
774                          * as cards with a PCI-to-PCI bridge can be
775                          * inserted later.
776                          */
777                         for (i=0; i<CARDBUS_RESERVE_BUSNR; i++) {
778                                 struct pci_bus *parent = bus;
779                                 if (pci_find_bus(pci_domain_nr(bus),
780                                                         max+i+1))
781                                         break;
782                                 while (parent->parent) {
783                                         if ((!pcibios_assign_all_busses()) &&
784                                             (parent->subordinate > max) &&
785                                             (parent->subordinate <= max+i)) {
786                                                 j = 1;
787                                         }
788                                         parent = parent->parent;
789                                 }
790                                 if (j) {
791                                         /*
792                                          * Often, there are two cardbus bridges
793                                          * -- try to leave one valid bus number
794                                          * for each one.
795                                          */
796                                         i /= 2;
797                                         break;
798                                 }
799                         }
800                         max += i;
801                         pci_fixup_parent_subordinate_busnr(child, max);
802                 }
803                 /*
804                  * Set the subordinate bus number to its real value.
805                  */
806                 child->subordinate = max;
807                 pci_write_config_byte(dev, PCI_SUBORDINATE_BUS, max);
808         }
809
810         sprintf(child->name,
811                 (is_cardbus ? "PCI CardBus %04x:%02x" : "PCI Bus %04x:%02x"),
812                 pci_domain_nr(bus), child->number);
813
814         /* Has only triggered on CardBus, fixup is in yenta_socket */
815         while (bus->parent) {
816                 if ((child->subordinate > bus->subordinate) ||
817                     (child->number > bus->subordinate) ||
818                     (child->number < bus->number) ||
819                     (child->subordinate < bus->number)) {
820                         dev_info(&child->dev, "[bus %02x-%02x] %s "
821                                 "hidden behind%s bridge %s [bus %02x-%02x]\n",
822                                 child->number, child->subordinate,
823                                 (bus->number > child->subordinate &&
824                                  bus->subordinate < child->number) ?
825                                         "wholly" : "partially",
826                                 bus->self->transparent ? " transparent" : "",
827                                 dev_name(&bus->dev),
828                                 bus->number, bus->subordinate);
829                 }
830                 bus = bus->parent;
831         }
832
833 out:
834         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, bctl);
835
836         return max;
837 }
838
839 /*
840  * Read interrupt line and base address registers.
841  * The architecture-dependent code can tweak these, of course.
842  */
843 static void pci_read_irq(struct pci_dev *dev)
844 {
845         unsigned char irq;
846
847         pci_read_config_byte(dev, PCI_INTERRUPT_PIN, &irq);
848         dev->pin = irq;
849         if (irq)
850                 pci_read_config_byte(dev, PCI_INTERRUPT_LINE, &irq);
851         dev->irq = irq;
852 }
853
854 void set_pcie_port_type(struct pci_dev *pdev)
855 {
856         int pos;
857         u16 reg16;
858
859         pos = pci_find_capability(pdev, PCI_CAP_ID_EXP);
860         if (!pos)
861                 return;
862         pdev->is_pcie = 1;
863         pdev->pcie_cap = pos;
864         pci_read_config_word(pdev, pos + PCI_EXP_FLAGS, &reg16);
865         pdev->pcie_type = (reg16 & PCI_EXP_FLAGS_TYPE) >> 4;
866         pci_read_config_word(pdev, pos + PCI_EXP_DEVCAP, &reg16);
867         pdev->pcie_mpss = reg16 & PCI_EXP_DEVCAP_PAYLOAD;
868 }
869
870 void set_pcie_hotplug_bridge(struct pci_dev *pdev)
871 {
872         int pos;
873         u16 reg16;
874         u32 reg32;
875
876         pos = pci_pcie_cap(pdev);
877         if (!pos)
878                 return;
879         pci_read_config_word(pdev, pos + PCI_EXP_FLAGS, &reg16);
880         if (!(reg16 & PCI_EXP_FLAGS_SLOT))
881                 return;
882         pci_read_config_dword(pdev, pos + PCI_EXP_SLTCAP, &reg32);
883         if (reg32 & PCI_EXP_SLTCAP_HPC)
884                 pdev->is_hotplug_bridge = 1;
885 }
886
887 #define LEGACY_IO_RESOURCE      (IORESOURCE_IO | IORESOURCE_PCI_FIXED)
888
889 /**
890  * pci_setup_device - fill in class and map information of a device
891  * @dev: the device structure to fill
892  *
893  * Initialize the device structure with information about the device's 
894  * vendor,class,memory and IO-space addresses,IRQ lines etc.
895  * Called at initialisation of the PCI subsystem and by CardBus services.
896  * Returns 0 on success and negative if unknown type of device (not normal,
897  * bridge or CardBus).
898  */
899 int pci_setup_device(struct pci_dev *dev)
900 {
901         u32 class;
902         u8 hdr_type;
903         struct pci_slot *slot;
904         int pos = 0;
905
906         if (pci_read_config_byte(dev, PCI_HEADER_TYPE, &hdr_type))
907                 return -EIO;
908
909         dev->sysdata = dev->bus->sysdata;
910         dev->dev.parent = dev->bus->bridge;
911         dev->dev.bus = &pci_bus_type;
912         dev->hdr_type = hdr_type & 0x7f;
913         dev->multifunction = !!(hdr_type & 0x80);
914         dev->error_state = pci_channel_io_normal;
915         set_pcie_port_type(dev);
916
917         list_for_each_entry(slot, &dev->bus->slots, list)
918                 if (PCI_SLOT(dev->devfn) == slot->number)
919                         dev->slot = slot;
920
921         /* Assume 32-bit PCI; let 64-bit PCI cards (which are far rarer)
922            set this higher, assuming the system even supports it.  */
923         dev->dma_mask = 0xffffffff;
924
925         dev_set_name(&dev->dev, "%04x:%02x:%02x.%d", pci_domain_nr(dev->bus),
926                      dev->bus->number, PCI_SLOT(dev->devfn),
927                      PCI_FUNC(dev->devfn));
928
929         pci_read_config_dword(dev, PCI_CLASS_REVISION, &class);
930         dev->revision = class & 0xff;
931         class >>= 8;                                /* upper 3 bytes */
932         dev->class = class;
933         class >>= 8;
934
935         dev_printk(KERN_DEBUG, &dev->dev, "[%04x:%04x] type %d class %#08x\n",
936                    dev->vendor, dev->device, dev->hdr_type, class);
937
938         /* need to have dev->class ready */
939         dev->cfg_size = pci_cfg_space_size(dev);
940
941         /* "Unknown power state" */
942         dev->current_state = PCI_UNKNOWN;
943
944         /* Early fixups, before probing the BARs */
945         pci_fixup_device(pci_fixup_early, dev);
946         /* device class may be changed after fixup */
947         class = dev->class >> 8;
948
949         switch (dev->hdr_type) {                    /* header type */
950         case PCI_HEADER_TYPE_NORMAL:                /* standard header */
951                 if (class == PCI_CLASS_BRIDGE_PCI)
952                         goto bad;
953                 pci_read_irq(dev);
954                 pci_read_bases(dev, 6, PCI_ROM_ADDRESS);
955                 pci_read_config_word(dev, PCI_SUBSYSTEM_VENDOR_ID, &dev->subsystem_vendor);
956                 pci_read_config_word(dev, PCI_SUBSYSTEM_ID, &dev->subsystem_device);
957
958                 /*
959                  *      Do the ugly legacy mode stuff here rather than broken chip
960                  *      quirk code. Legacy mode ATA controllers have fixed
961                  *      addresses. These are not always echoed in BAR0-3, and
962                  *      BAR0-3 in a few cases contain junk!
963                  */
964                 if (class == PCI_CLASS_STORAGE_IDE) {
965                         u8 progif;
966                         pci_read_config_byte(dev, PCI_CLASS_PROG, &progif);
967                         if ((progif & 1) == 0) {
968                                 dev->resource[0].start = 0x1F0;
969                                 dev->resource[0].end = 0x1F7;
970                                 dev->resource[0].flags = LEGACY_IO_RESOURCE;
971                                 dev->resource[1].start = 0x3F6;
972                                 dev->resource[1].end = 0x3F6;
973                                 dev->resource[1].flags = LEGACY_IO_RESOURCE;
974                         }
975                         if ((progif & 4) == 0) {
976                                 dev->resource[2].start = 0x170;
977                                 dev->resource[2].end = 0x177;
978                                 dev->resource[2].flags = LEGACY_IO_RESOURCE;
979                                 dev->resource[3].start = 0x376;
980                                 dev->resource[3].end = 0x376;
981                                 dev->resource[3].flags = LEGACY_IO_RESOURCE;
982                         }
983                 }
984                 break;
985
986         case PCI_HEADER_TYPE_BRIDGE:                /* bridge header */
987                 if (class != PCI_CLASS_BRIDGE_PCI)
988                         goto bad;
989                 /* The PCI-to-PCI bridge spec requires that subtractive
990                    decoding (i.e. transparent) bridge must have programming
991                    interface code of 0x01. */ 
992                 pci_read_irq(dev);
993                 dev->transparent = ((dev->class & 0xff) == 1);
994                 pci_read_bases(dev, 2, PCI_ROM_ADDRESS1);
995                 set_pcie_hotplug_bridge(dev);
996                 pos = pci_find_capability(dev, PCI_CAP_ID_SSVID);
997                 if (pos) {
998                         pci_read_config_word(dev, pos + PCI_SSVID_VENDOR_ID, &dev->subsystem_vendor);
999                         pci_read_config_word(dev, pos + PCI_SSVID_DEVICE_ID, &dev->subsystem_device);
1000                 }
1001                 break;
1002
1003         case PCI_HEADER_TYPE_CARDBUS:               /* CardBus bridge header */
1004                 if (class != PCI_CLASS_BRIDGE_CARDBUS)
1005                         goto bad;
1006                 pci_read_irq(dev);
1007                 pci_read_bases(dev, 1, 0);
1008                 pci_read_config_word(dev, PCI_CB_SUBSYSTEM_VENDOR_ID, &dev->subsystem_vendor);
1009                 pci_read_config_word(dev, PCI_CB_SUBSYSTEM_ID, &dev->subsystem_device);
1010                 break;
1011
1012         default:                                    /* unknown header */
1013                 dev_err(&dev->dev, "unknown header type %02x, "
1014                         "ignoring device\n", dev->hdr_type);
1015                 return -EIO;
1016
1017         bad:
1018                 dev_err(&dev->dev, "ignoring class %02x (doesn't match header "
1019                         "type %02x)\n", class, dev->hdr_type);
1020                 dev->class = PCI_CLASS_NOT_DEFINED;
1021         }
1022
1023         /* We found a fine healthy device, go go go... */
1024         return 0;
1025 }
1026
1027 static void pci_release_capabilities(struct pci_dev *dev)
1028 {
1029         pci_vpd_release(dev);
1030         pci_iov_release(dev);
1031 }
1032
1033 /**
1034  * pci_release_dev - free a pci device structure when all users of it are finished.
1035  * @dev: device that's been disconnected
1036  *
1037  * Will be called only by the device core when all users of this pci device are
1038  * done.
1039  */
1040 static void pci_release_dev(struct device *dev)
1041 {
1042         struct pci_dev *pci_dev;
1043
1044         pci_dev = to_pci_dev(dev);
1045         pci_release_capabilities(pci_dev);
1046         pci_release_of_node(pci_dev);
1047         kfree(pci_dev);
1048 }
1049
1050 /**
1051  * pci_cfg_space_size - get the configuration space size of the PCI device.
1052  * @dev: PCI device
1053  *
1054  * Regular PCI devices have 256 bytes, but PCI-X 2 and PCI Express devices
1055  * have 4096 bytes.  Even if the device is capable, that doesn't mean we can
1056  * access it.  Maybe we don't have a way to generate extended config space
1057  * accesses, or the device is behind a reverse Express bridge.  So we try
1058  * reading the dword at 0x100 which must either be 0 or a valid extended
1059  * capability header.
1060  */
1061 int pci_cfg_space_size_ext(struct pci_dev *dev)
1062 {
1063         u32 status;
1064         int pos = PCI_CFG_SPACE_SIZE;
1065
1066         if (pci_read_config_dword(dev, pos, &status) != PCIBIOS_SUCCESSFUL)
1067                 goto fail;
1068         if (status == 0xffffffff)
1069                 goto fail;
1070
1071         return PCI_CFG_SPACE_EXP_SIZE;
1072
1073  fail:
1074         return PCI_CFG_SPACE_SIZE;
1075 }
1076
1077 int pci_cfg_space_size(struct pci_dev *dev)
1078 {
1079         int pos;
1080         u32 status;
1081         u16 class;
1082
1083         class = dev->class >> 8;
1084         if (class == PCI_CLASS_BRIDGE_HOST)
1085                 return pci_cfg_space_size_ext(dev);
1086
1087         pos = pci_pcie_cap(dev);
1088         if (!pos) {
1089                 pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
1090                 if (!pos)
1091                         goto fail;
1092
1093                 pci_read_config_dword(dev, pos + PCI_X_STATUS, &status);
1094                 if (!(status & (PCI_X_STATUS_266MHZ | PCI_X_STATUS_533MHZ)))
1095                         goto fail;
1096         }
1097
1098         return pci_cfg_space_size_ext(dev);
1099
1100  fail:
1101         return PCI_CFG_SPACE_SIZE;
1102 }
1103
1104 static void pci_release_bus_bridge_dev(struct device *dev)
1105 {
1106         kfree(dev);
1107 }
1108
1109 struct pci_dev *alloc_pci_dev(void)
1110 {
1111         struct pci_dev *dev;
1112
1113         dev = kzalloc(sizeof(struct pci_dev), GFP_KERNEL);
1114         if (!dev)
1115                 return NULL;
1116
1117         INIT_LIST_HEAD(&dev->bus_list);
1118
1119         return dev;
1120 }
1121 EXPORT_SYMBOL(alloc_pci_dev);
1122
1123 /*
1124  * Read the config data for a PCI device, sanity-check it
1125  * and fill in the dev structure...
1126  */
1127 static struct pci_dev *pci_scan_device(struct pci_bus *bus, int devfn)
1128 {
1129         struct pci_dev *dev;
1130         u32 l;
1131         int delay = 1;
1132
1133         if (pci_bus_read_config_dword(bus, devfn, PCI_VENDOR_ID, &l))
1134                 return NULL;
1135
1136         /* some broken boards return 0 or ~0 if a slot is empty: */
1137         if (l == 0xffffffff || l == 0x00000000 ||
1138             l == 0x0000ffff || l == 0xffff0000)
1139                 return NULL;
1140
1141         /* Configuration request Retry Status */
1142         while (l == 0xffff0001) {
1143                 msleep(delay);
1144                 delay *= 2;
1145                 if (pci_bus_read_config_dword(bus, devfn, PCI_VENDOR_ID, &l))
1146                         return NULL;
1147                 /* Card hasn't responded in 60 seconds?  Must be stuck. */
1148                 if (delay > 60 * 1000) {
1149                         printk(KERN_WARNING "pci %04x:%02x:%02x.%d: not "
1150                                         "responding\n", pci_domain_nr(bus),
1151                                         bus->number, PCI_SLOT(devfn),
1152                                         PCI_FUNC(devfn));
1153                         return NULL;
1154                 }
1155         }
1156
1157         dev = alloc_pci_dev();
1158         if (!dev)
1159                 return NULL;
1160
1161         dev->bus = bus;
1162         dev->devfn = devfn;
1163         dev->vendor = l & 0xffff;
1164         dev->device = (l >> 16) & 0xffff;
1165
1166         pci_set_of_node(dev);
1167
1168         if (pci_setup_device(dev)) {
1169                 kfree(dev);
1170                 return NULL;
1171         }
1172
1173         return dev;
1174 }
1175
1176 static void pci_init_capabilities(struct pci_dev *dev)
1177 {
1178         /* MSI/MSI-X list */
1179         pci_msi_init_pci_dev(dev);
1180
1181         /* Buffers for saving PCIe and PCI-X capabilities */
1182         pci_allocate_cap_save_buffers(dev);
1183
1184         /* Power Management */
1185         pci_pm_init(dev);
1186         platform_pci_wakeup_init(dev);
1187
1188         /* Vital Product Data */
1189         pci_vpd_pci22_init(dev);
1190
1191         /* Alternative Routing-ID Forwarding */
1192         pci_enable_ari(dev);
1193
1194         /* Single Root I/O Virtualization */
1195         pci_iov_init(dev);
1196
1197         /* Enable ACS P2P upstream forwarding */
1198         pci_enable_acs(dev);
1199 }
1200
1201 void pci_device_add(struct pci_dev *dev, struct pci_bus *bus)
1202 {
1203         device_initialize(&dev->dev);
1204         dev->dev.release = pci_release_dev;
1205         pci_dev_get(dev);
1206
1207         dev->dev.dma_mask = &dev->dma_mask;
1208         dev->dev.dma_parms = &dev->dma_parms;
1209         dev->dev.coherent_dma_mask = 0xffffffffull;
1210
1211         pci_set_dma_max_seg_size(dev, 65536);
1212         pci_set_dma_seg_boundary(dev, 0xffffffff);
1213
1214         /* Fix up broken headers */
1215         pci_fixup_device(pci_fixup_header, dev);
1216
1217         /* Clear the state_saved flag. */
1218         dev->state_saved = false;
1219
1220         /* Initialize various capabilities */
1221         pci_init_capabilities(dev);
1222
1223         /*
1224          * Add the device to our list of discovered devices
1225          * and the bus list for fixup functions, etc.
1226          */
1227         down_write(&pci_bus_sem);
1228         list_add_tail(&dev->bus_list, &bus->devices);
1229         up_write(&pci_bus_sem);
1230 }
1231
1232 struct pci_dev *__ref pci_scan_single_device(struct pci_bus *bus, int devfn)
1233 {
1234         struct pci_dev *dev;
1235
1236         dev = pci_get_slot(bus, devfn);
1237         if (dev) {
1238                 pci_dev_put(dev);
1239                 return dev;
1240         }
1241
1242         dev = pci_scan_device(bus, devfn);
1243         if (!dev)
1244                 return NULL;
1245
1246         pci_device_add(dev, bus);
1247
1248         return dev;
1249 }
1250 EXPORT_SYMBOL(pci_scan_single_device);
1251
1252 static unsigned next_ari_fn(struct pci_dev *dev, unsigned fn)
1253 {
1254         u16 cap;
1255         unsigned pos, next_fn;
1256
1257         if (!dev)
1258                 return 0;
1259
1260         pos = pci_find_ext_capability(dev, PCI_EXT_CAP_ID_ARI);
1261         if (!pos)
1262                 return 0;
1263         pci_read_config_word(dev, pos + 4, &cap);
1264         next_fn = cap >> 8;
1265         if (next_fn <= fn)
1266                 return 0;
1267         return next_fn;
1268 }
1269
1270 static unsigned next_trad_fn(struct pci_dev *dev, unsigned fn)
1271 {
1272         return (fn + 1) % 8;
1273 }
1274
1275 static unsigned no_next_fn(struct pci_dev *dev, unsigned fn)
1276 {
1277         return 0;
1278 }
1279
1280 static int only_one_child(struct pci_bus *bus)
1281 {
1282         struct pci_dev *parent = bus->self;
1283         if (!parent || !pci_is_pcie(parent))
1284                 return 0;
1285         if (parent->pcie_type == PCI_EXP_TYPE_ROOT_PORT ||
1286             parent->pcie_type == PCI_EXP_TYPE_DOWNSTREAM)
1287                 return 1;
1288         return 0;
1289 }
1290
1291 /**
1292  * pci_scan_slot - scan a PCI slot on a bus for devices.
1293  * @bus: PCI bus to scan
1294  * @devfn: slot number to scan (must have zero function.)
1295  *
1296  * Scan a PCI slot on the specified PCI bus for devices, adding
1297  * discovered devices to the @bus->devices list.  New devices
1298  * will not have is_added set.
1299  *
1300  * Returns the number of new devices found.
1301  */
1302 int pci_scan_slot(struct pci_bus *bus, int devfn)
1303 {
1304         unsigned fn, nr = 0;
1305         struct pci_dev *dev;
1306         unsigned (*next_fn)(struct pci_dev *, unsigned) = no_next_fn;
1307
1308         if (only_one_child(bus) && (devfn > 0))
1309                 return 0; /* Already scanned the entire slot */
1310
1311         dev = pci_scan_single_device(bus, devfn);
1312         if (!dev)
1313                 return 0;
1314         if (!dev->is_added)
1315                 nr++;
1316
1317         if (pci_ari_enabled(bus))
1318                 next_fn = next_ari_fn;
1319         else if (dev->multifunction)
1320                 next_fn = next_trad_fn;
1321
1322         for (fn = next_fn(dev, 0); fn > 0; fn = next_fn(dev, fn)) {
1323                 dev = pci_scan_single_device(bus, devfn + fn);
1324                 if (dev) {
1325                         if (!dev->is_added)
1326                                 nr++;
1327                         dev->multifunction = 1;
1328                 }
1329         }
1330
1331         /* only one slot has pcie device */
1332         if (bus->self && nr)
1333                 pcie_aspm_init_link_state(bus->self);
1334
1335         return nr;
1336 }
1337
1338 static int pcie_find_smpss(struct pci_dev *dev, void *data)
1339 {
1340         u8 *smpss = data;
1341
1342         if (!pci_is_pcie(dev))
1343                 return 0;
1344
1345         /* For PCIE hotplug enabled slots not connected directly to a
1346          * PCI-E root port, there can be problems when hotplugging
1347          * devices.  This is due to the possibility of hotplugging a
1348          * device into the fabric with a smaller MPS that the devices
1349          * currently running have configured.  Modifying the MPS on the
1350          * running devices could cause a fatal bus error due to an
1351          * incoming frame being larger than the newly configured MPS.
1352          * To work around this, the MPS for the entire fabric must be
1353          * set to the minimum size.  Any devices hotplugged into this
1354          * fabric will have the minimum MPS set.  If the PCI hotplug
1355          * slot is directly connected to the root port and there are not
1356          * other devices on the fabric (which seems to be the most
1357          * common case), then this is not an issue and MPS discovery
1358          * will occur as normal.
1359          */
1360         if (dev->is_hotplug_bridge && (!list_is_singular(&dev->bus->devices) ||
1361              (dev->bus->self &&
1362               dev->bus->self->pcie_type != PCI_EXP_TYPE_ROOT_PORT)))
1363                 *smpss = 0;
1364
1365         if (*smpss > dev->pcie_mpss)
1366                 *smpss = dev->pcie_mpss;
1367
1368         return 0;
1369 }
1370
1371 static void pcie_write_mps(struct pci_dev *dev, int mps)
1372 {
1373         int rc;
1374
1375         if (pcie_bus_config == PCIE_BUS_PERFORMANCE) {
1376                 mps = 128 << dev->pcie_mpss;
1377
1378                 if (dev->pcie_type != PCI_EXP_TYPE_ROOT_PORT && dev->bus->self)
1379                         /* For "Performance", the assumption is made that
1380                          * downstream communication will never be larger than
1381                          * the MRRS.  So, the MPS only needs to be configured
1382                          * for the upstream communication.  This being the case,
1383                          * walk from the top down and set the MPS of the child
1384                          * to that of the parent bus.
1385                          *
1386                          * Configure the device MPS with the smaller of the
1387                          * device MPSS or the bridge MPS (which is assumed to be
1388                          * properly configured at this point to the largest
1389                          * allowable MPS based on its parent bus).
1390                          */
1391                         mps = min(mps, pcie_get_mps(dev->bus->self));
1392         }
1393
1394         rc = pcie_set_mps(dev, mps);
1395         if (rc)
1396                 dev_err(&dev->dev, "Failed attempting to set the MPS\n");
1397 }
1398
1399 static void pcie_write_mrrs(struct pci_dev *dev)
1400 {
1401         int rc, mrrs;
1402
1403         /* In the "safe" case, do not configure the MRRS.  There appear to be
1404          * issues with setting MRRS to 0 on a number of devices.
1405          */
1406         if (pcie_bus_config != PCIE_BUS_PERFORMANCE)
1407                 return;
1408
1409         /* For Max performance, the MRRS must be set to the largest supported
1410          * value.  However, it cannot be configured larger than the MPS the
1411          * device or the bus can support.  This should already be properly
1412          * configured by a prior call to pcie_write_mps.
1413          */
1414         mrrs = pcie_get_mps(dev);
1415
1416         /* MRRS is a R/W register.  Invalid values can be written, but a
1417          * subsequent read will verify if the value is acceptable or not.
1418          * If the MRRS value provided is not acceptable (e.g., too large),
1419          * shrink the value until it is acceptable to the HW.
1420          */
1421         while (mrrs != pcie_get_readrq(dev) && mrrs >= 128) {
1422                 rc = pcie_set_readrq(dev, mrrs);
1423                 if (!rc)
1424                         break;
1425
1426                 dev_warn(&dev->dev, "Failed attempting to set the MRRS\n");
1427                 mrrs /= 2;
1428         }
1429
1430         if (mrrs < 128)
1431                 dev_err(&dev->dev, "MRRS was unable to be configured with a "
1432                         "safe value.  If problems are experienced, try running "
1433                         "with pci=pcie_bus_safe.\n");
1434 }
1435
1436 static int pcie_bus_configure_set(struct pci_dev *dev, void *data)
1437 {
1438         int mps, orig_mps;
1439
1440         if (!pci_is_pcie(dev))
1441                 return 0;
1442
1443         mps = 128 << *(u8 *)data;
1444         orig_mps = pcie_get_mps(dev);
1445
1446         pcie_write_mps(dev, mps);
1447         pcie_write_mrrs(dev);
1448
1449         dev_info(&dev->dev, "PCI-E Max Payload Size set to %4d/%4d (was %4d), "
1450                  "Max Read Rq %4d\n", pcie_get_mps(dev), 128 << dev->pcie_mpss,
1451                  orig_mps, pcie_get_readrq(dev));
1452
1453         return 0;
1454 }
1455
1456 /* pcie_bus_configure_settings requires that pci_walk_bus work in a top-down,
1457  * parents then children fashion.  If this changes, then this code will not
1458  * work as designed.
1459  */
1460 void pcie_bus_configure_settings(struct pci_bus *bus, u8 mpss)
1461 {
1462         u8 smpss;
1463
1464         if (!pci_is_pcie(bus->self))
1465                 return;
1466
1467         if (pcie_bus_config == PCIE_BUS_TUNE_OFF)
1468                 return;
1469
1470         /* FIXME - Peer to peer DMA is possible, though the endpoint would need
1471          * to be aware to the MPS of the destination.  To work around this,
1472          * simply force the MPS of the entire system to the smallest possible.
1473          */
1474         if (pcie_bus_config == PCIE_BUS_PEER2PEER)
1475                 smpss = 0;
1476
1477         if (pcie_bus_config == PCIE_BUS_SAFE) {
1478                 smpss = mpss;
1479
1480                 pcie_find_smpss(bus->self, &smpss);
1481                 pci_walk_bus(bus, pcie_find_smpss, &smpss);
1482         }
1483
1484         pcie_bus_configure_set(bus->self, &smpss);
1485         pci_walk_bus(bus, pcie_bus_configure_set, &smpss);
1486 }
1487 EXPORT_SYMBOL_GPL(pcie_bus_configure_settings);
1488
1489 unsigned int __devinit pci_scan_child_bus(struct pci_bus *bus)
1490 {
1491         unsigned int devfn, pass, max = bus->secondary;
1492         struct pci_dev *dev;
1493
1494         dev_dbg(&bus->dev, "scanning bus\n");
1495
1496         /* Go find them, Rover! */
1497         for (devfn = 0; devfn < 0x100; devfn += 8)
1498                 pci_scan_slot(bus, devfn);
1499
1500         /* Reserve buses for SR-IOV capability. */
1501         max += pci_iov_bus_range(bus);
1502
1503         /*
1504          * After performing arch-dependent fixup of the bus, look behind
1505          * all PCI-to-PCI bridges on this bus.
1506          */
1507         if (!bus->is_added) {
1508                 dev_dbg(&bus->dev, "fixups for bus\n");
1509                 pcibios_fixup_bus(bus);
1510                 if (pci_is_root_bus(bus))
1511                         bus->is_added = 1;
1512         }
1513
1514         for (pass=0; pass < 2; pass++)
1515                 list_for_each_entry(dev, &bus->devices, bus_list) {
1516                         if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE ||
1517                             dev->hdr_type == PCI_HEADER_TYPE_CARDBUS)
1518                                 max = pci_scan_bridge(bus, dev, max, pass);
1519                 }
1520
1521         /*
1522          * We've scanned the bus and so we know all about what's on
1523          * the other side of any bridges that may be on this bus plus
1524          * any devices.
1525          *
1526          * Return how far we've got finding sub-buses.
1527          */
1528         dev_dbg(&bus->dev, "bus scan returning with max=%02x\n", max);
1529         return max;
1530 }
1531
1532 struct pci_bus * pci_create_bus(struct device *parent,
1533                 int bus, struct pci_ops *ops, void *sysdata)
1534 {
1535         int error;
1536         struct pci_bus *b, *b2;
1537         struct device *dev;
1538
1539         b = pci_alloc_bus();
1540         if (!b)
1541                 return NULL;
1542
1543         dev = kzalloc(sizeof(*dev), GFP_KERNEL);
1544         if (!dev){
1545                 kfree(b);
1546                 return NULL;
1547         }
1548
1549         b->sysdata = sysdata;
1550         b->ops = ops;
1551
1552         b2 = pci_find_bus(pci_domain_nr(b), bus);
1553         if (b2) {
1554                 /* If we already got to this bus through a different bridge, ignore it */
1555                 dev_dbg(&b2->dev, "bus already known\n");
1556                 goto err_out;
1557         }
1558
1559         down_write(&pci_bus_sem);
1560         list_add_tail(&b->node, &pci_root_buses);
1561         up_write(&pci_bus_sem);
1562
1563         dev->parent = parent;
1564         dev->release = pci_release_bus_bridge_dev;
1565         dev_set_name(dev, "pci%04x:%02x", pci_domain_nr(b), bus);
1566         error = device_register(dev);
1567         if (error)
1568                 goto dev_reg_err;
1569         b->bridge = get_device(dev);
1570         device_enable_async_suspend(b->bridge);
1571         pci_set_bus_of_node(b);
1572
1573         if (!parent)
1574                 set_dev_node(b->bridge, pcibus_to_node(b));
1575
1576         b->dev.class = &pcibus_class;
1577         b->dev.parent = b->bridge;
1578         dev_set_name(&b->dev, "%04x:%02x", pci_domain_nr(b), bus);
1579         error = device_register(&b->dev);
1580         if (error)
1581                 goto class_dev_reg_err;
1582
1583         /* Create legacy_io and legacy_mem files for this bus */
1584         pci_create_legacy_files(b);
1585
1586         b->number = b->secondary = bus;
1587         b->resource[0] = &ioport_resource;
1588         b->resource[1] = &iomem_resource;
1589
1590         return b;
1591
1592 class_dev_reg_err:
1593         device_unregister(dev);
1594 dev_reg_err:
1595         down_write(&pci_bus_sem);
1596         list_del(&b->node);
1597         up_write(&pci_bus_sem);
1598 err_out:
1599         kfree(dev);
1600         kfree(b);
1601         return NULL;
1602 }
1603
1604 struct pci_bus * __devinit pci_scan_bus_parented(struct device *parent,
1605                 int bus, struct pci_ops *ops, void *sysdata)
1606 {
1607         struct pci_bus *b;
1608
1609         b = pci_create_bus(parent, bus, ops, sysdata);
1610         if (b)
1611                 b->subordinate = pci_scan_child_bus(b);
1612         return b;
1613 }
1614 EXPORT_SYMBOL(pci_scan_bus_parented);
1615
1616 #ifdef CONFIG_HOTPLUG
1617 /**
1618  * pci_rescan_bus - scan a PCI bus for devices.
1619  * @bus: PCI bus to scan
1620  *
1621  * Scan a PCI bus and child buses for new devices, adds them,
1622  * and enables them.
1623  *
1624  * Returns the max number of subordinate bus discovered.
1625  */
1626 unsigned int __ref pci_rescan_bus(struct pci_bus *bus)
1627 {
1628         unsigned int max;
1629         struct pci_dev *dev;
1630
1631         max = pci_scan_child_bus(bus);
1632
1633         down_read(&pci_bus_sem);
1634         list_for_each_entry(dev, &bus->devices, bus_list)
1635                 if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE ||
1636                     dev->hdr_type == PCI_HEADER_TYPE_CARDBUS)
1637                         if (dev->subordinate)
1638                                 pci_bus_size_bridges(dev->subordinate);
1639         up_read(&pci_bus_sem);
1640
1641         pci_bus_assign_resources(bus);
1642         pci_enable_bridges(bus);
1643         pci_bus_add_devices(bus);
1644
1645         return max;
1646 }
1647 EXPORT_SYMBOL_GPL(pci_rescan_bus);
1648
1649 EXPORT_SYMBOL(pci_add_new_bus);
1650 EXPORT_SYMBOL(pci_scan_slot);
1651 EXPORT_SYMBOL(pci_scan_bridge);
1652 EXPORT_SYMBOL_GPL(pci_scan_child_bus);
1653 #endif
1654
1655 static int __init pci_sort_bf_cmp(const struct device *d_a, const struct device *d_b)
1656 {
1657         const struct pci_dev *a = to_pci_dev(d_a);
1658         const struct pci_dev *b = to_pci_dev(d_b);
1659
1660         if      (pci_domain_nr(a->bus) < pci_domain_nr(b->bus)) return -1;
1661         else if (pci_domain_nr(a->bus) > pci_domain_nr(b->bus)) return  1;
1662
1663         if      (a->bus->number < b->bus->number) return -1;
1664         else if (a->bus->number > b->bus->number) return  1;
1665
1666         if      (a->devfn < b->devfn) return -1;
1667         else if (a->devfn > b->devfn) return  1;
1668
1669         return 0;
1670 }
1671
1672 void __init pci_sort_breadthfirst(void)
1673 {
1674         bus_sort_breadthfirst(&pci_bus_type, &pci_sort_bf_cmp);
1675 }