[SPARC64]: Process dr-cpu events in a kthread instead of workqueue.
[pandora-kernel.git] / arch / sparc64 / kernel / ds.c
1 /* ds.c: Domain Services driver for Logical Domains
2  *
3  * Copyright (C) 2007 David S. Miller <davem@davemloft.net>
4  */
5
6 #include <linux/kernel.h>
7 #include <linux/module.h>
8 #include <linux/types.h>
9 #include <linux/module.h>
10 #include <linux/string.h>
11 #include <linux/slab.h>
12 #include <linux/sched.h>
13 #include <linux/delay.h>
14 #include <linux/mutex.h>
15 #include <linux/kthread.h>
16 #include <linux/cpu.h>
17
18 #include <asm/ldc.h>
19 #include <asm/vio.h>
20 #include <asm/power.h>
21 #include <asm/mdesc.h>
22 #include <asm/head.h>
23
24 #define DRV_MODULE_NAME         "ds"
25 #define PFX DRV_MODULE_NAME     ": "
26 #define DRV_MODULE_VERSION      "1.0"
27 #define DRV_MODULE_RELDATE      "Jul 11, 2007"
28
29 static char version[] __devinitdata =
30         DRV_MODULE_NAME ".c:v" DRV_MODULE_VERSION " (" DRV_MODULE_RELDATE ")\n";
31 MODULE_AUTHOR("David S. Miller (davem@davemloft.net)");
32 MODULE_DESCRIPTION("Sun LDOM domain services driver");
33 MODULE_LICENSE("GPL");
34 MODULE_VERSION(DRV_MODULE_VERSION);
35
36 struct ds_msg_tag {
37         __u32                   type;
38 #define DS_INIT_REQ             0x00
39 #define DS_INIT_ACK             0x01
40 #define DS_INIT_NACK            0x02
41 #define DS_REG_REQ              0x03
42 #define DS_REG_ACK              0x04
43 #define DS_REG_NACK             0x05
44 #define DS_UNREG_REQ            0x06
45 #define DS_UNREG_ACK            0x07
46 #define DS_UNREG_NACK           0x08
47 #define DS_DATA                 0x09
48 #define DS_NACK                 0x0a
49
50         __u32                   len;
51 };
52
53 /* Result codes */
54 #define DS_OK                   0x00
55 #define DS_REG_VER_NACK         0x01
56 #define DS_REG_DUP              0x02
57 #define DS_INV_HDL              0x03
58 #define DS_TYPE_UNKNOWN         0x04
59
60 struct ds_version {
61         __u16                   major;
62         __u16                   minor;
63 };
64
65 struct ds_ver_req {
66         struct ds_msg_tag       tag;
67         struct ds_version       ver;
68 };
69
70 struct ds_ver_ack {
71         struct ds_msg_tag       tag;
72         __u16                   minor;
73 };
74
75 struct ds_ver_nack {
76         struct ds_msg_tag       tag;
77         __u16                   major;
78 };
79
80 struct ds_reg_req {
81         struct ds_msg_tag       tag;
82         __u64                   handle;
83         __u16                   major;
84         __u16                   minor;
85         char                    svc_id[0];
86 };
87
88 struct ds_reg_ack {
89         struct ds_msg_tag       tag;
90         __u64                   handle;
91         __u16                   minor;
92 };
93
94 struct ds_reg_nack {
95         struct ds_msg_tag       tag;
96         __u64                   handle;
97         __u16                   major;
98 };
99
100 struct ds_unreg_req {
101         struct ds_msg_tag       tag;
102         __u64                   handle;
103 };
104
105 struct ds_unreg_ack {
106         struct ds_msg_tag       tag;
107         __u64                   handle;
108 };
109
110 struct ds_unreg_nack {
111         struct ds_msg_tag       tag;
112         __u64                   handle;
113 };
114
115 struct ds_data {
116         struct ds_msg_tag       tag;
117         __u64                   handle;
118 };
119
120 struct ds_data_nack {
121         struct ds_msg_tag       tag;
122         __u64                   handle;
123         __u64                   result;
124 };
125
126 struct ds_cap_state {
127         __u64                   handle;
128
129         void                    (*data)(struct ldc_channel *lp,
130                                         struct ds_cap_state *cp,
131                                         void *buf, int len);
132
133         const char              *service_id;
134
135         u8                      state;
136 #define CAP_STATE_UNKNOWN       0x00
137 #define CAP_STATE_REG_SENT      0x01
138 #define CAP_STATE_REGISTERED    0x02
139 };
140
141 static void md_update_data(struct ldc_channel *lp, struct ds_cap_state *cp,
142                            void *buf, int len);
143 static void domain_shutdown_data(struct ldc_channel *lp,
144                                  struct ds_cap_state *cp,
145                                  void *buf, int len);
146 static void domain_panic_data(struct ldc_channel *lp,
147                               struct ds_cap_state *cp,
148                               void *buf, int len);
149 #ifdef CONFIG_HOTPLUG_CPU
150 static void dr_cpu_data(struct ldc_channel *lp,
151                         struct ds_cap_state *cp,
152                         void *buf, int len);
153 #endif
154 static void ds_pri_data(struct ldc_channel *lp,
155                         struct ds_cap_state *cp,
156                         void *buf, int len);
157 static void ds_var_data(struct ldc_channel *lp,
158                         struct ds_cap_state *cp,
159                         void *buf, int len);
160
161 struct ds_cap_state ds_states[] = {
162         {
163                 .service_id     = "md-update",
164                 .data           = md_update_data,
165         },
166         {
167                 .service_id     = "domain-shutdown",
168                 .data           = domain_shutdown_data,
169         },
170         {
171                 .service_id     = "domain-panic",
172                 .data           = domain_panic_data,
173         },
174 #ifdef CONFIG_HOTPLUG_CPU
175         {
176                 .service_id     = "dr-cpu",
177                 .data           = dr_cpu_data,
178         },
179 #endif
180         {
181                 .service_id     = "pri",
182                 .data           = ds_pri_data,
183         },
184         {
185                 .service_id     = "var-config",
186                 .data           = ds_var_data,
187         },
188         {
189                 .service_id     = "var-config-backup",
190                 .data           = ds_var_data,
191         },
192 };
193
194 static DEFINE_SPINLOCK(ds_lock);
195
196 struct ds_info {
197         struct ldc_channel      *lp;
198         u8                      hs_state;
199 #define DS_HS_START             0x01
200 #define DS_HS_DONE              0x02
201
202         void                    *rcv_buf;
203         int                     rcv_buf_len;
204 };
205
206 static struct ds_info *ds_info;
207
208 static struct ds_cap_state *find_cap(u64 handle)
209 {
210         unsigned int index = handle >> 32;
211
212         if (index >= ARRAY_SIZE(ds_states))
213                 return NULL;
214         return &ds_states[index];
215 }
216
217 static struct ds_cap_state *find_cap_by_string(const char *name)
218 {
219         int i;
220
221         for (i = 0; i < ARRAY_SIZE(ds_states); i++) {
222                 if (strcmp(ds_states[i].service_id, name))
223                         continue;
224
225                 return &ds_states[i];
226         }
227         return NULL;
228 }
229
230 static int ds_send(struct ldc_channel *lp, void *data, int len)
231 {
232         int err, limit = 1000;
233
234         err = -EINVAL;
235         while (limit-- > 0) {
236                 err = ldc_write(lp, data, len);
237                 if (!err || (err != -EAGAIN))
238                         break;
239                 udelay(1);
240         }
241
242         return err;
243 }
244
245 struct ds_md_update_req {
246         __u64                           req_num;
247 };
248
249 struct ds_md_update_res {
250         __u64                           req_num;
251         __u32                           result;
252 };
253
254 static void md_update_data(struct ldc_channel *lp,
255                            struct ds_cap_state *dp,
256                            void *buf, int len)
257 {
258         struct ds_data *dpkt = buf;
259         struct ds_md_update_req *rp;
260         struct {
261                 struct ds_data          data;
262                 struct ds_md_update_res res;
263         } pkt;
264
265         rp = (struct ds_md_update_req *) (dpkt + 1);
266
267         printk(KERN_INFO PFX "Machine description update.\n");
268
269         memset(&pkt, 0, sizeof(pkt));
270         pkt.data.tag.type = DS_DATA;
271         pkt.data.tag.len = sizeof(pkt) - sizeof(struct ds_msg_tag);
272         pkt.data.handle = dp->handle;
273         pkt.res.req_num = rp->req_num;
274         pkt.res.result = DS_OK;
275
276         ds_send(lp, &pkt, sizeof(pkt));
277
278         mdesc_update();
279 }
280
281 struct ds_shutdown_req {
282         __u64                           req_num;
283         __u32                           ms_delay;
284 };
285
286 struct ds_shutdown_res {
287         __u64                           req_num;
288         __u32                           result;
289         char                            reason[1];
290 };
291
292 static void domain_shutdown_data(struct ldc_channel *lp,
293                                  struct ds_cap_state *dp,
294                                  void *buf, int len)
295 {
296         struct ds_data *dpkt = buf;
297         struct ds_shutdown_req *rp;
298         struct {
299                 struct ds_data          data;
300                 struct ds_shutdown_res  res;
301         } pkt;
302
303         rp = (struct ds_shutdown_req *) (dpkt + 1);
304
305         printk(KERN_ALERT PFX "Shutdown request from "
306                "LDOM manager received.\n");
307
308         memset(&pkt, 0, sizeof(pkt));
309         pkt.data.tag.type = DS_DATA;
310         pkt.data.tag.len = sizeof(pkt) - sizeof(struct ds_msg_tag);
311         pkt.data.handle = dp->handle;
312         pkt.res.req_num = rp->req_num;
313         pkt.res.result = DS_OK;
314         pkt.res.reason[0] = 0;
315
316         ds_send(lp, &pkt, sizeof(pkt));
317
318         wake_up_powerd();
319 }
320
321 struct ds_panic_req {
322         __u64                           req_num;
323 };
324
325 struct ds_panic_res {
326         __u64                           req_num;
327         __u32                           result;
328         char                            reason[1];
329 };
330
331 static void domain_panic_data(struct ldc_channel *lp,
332                               struct ds_cap_state *dp,
333                               void *buf, int len)
334 {
335         struct ds_data *dpkt = buf;
336         struct ds_panic_req *rp;
337         struct {
338                 struct ds_data          data;
339                 struct ds_panic_res     res;
340         } pkt;
341
342         rp = (struct ds_panic_req *) (dpkt + 1);
343
344         printk(KERN_ALERT PFX "Panic request from "
345                "LDOM manager received.\n");
346
347         memset(&pkt, 0, sizeof(pkt));
348         pkt.data.tag.type = DS_DATA;
349         pkt.data.tag.len = sizeof(pkt) - sizeof(struct ds_msg_tag);
350         pkt.data.handle = dp->handle;
351         pkt.res.req_num = rp->req_num;
352         pkt.res.result = DS_OK;
353         pkt.res.reason[0] = 0;
354
355         ds_send(lp, &pkt, sizeof(pkt));
356
357         panic("PANIC requested by LDOM manager.");
358 }
359
360 #ifdef CONFIG_HOTPLUG_CPU
361 struct dr_cpu_tag {
362         __u64                           req_num;
363         __u32                           type;
364 #define DR_CPU_CONFIGURE                0x43
365 #define DR_CPU_UNCONFIGURE              0x55
366 #define DR_CPU_FORCE_UNCONFIGURE        0x46
367 #define DR_CPU_STATUS                   0x53
368
369 /* Responses */
370 #define DR_CPU_OK                       0x6f
371 #define DR_CPU_ERROR                    0x65
372
373         __u32                           num_records;
374 };
375
376 struct dr_cpu_resp_entry {
377         __u32                           cpu;
378         __u32                           result;
379 #define DR_CPU_RES_OK                   0x00
380 #define DR_CPU_RES_FAILURE              0x01
381 #define DR_CPU_RES_BLOCKED              0x02
382 #define DR_CPU_RES_CPU_NOT_RESPONDING   0x03
383 #define DR_CPU_RES_NOT_IN_MD            0x04
384
385         __u32                           stat;
386 #define DR_CPU_STAT_NOT_PRESENT         0x00
387 #define DR_CPU_STAT_UNCONFIGURED        0x01
388 #define DR_CPU_STAT_CONFIGURED          0x02
389
390         __u32                           str_off;
391 };
392
393 /* DR cpu requests get queued onto the work list by the
394  * dr_cpu_data() callback.  The list is protected by
395  * ds_lock, and processed by dr_cpu_process() in order.
396  */
397 static LIST_HEAD(dr_cpu_work_list);
398 static DECLARE_WAIT_QUEUE_HEAD(dr_cpu_wait);
399
400 struct dr_cpu_queue_entry {
401         struct list_head                list;
402         char                            req[0];
403 };
404
405 static void __dr_cpu_send_error(struct ds_cap_state *cp, struct ds_data *data)
406 {
407         struct dr_cpu_tag *tag = (struct dr_cpu_tag *) (data + 1);
408         struct ds_info *dp = ds_info;
409         struct {
410                 struct ds_data          data;
411                 struct dr_cpu_tag       tag;
412         } pkt;
413         int msg_len;
414
415         memset(&pkt, 0, sizeof(pkt));
416         pkt.data.tag.type = DS_DATA;
417         pkt.data.handle = cp->handle;
418         pkt.tag.req_num = tag->req_num;
419         pkt.tag.type = DR_CPU_ERROR;
420         pkt.tag.num_records = 0;
421
422         msg_len = (sizeof(struct ds_data) +
423                    sizeof(struct dr_cpu_tag));
424
425         pkt.data.tag.len = msg_len - sizeof(struct ds_msg_tag);
426
427         ds_send(dp->lp, &pkt, msg_len);
428 }
429
430 static void dr_cpu_send_error(struct ds_cap_state *cp, struct ds_data *data)
431 {
432         unsigned long flags;
433
434         spin_lock_irqsave(&ds_lock, flags);
435         __dr_cpu_send_error(cp, data);
436         spin_unlock_irqrestore(&ds_lock, flags);
437 }
438
439 #define CPU_SENTINEL    0xffffffff
440
441 static void purge_dups(u32 *list, u32 num_ents)
442 {
443         unsigned int i;
444
445         for (i = 0; i < num_ents; i++) {
446                 u32 cpu = list[i];
447                 unsigned int j;
448
449                 if (cpu == CPU_SENTINEL)
450                         continue;
451
452                 for (j = i + 1; j < num_ents; j++) {
453                         if (list[j] == cpu)
454                                 list[j] = CPU_SENTINEL;
455                 }
456         }
457 }
458
459 static int dr_cpu_size_response(int ncpus)
460 {
461         return (sizeof(struct ds_data) +
462                 sizeof(struct dr_cpu_tag) +
463                 (sizeof(struct dr_cpu_resp_entry) * ncpus));
464 }
465
466 static void dr_cpu_init_response(struct ds_data *resp, u64 req_num,
467                                  u64 handle, int resp_len, int ncpus,
468                                  cpumask_t *mask, u32 default_stat)
469 {
470         struct dr_cpu_resp_entry *ent;
471         struct dr_cpu_tag *tag;
472         int i, cpu;
473
474         tag = (struct dr_cpu_tag *) (resp + 1);
475         ent = (struct dr_cpu_resp_entry *) (tag + 1);
476
477         resp->tag.type = DS_DATA;
478         resp->tag.len = resp_len - sizeof(struct ds_msg_tag);
479         resp->handle = handle;
480         tag->req_num = req_num;
481         tag->type = DR_CPU_OK;
482         tag->num_records = ncpus;
483
484         i = 0;
485         for_each_cpu_mask(cpu, *mask) {
486                 ent[i].cpu = cpu;
487                 ent[i].result = DR_CPU_RES_OK;
488                 ent[i].stat = default_stat;
489                 i++;
490         }
491         BUG_ON(i != ncpus);
492 }
493
494 static void dr_cpu_mark(struct ds_data *resp, int cpu, int ncpus,
495                         u32 res, u32 stat)
496 {
497         struct dr_cpu_resp_entry *ent;
498         struct dr_cpu_tag *tag;
499         int i;
500
501         tag = (struct dr_cpu_tag *) (resp + 1);
502         ent = (struct dr_cpu_resp_entry *) (tag + 1);
503
504         for (i = 0; i < ncpus; i++) {
505                 if (ent[i].cpu != cpu)
506                         continue;
507                 ent[i].result = res;
508                 ent[i].stat = stat;
509                 break;
510         }
511 }
512
513 static int dr_cpu_configure(struct ds_cap_state *cp, u64 req_num,
514                             cpumask_t *mask)
515 {
516         struct ds_data *resp;
517         int resp_len, ncpus, cpu;
518         unsigned long flags;
519
520         ncpus = cpus_weight(*mask);
521         resp_len = dr_cpu_size_response(ncpus);
522         resp = kzalloc(resp_len, GFP_KERNEL);
523         if (!resp)
524                 return -ENOMEM;
525
526         dr_cpu_init_response(resp, req_num, cp->handle,
527                              resp_len, ncpus, mask,
528                              DR_CPU_STAT_CONFIGURED);
529
530         mdesc_fill_in_cpu_data(*mask);
531
532         for_each_cpu_mask(cpu, *mask) {
533                 int err;
534
535                 printk(KERN_INFO PFX "Starting cpu %d...\n", cpu);
536                 err = cpu_up(cpu);
537                 if (err) {
538                         printk(KERN_INFO PFX "CPU startup failed err=%d\n",
539                                err);
540                         dr_cpu_mark(resp, cpu, ncpus,
541                                     DR_CPU_RES_FAILURE,
542                                     DR_CPU_STAT_UNCONFIGURED);
543                 }
544         }
545
546         spin_lock_irqsave(&ds_lock, flags);
547         ds_send(ds_info->lp, resp, resp_len);
548         spin_unlock_irqrestore(&ds_lock, flags);
549
550         kfree(resp);
551
552         return 0;
553 }
554
555 static int dr_cpu_unconfigure(struct ds_cap_state *cp, u64 req_num,
556                               cpumask_t *mask)
557 {
558         struct ds_data *resp;
559         int resp_len, ncpus;
560
561         ncpus = cpus_weight(*mask);
562         resp_len = dr_cpu_size_response(ncpus);
563         resp = kzalloc(resp_len, GFP_KERNEL);
564         if (!resp)
565                 return -ENOMEM;
566
567         dr_cpu_init_response(resp, req_num, cp->handle,
568                              resp_len, ncpus, mask,
569                              DR_CPU_STAT_UNCONFIGURED);
570
571         kfree(resp);
572
573         return -EOPNOTSUPP;
574 }
575
576 static void process_dr_cpu_list(struct ds_cap_state *cp)
577 {
578         struct dr_cpu_queue_entry *qp, *tmp;
579         unsigned long flags;
580         LIST_HEAD(todo);
581         cpumask_t mask;
582
583         spin_lock_irqsave(&ds_lock, flags);
584         list_splice(&dr_cpu_work_list, &todo);
585         INIT_LIST_HEAD(&dr_cpu_work_list);
586         spin_unlock_irqrestore(&ds_lock, flags);
587
588         list_for_each_entry_safe(qp, tmp, &todo, list) {
589                 struct ds_data *data = (struct ds_data *) qp->req;
590                 struct dr_cpu_tag *tag = (struct dr_cpu_tag *) (data + 1);
591                 u32 *cpu_list = (u32 *) (tag + 1);
592                 u64 req_num = tag->req_num;
593                 unsigned int i;
594                 int err;
595
596                 switch (tag->type) {
597                 case DR_CPU_CONFIGURE:
598                 case DR_CPU_UNCONFIGURE:
599                 case DR_CPU_FORCE_UNCONFIGURE:
600                         break;
601
602                 default:
603                         dr_cpu_send_error(cp, data);
604                         goto next;
605                 }
606
607                 purge_dups(cpu_list, tag->num_records);
608
609                 cpus_clear(mask);
610                 for (i = 0; i < tag->num_records; i++) {
611                         if (cpu_list[i] == CPU_SENTINEL)
612                                 continue;
613
614                         if (cpu_list[i] < NR_CPUS)
615                                 cpu_set(cpu_list[i], mask);
616                 }
617
618                 if (tag->type == DR_CPU_CONFIGURE)
619                         err = dr_cpu_configure(cp, req_num, &mask);
620                 else
621                         err = dr_cpu_unconfigure(cp, req_num, &mask);
622
623                 if (err)
624                         dr_cpu_send_error(cp, data);
625
626 next:
627                 list_del(&qp->list);
628                 kfree(qp);
629         }
630 }
631
632 static int dr_cpu_thread(void *__unused)
633 {
634         struct ds_cap_state *cp;
635         DEFINE_WAIT(wait);
636
637         cp = find_cap_by_string("dr-cpu");
638
639         while (1) {
640                 prepare_to_wait(&dr_cpu_wait, &wait, TASK_INTERRUPTIBLE);
641                 if (list_empty(&dr_cpu_work_list))
642                         schedule();
643                 finish_wait(&dr_cpu_wait, &wait);
644
645                 if (kthread_should_stop())
646                         break;
647
648                 process_dr_cpu_list(cp);
649         }
650
651         return 0;
652 }
653
654 static void dr_cpu_data(struct ldc_channel *lp,
655                         struct ds_cap_state *dp,
656                         void *buf, int len)
657 {
658         struct dr_cpu_queue_entry *qp;
659         struct ds_data *dpkt = buf;
660         struct dr_cpu_tag *rp;
661
662         rp = (struct dr_cpu_tag *) (dpkt + 1);
663
664         qp = kmalloc(sizeof(struct dr_cpu_queue_entry) + len, GFP_ATOMIC);
665         if (!qp) {
666                 struct ds_cap_state *cp;
667
668                 cp = find_cap_by_string("dr-cpu");
669                 __dr_cpu_send_error(cp, dpkt);
670         } else {
671                 memcpy(&qp->req, buf, len);
672                 list_add_tail(&qp->list, &dr_cpu_work_list);
673                 wake_up(&dr_cpu_wait);
674         }
675 }
676 #endif
677
678 struct ds_pri_msg {
679         __u64                           req_num;
680         __u64                           type;
681 #define DS_PRI_REQUEST                  0x00
682 #define DS_PRI_DATA                     0x01
683 #define DS_PRI_UPDATE                   0x02
684 };
685
686 static void ds_pri_data(struct ldc_channel *lp,
687                         struct ds_cap_state *dp,
688                         void *buf, int len)
689 {
690         struct ds_data *dpkt = buf;
691         struct ds_pri_msg *rp;
692
693         rp = (struct ds_pri_msg *) (dpkt + 1);
694
695         printk(KERN_INFO PFX "PRI REQ [%lx:%lx], len=%d\n",
696                rp->req_num, rp->type, len);
697 }
698
699 struct ds_var_hdr {
700         __u32                           type;
701 #define DS_VAR_SET_REQ                  0x00
702 #define DS_VAR_DELETE_REQ               0x01
703 #define DS_VAR_SET_RESP                 0x02
704 #define DS_VAR_DELETE_RESP              0x03
705 };
706
707 struct ds_var_set_msg {
708         struct ds_var_hdr               hdr;
709         char                            name_and_value[0];
710 };
711
712 struct ds_var_delete_msg {
713         struct ds_var_hdr               hdr;
714         char                            name[0];
715 };
716
717 struct ds_var_resp {
718         struct ds_var_hdr               hdr;
719         __u32                           result;
720 #define DS_VAR_SUCCESS                  0x00
721 #define DS_VAR_NO_SPACE                 0x01
722 #define DS_VAR_INVALID_VAR              0x02
723 #define DS_VAR_INVALID_VAL              0x03
724 #define DS_VAR_NOT_PRESENT              0x04
725 };
726
727 static DEFINE_MUTEX(ds_var_mutex);
728 static int ds_var_doorbell;
729 static int ds_var_response;
730
731 static void ds_var_data(struct ldc_channel *lp,
732                         struct ds_cap_state *dp,
733                         void *buf, int len)
734 {
735         struct ds_data *dpkt = buf;
736         struct ds_var_resp *rp;
737
738         rp = (struct ds_var_resp *) (dpkt + 1);
739
740         if (rp->hdr.type != DS_VAR_SET_RESP &&
741             rp->hdr.type != DS_VAR_DELETE_RESP)
742                 return;
743
744         ds_var_response = rp->result;
745         wmb();
746         ds_var_doorbell = 1;
747 }
748
749 void ldom_set_var(const char *var, const char *value)
750 {
751         struct ds_info *dp = ds_info;
752         struct ds_cap_state *cp;
753
754         cp = find_cap_by_string("var-config");
755         if (cp->state != CAP_STATE_REGISTERED)
756                 cp = find_cap_by_string("var-config-backup");
757
758         if (cp->state == CAP_STATE_REGISTERED) {
759                 union {
760                         struct {
761                                 struct ds_data          data;
762                                 struct ds_var_set_msg   msg;
763                         } header;
764                         char                    all[512];
765                 } pkt;
766                 unsigned long flags;
767                 char  *base, *p;
768                 int msg_len, loops;
769
770                 memset(&pkt, 0, sizeof(pkt));
771                 pkt.header.data.tag.type = DS_DATA;
772                 pkt.header.data.handle = cp->handle;
773                 pkt.header.msg.hdr.type = DS_VAR_SET_REQ;
774                 base = p = &pkt.header.msg.name_and_value[0];
775                 strcpy(p, var);
776                 p += strlen(var) + 1;
777                 strcpy(p, value);
778                 p += strlen(value) + 1;
779
780                 msg_len = (sizeof(struct ds_data) +
781                            sizeof(struct ds_var_set_msg) +
782                            (p - base));
783                 msg_len = (msg_len + 3) & ~3;
784                 pkt.header.data.tag.len = msg_len - sizeof(struct ds_msg_tag);
785
786                 mutex_lock(&ds_var_mutex);
787
788                 spin_lock_irqsave(&ds_lock, flags);
789                 ds_var_doorbell = 0;
790                 ds_var_response = -1;
791
792                 ds_send(dp->lp, &pkt, msg_len);
793                 spin_unlock_irqrestore(&ds_lock, flags);
794
795                 loops = 1000;
796                 while (ds_var_doorbell == 0) {
797                         if (loops-- < 0)
798                                 break;
799                         barrier();
800                         udelay(100);
801                 }
802
803                 mutex_unlock(&ds_var_mutex);
804
805                 if (ds_var_doorbell == 0 ||
806                     ds_var_response != DS_VAR_SUCCESS)
807                         printk(KERN_ERR PFX "var-config [%s:%s] "
808                                "failed, response(%d).\n",
809                                var, value,
810                                ds_var_response);
811         } else {
812                 printk(KERN_ERR PFX "var-config not registered so "
813                        "could not set (%s) variable to (%s).\n",
814                        var, value);
815         }
816 }
817
818 void ldom_reboot(const char *boot_command)
819 {
820         /* Don't bother with any of this if the boot_command
821          * is empty.
822          */
823         if (boot_command && strlen(boot_command)) {
824                 char full_boot_str[256];
825
826                 strcpy(full_boot_str, "boot ");
827                 strcpy(full_boot_str + strlen("boot "), boot_command);
828
829                 ldom_set_var("reboot-command", full_boot_str);
830         }
831         sun4v_mach_sir();
832 }
833
834 void ldom_power_off(void)
835 {
836         sun4v_mach_exit(0);
837 }
838
839 static void ds_conn_reset(struct ds_info *dp)
840 {
841         printk(KERN_ERR PFX "ds_conn_reset() from %p\n",
842                __builtin_return_address(0));
843 }
844
845 static int register_services(struct ds_info *dp)
846 {
847         struct ldc_channel *lp = dp->lp;
848         int i;
849
850         for (i = 0; i < ARRAY_SIZE(ds_states); i++) {
851                 struct {
852                         struct ds_reg_req req;
853                         u8 id_buf[256];
854                 } pbuf;
855                 struct ds_cap_state *cp = &ds_states[i];
856                 int err, msg_len;
857                 u64 new_count;
858
859                 if (cp->state == CAP_STATE_REGISTERED)
860                         continue;
861
862                 new_count = sched_clock() & 0xffffffff;
863                 cp->handle = ((u64) i << 32) | new_count;
864
865                 msg_len = (sizeof(struct ds_reg_req) +
866                            strlen(cp->service_id));
867
868                 memset(&pbuf, 0, sizeof(pbuf));
869                 pbuf.req.tag.type = DS_REG_REQ;
870                 pbuf.req.tag.len = (msg_len - sizeof(struct ds_msg_tag));
871                 pbuf.req.handle = cp->handle;
872                 pbuf.req.major = 1;
873                 pbuf.req.minor = 0;
874                 strcpy(pbuf.req.svc_id, cp->service_id);
875
876                 err = ds_send(lp, &pbuf, msg_len);
877                 if (err > 0)
878                         cp->state = CAP_STATE_REG_SENT;
879         }
880         return 0;
881 }
882
883 static int ds_handshake(struct ds_info *dp, struct ds_msg_tag *pkt)
884 {
885
886         if (dp->hs_state == DS_HS_START) {
887                 if (pkt->type != DS_INIT_ACK)
888                         goto conn_reset;
889
890                 dp->hs_state = DS_HS_DONE;
891
892                 return register_services(dp);
893         }
894
895         if (dp->hs_state != DS_HS_DONE)
896                 goto conn_reset;
897
898         if (pkt->type == DS_REG_ACK) {
899                 struct ds_reg_ack *ap = (struct ds_reg_ack *) pkt;
900                 struct ds_cap_state *cp = find_cap(ap->handle);
901
902                 if (!cp) {
903                         printk(KERN_ERR PFX "REG ACK for unknown handle %lx\n",
904                                ap->handle);
905                         return 0;
906                 }
907                 printk(KERN_INFO PFX "Registered %s service.\n",
908                        cp->service_id);
909                 cp->state = CAP_STATE_REGISTERED;
910         } else if (pkt->type == DS_REG_NACK) {
911                 struct ds_reg_nack *np = (struct ds_reg_nack *) pkt;
912                 struct ds_cap_state *cp = find_cap(np->handle);
913
914                 if (!cp) {
915                         printk(KERN_ERR PFX "REG NACK for "
916                                "unknown handle %lx\n",
917                                np->handle);
918                         return 0;
919                 }
920                 printk(KERN_INFO PFX "Could not register %s service\n",
921                        cp->service_id);
922                 cp->state = CAP_STATE_UNKNOWN;
923         }
924
925         return 0;
926
927 conn_reset:
928         ds_conn_reset(dp);
929         return -ECONNRESET;
930 }
931
932 static int ds_data(struct ds_info *dp, struct ds_msg_tag *pkt, int len)
933 {
934         struct ds_data *dpkt = (struct ds_data *) pkt;
935         struct ds_cap_state *cp = find_cap(dpkt->handle);
936
937         if (!cp) {
938                 struct ds_data_nack nack = {
939                         .tag = {
940                                 .type = DS_NACK,
941                                 .len = (sizeof(struct ds_data_nack) -
942                                         sizeof(struct ds_msg_tag)),
943                         },
944                         .handle = dpkt->handle,
945                         .result = DS_INV_HDL,
946                 };
947
948                 printk(KERN_ERR PFX "Data for unknown handle %lu\n",
949                        dpkt->handle);
950                 ds_send(dp->lp, &nack, sizeof(nack));
951         } else {
952                 cp->data(dp->lp, cp, dpkt, len);
953         }
954         return 0;
955 }
956
957 static void ds_up(struct ds_info *dp)
958 {
959         struct ldc_channel *lp = dp->lp;
960         struct ds_ver_req req;
961         int err;
962
963         req.tag.type = DS_INIT_REQ;
964         req.tag.len = sizeof(req) - sizeof(struct ds_msg_tag);
965         req.ver.major = 1;
966         req.ver.minor = 0;
967
968         err = ds_send(lp, &req, sizeof(req));
969         if (err > 0)
970                 dp->hs_state = DS_HS_START;
971 }
972
973 static void ds_event(void *arg, int event)
974 {
975         struct ds_info *dp = arg;
976         struct ldc_channel *lp = dp->lp;
977         unsigned long flags;
978         int err;
979
980         spin_lock_irqsave(&ds_lock, flags);
981
982         if (event == LDC_EVENT_UP) {
983                 ds_up(dp);
984                 spin_unlock_irqrestore(&ds_lock, flags);
985                 return;
986         }
987
988         if (event != LDC_EVENT_DATA_READY) {
989                 printk(KERN_WARNING PFX "Unexpected LDC event %d\n", event);
990                 spin_unlock_irqrestore(&ds_lock, flags);
991                 return;
992         }
993
994         err = 0;
995         while (1) {
996                 struct ds_msg_tag *tag;
997
998                 err = ldc_read(lp, dp->rcv_buf, sizeof(*tag));
999
1000                 if (unlikely(err < 0)) {
1001                         if (err == -ECONNRESET)
1002                                 ds_conn_reset(dp);
1003                         break;
1004                 }
1005                 if (err == 0)
1006                         break;
1007
1008                 tag = dp->rcv_buf;
1009                 err = ldc_read(lp, tag + 1, tag->len);
1010
1011                 if (unlikely(err < 0)) {
1012                         if (err == -ECONNRESET)
1013                                 ds_conn_reset(dp);
1014                         break;
1015                 }
1016                 if (err < tag->len)
1017                         break;
1018
1019                 if (tag->type < DS_DATA)
1020                         err = ds_handshake(dp, dp->rcv_buf);
1021                 else
1022                         err = ds_data(dp, dp->rcv_buf,
1023                                       sizeof(*tag) + err);
1024                 if (err == -ECONNRESET)
1025                         break;
1026         }
1027
1028         spin_unlock_irqrestore(&ds_lock, flags);
1029 }
1030
1031 static int __devinit ds_probe(struct vio_dev *vdev,
1032                               const struct vio_device_id *id)
1033 {
1034         static int ds_version_printed;
1035         struct ldc_channel_config ds_cfg = {
1036                 .event          = ds_event,
1037                 .mtu            = 4096,
1038                 .mode           = LDC_MODE_STREAM,
1039         };
1040         struct ldc_channel *lp;
1041         struct ds_info *dp;
1042         int err;
1043
1044         if (ds_version_printed++ == 0)
1045                 printk(KERN_INFO "%s", version);
1046
1047         dp = kzalloc(sizeof(*dp), GFP_KERNEL);
1048         err = -ENOMEM;
1049         if (!dp)
1050                 goto out_err;
1051
1052         dp->rcv_buf = kzalloc(4096, GFP_KERNEL);
1053         if (!dp->rcv_buf)
1054                 goto out_free_dp;
1055
1056         dp->rcv_buf_len = 4096;
1057
1058         ds_cfg.tx_irq = vdev->tx_irq;
1059         ds_cfg.rx_irq = vdev->rx_irq;
1060
1061         lp = ldc_alloc(vdev->channel_id, &ds_cfg, dp);
1062         if (IS_ERR(lp)) {
1063                 err = PTR_ERR(lp);
1064                 goto out_free_rcv_buf;
1065         }
1066         dp->lp = lp;
1067
1068         err = ldc_bind(lp, "DS");
1069         if (err)
1070                 goto out_free_ldc;
1071
1072         ds_info = dp;
1073
1074         start_powerd();
1075
1076         return err;
1077
1078 out_free_ldc:
1079         ldc_free(dp->lp);
1080
1081 out_free_rcv_buf:
1082         kfree(dp->rcv_buf);
1083
1084 out_free_dp:
1085         kfree(dp);
1086
1087 out_err:
1088         return err;
1089 }
1090
1091 static int ds_remove(struct vio_dev *vdev)
1092 {
1093         return 0;
1094 }
1095
1096 static struct vio_device_id ds_match[] = {
1097         {
1098                 .type = "domain-services-port",
1099         },
1100         {},
1101 };
1102
1103 static struct vio_driver ds_driver = {
1104         .id_table       = ds_match,
1105         .probe          = ds_probe,
1106         .remove         = ds_remove,
1107         .driver         = {
1108                 .name   = "ds",
1109                 .owner  = THIS_MODULE,
1110         }
1111 };
1112
1113 static int __init ds_init(void)
1114 {
1115         int i;
1116
1117         for (i = 0; i < ARRAY_SIZE(ds_states); i++)
1118                 ds_states[i].handle = ((u64)i << 32);
1119
1120 #ifdef CONFIG_HOTPLUG_CPU
1121         kthread_run(dr_cpu_thread, NULL, "kdrcpud");
1122 #endif
1123
1124         return vio_register_driver(&ds_driver);
1125 }
1126
1127 subsys_initcall(ds_init);