]> git.ipfire.org Git - thirdparty/binutils-gdb.git/blobdiff - sim/sh/interp.c
sim: parse_args: display getopt error ourselves
[thirdparty/binutils-gdb.git] / sim / sh / interp.c
index beaf44297668e5f56cc9c61105384cadde12eb08..2f59c5c92c9f29ee5841bd012fbcaac6023f9db0 100644 (file)
@@ -1,4 +1,4 @@
-/* Simulator for the Hitachi SH architecture.
+/* Simulator for the Renesas (formerly Hitachi) / SuperH Inc. SH architecture.
 
    Written by Steve Chamberlain of Cygnus Support.
    sac@cygnus.com
 
 */
 
+#include "config.h"
+
+#include <ctype.h>
+#include <stdio.h>
+#include <errno.h>
 #include <signal.h>
-#include "sysdep.h"
+#ifdef HAVE_UNISTD_H
+#include <unistd.h>
+#endif
+#ifdef HAVE_MMAP
+#include <sys/mman.h>
+# ifndef MAP_FAILED
+#  define MAP_FAILED -1
+# endif
+# if !defined (MAP_ANONYMOUS) && defined (MAP_ANON)
+#  define MAP_ANONYMOUS MAP_ANON
+# endif
+#endif
+
+#ifdef HAVE_STRING_H
+#include <string.h>
+#else
+#ifdef HAVE_STRINGS_H
+#include <strings.h>
+#endif
+#endif
+
+#ifdef HAVE_STDLIB_H
+#include <stdlib.h>
+#endif
+
+#ifdef HAVE_SYS_STAT_H
+#include <sys/stat.h>
+#endif
+#ifdef HAVE_TIME_H
+#include <time.h>
+#endif
+#ifdef HAVE_SYS_TIME_H
+#include <sys/time.h>
+#endif
+#ifndef _WIN32
+#include <utime.h>
+#include <sys/wait.h>
+#endif
+
 #include "bfd.h"
-#include "remote-sim.h"
+#include "gdb/callback.h"
+#include "gdb/remote-sim.h"
+#include "gdb/sim-sh.h"
+
+#include "sim-main.h"
+#include "sim-base.h"
+#include "sim-options.h"
 
 /* This file is local - if newlib changes, then so should this.  */
 #include "syscall.h"
 
-/* start-sanitize-sh3e */
 #include <math.h>
-/* end-sanitize-sh3e */
+
+#ifdef _WIN32
+#include <float.h>             /* Needed for _isnan() */
+#define isnan _isnan
+#endif
 
 #ifndef SIGBUS
 #define SIGBUS SIGSEGV
 #define SIGQUIT SIGTERM
 #endif
 
+#ifndef SIGTRAP
+#define SIGTRAP 5
+#endif
+
+/* TODO: Stop using these names.  */
+#undef SEXT
+#undef SEXT32
+
+extern unsigned short sh_jump_table[], sh_dsp_table[0x1000], ppi_table[];
+
 #define O_RECOMPILE 85
 #define DEFINE_TABLE
 #define DISASSEMBLER_TABLE
 
+/* Define the rate at which the simulator should poll the host
+   for a quit. */
+#define POLL_QUIT_INTERVAL 0x60000
+
+/* TODO: Move into sim_cpu.  */
+saved_state_type saved_state;
+
+struct loop_bounds { unsigned char *start, *end; };
+
+/* These variables are at file scope so that functions other than
+   sim_resume can use the fetch/store macros */
+
+#define target_little_endian (CURRENT_TARGET_BYTE_ORDER == BFD_ENDIAN_LITTLE)
+static int global_endianw, endianb;
+static int target_dsp;
+#define host_little_endian (HOST_BYTE_ORDER == BFD_ENDIAN_LITTLE)
+
+static int maskw = 0;
+static int maskl = 0;
 
+/* Short hand definitions of the registers */
 
 #define SBIT(x) ((x)&sbit)
 #define R0     saved_state.asregs.regs[0]
 #define Rn     saved_state.asregs.regs[n]
 #define Rm     saved_state.asregs.regs[m]
-#define UR0    (unsigned int)(saved_state.asregs.regs[0])
-#define UR     (unsigned int)R
-#define UR     (unsigned int)R
+#define UR0    (unsigned int) (saved_state.asregs.regs[0])
+#define UR     (unsigned int) R
+#define UR     (unsigned int) R
 #define SR0    saved_state.asregs.regs[0]
-#define GBR    saved_state.asregs.gbr
-#define VBR    saved_state.asregs.vbr
-#define MACH   saved_state.asregs.mach
-#define MACL   saved_state.asregs.macl
-#define M      saved_state.asregs.sr.bits.m
-#define Q      saved_state.asregs.sr.bits.q
-#define S      saved_state.asregs.sr.bits.s
-/* start-sanitize-sh3e */
-#define FPSCR  saved_state.asregs.fpscr
-#define FPUL   saved_state.asregs.fpul
-/* end-sanitize-sh3e */
-
-#define GET_SR() (saved_state.asregs.sr.bits.t = T, saved_state.asregs.sr.word)
-#define SET_SR(x) {saved_state.asregs.sr.word = (x); T =saved_state.asregs.sr.bits.t;}
-
-#define PC pc
-#define C cycles
-
-int 
-fail ()
+#define CREG(n)        (saved_state.asregs.cregs.i[(n)])
+#define GBR    saved_state.asregs.cregs.named.gbr
+#define VBR    saved_state.asregs.cregs.named.vbr
+#define DBR    saved_state.asregs.cregs.named.dbr
+#define TBR    saved_state.asregs.cregs.named.tbr
+#define IBCR   saved_state.asregs.cregs.named.ibcr
+#define IBNR   saved_state.asregs.cregs.named.ibnr
+#define BANKN  (saved_state.asregs.cregs.named.ibnr & 0x1ff)
+#define ME     ((saved_state.asregs.cregs.named.ibnr >> 14) & 0x3)
+#define SSR    saved_state.asregs.cregs.named.ssr
+#define SPC    saved_state.asregs.cregs.named.spc
+#define SGR    saved_state.asregs.cregs.named.sgr
+#define SREG(n)        (saved_state.asregs.sregs.i[(n)])
+#define MACH   saved_state.asregs.sregs.named.mach
+#define MACL   saved_state.asregs.sregs.named.macl
+#define PR     saved_state.asregs.sregs.named.pr
+#define FPUL   saved_state.asregs.sregs.named.fpul
+
+#define PC insn_ptr
+
+
+
+/* Alternate bank of registers r0-r7 */
+
+/* Note: code controling SR handles flips between BANK0 and BANK1 */
+#define Rn_BANK(n) (saved_state.asregs.cregs.named.bank[(n)])
+#define SET_Rn_BANK(n, EXP) do { saved_state.asregs.cregs.named.bank[(n)] = (EXP); } while (0)
+
+
+/* Manipulate SR */
+
+#define SR_MASK_BO  (1 << 14)
+#define SR_MASK_CS  (1 << 13)
+#define SR_MASK_DMY (1 << 11)
+#define SR_MASK_DMX (1 << 10)
+#define SR_MASK_M (1 << 9)
+#define SR_MASK_Q (1 << 8)
+#define SR_MASK_I (0xf << 4)
+#define SR_MASK_S (1 << 1)
+#define SR_MASK_T (1 << 0)
+
+#define SR_MASK_BL (1 << 28)
+#define SR_MASK_RB (1 << 29)
+#define SR_MASK_MD (1 << 30)
+#define SR_MASK_RC 0x0fff0000
+#define SR_RC_INCREMENT -0x00010000
+
+#define BO     ((saved_state.asregs.cregs.named.sr & SR_MASK_BO) != 0)
+#define CS     ((saved_state.asregs.cregs.named.sr & SR_MASK_CS) != 0)
+#define M      ((saved_state.asregs.cregs.named.sr & SR_MASK_M) != 0)
+#define Q      ((saved_state.asregs.cregs.named.sr & SR_MASK_Q) != 0)
+#define S      ((saved_state.asregs.cregs.named.sr & SR_MASK_S) != 0)
+#define T      ((saved_state.asregs.cregs.named.sr & SR_MASK_T) != 0)
+#define LDST   ((saved_state.asregs.cregs.named.ldst) != 0)
+
+#define SR_BL ((saved_state.asregs.cregs.named.sr & SR_MASK_BL) != 0)
+#define SR_RB ((saved_state.asregs.cregs.named.sr & SR_MASK_RB) != 0)
+#define SR_MD ((saved_state.asregs.cregs.named.sr & SR_MASK_MD) != 0)
+#define SR_DMY ((saved_state.asregs.cregs.named.sr & SR_MASK_DMY) != 0)
+#define SR_DMX ((saved_state.asregs.cregs.named.sr & SR_MASK_DMX) != 0)
+#define SR_RC ((saved_state.asregs.cregs.named.sr & SR_MASK_RC))
+
+/* Note: don't use this for privileged bits */
+#define SET_SR_BIT(EXP, BIT) \
+do { \
+  if ((EXP) & 1) \
+    saved_state.asregs.cregs.named.sr |= (BIT); \
+  else \
+    saved_state.asregs.cregs.named.sr &= ~(BIT); \
+} while (0)
+
+#define SET_SR_BO(EXP) SET_SR_BIT ((EXP), SR_MASK_BO)
+#define SET_SR_CS(EXP) SET_SR_BIT ((EXP), SR_MASK_CS)
+#define SET_BANKN(EXP) \
+do { \
+  IBNR = (IBNR & 0xfe00) | (EXP & 0x1f); \
+} while (0)
+#define SET_ME(EXP) \
+do { \
+  IBNR = (IBNR & 0x3fff) | ((EXP & 0x3) << 14); \
+} while (0)
+#define SET_SR_M(EXP) SET_SR_BIT ((EXP), SR_MASK_M)
+#define SET_SR_Q(EXP) SET_SR_BIT ((EXP), SR_MASK_Q)
+#define SET_SR_S(EXP) SET_SR_BIT ((EXP), SR_MASK_S)
+#define SET_SR_T(EXP) SET_SR_BIT ((EXP), SR_MASK_T)
+#define SET_LDST(EXP) (saved_state.asregs.cregs.named.ldst = ((EXP) != 0))
+
+/* stc currently relies on being able to read SR without modifications.  */
+#define GET_SR() (saved_state.asregs.cregs.named.sr - 0)
+
+#define SET_SR(x) set_sr (x)
+
+#define SET_RC(x) \
+  (saved_state.asregs.cregs.named.sr \
+   = saved_state.asregs.cregs.named.sr & 0xf000ffff | ((x) & 0xfff) << 16)
+
+/* Manipulate FPSCR */
+
+#define FPSCR_MASK_FR (1 << 21)
+#define FPSCR_MASK_SZ (1 << 20)
+#define FPSCR_MASK_PR (1 << 19)
+
+#define FPSCR_FR  ((GET_FPSCR () & FPSCR_MASK_FR) != 0)
+#define FPSCR_SZ  ((GET_FPSCR () & FPSCR_MASK_SZ) != 0)
+#define FPSCR_PR  ((GET_FPSCR () & FPSCR_MASK_PR) != 0)
+
+static void
+set_fpscr1 (int x)
 {
-  abort ();
+  int old = saved_state.asregs.sregs.named.fpscr;
+  saved_state.asregs.sregs.named.fpscr = (x);
+  /* swap the floating point register banks */
+  if ((saved_state.asregs.sregs.named.fpscr ^ old) & FPSCR_MASK_FR
+      /* Ignore bit change if simulating sh-dsp.  */
+      && ! target_dsp)
+    {
+      union fregs_u tmpf = saved_state.asregs.fregs[0];
+      saved_state.asregs.fregs[0] = saved_state.asregs.fregs[1];
+      saved_state.asregs.fregs[1] = tmpf;
+    }
+}
+
+/* sts relies on being able to read fpscr directly.  */
+#define GET_FPSCR()  (saved_state.asregs.sregs.named.fpscr)
+#define SET_FPSCR(x) \
+do { \
+  set_fpscr1 (x); \
+} while (0)
+
+#define DSR  (saved_state.asregs.sregs.named.fpscr)
+
+#define RAISE_EXCEPTION(x) \
+  (saved_state.asregs.exception = x, saved_state.asregs.insn_end = 0)
+
+#define RAISE_EXCEPTION_IF_IN_DELAY_SLOT() \
+  if (in_delay_slot) RAISE_EXCEPTION (SIGILL)
+
+/* This function exists mainly for the purpose of setting a breakpoint to
+   catch simulated bus errors when running the simulator under GDB.  */
+
+static void
+raise_exception (int x)
+{
+  RAISE_EXCEPTION (x);
+}
+
+static void
+raise_buserror (void)
+{
+  raise_exception (SIGBUS);
 }
 
-#define BUSERROR(addr, mask) \
-  if (addr & ~mask)  { saved_state.asregs.exception = SIGBUS;}
+#define PROCESS_SPECIAL_ADDRESS(addr, endian, ptr, bits_written, \
+                               forbidden_addr_bits, data, retval) \
+do { \
+  if (addr & forbidden_addr_bits) \
+    { \
+      raise_buserror (); \
+      return retval; \
+    } \
+  else if ((addr & saved_state.asregs.xyram_select) \
+          == saved_state.asregs.xram_start) \
+    ptr = (void *) &saved_state.asregs.xmem_offset[addr ^ endian]; \
+  else if ((addr & saved_state.asregs.xyram_select) \
+          == saved_state.asregs.yram_start) \
+    ptr = (void *) &saved_state.asregs.ymem_offset[addr ^ endian]; \
+  else if ((unsigned) addr >> 24 == 0xf0 \
+          && bits_written == 32 && (data & 1) == 0) \
+    /* This invalidates (if not associative) or might invalidate \
+       (if associative) an instruction cache line.  This is used for \
+       trampolines.  Since we don't simulate the cache, this is a no-op \
+       as far as the simulator is concerned.  */ \
+    return retval; \
+  else \
+    { \
+      if (bits_written == 8 && addr > 0x5000000) \
+       IOMEM (addr, 1, data); \
+      /* We can't do anything useful with the other stuff, so fail.  */ \
+      raise_buserror (); \
+      return retval; \
+    } \
+} while (0)
+
+/* FIXME: sim_resume should be renamed to sim_engine_run.  sim_resume
+   being implemented by ../common/sim_resume.c and the below should
+   make a call to sim_engine_halt */
+
+#define BUSERROR(addr, mask) ((addr) & (mask))
+
+#define WRITE_BUSERROR(addr, mask, data, addr_func) \
+  do \
+    { \
+      if (addr & mask) \
+       { \
+         addr_func (addr, data); \
+         return; \
+       } \
+    } \
+  while (0)
+
+#define READ_BUSERROR(addr, mask, addr_func) \
+  do \
+    { \
+      if (addr & mask) \
+       return addr_func (addr); \
+    } \
+  while (0)
 
 /* Define this to enable register lifetime checking.
    The compiler generates "add #0,rn" insns to mark registers as invalid,
@@ -89,7 +352,7 @@ fail ()
 
 #ifdef PARANOID
 int valid[16];
-#define CREF(x)  if(!valid[x]) fail();
+#define CREF(x)  if (!valid[x]) fail ();
 #define CDEF(x)  valid[x] = 1;
 #define UNDEF(x) valid[x] = 0;
 #else
@@ -98,235 +361,365 @@ int valid[16];
 #define UNDEF(x)
 #endif
 
-static void parse_and_set_memory_size PARAMS ((char *str));
-
-static int IOMEM PARAMS ((int addr, int write, int value));
-
-/* These variables are at file scope so that functions other than
-   sim_resume can use the fetch/store macros */
-
-static int  little_endian;
-
-#if 1
-static int maskl = ~0;
-static int maskw = ~0;
-#endif
-typedef union
+static void parse_and_set_memory_size (SIM_DESC sd, const char *str);
+static int IOMEM (int addr, int write, int value);
+static struct loop_bounds get_loop_bounds (int, int, unsigned char *,
+                                          unsigned char *, int, int);
+static void process_wlat_addr (int, int);
+static void process_wwat_addr (int, int);
+static void process_wbat_addr (int, int);
+static int process_rlat_addr (int);
+static int process_rwat_addr (int);
+static int process_rbat_addr (int);
+
+/* Floating point registers */
+
+#define DR(n) (get_dr (n))
+static double
+get_dr (int n)
 {
+  n = (n & ~1);
+  if (host_little_endian)
+    {
+      union
+      {
+       int i[2];
+       double d;
+      } dr;
+      dr.i[1] = saved_state.asregs.fregs[0].i[n + 0];
+      dr.i[0] = saved_state.asregs.fregs[0].i[n + 1];
+      return dr.d;
+    }
+  else
+    return (saved_state.asregs.fregs[0].d[n >> 1]);
+}
 
-  struct
-  {
-
-    int regs[16];
-    int pc;
-    int pr;
+#define SET_DR(n, EXP) set_dr ((n), (EXP))
+static void
+set_dr (int n, double exp)
+{
+  n = (n & ~1);
+  if (host_little_endian)
+    {
+      union
+      {
+       int i[2];
+       double d;
+      } dr;
+      dr.d = exp;
+      saved_state.asregs.fregs[0].i[n + 0] = dr.i[1];
+      saved_state.asregs.fregs[0].i[n + 1] = dr.i[0];
+    }
+  else
+    saved_state.asregs.fregs[0].d[n >> 1] = exp;
+}
 
-    int gbr;
-    int vbr;
-    int mach;
-    int macl;
+#define SET_FI(n,EXP) (saved_state.asregs.fregs[0].i[(n)] = (EXP))
+#define FI(n) (saved_state.asregs.fregs[0].i[(n)])
+
+#define FR(n) (saved_state.asregs.fregs[0].f[(n)])
+#define SET_FR(n,EXP) (saved_state.asregs.fregs[0].f[(n)] = (EXP))
+
+#define XD_TO_XF(n) ((((n) & 1) << 5) | ((n) & 0x1e))
+#define XF(n) (saved_state.asregs.fregs[(n) >> 5].i[(n) & 0x1f])
+#define SET_XF(n,EXP) (saved_state.asregs.fregs[(n) >> 5].i[(n) & 0x1f] = (EXP))
+
+#define RS saved_state.asregs.cregs.named.rs
+#define RE saved_state.asregs.cregs.named.re
+#define MOD (saved_state.asregs.cregs.named.mod)
+#define SET_MOD(i) \
+(MOD = (i), \
+ MOD_ME = (unsigned) MOD >> 16 | (SR_DMY ? ~0xffff : (SR_DMX ? 0 : 0x10000)), \
+ MOD_DELTA = (MOD & 0xffff) - ((unsigned) MOD >> 16))
+
+#define DSP_R(n) saved_state.asregs.sregs.i[(n)]
+#define DSP_GRD(n) DSP_R ((n) + 8)
+#define GET_DSP_GRD(n) ((n | 2) == 7 ? SEXT (DSP_GRD (n)) : SIGN32 (DSP_R (n)))
+#define A1 DSP_R (5)
+#define A0 DSP_R (7)
+#define X0 DSP_R (8)
+#define X1 DSP_R (9)
+#define Y0 DSP_R (10)
+#define Y1 DSP_R (11)
+#define M0 DSP_R (12)
+#define A1G DSP_R (13)
+#define M1 DSP_R (14)
+#define A0G DSP_R (15)
+/* DSP_R (16) / DSP_GRD (16) are used as a fake destination for pcmp.  */
+#define MOD_ME DSP_GRD (17)
+#define MOD_DELTA DSP_GRD (18)
+
+#define FP_OP(n, OP, m) \
+{ \
+  if (FPSCR_PR) \
+    { \
+      if (((n) & 1) || ((m) & 1)) \
+       RAISE_EXCEPTION (SIGILL); \
+      else \
+       SET_DR (n, (DR (n) OP DR (m))); \
+    } \
+  else \
+    SET_FR (n, (FR (n) OP FR (m))); \
+} while (0)
+
+#define FP_UNARY(n, OP) \
+{ \
+  if (FPSCR_PR) \
+    { \
+      if ((n) & 1) \
+       RAISE_EXCEPTION (SIGILL); \
+      else \
+       SET_DR (n, (OP (DR (n)))); \
+    } \
+  else \
+    SET_FR (n, (OP (FR (n)))); \
+} while (0)
+
+#define FP_CMP(n, OP, m) \
+{ \
+  if (FPSCR_PR) \
+    { \
+      if (((n) & 1) || ((m) & 1)) \
+       RAISE_EXCEPTION (SIGILL); \
+      else \
+       SET_SR_T (DR (n) OP DR (m)); \
+    } \
+  else \
+    SET_SR_T (FR (n) OP FR (m)); \
+} while (0)
 
-    union
-      {
-       struct
-         {
-           unsigned int d0:22;
-           unsigned int m:1;
-           unsigned int q:1;
-           unsigned int i:4;
-           unsigned int d1:2;
-           unsigned int s:1;
-           unsigned int t:1;
-         }
-       bits;
-       int word;
-      }
-    sr;
-    int ticks;
-    int stalls;
-    int cycles;
-    int insts;
-
-
-    int prevlock;
-    int thislock;
-/* start-sanitize-sh3e */
-    float fregs[16];
-    float fpscr;
-    int fpul;
-/* end-sanitize-sh3e */
-    int exception;
-    int msize;
-#define PROFILE_FREQ 1
-#define PROFILE_SHIFT 2
-    int profile;
-    unsigned short *profile_hist;
-    unsigned char *memory;
-  }
-  asregs;
-  int asints[28];
-} saved_state_type;
-saved_state_type saved_state;
+static void
+set_sr (int new_sr)
+{
+  /* do we need to swap banks */
+  int old_gpr = SR_MD && SR_RB;
+  int new_gpr = (new_sr & SR_MASK_MD) && (new_sr & SR_MASK_RB);
+  if (old_gpr != new_gpr)
+    {
+      int i, tmp;
+      for (i = 0; i < 8; i++)
+       {
+         tmp = saved_state.asregs.cregs.named.bank[i];
+         saved_state.asregs.cregs.named.bank[i] = saved_state.asregs.regs[i];
+         saved_state.asregs.regs[i] = tmp;
+       }
+    }
+  saved_state.asregs.cregs.named.sr = new_sr;
+  SET_MOD (MOD);
+}
 
-static void INLINE 
-wlat_little (memory, x, value, maskl)
-     unsigned char *memory;
+static INLINE void
+wlat_fast (unsigned char *memory, int x, int value, int maskl)
 {
   int v = value;
-  unsigned char *p = memory + ((x) & maskl);
-  BUSERROR(x, maskl);
-  p[3] = v >> 24;
-  p[2] = v >> 16;
-  p[1] = v >> 8;
-  p[0] = v;
+  unsigned int *p = (unsigned int *) (memory + x);
+  WRITE_BUSERROR (x, maskl, v, process_wlat_addr);
+  *p = v;
 }
 
-static void INLINE 
-wwat_little (memory, x, value, maskw)
-     unsigned char *memory;
+static INLINE void
+wwat_fast (unsigned char *memory, int x, int value, int maskw, int endianw)
 {
   int v = value;
-  unsigned char *p = memory + ((x) & maskw);
-  BUSERROR(x, maskw);
-
-  p[1] = v >> 8;
-  p[0] = v;
+  unsigned short *p = (unsigned short *) (memory + (x ^ endianw));
+  WRITE_BUSERROR (x, maskw, v, process_wwat_addr);
+  *p = v;
 }
 
-
-static void INLINE 
-wbat_any (memory, x, value, maskb)
-     unsigned char *memory;
+static INLINE void
+wbat_fast (unsigned char *memory, int x, int value, int maskb)
 {
-  unsigned char *p = memory + (x & maskb);
-  if (x > 0x5000000)
-    IOMEM (x, 1, value);
-  BUSERROR(x, maskb);
+  unsigned char *p = memory + (x ^ endianb);
+  WRITE_BUSERROR (x, maskb, value, process_wbat_addr);
 
   p[0] = value;
 }
 
+/* Read functions */
 
-
-static void INLINE 
-wlat_big (memory, x, value, maskl)
-     unsigned char *memory;
+static INLINE int
+rlat_fast (unsigned char *memory, int x, int maskl)
 {
-  int v = value;
-  unsigned char *p = memory + ((x) & maskl);
-  BUSERROR(x, maskl);
+  unsigned int *p = (unsigned int *) (memory + x);
+  READ_BUSERROR (x, maskl, process_rlat_addr);
 
-  p[0] = v >> 24;
-  p[1] = v >> 16;
-  p[2] = v >> 8;
-  p[3] = v;
+  return *p;
 }
 
-static void INLINE 
-wwat_big (memory, x, value, maskw)
-     unsigned char *memory;
+static INLINE int
+rwat_fast (unsigned char *memory, int x, int maskw, int endianw)
 {
-  int v = value;
-  unsigned char *p = memory + ((x) & maskw);
-  BUSERROR(x, maskw);
+  unsigned short *p = (unsigned short *) (memory + (x ^ endianw));
+  READ_BUSERROR (x, maskw, process_rwat_addr);
 
-  p[0] = v >> 8;
-  p[1] = v;
+  return *p;
 }
 
+static INLINE int
+riat_fast (unsigned char *insn_ptr, int endianw)
+{
+  unsigned short *p = (unsigned short *) ((size_t) insn_ptr ^ endianw);
+
+  return *p;
+}
 
-static void INLINE 
-wbat_big (memory, x, value, maskb)
-     unsigned char *memory;
+static INLINE int
+rbat_fast (unsigned char *memory, int x, int maskb)
 {
-  unsigned char *p = memory + (x & maskb);
-  BUSERROR(x, maskb);
+  unsigned char *p = memory + (x ^ endianb);
+  READ_BUSERROR (x, maskb, process_rbat_addr);
 
-  if (x > 0x5000000)
-    IOMEM (x, 1, value);
-  p[0] = value;
+  return *p;
 }
 
+#define RWAT(x)        (rwat_fast (memory, x, maskw, endianw))
+#define RLAT(x)        (rlat_fast (memory, x, maskl))
+#define RBAT(x)         (rbat_fast (memory, x, maskb))
+#define RIAT(p)                (riat_fast ((p), endianw))
+#define WWAT(x,v)      (wwat_fast (memory, x, v, maskw, endianw))
+#define WLAT(x,v)      (wlat_fast (memory, x, v, maskl))
+#define WBAT(x,v)       (wbat_fast (memory, x, v, maskb))
 
+#define RUWAT(x)  (RWAT (x) & 0xffff)
+#define RSWAT(x)  ((short) (RWAT (x)))
+#define RSLAT(x)  ((long) (RLAT (x)))
+#define RSBAT(x)  (SEXT (RBAT (x)))
 
-/* Read functions */
-static int INLINE 
-rlat_little (memory, x, maskl)
-     unsigned char *memory;
+#define RDAT(x, n) (do_rdat (memory, (x), (n), (maskl)))
+static int
+do_rdat (unsigned char *memory, int x, int n, int maskl)
 {
-  unsigned char *p = memory + ((x) & maskl);
-  BUSERROR(x, maskl);
+  int f0;
+  int f1;
+  int i = (n & 1);
+  int j = (n & ~1);
+  f0 = rlat_fast (memory, x + 0, maskl);
+  f1 = rlat_fast (memory, x + 4, maskl);
+  saved_state.asregs.fregs[i].i[(j + 0)] = f0;
+  saved_state.asregs.fregs[i].i[(j + 1)] = f1;
+  return 0;
+}
 
-  return (p[3] << 24) | (p[2] << 16) | (p[1] << 8) | p[0];
+#define WDAT(x, n) (do_wdat (memory, (x), (n), (maskl)))
+static int
+do_wdat (unsigned char *memory, int x, int n, int maskl)
+{
+  int f0;
+  int f1;
+  int i = (n & 1);
+  int j = (n & ~1);
+  f0 = saved_state.asregs.fregs[i].i[(j + 0)];
+  f1 = saved_state.asregs.fregs[i].i[(j + 1)];
+  wlat_fast (memory, (x + 0), f0, maskl);
+  wlat_fast (memory, (x + 4), f1, maskl);
+  return 0;
+}
+
+static void
+process_wlat_addr (int addr, int value)
+{
+  unsigned int *ptr;
 
+  PROCESS_SPECIAL_ADDRESS (addr, endianb, ptr, 32, 3, value, );
+  *ptr = value;
 }
 
-static int INLINE 
-rwat_little (memory, x, maskw)
-     unsigned char *memory;
+static void
+process_wwat_addr (int addr, int value)
 {
-  unsigned char *p = memory + ((x) & maskw);
-  BUSERROR(x, maskw);
+  unsigned short *ptr;
 
-  return (p[1] << 8) | p[0];
+  PROCESS_SPECIAL_ADDRESS (addr, endianb, ptr, 16, 1, value, );
+  *ptr = value;
 }
 
-static int INLINE 
-rbat_any (memory, x, maskb)
-     unsigned char *memory;
+static void
+process_wbat_addr (int addr, int value)
 {
-  unsigned char *p = memory + ((x) & maskb);
-  BUSERROR(x, maskb);
+  unsigned char *ptr;
 
-  return p[0];
+  PROCESS_SPECIAL_ADDRESS (addr, endianb, ptr, 8, 0, value, );
+  *ptr = value;
 }
 
-static int INLINE 
-rlat_big (memory, x, maskl)
-     unsigned char *memory;
+static int
+process_rlat_addr (int addr)
 {
-  unsigned char *p = memory + ((x) & maskl);
-  BUSERROR(x, maskl);
+  unsigned char *ptr;
+
+  PROCESS_SPECIAL_ADDRESS (addr, endianb, ptr, -32, 3, -1, 0);
+  return *ptr;
+}
 
-  return (p[0] << 24) | (p[1] << 16) | (p[2] << 8) | p[3];
+static int
+process_rwat_addr (int addr)
+{
+  unsigned char *ptr;
 
+  PROCESS_SPECIAL_ADDRESS (addr, endianb, ptr, -16, 1, -1, 0);
+  return *ptr;
 }
 
-static int INLINE 
-rwat_big (memory, x, maskw)
-     unsigned char *memory;
+static int
+process_rbat_addr (int addr)
 {
-  unsigned char *p = memory + ((x) & maskw);
-  BUSERROR(x, maskw);
+  unsigned char *ptr;
 
-  return (p[0] << 8) | p[1];
+  PROCESS_SPECIAL_ADDRESS (addr, endianb, ptr, -8, 0, -1, 0);
+  return *ptr;
 }
 
+#define SEXT(x)        (((x &  0xff) ^ (~0x7f))+0x80)
+#define SEXT12(x)      (((x & 0xfff) ^ 0x800) - 0x800)
+#define SEXTW(y)       ((int) ((short) y))
+#if 0
+#define SEXT32(x)      ((int) ((x & 0xffffffff) ^ 0x80000000U) - 0x7fffffff - 1)
+#else
+#define SEXT32(x)      ((int) (x))
+#endif
+#define SIGN32(x)      (SEXT32 (x) >> 31)
 
-#define RWAT(x)        (little_endian ? rwat_little(memory, x, maskw): rwat_big(memory, x, maskw))
-#define RLAT(x)        (little_endian ? rlat_little(memory, x, maskl): rlat_big(memory, x, maskl))
-#define RBAT(x)         (rbat_any (memory, x, maskb))
-#define WWAT(x,v)      (little_endian ? wwat_little(memory, x, v, maskw): wwat_big(memory, x, v, maskw))
-#define WLAT(x,v)      (little_endian ? wlat_little(memory, x, v, maskl): wlat_big(memory, x, v, maskl))
-#define WBAT(x,v)       (wbat_any (memory, x, v, maskb))
+/* convert pointer from target to host value.  */
+#define PT2H(x) ((x) + memory)
+/* convert pointer from host to target value.  */
+#define PH2T(x) ((x) - memory)
 
-#define RUWAT(x)  (RWAT(x) & 0xffff)
-#define RSWAT(x)  ((short)(RWAT(x)))
-#define RSBAT(x)  (SEXT(RBAT(x)))
+#define SKIP_INSN(p) ((p) += ((RIAT (p) & 0xfc00) == 0xf800 ? 4 : 2))
 
-#define SEXT(x)        (((x&0xff) ^ (~0x7f))+0x80)
-#define SEXTW(y)       ((int)((short)y))
+#define SET_NIP(x) nip = (x); CHECK_INSN_PTR (nip);
 
-#define SL(TEMPPC)     iword= RUWAT(TEMPPC); goto top;
+static int in_delay_slot = 0;
+#define Delay_Slot(TEMPPC)     iword = RIAT (TEMPPC); in_delay_slot = 1; goto top;
 
+#define CHECK_INSN_PTR(p) \
+do { \
+  if (saved_state.asregs.exception || PH2T (p) & maskw) \
+    saved_state.asregs.insn_end = 0; \
+  else if (p < loop.end) \
+    saved_state.asregs.insn_end = loop.end; \
+  else \
+    saved_state.asregs.insn_end = mem_end; \
+} while (0)
 
-int empty[16];
+#ifdef ACE_FAST
+
+#define MA(n)
+#define L(x)
+#define TL(x)
+#define TB(x)
+
+#else
+
+#define MA(n) \
+  do { memstalls += ((((long) PC & 3) != 0) ? (n) : ((n) - 1)); } while (0)
 
 #define L(x)   thislock = x;
 #define TL(x)  if ((x) == prevlock) stalls++;
-#define TB(x,y)  if ((x) == prevlock || (y)==prevlock) stalls++;
+#define TB(x,y)  if ((x) == prevlock || (y) == prevlock) stalls++;
 
-#if defined(__GO32__) || defined(WIN32)
+#endif
+
+#if defined(__GO32__)
 int sim_memory_size = 19;
 #else
 int sim_memory_size = 24;
@@ -349,16 +742,8 @@ static int nsamples;
 #define SCI_TDRE       0x80    /* Transmit data register empty */
 
 static int
-IOMEM (addr, write, value)
-     int addr;
-     int write;
-     int value;
+IOMEM (int addr, int write, int value)
 {
-  static int io;
-  static char ssr1;
-  int x;
-  static char lastchar;
-
   if (write)
     {
       switch (addr)
@@ -380,89 +765,130 @@ IOMEM (addr, write, value)
          return getchar ();
        }
     }
+  return 0;
 }
 
-
-
 static int
-get_now ()
+get_now (void)
 {
   return time ((long *) 0);
 }
 
 static int
-now_persec ()
+now_persec (void)
 {
   return 1;
 }
 
-
-
 static FILE *profile_file;
 
-static void
-swap (memory, n)
-     unsigned char *memory;
-     int n;
+static INLINE unsigned
+swap (unsigned n)
 {
-  WLAT (0, n);
+  if (endianb)
+    n = (n << 24 | (n & 0xff00) << 8
+        | (n & 0xff0000) >> 8 | (n & 0xff000000) >> 24);
+  return n;
 }
-static void
-swap16 (memory, n)
-     unsigned char *memory;
-     int n;
+
+static INLINE unsigned short
+swap16 (unsigned short n)
 {
-  WWAT (0, n);
+  if (endianb)
+    n = n << 8 | (n & 0xff00) >> 8;
+  return n;
 }
 
 static void
-swapout (n)
-     int n;
+swapout (int n)
 {
   if (profile_file)
     {
-      char b[4];
-      swap (b, n);
-      fwrite (b, 4, 1, profile_file);
+      union { char b[4]; int n; } u;
+      u.n = swap (n);
+      fwrite (u.b, 4, 1, profile_file);
     }
 }
 
 static void
-swapout16 (n)
-     int n;
+swapout16 (int n)
 {
-  char b[4];
-  swap16 (b, n);
-  fwrite (b, 2, 1, profile_file);
+  union { char b[4]; int n; } u;
+  u.n = swap16 (n);
+  fwrite (u.b, 2, 1, profile_file);
 }
 
-
 /* Turn a pointer in a register into a pointer into real memory. */
 
 static char *
-ptr (x)
-     int x;
+ptr (int x)
 {
   return (char *) (x + saved_state.asregs.memory);
 }
 
+/* STR points to a zero-terminated string in target byte order.  Return
+   the number of bytes that need to be converted to host byte order in order
+   to use this string as a zero-terminated string on the host.
+   (Not counting the rounding up needed to operate on entire words.)  */
+static int
+strswaplen (int str)
+{
+  unsigned char *memory = saved_state.asregs.memory;
+  int start, end;
+  int endian = endianb;
+
+  if (! endian)
+    return 0;
+  end = str;
+  for (end = str; memory[end ^ endian]; end++) ;
+  return end - str + 1;
+}
 
-/* Simulate a monitor trap, put the result into r0 and errno into r1 */
 static void
-trap (i, regs, memory, maskl, maskw, little_endian)
-     int i;
-     int *regs;
-     unsigned char *memory;
+strnswap (int str, int len)
+{
+  int *start, *end;
+
+  if (! endianb || ! len)
+    return;
+  start = (int *) ptr (str & ~3);
+  end = (int *) ptr (str + len);
+  do
+    {
+      int old = *start;
+      *start = (old << 24 | (old & 0xff00) << 8
+               | (old & 0xff0000) >> 8 | (old & 0xff000000) >> 24);
+      start++;
+    }
+  while (start < end);
+}
+
+/* Simulate a monitor trap, put the result into r0 and errno into r1
+   return offset by which to adjust pc.  */
+
+static int
+trap (SIM_DESC sd, int i, int *regs, unsigned char *insn_ptr,
+      unsigned char *memory, int maskl, int maskw, int endianw)
 {
+  host_callback *callback = STATE_CALLBACK (sd);
+  char **prog_argv = STATE_PROG_ARGV (sd);
+
   switch (i)
     {
     case 1:
       printf ("%c", regs[0]);
       break;
     case 2:
-      saved_state.asregs.exception = SIGQUIT;
+      raise_exception (SIGQUIT);
       break;
     case 3:                    /* FIXME: for backwards compat, should be removed */
+    case 33:
+      {
+       unsigned int countp = * (unsigned int *) (insn_ptr + 4);
+
+       WLAT (countp, RLAT (countp) + 1);
+       return 6;
+      }
     case 34:
       {
        extern int errno;
@@ -472,66 +898,82 @@ trap (i, regs, memory, maskl, maskw, little_endian)
        switch (regs[4])
          {
 
-#if !defined(__GO32__) && !defined(WIN32)
+#if !defined(__GO32__) && !defined(_WIN32)
          case SYS_fork:
            regs[0] = fork ();
            break;
+/* This would work only if endianness matched between host and target.
+   Besides, it's quite dangerous.  */
+#if 0
          case SYS_execve:
-           regs[0] = execve (ptr (regs[5]), ptr (regs[6]), ptr (regs[7]));
+           regs[0] = execve (ptr (regs[5]), (char **) ptr (regs[6]), 
+                             (char **) ptr (regs[7]));
            break;
          case SYS_execv:
-           regs[0] = execve (ptr (regs[5]), ptr (regs[6]), 0);
+           regs[0] = execve (ptr (regs[5]), (char **) ptr (regs[6]), 0);
            break;
+#endif
          case SYS_pipe:
            {
-             char *buf;
-             int host_fd[2];
-
-             buf = ptr (regs[5]);
-
-             regs[0] = pipe (host_fd);
-
-             WLAT (buf, host_fd[0]);
-             buf += 4;
-             WLAT (buf, host_fd[1]);
+             regs[0] = (BUSERROR (regs[5], maskl)
+                        ? -EINVAL
+                        : pipe ((int *) ptr (regs[5])));
            }
            break;
 
          case SYS_wait:
-           regs[0] = wait (ptr (regs[5]));
+           regs[0] = wait ((int *) ptr (regs[5]));
            break;
-#endif
+#endif /* !defined(__GO32__) && !defined(_WIN32) */
 
          case SYS_read:
-           regs[0] = read (regs[5], ptr (regs[6]), regs[7]);
+           strnswap (regs[6], regs[7]);
+           regs[0]
+             = callback->read (callback, regs[5], ptr (regs[6]), regs[7]);
+           strnswap (regs[6], regs[7]);
            break;
          case SYS_write:
-           regs[0] = write (regs[5], ptr (regs[6]), regs[7]);
+           strnswap (regs[6], regs[7]);
+           if (regs[5] == 1)
+             regs[0] = (int) callback->write_stdout (callback, 
+                                                     ptr (regs[6]), regs[7]);
+           else
+             regs[0] = (int) callback->write (callback, regs[5], 
+                                              ptr (regs[6]), regs[7]);
+           strnswap (regs[6], regs[7]);
            break;
          case SYS_lseek:
-           regs[0] = lseek (regs[5], regs[6], regs[7]);
+           regs[0] = callback->lseek (callback,regs[5], regs[6], regs[7]);
            break;
          case SYS_close:
-           regs[0] = close (regs[5]);
+           regs[0] = callback->close (callback,regs[5]);
            break;
          case SYS_open:
-           regs[0] = open (ptr (regs[5]), regs[6]);
-           break;
+           {
+             int len = strswaplen (regs[5]);
+             strnswap (regs[5], len);
+             regs[0] = callback->open (callback, ptr (regs[5]), regs[6]);
+             strnswap (regs[5], len);
+             break;
+           }
          case SYS_exit:
-           /* EXIT - caller can look in r5 to work out the 
-              reason */
-           saved_state.asregs.exception = SIGQUIT;
+           /* EXIT - caller can look in r5 to work out the reason */
+           raise_exception (SIGQUIT);
+           regs[0] = regs[5];
            break;
 
          case SYS_stat:        /* added at hmsi */
            /* stat system call */
            {
              struct stat host_stat;
-             char *buf;
+             int buf;
+             int len = strswaplen (regs[5]);
 
+             strnswap (regs[5], len);
              regs[0] = stat (ptr (regs[5]), &host_stat);
+             strnswap (regs[5], len);
 
-             buf = ptr (regs[6]);
+             buf = regs[6];
 
              WWAT (buf, host_stat.st_dev);
              buf += 2;
@@ -568,53 +1010,103 @@ trap (i, regs, memory, maskl, maskw, little_endian)
            }
            break;
 
+#ifndef _WIN32
          case SYS_chown:
-           regs[0] = chown (ptr (regs[5]), regs[6], regs[7]);
-           break;
+           {
+             int len = strswaplen (regs[5]);
+
+             strnswap (regs[5], len);
+             regs[0] = chown (ptr (regs[5]), regs[6], regs[7]);
+             strnswap (regs[5], len);
+             break;
+           }
+#endif /* _WIN32 */
          case SYS_chmod:
-           regs[0] = chmod (ptr (regs[5]), regs[6]);
-           break;
+           {
+             int len = strswaplen (regs[5]);
+
+             strnswap (regs[5], len);
+             regs[0] = chmod (ptr (regs[5]), regs[6]);
+             strnswap (regs[5], len);
+             break;
+           }
          case SYS_utime:
-           regs[0] = utime (ptr (regs[5]), ptr (regs[6]));
+           {
+             /* Cast the second argument to void *, to avoid type mismatch
+                if a prototype is present.  */
+             int len = strswaplen (regs[5]);
+
+             strnswap (regs[5], len);
+             regs[0] = utime (ptr (regs[5]), (void *) ptr (regs[6]));
+             strnswap (regs[5], len);
+             break;
+           }
+         case SYS_argc:
+           regs[0] = countargv (prog_argv);
+           break;
+         case SYS_argnlen:
+           if (regs[5] < countargv (prog_argv))
+             regs[0] = strlen (prog_argv[regs[5]]);
+           else
+             regs[0] = -1;
+           break;
+         case SYS_argn:
+           if (regs[5] < countargv (prog_argv))
+             {
+               /* Include the termination byte.  */
+               int i = strlen (prog_argv[regs[5]]) + 1;
+               regs[0] = sim_write (0, regs[6], (void *) prog_argv[regs[5]], i);
+             }
+           else
+             regs[0] = -1;
+           break;
+         case SYS_time:
+           regs[0] = get_now ();
            break;
+         case SYS_ftruncate:
+           regs[0] = callback->ftruncate (callback, regs[5], regs[6]);
+           break;
+         case SYS_truncate:
+           {
+             int len = strswaplen (regs[5]);
+             strnswap (regs[5], len);
+             regs[0] = callback->truncate (callback, ptr (regs[5]), regs[6]);
+             strnswap (regs[5], len);
+             break;
+           }
          default:
-           abort ();
+           regs[0] = -1;
+           break;
          }
-       regs[1] = errno;
+       regs[1] = callback->get_errno (callback);
        errno = perrno;
       }
       break;
 
+    case 13:   /* Set IBNR */
+      IBNR = regs[0] & 0xffff;
+      break;
+    case 14:   /* Set IBCR */
+      IBCR = regs[0] & 0xffff;
+      break;
     case 0xc3:
     case 255:
-      saved_state.asregs.exception = SIGTRAP;
+      raise_exception (SIGTRAP);
+      if (i == 0xc3)
+       return -2;
       break;
     }
-
-}
-void
-control_c (sig, code, scp, addr)
-     int sig;
-     int code;
-     char *scp;
-     char *addr;
-{
-  saved_state.asregs.exception = SIGINT;
+  return 0;
 }
 
-
-static int
-div1 (R, iRn2, iRn1, T)
-     int *R;
-     int iRn1;
-     int iRn2;
-     int T;
+static void
+div1 (int *R, int iRn2, int iRn1/*, int T*/)
 {
   unsigned long tmp0;
   unsigned char old_q, tmp1;
 
   old_q = Q;
-  Q = (unsigned char) ((0x80000000 & R[iRn1]) != 0);
+  SET_SR_Q ((unsigned char) ((0x80000000 & R[iRn1]) != 0));
   R[iRn1] <<= 1;
   R[iRn1] |= (unsigned long) T;
 
@@ -630,10 +1122,10 @@ div1 (R, iRn2, iRn1, T)
          switch (Q)
            {
            case 0:
-             Q = tmp1;
+             SET_SR_Q (tmp1);
              break;
            case 1:
-             Q = (unsigned char) (tmp1 == 0);
+             SET_SR_Q ((unsigned char) (tmp1 == 0));
              break;
            }
          break;
@@ -644,10 +1136,10 @@ div1 (R, iRn2, iRn1, T)
          switch (Q)
            {
            case 0:
-             Q = (unsigned char) (tmp1 == 0);
+             SET_SR_Q ((unsigned char) (tmp1 == 0));
              break;
            case 1:
-             Q = tmp1;
+             SET_SR_Q (tmp1);
              break;
            }
          break;
@@ -663,10 +1155,10 @@ div1 (R, iRn2, iRn1, T)
          switch (Q)
            {
            case 0:
-             Q = tmp1;
+             SET_SR_Q (tmp1);
              break;
            case 1:
-             Q = (unsigned char) (tmp1 == 0);
+             SET_SR_Q ((unsigned char) (tmp1 == 0));
              break;
            }
          break;
@@ -677,26 +1169,23 @@ div1 (R, iRn2, iRn1, T)
          switch (Q)
            {
            case 0:
-             Q = (unsigned char) (tmp1 == 0);
+             SET_SR_Q ((unsigned char) (tmp1 == 0));
              break;
            case 1:
-             Q = tmp1;
+             SET_SR_Q (tmp1);
              break;
            }
          break;
        }
       break;
     }
-  T = (Q == M);
-  return T;
+  /*T = (Q == M);*/
+  SET_SR_T (Q == M);
+  /*return T;*/
 }
 
-
 static void
-dmul (sign, rm, rn)
-     int sign;
-     unsigned int rm;
-     unsigned int rn;
+dmul (int sign, unsigned int rm, unsigned int rn)
 {
   unsigned long RnL, RnH;
   unsigned long RmL, RmH;
@@ -734,19 +1223,16 @@ dmul (sign, rm, rn)
 }
 
 static void
-macw (regs, memory, n, m)
-     int *regs;
-     unsigned char *memory;
-     int m, n;
+macw (int *regs, unsigned char *memory, int n, int m, int endianw)
 {
   long tempm, tempn;
   long prod, macl, sum;
 
-  tempm=RSWAT(regs[m]); regs[m]+=2;
-  tempn=RSWAT(regs[n]); regs[n]+=2;
+  tempm=RSWAT (regs[m]); regs[m]+=2;
+  tempn=RSWAT (regs[n]); regs[n]+=2;
 
   macl = MACL;
-  prod = (long)(short) tempm * (long)(short) tempn;
+  prod = (long) (short) tempm * (long) (short) tempn;
   sum = prod + macl;
   if (S)
     {
@@ -770,25 +1256,334 @@ macw (regs, memory, n, m)
   MACL = sum;
 }
 
-/* Set the memory size to the power of two provided. */
+static void
+macl (int *regs, unsigned char *memory, int n, int m)
+{
+  long tempm, tempn;
+  long macl, mach;
+  long long ans;
+  long long mac64;
 
-void
-sim_size (power)
-     int power;
+  tempm = RSLAT (regs[m]);
+  regs[m] += 4;
+
+  tempn = RSLAT (regs[n]);
+  regs[n] += 4;
+
+  mach = MACH;
+  macl = MACL;
+
+  mac64 = ((long long) macl & 0xffffffff) |
+          ((long long) mach & 0xffffffff) << 32;
+
+  ans = (long long) tempm * (long long) tempn; /* Multiply 32bit * 32bit */
+
+  mac64 += ans; /* Accumulate 64bit + 64 bit */
+
+  macl = (long) (mac64 & 0xffffffff);
+  mach = (long) ((mac64 >> 32) & 0xffffffff);
+
+  if (S)  /* Store only 48 bits of the result */
+    {
+      if (mach < 0) /* Result is negative */
+        {
+          mach = mach & 0x0000ffff; /* Mask higher 16 bits */
+          mach |= 0xffff8000; /* Sign extend higher 16 bits */
+        }
+      else
+        mach = mach & 0x00007fff; /* Postive Result */
+    }
+
+  MACL = macl;
+  MACH = mach;
+}
+
+enum {
+  B_BCLR = 0,
+  B_BSET = 1,
+  B_BST  = 2,
+  B_BLD  = 3,
+  B_BAND = 4,
+  B_BOR  = 5,
+  B_BXOR = 6,
+  B_BLDNOT = 11,
+  B_BANDNOT = 12,
+  B_BORNOT = 13,
+  
+  MOVB_RM = 0x0000,
+  MOVW_RM = 0x1000,
+  MOVL_RM = 0x2000,
+  FMOV_RM = 0x3000,
+  MOVB_MR = 0x4000,
+  MOVW_MR = 0x5000,
+  MOVL_MR = 0x6000,
+  FMOV_MR = 0x7000,
+  MOVU_BMR = 0x8000,
+  MOVU_WMR = 0x9000,
+};
+
+/* Do extended displacement move instructions.  */
+static void
+do_long_move_insn (int op, int disp12, int m, int n, int *thatlock)
+{
+  int memstalls = 0;
+  int thislock = *thatlock;
+  int endianw = global_endianw;
+  int *R = &(saved_state.asregs.regs[0]);
+  unsigned char *memory = saved_state.asregs.memory;
+  int maskb = ~((saved_state.asregs.msize - 1) & ~0);
+  unsigned char *insn_ptr = PT2H (saved_state.asregs.pc);
+
+  switch (op) {
+  case MOVB_RM:                /* signed */
+    WBAT (disp12 * 1 + R[n], R[m]); 
+    break;
+  case MOVW_RM:
+    WWAT (disp12 * 2 + R[n], R[m]); 
+    break;
+  case MOVL_RM:
+    WLAT (disp12 * 4 + R[n], R[m]); 
+    break;
+  case FMOV_RM:                /* floating point */
+    if (FPSCR_SZ) 
+      {
+        MA (1);
+        WDAT (R[n] + 8 * disp12, m);
+      }
+    else 
+      WLAT (R[n] + 4 * disp12, FI (m));
+    break;
+  case MOVB_MR:
+    R[n] = RSBAT (disp12 * 1 + R[m]);
+    L (n); 
+    break;
+  case MOVW_MR:
+    R[n] = RSWAT (disp12 * 2 + R[m]);
+    L (n); 
+    break;
+  case MOVL_MR:
+    R[n] = RLAT (disp12 * 4 + R[m]);
+    L (n); 
+    break;
+  case FMOV_MR:
+    if (FPSCR_SZ) {
+      MA (1);
+      RDAT (R[m] + 8 * disp12, n);
+    }
+    else 
+      SET_FI (n, RLAT (R[m] + 4 * disp12));
+    break;
+  case MOVU_BMR:       /* unsigned */
+    R[n] = RBAT (disp12 * 1 + R[m]);
+    L (n);
+    break;
+  case MOVU_WMR:
+    R[n] = RWAT (disp12 * 2 + R[m]);
+    L (n);
+    break;
+  default:
+    RAISE_EXCEPTION (SIGINT);
+    exit (1);
+  }
+  saved_state.asregs.memstalls += memstalls;
+  *thatlock = thislock;
+}
 
+/* Do binary logical bit-manipulation insns.  */
+static void
+do_blog_insn (int imm, int addr, int binop, 
+             unsigned char *memory, int maskb)
 {
-  saved_state.asregs.msize = 1 << power;
+  int oldval = RBAT (addr);
+
+  switch (binop) {
+  case B_BCLR: /* bclr.b */
+    WBAT (addr, oldval & ~imm);
+    break;
+  case B_BSET: /* bset.b */
+    WBAT (addr, oldval | imm);
+    break;
+  case B_BST:  /* bst.b */
+    if (T)
+      WBAT (addr, oldval | imm);
+    else
+      WBAT (addr, oldval & ~imm);
+    break;
+  case B_BLD:  /* bld.b */
+    SET_SR_T ((oldval & imm) != 0);
+    break;
+  case B_BAND: /* band.b */
+    SET_SR_T (T && ((oldval & imm) != 0));
+    break;
+  case B_BOR:  /* bor.b */
+    SET_SR_T (T || ((oldval & imm) != 0));
+    break;
+  case B_BXOR: /* bxor.b */
+    SET_SR_T (T ^ ((oldval & imm) != 0));
+    break;
+  case B_BLDNOT:       /* bldnot.b */
+    SET_SR_T ((oldval & imm) == 0);
+    break;
+  case B_BANDNOT:      /* bandnot.b */
+    SET_SR_T (T && ((oldval & imm) == 0));
+    break;
+  case B_BORNOT:       /* bornot.b */
+    SET_SR_T (T || ((oldval & imm) == 0));
+    break;
+  }
+}
 
-  sim_memory_size = power;
+static float
+fsca_s (int in, double (*f) (double))
+{
+  double rad = ldexp ((in & 0xffff), -15) * 3.141592653589793238462643383;
+  double result = (*f) (rad);
+  double error, upper, lower, frac;
+  int exp;
+
+  /* Search the value with the maximum error that is still within the
+     architectural spec.  */
+  error = ldexp (1., -21);
+  /* compensate for calculation inaccuracy by reducing error.  */
+  error = error - ldexp (1., -50);
+  upper = result + error;
+  frac = frexp (upper, &exp);
+  upper = ldexp (floor (ldexp (frac, 24)), exp - 24);
+  lower = result - error;
+  frac = frexp (lower, &exp);
+  lower = ldexp (ceil (ldexp (frac, 24)), exp - 24);
+  return abs (upper - result) >= abs (lower - result) ? upper : lower;
+}
 
+static float
+fsrra_s (float in)
+{
+  double result = 1. / sqrt (in);
+  int exp;
+  double frac, upper, lower, error, eps;
+
+  /* refine result */
+  result = result - (result * result * in - 1) * 0.5 * result;
+  /* Search the value with the maximum error that is still within the
+     architectural spec.  */
+  frac = frexp (result, &exp);
+  frac = ldexp (frac, 24);
+  error = 4.0; /* 1 << 24-1-21 */
+  /* use eps to compensate for possible 1 ulp error in our 'exact' result.  */
+  eps = ldexp (1., -29);
+  upper = floor (frac + error - eps);
+  if (upper > 16777216.)
+    upper = floor ((frac + error - eps) * 0.5) * 2.;
+  lower = ceil ((frac - error + eps) * 2) * .5;
+  if (lower > 8388608.)
+    lower = ceil (frac - error + eps);
+  upper = ldexp (upper, exp - 24);
+  lower = ldexp (lower, exp - 24);
+  return upper - result >= result - lower ? upper : lower;
+}
+
+
+/* GET_LOOP_BOUNDS {EXTENDED}
+   These two functions compute the actual starting and ending point
+   of the repeat loop, based on the RS and RE registers (repeat start, 
+   repeat stop).  The extended version is called for LDRC, and the
+   regular version is called for SETRC.  The difference is that for
+   LDRC, the loop start and end instructions are literally the ones
+   pointed to by RS and RE -- for SETRC, they're not (see docs).  */
+
+static struct loop_bounds
+get_loop_bounds_ext (int rs, int re, unsigned char *memory,
+                    unsigned char *mem_end, int maskw, int endianw)
+{
+  struct loop_bounds loop;
+
+  /* FIXME: should I verify RS < RE?  */
+  loop.start = PT2H (RS);      /* FIXME not using the params?  */
+  loop.end   = PT2H (RE & ~1); /* Ignore bit 0 of RE.  */
+  SKIP_INSN (loop.end);
+  if (loop.end >= mem_end)
+    loop.end = PT2H (0);
+  return loop;
+}
+
+static struct loop_bounds
+get_loop_bounds (int rs, int re, unsigned char *memory, unsigned char *mem_end,
+                int maskw, int endianw)
+{
+  struct loop_bounds loop;
+
+  if (SR_RC)
+    {
+      if (RS >= RE)
+       {
+         loop.start = PT2H (RE - 4);
+         SKIP_INSN (loop.start);
+         loop.end = loop.start;
+         if (RS - RE == 0)
+           SKIP_INSN (loop.end);
+         if (RS - RE <= 2)
+           SKIP_INSN (loop.end);
+         SKIP_INSN (loop.end);
+       }
+      else
+       {
+         loop.start = PT2H (RS);
+         loop.end = PT2H (RE - 4);
+         SKIP_INSN (loop.end);
+         SKIP_INSN (loop.end);
+         SKIP_INSN (loop.end);
+         SKIP_INSN (loop.end);
+       }
+      if (loop.end >= mem_end)
+       loop.end = PT2H (0);
+    }
+  else
+    loop.end = PT2H (0);
+
+  return loop;
+}
+
+static void ppi_insn ();
+
+#include "ppi.c"
+
+/* Provide calloc / free versions that use an anonymous mmap.  This can
+   significantly cut the start-up time when a large simulator memory is
+   required, because pages are only zeroed on demand.  */
+#ifdef MAP_ANONYMOUS
+static void *
+mcalloc (size_t nmemb, size_t size)
+{
+  void *page;
+
+  if (nmemb != 1)
+    size *= nmemb;
+  return mmap (0, size, PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS,
+              -1, 0);
+}
+
+#define mfree(start,length) munmap ((start), (length))
+#else
+#define mcalloc calloc
+#define mfree(start,length) free(start)
+#endif
+
+/* Set the memory size to the power of two provided. */
+
+static void
+sim_size (int power)
+{
+  sim_memory_size = power;
 
   if (saved_state.asregs.memory)
     {
-      free (saved_state.asregs.memory);
+      mfree (saved_state.asregs.memory, saved_state.asregs.msize);
     }
 
+  saved_state.asregs.msize = 1 << power;
+
   saved_state.asregs.memory =
-    (unsigned char *) calloc (64, saved_state.asregs.msize / 64);
+    (unsigned char *) mcalloc (1, saved_state.asregs.msize);
 
   if (!saved_state.asregs.memory)
     {
@@ -797,26 +1592,106 @@ sim_size (power)
               saved_state.asregs.msize);
 
       saved_state.asregs.msize = 1;
-      saved_state.asregs.memory = (unsigned char *) calloc (1, 1);
+      saved_state.asregs.memory = (unsigned char *) mcalloc (1, 1);
     }
 }
 
-
-int target_byte_order;
-
 static void
-set_static_little_endian(x)
-int x;
+init_dsp (struct bfd *abfd)
 {
-  little_endian = x;
+  int was_dsp = target_dsp;
+  unsigned long mach = bfd_get_mach (abfd);
+
+  if (mach == bfd_mach_sh_dsp  || 
+      mach == bfd_mach_sh4al_dsp ||
+      mach == bfd_mach_sh3_dsp)
+    {
+      int ram_area_size, xram_start, yram_start;
+      int new_select;
+
+      target_dsp = 1;
+      if (mach == bfd_mach_sh_dsp)
+       {
+         /* SH7410 (orig. sh-sdp):
+            4KB each for X & Y memory;
+            On-chip X RAM 0x0800f000-0x0800ffff
+            On-chip Y RAM 0x0801f000-0x0801ffff  */
+         xram_start = 0x0800f000;
+         ram_area_size = 0x1000;
+       }
+      if (mach == bfd_mach_sh3_dsp || mach == bfd_mach_sh4al_dsp)
+       {
+         /* SH7612:
+            8KB each for X & Y memory;
+            On-chip X RAM 0x1000e000-0x1000ffff
+            On-chip Y RAM 0x1001e000-0x1001ffff  */
+         xram_start = 0x1000e000;
+         ram_area_size = 0x2000;
+       }
+      yram_start = xram_start + 0x10000;
+      new_select = ~(ram_area_size - 1);
+      if (saved_state.asregs.xyram_select != new_select)
+       {
+         saved_state.asregs.xyram_select = new_select;
+         free (saved_state.asregs.xmem);
+         free (saved_state.asregs.ymem);
+         saved_state.asregs.xmem = 
+           (unsigned char *) calloc (1, ram_area_size);
+         saved_state.asregs.ymem = 
+           (unsigned char *) calloc (1, ram_area_size);
+
+         /* Disable use of X / Y mmeory if not allocated.  */
+         if (! saved_state.asregs.xmem || ! saved_state.asregs.ymem)
+           {
+             saved_state.asregs.xyram_select = 0;
+             if (saved_state.asregs.xmem)
+               free (saved_state.asregs.xmem);
+             if (saved_state.asregs.ymem)
+               free (saved_state.asregs.ymem);
+           }
+       }
+      saved_state.asregs.xram_start = xram_start;
+      saved_state.asregs.yram_start = yram_start;
+      saved_state.asregs.xmem_offset = saved_state.asregs.xmem - xram_start;
+      saved_state.asregs.ymem_offset = saved_state.asregs.ymem - yram_start;
+    }
+  else
+    {
+      target_dsp = 0;
+      if (saved_state.asregs.xyram_select)
+       {
+         saved_state.asregs.xyram_select = 0;
+         free (saved_state.asregs.xmem);
+         free (saved_state.asregs.ymem);
+       }
+    }
+
+  if (! saved_state.asregs.xyram_select)
+    {
+      saved_state.asregs.xram_start = 1;
+      saved_state.asregs.yram_start = 1;
+    }
+
+  if (saved_state.asregs.regstack == NULL)
+    saved_state.asregs.regstack = 
+      calloc (512, sizeof *saved_state.asregs.regstack);
+
+  if (target_dsp != was_dsp)
+    {
+      int i, tmp;
+
+      for (i = (sizeof sh_dsp_table / sizeof sh_dsp_table[0]) - 1; i >= 0; i--)
+       {
+         tmp = sh_jump_table[0xf000 + i];
+         sh_jump_table[0xf000 + i] = sh_dsp_table[i];
+         sh_dsp_table[i] = tmp;
+       }
+    }
 }
 
-static
-void
-init_pointers ()
+static void
+init_pointers (void)
 {
-  register int little_endian = target_byte_order == 1234;
-  set_static_little_endian (little_endian);
   if (saved_state.asregs.msize != 1 << sim_memory_size)
     {
       sim_size (sim_memory_size);
@@ -843,17 +1718,13 @@ init_pointers ()
 }
 
 static void
-dump_profile ()
+dump_profile (void)
 {
   unsigned int minpc;
   unsigned int maxpc;
   unsigned short *p;
-
-  int thisshift;
-
-  unsigned short *first;
-
   int i;
+
   p = saved_state.asregs.profile_hist;
   minpc = 0;
   maxpc = (1 << sim_profile_size);
@@ -867,10 +1738,8 @@ dump_profile ()
 
 }
 
-static int
-gotcall (from, to)
-     int from;
-     int to;
+static void
+gotcall (int from, int to)
 {
   swapout (from);
   swapout (to);
@@ -879,61 +1748,65 @@ gotcall (from, to)
 
 #define MMASKB ((saved_state.asregs.msize -1) & ~0)
 
-
 void
-sim_resume (step, siggnal)
-     int step, siggnal;
+sim_resume (SIM_DESC sd, int step, int siggnal)
 {
-  register unsigned int pc;
+  register unsigned char *insn_ptr;
+  unsigned char *mem_end;
+  struct loop_bounds loop;
   register int cycles = 0;
   register int stalls = 0;
+  register int memstalls = 0;
   register int insts = 0;
   register int prevlock;
+#if 1
+  int thislock;
+#else
   register int thislock;
+#endif
   register unsigned int doprofile;
-#if defined(__GO32__) || defined(WIN32)
   register int pollcount = 0;
-#endif
-  register int little_endian = target_byte_order == 1234;
-
+  /* endianw is used for every insn fetch, hence it makes sense to cache it.
+     endianb is used less often.  */
+  register int endianw = global_endianw;
 
   int tick_start = get_now ();
-  void (*prev) ();
-  extern unsigned char sh_jump_table0[];
+  void (*prev_fpe) ();
 
-  register unsigned char *jump_table = sh_jump_table0;
+  register unsigned short *jump_table = sh_jump_table;
 
   register int *R = &(saved_state.asregs.regs[0]);
-/* start-sanitize-sh3e */
-  register float *F = &(saved_state.asregs.fregs[0]);
-/* end-sanitize-sh3e */
-  register int T;
+  /*register int T;*/
+#ifndef PR
   register int PR;
+#endif
 
-  register int maskb = ((saved_state.asregs.msize - 1) & ~0);
-  register int maskw = ((saved_state.asregs.msize - 1) & ~1);
-  register int maskl = ((saved_state.asregs.msize - 1) & ~3);
+  register int maskb = ~((saved_state.asregs.msize - 1) & ~0);
+  register int maskw = ~((saved_state.asregs.msize - 1) & ~1);
+  register int maskl = ~((saved_state.asregs.msize - 1) & ~3);
   register unsigned char *memory;
   register unsigned int sbit = ((unsigned int) 1 << 31);
 
-  prev = signal (SIGINT, control_c);
+  prev_fpe = signal (SIGFPE, SIG_IGN);
 
   init_pointers ();
+  saved_state.asregs.exception = 0;
 
   memory = saved_state.asregs.memory;
+  mem_end = memory + saved_state.asregs.msize;
 
-  if (step)
-    {
-      saved_state.asregs.exception = SIGTRAP;
-    }
+  if (RE & 1)
+    loop = get_loop_bounds_ext (RS, RE, memory, mem_end, maskw, endianw);
   else
-    {
-      saved_state.asregs.exception = 0;
-    }
+    loop = get_loop_bounds     (RS, RE, memory, mem_end, maskw, endianw);
 
-  pc = saved_state.asregs.pc;
-  PR = saved_state.asregs.pr;
-  T = saved_state.asregs.sr.bits.t;
+  insn_ptr = PT2H (saved_state.asregs.pc);
+  CHECK_INSN_PTR (insn_ptr);
+
+#ifndef PR
+  PR = saved_state.asregs.sregs.named.pr;
+#endif
+  /*T = GET_SR () & SR_MASK_T;*/
   prevlock = saved_state.asregs.prevlock;
   thislock = saved_state.asregs.thislock;
   doprofile = saved_state.asregs.profile;
@@ -943,10 +1816,26 @@ sim_resume (step, siggnal)
   if (doprofile == 0)
     doprofile = ~0;
 
-  do
+ loop:
+  if (step && insn_ptr < saved_state.asregs.insn_end)
+    {
+      if (saved_state.asregs.exception)
+       /* This can happen if we've already been single-stepping and
+          encountered a loop end.  */
+       saved_state.asregs.insn_end = insn_ptr;
+      else
+       {
+         saved_state.asregs.exception = SIGTRAP;
+         saved_state.asregs.insn_end = insn_ptr + 2;
+       }
+    }
+
+  while (insn_ptr < saved_state.asregs.insn_end)
     {
-      register unsigned int iword = RUWAT (pc);
+      register unsigned int iword = RIAT (insn_ptr);
       register unsigned int ult;
+      register unsigned char *nip = insn_ptr + 2;
+
 #ifndef ACE_FAST
       insts++;
 #endif
@@ -955,32 +1844,20 @@ sim_resume (step, siggnal)
 #include "code.c"
 
 
-      pc += 2;
+      in_delay_slot = 0;
+      insn_ptr = nip;
 
-#ifdef __GO32__
-      pollcount++;
-      if (pollcount > 1000)
+      if (--pollcount < 0)
        {
-         pollcount = 0;
-         if (kbhit()) {
-           int k = getkey();
-           if (k == 1)
-             saved_state.asregs.exception = SIGINT;        
-           
-         }
-       }
-#endif
-#if defined (WIN32)
-      pollcount++;
-      if (pollcount > 1000)
-       {
-         pollcount = 0;
-         if (win32pollquit())
+         host_callback *callback = STATE_CALLBACK (sd);
+
+         pollcount = POLL_QUIT_INTERVAL;
+         if ((*callback->poll_quit) != NULL
+             && (*callback->poll_quit) (callback))
            {
-             control_c();
-           }
+             sim_stop (sd);
+           }       
        }
-#endif
 
 #ifndef ACE_FAST
       prevlock = thislock;
@@ -994,7 +1871,7 @@ sim_resume (step, siggnal)
          cycles -= doprofile;
          if (saved_state.asregs.profile_hist)
            {
-             int n = pc >> PROFILE_SHIFT;
+             int n = PH2T (insn_ptr) >> PROFILE_SHIFT;
              if (n < nsamples)
                {
                  int i = saved_state.asregs.profile_hist[n];
@@ -1006,58 +1883,65 @@ sim_resume (step, siggnal)
        }
 #endif
     }
-  while (!saved_state.asregs.exception);
+  if (saved_state.asregs.insn_end == loop.end)
+    {
+      saved_state.asregs.cregs.named.sr += SR_RC_INCREMENT;
+      if (SR_RC)
+       insn_ptr = loop.start;
+      else
+       {
+         saved_state.asregs.insn_end = mem_end;
+         loop.end = PT2H (0);
+       }
+      goto loop;
+    }
 
   if (saved_state.asregs.exception == SIGILL
       || saved_state.asregs.exception == SIGBUS)
     {
-      pc -= 2;
+      insn_ptr -= 2;
     }
+  /* Check for SIGBUS due to insn fetch.  */
+  else if (! saved_state.asregs.exception)
+    saved_state.asregs.exception = SIGBUS;
 
   saved_state.asregs.ticks += get_now () - tick_start;
   saved_state.asregs.cycles += cycles;
   saved_state.asregs.stalls += stalls;
+  saved_state.asregs.memstalls += memstalls;
   saved_state.asregs.insts += insts;
-  saved_state.asregs.pc = pc;
-  saved_state.asregs.sr.bits.t = T;
-  saved_state.asregs.pr = PR;
+  saved_state.asregs.pc = PH2T (insn_ptr);
+#ifndef PR
+  saved_state.asregs.sregs.named.pr = PR;
+#endif
 
   saved_state.asregs.prevlock = prevlock;
   saved_state.asregs.thislock = thislock;
 
-
   if (profile_file)
     {
       dump_profile ();
     }
 
-  signal (SIGINT, prev);
+  signal (SIGFPE, prev_fpe);
 }
 
-
-
-
 int
-sim_write (addr, buffer, size)
-     SIM_ADDR addr;
-     unsigned char *buffer;
-     int size;
+sim_write (SIM_DESC sd, SIM_ADDR addr, const unsigned char *buffer, int size)
 {
   int i;
+
   init_pointers ();
 
   for (i = 0; i < size; i++)
     {
-      saved_state.asregs.memory[MMASKB & (addr + i)] = buffer[i];
+      saved_state.asregs.memory[(MMASKB & (addr + i)) ^ endianb] = buffer[i];
     }
   return size;
 }
 
 int
-sim_read (addr, buffer, size)
-     SIM_ADDR addr;
-     unsigned char *buffer;
-     int size;
+sim_read (SIM_DESC sd, SIM_ADDR addr, unsigned char *buffer, int size)
 {
   int i;
 
@@ -1065,101 +1949,529 @@ sim_read (addr, buffer, size)
 
   for (i = 0; i < size; i++)
     {
-      buffer[i] = saved_state.asregs.memory[MMASKB & (addr + i)];
+      buffer[i] = saved_state.asregs.memory[(MMASKB & (addr + i)) ^ endianb];
     }
   return size;
 }
 
+static int gdb_bank_number;
+enum {
+  REGBANK_MACH = 15,
+  REGBANK_IVN  = 16,
+  REGBANK_PR   = 17,
+  REGBANK_GBR  = 18,
+  REGBANK_MACL = 19
+};
 
-void
-sim_store_register (rn, memory)
-     int rn;
-     unsigned char *memory;
+static int
+sh_reg_store (SIM_CPU *cpu, int rn, unsigned char *memory, int length)
 {
-  init_pointers();
-  saved_state.asregs.regs[rn]=RLAT(0);
-}
+  unsigned val;
 
-void
-sim_fetch_register (rn, memory)
-     int rn;
-     unsigned char *memory;
-{
-  init_pointers();
-  WLAT (0, saved_state.asregs.regs[rn]);
+  init_pointers ();
+  val = swap (* (int *) memory);
+  switch (rn)
+    {
+    case SIM_SH_R0_REGNUM: case SIM_SH_R1_REGNUM: case SIM_SH_R2_REGNUM:
+    case SIM_SH_R3_REGNUM: case SIM_SH_R4_REGNUM: case SIM_SH_R5_REGNUM:
+    case SIM_SH_R6_REGNUM: case SIM_SH_R7_REGNUM: case SIM_SH_R8_REGNUM:
+    case SIM_SH_R9_REGNUM: case SIM_SH_R10_REGNUM: case SIM_SH_R11_REGNUM:
+    case SIM_SH_R12_REGNUM: case SIM_SH_R13_REGNUM: case SIM_SH_R14_REGNUM:
+    case SIM_SH_R15_REGNUM:
+      saved_state.asregs.regs[rn] = val;
+      break;
+    case SIM_SH_PC_REGNUM:
+      saved_state.asregs.pc = val;
+      break;
+    case SIM_SH_PR_REGNUM:
+      PR = val;
+      break;
+    case SIM_SH_GBR_REGNUM:
+      GBR = val;
+      break;
+    case SIM_SH_VBR_REGNUM:
+      VBR = val;
+      break;
+    case SIM_SH_MACH_REGNUM:
+      MACH = val;
+      break;
+    case SIM_SH_MACL_REGNUM:
+      MACL = val;
+      break;
+    case SIM_SH_SR_REGNUM:
+      SET_SR (val);
+      break;
+    case SIM_SH_FPUL_REGNUM:
+      FPUL = val;
+      break;
+    case SIM_SH_FPSCR_REGNUM:
+      SET_FPSCR (val);
+      break;
+    case SIM_SH_FR0_REGNUM: case SIM_SH_FR1_REGNUM: case SIM_SH_FR2_REGNUM:
+    case SIM_SH_FR3_REGNUM: case SIM_SH_FR4_REGNUM: case SIM_SH_FR5_REGNUM:
+    case SIM_SH_FR6_REGNUM: case SIM_SH_FR7_REGNUM: case SIM_SH_FR8_REGNUM:
+    case SIM_SH_FR9_REGNUM: case SIM_SH_FR10_REGNUM: case SIM_SH_FR11_REGNUM:
+    case SIM_SH_FR12_REGNUM: case SIM_SH_FR13_REGNUM: case SIM_SH_FR14_REGNUM:
+    case SIM_SH_FR15_REGNUM:
+      SET_FI (rn - SIM_SH_FR0_REGNUM, val);
+      break;
+    case SIM_SH_DSR_REGNUM:
+      DSR = val;
+      break;
+    case SIM_SH_A0G_REGNUM:
+      A0G = val;
+      break;
+    case SIM_SH_A0_REGNUM:
+      A0 = val;
+      break;
+    case SIM_SH_A1G_REGNUM:
+      A1G = val;
+      break;
+    case SIM_SH_A1_REGNUM:
+      A1 = val;
+      break;
+    case SIM_SH_M0_REGNUM:
+      M0 = val;
+      break;
+    case SIM_SH_M1_REGNUM:
+      M1 = val;
+      break;
+    case SIM_SH_X0_REGNUM:
+      X0 = val;
+      break;
+    case SIM_SH_X1_REGNUM:
+      X1 = val;
+      break;
+    case SIM_SH_Y0_REGNUM:
+      Y0 = val;
+      break;
+    case SIM_SH_Y1_REGNUM:
+      Y1 = val;
+      break;
+    case SIM_SH_MOD_REGNUM:
+      SET_MOD (val);
+      break;
+    case SIM_SH_RS_REGNUM:
+      RS = val;
+      break;
+    case SIM_SH_RE_REGNUM:
+      RE = val;
+      break;
+    case SIM_SH_SSR_REGNUM:
+      SSR = val;
+      break;
+    case SIM_SH_SPC_REGNUM:
+      SPC = val;
+      break;
+    /* The rn_bank idiosyncracies are not due to hardware differences, but to
+       a weird aliasing naming scheme for sh3 / sh3e / sh4.  */
+    case SIM_SH_R0_BANK0_REGNUM: case SIM_SH_R1_BANK0_REGNUM:
+    case SIM_SH_R2_BANK0_REGNUM: case SIM_SH_R3_BANK0_REGNUM:
+    case SIM_SH_R4_BANK0_REGNUM: case SIM_SH_R5_BANK0_REGNUM:
+    case SIM_SH_R6_BANK0_REGNUM: case SIM_SH_R7_BANK0_REGNUM:
+      if (saved_state.asregs.bfd_mach == bfd_mach_sh2a)
+       {
+         rn -= SIM_SH_R0_BANK0_REGNUM;
+         saved_state.asregs.regstack[gdb_bank_number].regs[rn] = val;
+       }
+      else
+      if (SR_MD && SR_RB)
+       Rn_BANK (rn - SIM_SH_R0_BANK0_REGNUM) = val;
+      else
+       saved_state.asregs.regs[rn - SIM_SH_R0_BANK0_REGNUM] = val;
+      break;
+    case SIM_SH_R0_BANK1_REGNUM: case SIM_SH_R1_BANK1_REGNUM:
+    case SIM_SH_R2_BANK1_REGNUM: case SIM_SH_R3_BANK1_REGNUM:
+    case SIM_SH_R4_BANK1_REGNUM: case SIM_SH_R5_BANK1_REGNUM:
+    case SIM_SH_R6_BANK1_REGNUM: case SIM_SH_R7_BANK1_REGNUM:
+      if (saved_state.asregs.bfd_mach == bfd_mach_sh2a)
+       {
+         rn -= SIM_SH_R0_BANK1_REGNUM;
+         saved_state.asregs.regstack[gdb_bank_number].regs[rn + 8] = val;
+       }
+      else
+      if (SR_MD && SR_RB)
+       saved_state.asregs.regs[rn - SIM_SH_R0_BANK1_REGNUM] = val;
+      else
+       Rn_BANK (rn - SIM_SH_R0_BANK1_REGNUM) = val;
+      break;
+    case SIM_SH_R0_BANK_REGNUM: case SIM_SH_R1_BANK_REGNUM:
+    case SIM_SH_R2_BANK_REGNUM: case SIM_SH_R3_BANK_REGNUM:
+    case SIM_SH_R4_BANK_REGNUM: case SIM_SH_R5_BANK_REGNUM:
+    case SIM_SH_R6_BANK_REGNUM: case SIM_SH_R7_BANK_REGNUM:
+      SET_Rn_BANK (rn - SIM_SH_R0_BANK_REGNUM, val);
+      break;
+    case SIM_SH_TBR_REGNUM:
+      TBR = val;
+      break;
+    case SIM_SH_IBNR_REGNUM:
+      IBNR = val;
+      break;
+    case SIM_SH_IBCR_REGNUM:
+      IBCR = val;
+      break;
+    case SIM_SH_BANK_REGNUM:
+      /* This is a pseudo-register maintained just for gdb.
+        It tells us what register bank gdb would like to read/write.  */
+      gdb_bank_number = val;
+      break;
+    case SIM_SH_BANK_MACL_REGNUM:
+      saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_MACL] = val;
+      break;
+    case SIM_SH_BANK_GBR_REGNUM:
+      saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_GBR] = val;
+      break;
+    case SIM_SH_BANK_PR_REGNUM:
+      saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_PR] = val;
+      break;
+    case SIM_SH_BANK_IVN_REGNUM:
+      saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_IVN] = val;
+      break;
+    case SIM_SH_BANK_MACH_REGNUM:
+      saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_MACH] = val;
+      break;
+    default:
+      return 0;
+    }
+  return length;
 }
 
-
-int
-sim_trace ()
+static int
+sh_reg_fetch (SIM_CPU *cpu, int rn, unsigned char *memory, int length)
 {
-  return 0;
+  int val;
+
+  init_pointers ();
+  switch (rn)
+    {
+    case SIM_SH_R0_REGNUM: case SIM_SH_R1_REGNUM: case SIM_SH_R2_REGNUM:
+    case SIM_SH_R3_REGNUM: case SIM_SH_R4_REGNUM: case SIM_SH_R5_REGNUM:
+    case SIM_SH_R6_REGNUM: case SIM_SH_R7_REGNUM: case SIM_SH_R8_REGNUM:
+    case SIM_SH_R9_REGNUM: case SIM_SH_R10_REGNUM: case SIM_SH_R11_REGNUM:
+    case SIM_SH_R12_REGNUM: case SIM_SH_R13_REGNUM: case SIM_SH_R14_REGNUM:
+    case SIM_SH_R15_REGNUM:
+      val = saved_state.asregs.regs[rn];
+      break;
+    case SIM_SH_PC_REGNUM:
+      val = saved_state.asregs.pc;
+      break;
+    case SIM_SH_PR_REGNUM:
+      val = PR;
+      break;
+    case SIM_SH_GBR_REGNUM:
+      val = GBR;
+      break;
+    case SIM_SH_VBR_REGNUM:
+      val = VBR;
+      break;
+    case SIM_SH_MACH_REGNUM:
+      val = MACH;
+      break;
+    case SIM_SH_MACL_REGNUM:
+      val = MACL;
+      break;
+    case SIM_SH_SR_REGNUM:
+      val = GET_SR ();
+      break;
+    case SIM_SH_FPUL_REGNUM:
+      val = FPUL;
+      break;
+    case SIM_SH_FPSCR_REGNUM:
+      val = GET_FPSCR ();
+      break;
+    case SIM_SH_FR0_REGNUM: case SIM_SH_FR1_REGNUM: case SIM_SH_FR2_REGNUM:
+    case SIM_SH_FR3_REGNUM: case SIM_SH_FR4_REGNUM: case SIM_SH_FR5_REGNUM:
+    case SIM_SH_FR6_REGNUM: case SIM_SH_FR7_REGNUM: case SIM_SH_FR8_REGNUM:
+    case SIM_SH_FR9_REGNUM: case SIM_SH_FR10_REGNUM: case SIM_SH_FR11_REGNUM:
+    case SIM_SH_FR12_REGNUM: case SIM_SH_FR13_REGNUM: case SIM_SH_FR14_REGNUM:
+    case SIM_SH_FR15_REGNUM:
+      val = FI (rn - SIM_SH_FR0_REGNUM);
+      break;
+    case SIM_SH_DSR_REGNUM:
+      val = DSR;
+      break;
+    case SIM_SH_A0G_REGNUM:
+      val = SEXT (A0G);
+      break;
+    case SIM_SH_A0_REGNUM:
+      val = A0;
+      break;
+    case SIM_SH_A1G_REGNUM:
+      val = SEXT (A1G);
+      break;
+    case SIM_SH_A1_REGNUM:
+      val = A1;
+      break;
+    case SIM_SH_M0_REGNUM:
+      val = M0;
+      break;
+    case SIM_SH_M1_REGNUM:
+      val = M1;
+      break;
+    case SIM_SH_X0_REGNUM:
+      val = X0;
+      break;
+    case SIM_SH_X1_REGNUM:
+      val = X1;
+      break;
+    case SIM_SH_Y0_REGNUM:
+      val = Y0;
+      break;
+    case SIM_SH_Y1_REGNUM:
+      val = Y1;
+      break;
+    case SIM_SH_MOD_REGNUM:
+      val = MOD;
+      break;
+    case SIM_SH_RS_REGNUM:
+      val = RS;
+      break;
+    case SIM_SH_RE_REGNUM:
+      val = RE;
+      break;
+    case SIM_SH_SSR_REGNUM:
+      val = SSR;
+      break;
+    case SIM_SH_SPC_REGNUM:
+      val = SPC;
+      break;
+    /* The rn_bank idiosyncracies are not due to hardware differences, but to
+       a weird aliasing naming scheme for sh3 / sh3e / sh4.  */
+    case SIM_SH_R0_BANK0_REGNUM: case SIM_SH_R1_BANK0_REGNUM:
+    case SIM_SH_R2_BANK0_REGNUM: case SIM_SH_R3_BANK0_REGNUM:
+    case SIM_SH_R4_BANK0_REGNUM: case SIM_SH_R5_BANK0_REGNUM:
+    case SIM_SH_R6_BANK0_REGNUM: case SIM_SH_R7_BANK0_REGNUM:
+      if (saved_state.asregs.bfd_mach == bfd_mach_sh2a)
+       {
+         rn -= SIM_SH_R0_BANK0_REGNUM;
+         val = saved_state.asregs.regstack[gdb_bank_number].regs[rn];
+       }
+      else
+      val = (SR_MD && SR_RB
+            ? Rn_BANK (rn - SIM_SH_R0_BANK0_REGNUM)
+            : saved_state.asregs.regs[rn - SIM_SH_R0_BANK0_REGNUM]);
+      break;
+    case SIM_SH_R0_BANK1_REGNUM: case SIM_SH_R1_BANK1_REGNUM:
+    case SIM_SH_R2_BANK1_REGNUM: case SIM_SH_R3_BANK1_REGNUM:
+    case SIM_SH_R4_BANK1_REGNUM: case SIM_SH_R5_BANK1_REGNUM:
+    case SIM_SH_R6_BANK1_REGNUM: case SIM_SH_R7_BANK1_REGNUM:
+      if (saved_state.asregs.bfd_mach == bfd_mach_sh2a)
+       {
+         rn -= SIM_SH_R0_BANK1_REGNUM;
+         val = saved_state.asregs.regstack[gdb_bank_number].regs[rn + 8];
+       }
+      else
+      val = (! SR_MD || ! SR_RB
+            ? Rn_BANK (rn - SIM_SH_R0_BANK1_REGNUM)
+            : saved_state.asregs.regs[rn - SIM_SH_R0_BANK1_REGNUM]);
+      break;
+    case SIM_SH_R0_BANK_REGNUM: case SIM_SH_R1_BANK_REGNUM:
+    case SIM_SH_R2_BANK_REGNUM: case SIM_SH_R3_BANK_REGNUM:
+    case SIM_SH_R4_BANK_REGNUM: case SIM_SH_R5_BANK_REGNUM:
+    case SIM_SH_R6_BANK_REGNUM: case SIM_SH_R7_BANK_REGNUM:
+      val = Rn_BANK (rn - SIM_SH_R0_BANK_REGNUM);
+      break;
+    case SIM_SH_TBR_REGNUM:
+      val = TBR;
+      break;
+    case SIM_SH_IBNR_REGNUM:
+      val = IBNR;
+      break;
+    case SIM_SH_IBCR_REGNUM:
+      val = IBCR;
+      break;
+    case SIM_SH_BANK_REGNUM:
+      /* This is a pseudo-register maintained just for gdb.
+        It tells us what register bank gdb would like to read/write.  */
+      val = gdb_bank_number;
+      break;
+    case SIM_SH_BANK_MACL_REGNUM:
+      val = saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_MACL];
+      break;
+    case SIM_SH_BANK_GBR_REGNUM:
+      val = saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_GBR];
+      break;
+    case SIM_SH_BANK_PR_REGNUM:
+      val = saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_PR];
+      break;
+    case SIM_SH_BANK_IVN_REGNUM:
+      val = saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_IVN];
+      break;
+    case SIM_SH_BANK_MACH_REGNUM:
+      val = saved_state.asregs.regstack[gdb_bank_number].regs[REGBANK_MACH];
+      break;
+    default:
+      return 0;
+    }
+  * (int *) memory = swap (val);
+  return length;
 }
 
 void
-sim_stop_reason (reason, sigrc)
-     enum sim_stop *reason;
-     int *sigrc;
+sim_stop_reason (SIM_DESC sd, enum sim_stop *reason, int *sigrc)
 {
-  *reason = sim_stopped;
-  *sigrc = saved_state.asregs.exception;
+  /* The SH simulator uses SIGQUIT to indicate that the program has
+     exited, so we must check for it here and translate it to exit.  */
+  if (saved_state.asregs.exception == SIGQUIT)
+    {
+      *reason = sim_exited;
+      *sigrc = saved_state.asregs.regs[5];
+    }
+  else
+    {
+      *reason = sim_stopped;
+      *sigrc = saved_state.asregs.exception;
+    }
 }
 
-
 void
-sim_info (verbose)
-     int verbose;
+sim_info (SIM_DESC sd, int verbose)
 {
-  double timetaken = (double) saved_state.asregs.ticks / (double) now_persec ();
+  double timetaken = 
+    (double) saved_state.asregs.ticks / (double) now_persec ();
   double virttime = saved_state.asregs.cycles / 36.0e6;
 
-  printf_filtered ("\n\n# instructions executed  %10d\n", saved_state.asregs.insts);
-  printf_filtered ("# cycles                 %10d\n", saved_state.asregs.cycles);
-  printf_filtered ("# pipeline stalls        %10d\n", saved_state.asregs.stalls);
-  printf_filtered ("# real time taken        %10.4f\n", timetaken);
-  printf_filtered ("# virtual time taken     %10.4f\n", virttime);
-  printf_filtered ("# profiling size         %10d\n", sim_profile_size);
-  printf_filtered ("# profiling frequency    %10d\n", saved_state.asregs.profile);
-  printf_filtered ("# profile maxpc          %10x\n", (1 << sim_profile_size) << PROFILE_SHIFT);
+  sim_io_printf (sd, "\n\n# instructions executed  %10d\n",
+                saved_state.asregs.insts);
+  sim_io_printf (sd, "# cycles                 %10d\n",
+                saved_state.asregs.cycles);
+  sim_io_printf (sd, "# pipeline stalls        %10d\n",
+                saved_state.asregs.stalls);
+  sim_io_printf (sd, "# misaligned load/store  %10d\n",
+                saved_state.asregs.memstalls);
+  sim_io_printf (sd, "# real time taken        %10.4f\n", timetaken);
+  sim_io_printf (sd, "# virtual time taken     %10.4f\n", virttime);
+  sim_io_printf (sd, "# profiling size         %10d\n", sim_profile_size);
+  sim_io_printf (sd, "# profiling frequency    %10d\n",
+                saved_state.asregs.profile);
+  sim_io_printf (sd, "# profile maxpc          %10x\n",
+                (1 << sim_profile_size) << PROFILE_SHIFT);
 
   if (timetaken != 0)
     {
-      printf_filtered ("# cycles/second          %10d\n", (int) (saved_state.asregs.cycles / timetaken));
-      printf_filtered ("# simulation ratio       %10.4f\n", virttime / timetaken);
+      sim_io_printf (sd, "# cycles/second          %10d\n",
+                    (int) (saved_state.asregs.cycles / timetaken));
+      sim_io_printf (sd, "# simulation ratio       %10.4f\n",
+                    virttime / timetaken);
     }
 }
 
-
-void
-sim_set_profile (n)
-     int n;
+static sim_cia
+sh_pc_get (sim_cpu *cpu)
 {
-  saved_state.asregs.profile = n;
+  return saved_state.asregs.pc;
 }
 
-void
-sim_set_profile_size (n)
-     int n;
+static void
+sh_pc_set (sim_cpu *cpu, sim_cia pc)
 {
-  sim_profile_size = n;
+  saved_state.asregs.pc = pc;
 }
 
+static void
+free_state (SIM_DESC sd)
+{
+  if (STATE_MODULES (sd) != NULL)
+    sim_module_uninstall (sd);
+  sim_cpu_free_all (sd);
+  sim_state_free (sd);
+}
 
-void
-sim_open (args)
-     char *args;
+SIM_DESC
+sim_open (SIM_OPEN_KIND kind, host_callback *cb, struct bfd *abfd, char **argv)
 {
-  int n;
+  char **p;
+  int i;
+  union
+    {
+      int i;
+      short s[2];
+      char c[4];
+    }
+  mem_word;
+
+  SIM_DESC sd = sim_state_alloc (kind, cb);
+  SIM_ASSERT (STATE_MAGIC (sd) == SIM_MAGIC_NUMBER);
+
+  /* The cpu data is kept in a separately allocated chunk of memory.  */
+  if (sim_cpu_alloc_all (sd, 1, /*cgen_cpu_max_extra_bytes ()*/0) != SIM_RC_OK)
+    {
+      free_state (sd);
+      return 0;
+    }
+
+  if (sim_pre_argv_init (sd, argv[0]) != SIM_RC_OK)
+    {
+      free_state (sd);
+      return 0;
+    }
 
-  if (args != NULL)
+  /* The parser will print an error message for us, so we silently return.  */
+  if (sim_parse_args (sd, argv) != SIM_RC_OK)
     {
-      parse_and_set_memory_size (args);
+      free_state (sd);
+      return 0;
     }
+
+  /* Check for/establish the a reference program image.  */
+  if (sim_analyze_program (sd,
+                          (STATE_PROG_ARGV (sd) != NULL
+                           ? *STATE_PROG_ARGV (sd)
+                           : NULL), abfd) != SIM_RC_OK)
+    {
+      free_state (sd);
+      return 0;
+    }
+
+  /* Configure/verify the target byte order and other runtime
+     configuration options.  */
+  if (sim_config (sd) != SIM_RC_OK)
+    {
+      sim_module_uninstall (sd);
+      return 0;
+    }
+
+  if (sim_post_argv_init (sd) != SIM_RC_OK)
+    {
+      /* Uninstall the modules to avoid memory leaks,
+        file descriptor leaks, etc.  */
+      sim_module_uninstall (sd);
+      return 0;
+    }
+
+  /* CPU specific initialization.  */
+  for (i = 0; i < MAX_NR_PROCESSORS; ++i)
+    {
+      SIM_CPU *cpu = STATE_CPU (sd, i);
+
+      CPU_REG_FETCH (cpu) = sh_reg_fetch;
+      CPU_REG_STORE (cpu) = sh_reg_store;
+      CPU_PC_FETCH (cpu) = sh_pc_get;
+      CPU_PC_STORE (cpu) = sh_pc_set;
+    }
+
+  for (p = argv + 1; *p != NULL; ++p)
+    {
+      if (isdigit (**p))
+       parse_and_set_memory_size (sd, *p);
+    }
+
+  if (abfd)
+    init_dsp (abfd);
+
+  for (i = 4; (i -= 2) >= 0; )
+    mem_word.s[i >> 1] = i;
+  global_endianw = mem_word.i >> (target_little_endian ? 0 : 16) & 0xffff;
+
+  for (i = 4; --i >= 0; )
+    mem_word.c[i] = i;
+  endianb = mem_word.i >> (target_little_endian ? 0 : 24) & 0xff;
+
+  return sd;
 }
 
 static void
-parse_and_set_memory_size (str)
-     char *str;
+parse_and_set_memory_size (SIM_DESC sd, const char *str)
 {
   int n;
 
@@ -1167,58 +2479,55 @@ parse_and_set_memory_size (str)
   if (n > 0 && n <= 24)
     sim_memory_size = n;
   else
-    printf_filtered ("Bad memory size %d; must be 1 to 24, inclusive\n", n);
+    sim_io_printf (sd, "Bad memory size %d; must be 1 to 24, inclusive\n", n);
 }
 
-void
-sim_close (quitting)
-     int quitting;
+SIM_RC
+sim_create_inferior (SIM_DESC sd, struct bfd *prog_bfd, char **argv, char **env)
 {
-  /* nothing to do */
-}
+  /* Clear the registers. */
+  memset (&saved_state, 0,
+         (char*) &saved_state.asregs.end_of_registers - (char*) &saved_state);
 
-int
-sim_load (prog, from_tty)
-     char *prog;
-     int from_tty;
-{
-  /* Return nonzero so GDB will handle it.  */
-  return 1;
-}
+  /* Set the PC.  */
+  if (prog_bfd != NULL)
+    saved_state.asregs.pc = bfd_get_start_address (prog_bfd);
 
-void
-sim_create_inferior (start_address, argv, env)
-     SIM_ADDR start_address;
-     char **argv;
-     char **env;
-{
-  saved_state.asregs.pc = start_address;
-}
+  /* Set the bfd machine type.  */
+  if (prog_bfd != NULL)
+    saved_state.asregs.bfd_mach = bfd_get_mach (prog_bfd);
 
-void
-sim_kill ()
-{
-  /* nothing to do */
+  if (prog_bfd != NULL)
+    init_dsp (prog_bfd);
+
+  return SIM_RC_OK;
 }
 
 void
-sim_do_command (cmd)
-     char *cmd;
+sim_do_command (SIM_DESC sd, const char *cmd)
 {
-  int n;
-  char *sms_cmd = "set-memory-size";
+  const char *sms_cmd = "set-memory-size";
+  int cmdsize;
 
-  if (strncmp (cmd, sms_cmd, strlen (sms_cmd)) == 0
-      && strchr ("     ", cmd[strlen(sms_cmd)]))
-    parse_and_set_memory_size (cmd + strlen(sms_cmd) + 1);
+  if (cmd == NULL || *cmd == '\0')
+    {
+      cmd = "help";
+    }
 
+  cmdsize = strlen (sms_cmd);
+  if (strncmp (cmd, sms_cmd, cmdsize) == 0 
+      && strchr (" \t", cmd[cmdsize]) != NULL)
+    {
+      parse_and_set_memory_size (sd, cmd + cmdsize + 1);
+    }
   else if (strcmp (cmd, "help") == 0)
     {
-       printf_filtered ("List of SH simulator commands:\n\n");
-       printf_filtered ("set-memory-size <n> -- Set the number of address bits to use\n");
-       printf_filtered ("\n");
+      sim_io_printf (sd, "List of SH simulator commands:\n\n");
+      sim_io_printf (sd, "set-memory-size <n> -- Set the number of address bits to use\n");
+      sim_io_printf (sd, "\n");
     }
   else
-    fprintf (stderr, "Error: \"%s\" is not a valid SH simulator command.\n",
-            cmd);
+    {
+      sim_io_printf (sd, "Error: \"%s\" is not a valid SH simulator command.\n", cmd);
+    }
 }