]> git.ipfire.org Git - thirdparty/gcc.git/blobdiff - gcc/tree-ssa-ccp.c
c++: Handle multiple aggregate overloads [PR95319].
[thirdparty/gcc.git] / gcc / tree-ssa-ccp.c
index 34c3ad612913f112263faa0b72c77c532cf4f3f7..be6647db894d2673bc819fc106e6198e13316be8 100644 (file)
@@ -1,5 +1,5 @@
 /* Conditional constant propagation pass for the GNU compiler.
-   Copyright (C) 2000-2015 Free Software Foundation, Inc.
+   Copyright (C) 2000-2020 Free Software Foundation, Inc.
    Adapted from original RTL SSA-CCP by Daniel Berlin <dberlin@dberlin.org>
    Adapted to GIMPLE trees by Diego Novillo <dnovillo@redhat.com>
 
@@ -121,47 +121,36 @@ along with GCC; see the file COPYING3.  If not see
 #include "config.h"
 #include "system.h"
 #include "coretypes.h"
-#include "tm.h"
-#include "alias.h"
-#include "symtab.h"
+#include "backend.h"
+#include "target.h"
 #include "tree.h"
-#include "fold-const.h"
-#include "stor-layout.h"
-#include "flags.h"
-#include "tm_p.h"
-#include "predict.h"
-#include "hard-reg-set.h"
-#include "function.h"
-#include "dominance.h"
-#include "cfg.h"
-#include "basic-block.h"
+#include "gimple.h"
+#include "tree-pass.h"
+#include "ssa.h"
 #include "gimple-pretty-print.h"
-#include "tree-ssa-alias.h"
-#include "internal-fn.h"
+#include "fold-const.h"
 #include "gimple-fold.h"
 #include "tree-eh.h"
-#include "gimple-expr.h"
-#include "gimple.h"
 #include "gimplify.h"
 #include "gimple-iterator.h"
-#include "gimple-ssa.h"
 #include "tree-cfg.h"
-#include "tree-phinodes.h"
-#include "ssa-iterators.h"
-#include "stringpool.h"
-#include "tree-ssanames.h"
-#include "tree-pass.h"
 #include "tree-ssa-propagate.h"
-#include "value-prof.h"
-#include "langhooks.h"
-#include "target.h"
-#include "diagnostic-core.h"
 #include "dbgcnt.h"
-#include "params.h"
-#include "wide-int-print.h"
 #include "builtins.h"
-#include "tree-chkp.h"
-
+#include "cfgloop.h"
+#include "stor-layout.h"
+#include "optabs-query.h"
+#include "tree-ssa-ccp.h"
+#include "tree-dfa.h"
+#include "diagnostic-core.h"
+#include "stringpool.h"
+#include "attribs.h"
+#include "tree-vector-builder.h"
+#include "cgraph.h"
+#include "alloc-pool.h"
+#include "symbol-summary.h"
+#include "ipa-utils.h"
+#include "ipa-prop.h"
 
 /* Possible lattice values.  */
 typedef enum
@@ -172,7 +161,8 @@ typedef enum
   VARYING
 } ccp_lattice_t;
 
-struct ccp_prop_value_t {
+class ccp_prop_value_t {
+public:
     /* Lattice value.  */
     ccp_lattice_t lattice_val;
 
@@ -186,6 +176,13 @@ struct ccp_prop_value_t {
     widest_int mask;
 };
 
+class ccp_propagate : public ssa_propagation_engine
+{
+ public:
+  enum ssa_prop_result visit_stmt (gimple *, edge *, tree *) FINAL OVERRIDE;
+  enum ssa_prop_result visit_phi (gphi *) FINAL OVERRIDE;
+};
+
 /* Array of propagated constant values.  After propagation,
    CONST_VAL[I].VALUE holds the constant value for SSA_NAME(I).  If
    the constant is held in an SSA name representing a memory store
@@ -196,7 +193,6 @@ static ccp_prop_value_t *const_val;
 static unsigned n_const_val;
 
 static void canonicalize_value (ccp_prop_value_t *);
-static bool ccp_fold_stmt (gimple_stmt_iterator *);
 static void ccp_lattice_meet (ccp_prop_value_t *, ccp_prop_value_t *);
 
 /* Dump constant propagation value VAL to file OUTF prefixed by PREFIX.  */
@@ -250,13 +246,12 @@ debug_lattice_value (ccp_prop_value_t val)
   fprintf (stderr, "\n");
 }
 
-/* Extend NONZERO_BITS to a full mask, with the upper bits being set.  */
+/* Extend NONZERO_BITS to a full mask, based on sgn.  */ 
 
 static widest_int
-extend_mask (const wide_int &nonzero_bits)
+extend_mask (const wide_int &nonzero_bits, signop sgn)
 {
-  return (wi::mask <widest_int> (wi::get_precision (nonzero_bits), true)
-         | widest_int::from (nonzero_bits, UNSIGNED));
+  return widest_int::from (nonzero_bits, sgn); 
 }
 
 /* Compute a default value for variable VAR and store it in the
@@ -281,7 +276,7 @@ static ccp_prop_value_t
 get_default_value (tree var)
 {
   ccp_prop_value_t val = { UNINITIALIZED, NULL_TREE, 0 };
-  gimple stmt;
+  gimple *stmt;
 
   stmt = SSA_NAME_DEF_STMT (var);
 
@@ -292,6 +287,7 @@ get_default_value (tree var)
         can assume initially that it is UNDEFINED, otherwise we must
         consider it VARYING.  */
       if (!virtual_operand_p (var)
+         && SSA_NAME_VAR (var)
          && TREE_CODE (SSA_NAME_VAR (var)) == VAR_DECL)
        val.lattice_val = UNDEFINED;
       else
@@ -301,11 +297,26 @@ get_default_value (tree var)
          if (flag_tree_bit_ccp)
            {
              wide_int nonzero_bits = get_nonzero_bits (var);
-             if (nonzero_bits != -1)
+             tree value;
+             widest_int mask;
+
+             if (SSA_NAME_VAR (var)
+                 && TREE_CODE (SSA_NAME_VAR (var)) == PARM_DECL
+                 && ipcp_get_parm_bits (SSA_NAME_VAR (var), &value, &mask))
+               {
+                 val.lattice_val = CONSTANT;
+                 val.value = value;
+                 val.mask = mask;
+                 if (nonzero_bits != -1)
+                   val.mask &= extend_mask (nonzero_bits,
+                                            TYPE_SIGN (TREE_TYPE (var)));
+               }
+             else if (nonzero_bits != -1)
                {
                  val.lattice_val = CONSTANT;
                  val.value = build_zero_cst (TREE_TYPE (var));
-                 val.mask = extend_mask (nonzero_bits);
+                 val.mask = extend_mask (nonzero_bits,
+                                         TYPE_SIGN (TREE_TYPE (var)));
                }
            }
        }
@@ -474,11 +485,14 @@ valid_lattice_transition (ccp_prop_value_t old_val, ccp_prop_value_t new_val)
   else if (VECTOR_FLOAT_TYPE_P (type)
           && !HONOR_NANS (type))
     {
-      for (unsigned i = 0; i < VECTOR_CST_NELTS (old_val.value); ++i)
+      unsigned int count
+       = tree_vector_builder::binary_encoded_nelts (old_val.value,
+                                                    new_val.value);
+      for (unsigned int i = 0; i < count; ++i)
        if (!REAL_VALUE_ISNAN
-              (TREE_REAL_CST (VECTOR_CST_ELT (old_val.value, i)))
-           && !operand_equal_p (VECTOR_CST_ELT (old_val.value, i),
-                                VECTOR_CST_ELT (new_val.value, i), 0))
+              (TREE_REAL_CST (VECTOR_CST_ENCODED_ELT (old_val.value, i)))
+           && !operand_equal_p (VECTOR_CST_ENCODED_ELT (old_val.value, i),
+                                VECTOR_CST_ENCODED_ELT (new_val.value, i), 0))
          return false;
       return true;
     }
@@ -514,9 +528,7 @@ set_lattice_value (tree var, ccp_prop_value_t *new_val)
      use the meet operator to retain a conservative value.
      Missed optimizations like PR65851 makes this necessary.
      It also ensures we converge to a stable lattice solution.  */
-  if (new_val->lattice_val == CONSTANT
-      && old_val->lattice_val == CONSTANT
-      && TREE_CODE (new_val->value) != SSA_NAME)
+  if (old_val->lattice_val != UNINITIALIZED)
     ccp_lattice_meet (new_val, old_val);
 
   gcc_checking_assert (valid_lattice_transition (*old_val, *new_val));
@@ -555,9 +567,9 @@ set_lattice_value (tree var, ccp_prop_value_t *new_val)
 
 static ccp_prop_value_t get_value_for_expr (tree, bool);
 static ccp_prop_value_t bit_value_binop (enum tree_code, tree, tree, tree);
-static void bit_value_binop_1 (enum tree_code, tree, widest_int *, widest_int *,
-                              tree, const widest_int &, const widest_int &,
-                              tree, const widest_int &, const widest_int &);
+void bit_value_binop (enum tree_code, signop, int, widest_int *, widest_int *,
+                     signop, int, const widest_int &, const widest_int &,
+                     signop, int, const widest_int &, const widest_int &);
 
 /* Return a widest_int that can be used for bitwise simplifications
    from VAL.  */
@@ -586,9 +598,11 @@ get_value_from_alignment (tree expr)
   gcc_assert (TREE_CODE (expr) == ADDR_EXPR);
 
   get_pointer_alignment_1 (expr, &align, &bitpos);
-  val.mask = (POINTER_TYPE_P (type) || TYPE_UNSIGNED (type)
-             ? wi::mask <widest_int> (TYPE_PRECISION (type), false)
-             : -1).and_not (align / BITS_PER_UNIT - 1);
+  val.mask = wi::bit_and_not
+    (POINTER_TYPE_P (type) || TYPE_UNSIGNED (type)
+     ? wi::mask <widest_int> (TYPE_PRECISION (type), false)
+     : -1,
+     align / BITS_PER_UNIT - 1);
   val.lattice_val
     = wi::sext (val.mask, TYPE_PRECISION (type)) == -1 ? VARYING : CONSTANT;
   if (val.lattice_val == CONSTANT)
@@ -610,11 +624,27 @@ get_value_for_expr (tree expr, bool for_bits_p)
 
   if (TREE_CODE (expr) == SSA_NAME)
     {
-      val = *get_value (expr);
+      ccp_prop_value_t *val_ = get_value (expr);
+      if (val_)
+       val = *val_;
+      else
+       {
+         val.lattice_val = VARYING;
+         val.value = NULL_TREE;
+         val.mask = -1;
+       }
       if (for_bits_p
-         && val.lattice_val == CONSTANT
-         && TREE_CODE (val.value) == ADDR_EXPR)
-       val = get_value_from_alignment (val.value);
+         && val.lattice_val == CONSTANT)
+       {
+         if (TREE_CODE (val.value) == ADDR_EXPR)
+           val = get_value_from_alignment (val.value);
+         else if (TREE_CODE (val.value) != INTEGER_CST)
+           {
+             val.lattice_val = VARYING;
+             val.value = NULL_TREE;
+             val.mask = -1;
+           }
+       }
       /* Fall back to a copy value.  */
       if (!for_bits_p
          && val.lattice_val == VARYING
@@ -626,7 +656,7 @@ get_value_for_expr (tree expr, bool for_bits_p)
        }
     }
   else if (is_gimple_min_invariant (expr)
-          && (!for_bits_p || TREE_CODE (expr) != ADDR_EXPR))
+          && (!for_bits_p || TREE_CODE (expr) == INTEGER_CST))
     {
       val.lattice_val = CONSTANT;
       val.value = expr;
@@ -641,6 +671,11 @@ get_value_for_expr (tree expr, bool for_bits_p)
       val.mask = -1;
       val.value = NULL_TREE;
     }
+
+  if (val.lattice_val == VARYING
+      && TYPE_UNSIGNED (TREE_TYPE (expr)))
+    val.mask = wi::zext (val.mask, TYPE_PRECISION (TREE_TYPE (expr)));
+
   return val;
 }
 
@@ -656,7 +691,7 @@ get_value_for_expr (tree expr, bool for_bits_p)
    Else return VARYING.  */
 
 static ccp_lattice_t
-likely_value (gimple stmt)
+likely_value (gimple *stmt)
 {
   bool has_constant_operand, has_undefined_operand, all_undefined_operands;
   bool has_nsa_operand;
@@ -687,12 +722,12 @@ likely_value (gimple stmt)
     {
       ccp_prop_value_t *val = get_value (use);
 
-      if (val->lattice_val == UNDEFINED)
+      if (val && val->lattice_val == UNDEFINED)
        has_undefined_operand = true;
       else
        all_undefined_operands = false;
 
-      if (val->lattice_val == CONSTANT)
+      if (val && val->lattice_val == CONSTANT)
        has_constant_operand = true;
 
       if (SSA_NAME_IS_DEFAULT_DEF (use)
@@ -745,9 +780,11 @@ likely_value (gimple stmt)
        case PLUS_EXPR:
        case MINUS_EXPR:
        case POINTER_PLUS_EXPR:
+       case BIT_XOR_EXPR:
          /* Not MIN_EXPR, MAX_EXPR.  One VARYING operand may be selected.
             Not bitwise operators, one VARYING operand may specify the
-            result completely.  Not logical operators for the same reason.
+            result completely.
+            Not logical operators for the same reason, apart from XOR.
             Not COMPLEX_EXPR as one VARYING operand makes the result partly
             not UNDEFINED.  Not *DIV_EXPR, comparisons and shifts because
             the undefined operand may be promoted.  */
@@ -783,7 +820,7 @@ likely_value (gimple stmt)
 /* Returns true if STMT cannot be constant.  */
 
 static bool
-surely_varying_stmt_p (gimple stmt)
+surely_varying_stmt_p (gimple *stmt)
 {
   /* If the statement has operands that we cannot handle, it cannot be
      constant.  */
@@ -798,7 +835,7 @@ surely_varying_stmt_p (gimple stmt)
       tree fndecl, fntype = gimple_call_fntype (stmt);
       if (!gimple_call_lhs (stmt)
          || ((fndecl = gimple_call_fndecl (stmt)) != NULL_TREE
-             && !DECL_BUILT_IN (fndecl)
+             && !fndecl_built_in_p (fndecl)
              && !lookup_attribute ("assume_aligned",
                                    TYPE_ATTRIBUTES (fntype))
              && !lookup_attribute ("alloc_align",
@@ -838,7 +875,7 @@ ccp_initialize (void)
 
       for (i = gsi_start_bb (bb); !gsi_end_p (i); gsi_next (&i))
         {
-         gimple stmt = gsi_stmt (i);
+         gimple *stmt = gsi_stmt (i);
          bool is_varying;
 
          /* If the statement is a control insn, then we do not
@@ -902,39 +939,57 @@ do_dbg_cnt (void)
 }
 
 
+/* We want to provide our own GET_VALUE and FOLD_STMT virtual methods.  */
+class ccp_folder : public substitute_and_fold_engine
+{
+ public:
+  tree get_value (tree) FINAL OVERRIDE;
+  bool fold_stmt (gimple_stmt_iterator *) FINAL OVERRIDE;
+};
+
+/* This method just wraps GET_CONSTANT_VALUE for now.  Over time
+   naked calls to GET_CONSTANT_VALUE should be eliminated in favor
+   of calling member functions.  */
+
+tree
+ccp_folder::get_value (tree op)
+{
+  return get_constant_value (op);
+}
+
 /* Do final substitution of propagated values, cleanup the flowgraph and
-   free allocated storage.
+   free allocated storage.  If NONZERO_P, record nonzero bits.
 
    Return TRUE when something was optimized.  */
 
 static bool
-ccp_finalize (void)
+ccp_finalize (bool nonzero_p) 
 {
   bool something_changed;
   unsigned i;
+  tree name;
 
   do_dbg_cnt ();
 
   /* Derive alignment and misalignment information from partially
      constant pointers in the lattice or nonzero bits from partially
      constant integers.  */
-  for (i = 1; i < num_ssa_names; ++i)
+  FOR_EACH_SSA_NAME (i, name, cfun)
     {
-      tree name = ssa_name (i);
       ccp_prop_value_t *val;
       unsigned int tem, align;
 
-      if (!name
-         || (!POINTER_TYPE_P (TREE_TYPE (name))
-             && (!INTEGRAL_TYPE_P (TREE_TYPE (name))
-                 /* Don't record nonzero bits before IPA to avoid
-                    using too much memory.  */
-                 || first_pass_instance)))
+      if (!POINTER_TYPE_P (TREE_TYPE (name))
+         && (!INTEGRAL_TYPE_P (TREE_TYPE (name))
+             /* Don't record nonzero bits before IPA to avoid
+                using too much memory.  */
+             || !nonzero_p))
        continue;
 
       val = get_value (name);
       if (val->lattice_val != CONSTANT
-         || TREE_CODE (val->value) != INTEGER_CST)
+         || TREE_CODE (val->value) != INTEGER_CST
+         || val->mask == 0)
        continue;
 
       if (POINTER_TYPE_P (TREE_TYPE (name)))
@@ -942,7 +997,7 @@ ccp_finalize (void)
          /* Trailing mask bits specify the alignment, trailing value
             bits the misalignment.  */
          tem = val->mask.to_uhwi ();
-         align = (tem & -tem);
+         align = least_bit_hwi (tem);
          if (align > 1)
            set_ptr_info_alignment (get_ptr_info (name), align,
                                    (TREE_INT_CST_LOW (val->value)
@@ -951,20 +1006,21 @@ ccp_finalize (void)
       else
        {
          unsigned int precision = TYPE_PRECISION (TREE_TYPE (val->value));
-         wide_int nonzero_bits = wide_int::from (val->mask, precision,
-                                                 UNSIGNED) | val->value;
+         wide_int nonzero_bits
+           = (wide_int::from (val->mask, precision, UNSIGNED)
+              | wi::to_wide (val->value));
          nonzero_bits &= get_nonzero_bits (name);
          set_nonzero_bits (name, nonzero_bits);
        }
     }
 
   /* Perform substitutions based on the known constant values.  */
-  something_changed = substitute_and_fold (get_constant_value,
-                                          ccp_fold_stmt, true);
+  class ccp_folder ccp_folder;
+  something_changed = ccp_folder.substitute_and_fold ();
 
   free (const_val);
   const_val = NULL;
-  return something_changed;;
+  return something_changed;
 }
 
 
@@ -1064,8 +1120,8 @@ ccp_lattice_meet (ccp_prop_value_t *val1, ccp_prop_value_t *val2)
    PHI node is determined calling ccp_lattice_meet with all the arguments
    of the PHI node that are incoming via executable edges.  */
 
-static enum ssa_prop_result
-ccp_visit_phi_node (gphi *phi)
+enum ssa_prop_result
+ccp_propagate::visit_phi (gphi *phi)
 {
   unsigned i;
   ccp_prop_value_t new_val;
@@ -1081,6 +1137,7 @@ ccp_visit_phi_node (gphi *phi)
   new_val.mask = 0;
 
   bool first = true;
+  bool non_exec_edge = false;
   for (i = 0; i < gimple_phi_num_args (phi); i++)
     {
       /* Compute the meet operator over all the PHI arguments flowing
@@ -1090,7 +1147,7 @@ ccp_visit_phi_node (gphi *phi)
       if (dump_file && (dump_flags & TDF_DETAILS))
        {
          fprintf (dump_file,
-             "\n    Argument #%d (%d -> %d %sexecutable)\n",
+             "\tArgument #%d (%d -> %d %sexecutable)\n",
              i, e->src->index, e->dest->index,
              (e->flags & EDGE_EXECUTABLE) ? "" : "not ");
        }
@@ -1121,6 +1178,22 @@ ccp_visit_phi_node (gphi *phi)
          if (new_val.lattice_val == VARYING)
            break;
        }
+      else
+       non_exec_edge = true;
+    }
+
+  /* In case there were non-executable edges and the value is a copy
+     make sure its definition dominates the PHI node.  */
+  if (non_exec_edge
+      && new_val.lattice_val == CONSTANT
+      && TREE_CODE (new_val.value) == SSA_NAME
+      && ! SSA_NAME_IS_DEFAULT_DEF (new_val.value)
+      && ! dominated_by_p (CDI_DOMINATORS, gimple_bb (phi),
+                          gimple_bb (SSA_NAME_DEF_STMT (new_val.value))))
+    {
+      new_val.lattice_val = VARYING;
+      new_val.value = NULL_TREE;
+      new_val.mask = -1;
     }
 
   if (dump_file && (dump_flags & TDF_DETAILS))
@@ -1166,7 +1239,7 @@ valueize_op_1 (tree op)
       /* If the definition may be simulated again we cannot follow
          this SSA edge as the SSA propagator does not necessarily
         re-visit the use.  */
-      gimple def_stmt = SSA_NAME_DEF_STMT (op);
+      gimple *def_stmt = SSA_NAME_DEF_STMT (op);
       if (!gimple_nop_p (def_stmt)
          && prop_simulate_again_p (def_stmt))
        return NULL_TREE;
@@ -1187,7 +1260,7 @@ valueize_op_1 (tree op)
    otherwise return the original RHS or NULL_TREE.  */
 
 static tree
-ccp_fold (gimple stmt)
+ccp_fold (gimple *stmt)
 {
   location_t loc = gimple_location (stmt);
   switch (gimple_code (stmt))
@@ -1221,10 +1294,11 @@ ccp_fold (gimple stmt)
    RVAL and RMASK representing a value of type RTYPE and set
    the value, mask pair *VAL and *MASK to the result.  */
 
-static void
-bit_value_unop_1 (enum tree_code code, tree type,
-                 widest_int *val, widest_int *mask,
-                 tree rtype, const widest_int &rval, const widest_int &rmask)
+void
+bit_value_unop (enum tree_code code, signop type_sgn, int type_precision, 
+               widest_int *val, widest_int *mask,
+               signop rtype_sgn, int rtype_precision,
+               const widest_int &rval, const widest_int &rmask)
 {
   switch (code)
     {
@@ -1237,25 +1311,23 @@ bit_value_unop_1 (enum tree_code code, tree type,
       {
        widest_int temv, temm;
        /* Return ~rval + 1.  */
-       bit_value_unop_1 (BIT_NOT_EXPR, type, &temv, &temm, type, rval, rmask);
-       bit_value_binop_1 (PLUS_EXPR, type, val, mask,
-                          type, temv, temm, type, 1, 0);
+       bit_value_unop (BIT_NOT_EXPR, type_sgn, type_precision, &temv, &temm,
+                       type_sgn, type_precision, rval, rmask);
+       bit_value_binop (PLUS_EXPR, type_sgn, type_precision, val, mask,
+                        type_sgn, type_precision, temv, temm,
+                        type_sgn, type_precision, 1, 0);
        break;
       }
 
     CASE_CONVERT:
       {
-       signop sgn;
-
        /* First extend mask and value according to the original type.  */
-       sgn = TYPE_SIGN (rtype);
-       *mask = wi::ext (rmask, TYPE_PRECISION (rtype), sgn);
-       *val = wi::ext (rval, TYPE_PRECISION (rtype), sgn);
+       *mask = wi::ext (rmask, rtype_precision, rtype_sgn);
+       *val = wi::ext (rval, rtype_precision, rtype_sgn);
 
        /* Then extend mask and value according to the target type.  */
-       sgn = TYPE_SIGN (type);
-       *mask = wi::ext (*mask, TYPE_PRECISION (type), sgn);
-       *val = wi::ext (*val, TYPE_PRECISION (type), sgn);
+       *mask = wi::ext (*mask, type_precision, type_sgn);
+       *val = wi::ext (*val, type_precision, type_sgn);
        break;
       }
 
@@ -1269,15 +1341,14 @@ bit_value_unop_1 (enum tree_code code, tree type,
    R1VAL, R1MASK and R2VAL, R2MASK representing a values of type R1TYPE
    and R2TYPE and set the value, mask pair *VAL and *MASK to the result.  */
 
-static void
-bit_value_binop_1 (enum tree_code code, tree type,
-                  widest_int *val, widest_int *mask,
-                  tree r1type, const widest_int &r1val,
-                  const widest_int &r1mask, tree r2type,
-                  const widest_int &r2val, const widest_int &r2mask)
+void
+bit_value_binop (enum tree_code code, signop sgn, int width, 
+                widest_int *val, widest_int *mask,
+                signop r1type_sgn, int r1type_precision,
+                const widest_int &r1val, const widest_int &r1mask,
+                signop r2type_sgn, int r2type_precision,
+                const widest_int &r2val, const widest_int &r2mask)
 {
-  signop sgn = TYPE_SIGN (type);
-  int width = TYPE_PRECISION (type);
   bool swap_p = false;
 
   /* Assume we'll get a constant result.  Use an initial non varying
@@ -1296,8 +1367,9 @@ bit_value_binop_1 (enum tree_code code, tree type,
     case BIT_IOR_EXPR:
       /* The mask is constant where there is a known
         set bit, (m1 | m2) & ~((v1 & ~m1) | (v2 & ~m2)).  */
-      *mask = (r1mask | r2mask)
-             .and_not (r1val.and_not (r1mask) | r2val.and_not (r2mask));
+      *mask = wi::bit_and_not (r1mask | r2mask,
+                              wi::bit_and_not (r1val, r1mask)
+                              | wi::bit_and_not (r2val, r2mask));
       *val = r1val | r2val;
       break;
 
@@ -1371,8 +1443,8 @@ bit_value_binop_1 (enum tree_code code, tree type,
                }
              else
                {
-                 *mask = wi::ext (wi::lshift (r1mask, shift), width, sgn);
-                 *val = wi::ext (wi::lshift (r1val, shift), width, sgn);
+                 *mask = wi::ext (r1mask << shift, width, sgn);
+                 *val = wi::ext (r1val << shift, width, sgn);
                }
            }
        }
@@ -1383,7 +1455,8 @@ bit_value_binop_1 (enum tree_code code, tree type,
       {
        /* Do the addition with unknown bits set to zero, to give carry-ins of
           zero wherever possible.  */
-       widest_int lo = r1val.and_not (r1mask) + r2val.and_not (r2mask);
+       widest_int lo = (wi::bit_and_not (r1val, r1mask)
+                        + wi::bit_and_not (r2val, r2mask));
        lo = wi::ext (lo, width, sgn);
        /* Do the addition with unknown bits set to one, to give carry-ins of
           one wherever possible.  */
@@ -1403,11 +1476,11 @@ bit_value_binop_1 (enum tree_code code, tree type,
     case MINUS_EXPR:
       {
        widest_int temv, temm;
-       bit_value_unop_1 (NEGATE_EXPR, r2type, &temv, &temm,
-                         r2type, r2val, r2mask);
-       bit_value_binop_1 (PLUS_EXPR, type, val, mask,
-                          r1type, r1val, r1mask,
-                          r2type, temv, temm);
+       bit_value_unop (NEGATE_EXPR, r2type_sgn, r2type_precision, &temv, &temm,
+                         r2type_sgn, r2type_precision, r2val, r2mask);
+       bit_value_binop (PLUS_EXPR, sgn, width, val, mask,
+                        r1type_sgn, r1type_precision, r1val, r1mask,
+                        r2type_sgn, r2type_precision, temv, temm);
        break;
       }
 
@@ -1435,7 +1508,7 @@ bit_value_binop_1 (enum tree_code code, tree type,
     case NE_EXPR:
       {
        widest_int m = r1mask | r2mask;
-       if (r1val.and_not (m) != r2val.and_not (m))
+       if (wi::bit_and_not (r1val, m) != wi::bit_and_not (r2val, m))
          {
            *mask = 0;
            *val = ((code == EQ_EXPR) ? 0 : 1);
@@ -1469,13 +1542,15 @@ bit_value_binop_1 (enum tree_code code, tree type,
          break;
 
        /* For comparisons the signedness is in the comparison operands.  */
-       sgn = TYPE_SIGN (r1type);
+       sgn = r1type_sgn;
 
        /* If we know the most significant bits we know the values
           value ranges by means of treating varying bits as zero
           or one.  Do a cross comparison of the max/min pairs.  */
-       maxmin = wi::cmp (o1val | o1mask, o2val.and_not (o2mask), sgn);
-       minmax = wi::cmp (o1val.and_not (o1mask), o2val | o2mask, sgn);
+       maxmin = wi::cmp (o1val | o1mask,
+                         wi::bit_and_not (o2val, o2mask), sgn);
+       minmax = wi::cmp (wi::bit_and_not (o1val, o1mask),
+                         o2val | o2mask, sgn);
        if (maxmin < 0)  /* o1 is less than o2.  */
          {
            *mask = 0;
@@ -1522,8 +1597,9 @@ bit_value_unop (enum tree_code code, tree type, tree rhs)
   gcc_assert ((rval.lattice_val == CONSTANT
               && TREE_CODE (rval.value) == INTEGER_CST)
              || wi::sext (rval.mask, TYPE_PRECISION (TREE_TYPE (rhs))) == -1);
-  bit_value_unop_1 (code, type, &value, &mask,
-                   TREE_TYPE (rhs), value_to_wide_int (rval), rval.mask);
+  bit_value_unop (code, TYPE_SIGN (type), TYPE_PRECISION (type), &value, &mask,
+                 TYPE_SIGN (TREE_TYPE (rhs)), TYPE_PRECISION (TREE_TYPE (rhs)),
+                 value_to_wide_int (rval), rval.mask);
   if (wi::sext (mask, TYPE_PRECISION (type)) != -1)
     {
       val.lattice_val = CONSTANT;
@@ -1568,9 +1644,23 @@ bit_value_binop (enum tree_code code, tree type, tree rhs1, tree rhs2)
               && TREE_CODE (r2val.value) == INTEGER_CST)
              || wi::sext (r2val.mask,
                           TYPE_PRECISION (TREE_TYPE (rhs2))) == -1);
-  bit_value_binop_1 (code, type, &value, &mask,
-                    TREE_TYPE (rhs1), value_to_wide_int (r1val), r1val.mask,
-                    TREE_TYPE (rhs2), value_to_wide_int (r2val), r2val.mask);
+  bit_value_binop (code, TYPE_SIGN (type), TYPE_PRECISION (type), &value, &mask,
+                  TYPE_SIGN (TREE_TYPE (rhs1)), TYPE_PRECISION (TREE_TYPE (rhs1)),
+                  value_to_wide_int (r1val), r1val.mask,
+                  TYPE_SIGN (TREE_TYPE (rhs2)), TYPE_PRECISION (TREE_TYPE (rhs2)),
+                  value_to_wide_int (r2val), r2val.mask);
+
+  /* (x * x) & 2 == 0.  */
+  if (code == MULT_EXPR && rhs1 == rhs2 && TYPE_PRECISION (type) > 1)
+    {
+      widest_int m = 2;
+      if (wi::sext (mask, TYPE_PRECISION (type)) != -1)
+       value = wi::bit_and_not (value, m);
+      else
+       value = 0;
+      mask = wi::bit_and_not (mask, m);
+    }
+
   if (wi::sext (mask, TYPE_PRECISION (type)) != -1)
     {
       val.lattice_val = CONSTANT;
@@ -1595,7 +1685,7 @@ bit_value_binop (enum tree_code code, tree type, tree rhs1, tree rhs2)
    ALLOC_ALIGNED is true.  */
 
 static ccp_prop_value_t
-bit_value_assume_aligned (gimple stmt, tree attr, ccp_prop_value_t ptrval,
+bit_value_assume_aligned (gimple *stmt, tree attr, ccp_prop_value_t ptrval,
                          bool alloc_aligned)
 {
   tree align, misalign = NULL_TREE, type;
@@ -1669,9 +1759,10 @@ bit_value_assume_aligned (gimple stmt, tree attr, ccp_prop_value_t ptrval,
 
   align = build_int_cst_type (type, -aligni);
   alignval = get_value_for_expr (align, true);
-  bit_value_binop_1 (BIT_AND_EXPR, type, &value, &mask,
-                    type, value_to_wide_int (ptrval), ptrval.mask,
-                    type, value_to_wide_int (alignval), alignval.mask);
+  bit_value_binop (BIT_AND_EXPR, TYPE_SIGN (type), TYPE_PRECISION (type), &value, &mask,
+                  TYPE_SIGN (type), TYPE_PRECISION (type), value_to_wide_int (ptrval), ptrval.mask,
+                  TYPE_SIGN (type), TYPE_PRECISION (type), value_to_wide_int (alignval), alignval.mask);
+
   if (wi::sext (mask, TYPE_PRECISION (type)) != -1)
     {
       val.lattice_val = CONSTANT;
@@ -1695,7 +1786,7 @@ bit_value_assume_aligned (gimple stmt, tree attr, ccp_prop_value_t ptrval,
    Valid only for assignments, calls, conditionals, and switches. */
 
 static ccp_prop_value_t
-evaluate_stmt (gimple stmt)
+evaluate_stmt (gimple *stmt)
 {
   ccp_prop_value_t val;
   tree simplified = NULL_TREE;
@@ -1731,14 +1822,25 @@ evaluate_stmt (gimple stmt)
     {
       fold_defer_overflow_warnings ();
       simplified = ccp_fold (stmt);
-      if (simplified && TREE_CODE (simplified) == SSA_NAME)
+      if (simplified
+         && TREE_CODE (simplified) == SSA_NAME)
        {
-         val = *get_value (simplified);
-         if (val.lattice_val != VARYING)
+         /* We may not use values of something that may be simulated again,
+            see valueize_op_1.  */
+         if (SSA_NAME_IS_DEFAULT_DEF (simplified)
+             || ! prop_simulate_again_p (SSA_NAME_DEF_STMT (simplified)))
            {
-             fold_undefer_overflow_warnings (true, stmt, 0);
-             return val;
+             ccp_prop_value_t *val = get_value (simplified);
+             if (val && val->lattice_val != VARYING)
+               {
+                 fold_undefer_overflow_warnings (true, stmt, 0);
+                 return *val;
+               }
            }
+         else
+           /* We may also not place a non-valueized copy in the lattice
+              as that might become stale if we never re-visit this stmt.  */
+           simplified = NULL_TREE;
        }
       is_constant = simplified && is_gimple_min_invariant (simplified);
       fold_undefer_overflow_warnings (is_constant, stmt, 0);
@@ -1851,11 +1953,10 @@ evaluate_stmt (gimple stmt)
                           / BITS_PER_UNIT - 1);
              break;
 
-           case BUILT_IN_ALLOCA:
-           case BUILT_IN_ALLOCA_WITH_ALIGN:
-             align = (DECL_FUNCTION_CODE (fndecl) == BUILT_IN_ALLOCA_WITH_ALIGN
-                      ? TREE_INT_CST_LOW (gimple_call_arg (stmt, 1))
-                      : BIGGEST_ALIGNMENT);
+           CASE_BUILT_IN_ALLOCA:
+             align = (DECL_FUNCTION_CODE (fndecl) == BUILT_IN_ALLOCA
+                      ? BIGGEST_ALIGNMENT
+                      : TREE_INT_CST_LOW (gimple_call_arg (stmt, 1)));
              val.lattice_val = CONSTANT;
              val.value = build_int_cst (TREE_TYPE (gimple_get_lhs (stmt)), 0);
              val.mask = ~((HOST_WIDE_INT) align / BITS_PER_UNIT - 1);
@@ -1898,6 +1999,35 @@ evaluate_stmt (gimple stmt)
                break;
              }
 
+           case BUILT_IN_BSWAP16:
+           case BUILT_IN_BSWAP32:
+           case BUILT_IN_BSWAP64:
+             val = get_value_for_expr (gimple_call_arg (stmt, 0), true);
+             if (val.lattice_val == UNDEFINED)
+               break;
+             else if (val.lattice_val == CONSTANT
+                      && val.value
+                      && TREE_CODE (val.value) == INTEGER_CST)
+               {
+                 tree type = TREE_TYPE (gimple_call_lhs (stmt));
+                 int prec = TYPE_PRECISION (type);
+                 wide_int wval = wi::to_wide (val.value);
+                 val.value
+                   = wide_int_to_tree (type,
+                                       wide_int::from (wval, prec,
+                                                       UNSIGNED).bswap ());
+                 val.mask
+                   = widest_int::from (wide_int::from (val.mask, prec,
+                                                       UNSIGNED).bswap (),
+                                       UNSIGNED);
+                 if (wi::sext (val.mask, prec) != -1)
+                   break;
+               }
+             val.lattice_val = VARYING;
+             val.value = NULL_TREE;
+             val.mask = -1;
+             break;
+
            default:;
            }
        }
@@ -1933,18 +2063,20 @@ evaluate_stmt (gimple stmt)
            {
              val.lattice_val = CONSTANT;
              val.value = build_zero_cst (TREE_TYPE (lhs));
-             val.mask = extend_mask (nonzero_bits);
+             val.mask = extend_mask (nonzero_bits, TYPE_SIGN (TREE_TYPE (lhs)));
              is_constant = true;
            }
          else
            {
-             if (wi::bit_and_not (val.value, nonzero_bits) != 0)
+             if (wi::bit_and_not (wi::to_wide (val.value), nonzero_bits) != 0)
                val.value = wide_int_to_tree (TREE_TYPE (lhs),
-                                             nonzero_bits & val.value);
+                                             nonzero_bits
+                                             & wi::to_wide (val.value));
              if (nonzero_bits == 0)
                val.mask = 0;
              else
-               val.mask = val.mask & extend_mask (nonzero_bits);
+               val.mask = val.mask & extend_mask (nonzero_bits,
+                                                  TYPE_SIGN (TREE_TYPE (lhs)));
            }
        }
     }
@@ -1972,7 +2104,7 @@ evaluate_stmt (gimple stmt)
   return val;
 }
 
-typedef hash_table<pointer_hash<gimple_statement_base> > gimple_htab;
+typedef hash_table<nofree_ptr_hash<gimple> > gimple_htab;
 
 /* Given a BUILT_IN_STACK_SAVE value SAVED_VAL, insert a clobber of VAR before
    each matching BUILT_IN_STACK_RESTORE.  Mark visited phis in VISITED.  */
@@ -1981,19 +2113,17 @@ static void
 insert_clobber_before_stack_restore (tree saved_val, tree var,
                                     gimple_htab **visited)
 {
-  gimple stmt;
+  gimple *stmt;
   gassign *clobber_stmt;
   tree clobber;
   imm_use_iterator iter;
   gimple_stmt_iterator i;
-  gimple *slot;
+  gimple **slot;
 
   FOR_EACH_IMM_USE_STMT (stmt, iter, saved_val)
     if (gimple_call_builtin_p (stmt, BUILT_IN_STACK_RESTORE))
       {
-       clobber = build_constructor (TREE_TYPE (var),
-                                    NULL);
-       TREE_THIS_VOLATILE (clobber) = 1;
+       clobber = build_clobber (TREE_TYPE (var));
        clobber_stmt = gimple_build_assign (var, clobber);
 
        i = gsi_for_stmt (stmt);
@@ -2015,10 +2145,6 @@ insert_clobber_before_stack_restore (tree saved_val, tree var,
     else if (gimple_assign_ssa_name_copy_p (stmt))
       insert_clobber_before_stack_restore (gimple_assign_lhs (stmt), var,
                                           visited);
-    else if (chkp_gimple_call_builtin_p (stmt, BUILT_IN_CHKP_BNDRET))
-      continue;
-    else
-      gcc_assert (is_gimple_debug (stmt));
 }
 
 /* Advance the iterator to the previous non-debug gimple statement in the same
@@ -2043,14 +2169,14 @@ gsi_prev_dom_bb_nondebug (gimple_stmt_iterator *i)
 /* Find a BUILT_IN_STACK_SAVE dominating gsi_stmt (I), and insert
    a clobber of VAR before each matching BUILT_IN_STACK_RESTORE.
 
-   It is possible that BUILT_IN_STACK_SAVE cannot be find in a dominator when a
-   previous pass (such as DOM) duplicated it along multiple paths to a BB.  In
-   that case the function gives up without inserting the clobbers.  */
+   It is possible that BUILT_IN_STACK_SAVE cannot be found in a dominator when
+   a previous pass (such as DOM) duplicated it along multiple paths to a BB.
+   In that case the function gives up without inserting the clobbers.  */
 
 static void
 insert_clobbers_for_var (gimple_stmt_iterator i, tree var)
 {
-  gimple stmt;
+  gimple *stmt;
   tree saved_val;
   gimple_htab *visited = NULL;
 
@@ -2077,7 +2203,7 @@ insert_clobbers_for_var (gimple_stmt_iterator i, tree var)
    NULL_TREE.  */
 
 static tree
-fold_builtin_alloca_with_align (gimple stmt)
+fold_builtin_alloca_with_align (gimple *stmt)
 {
   unsigned HOST_WIDE_INT size, threshold, n_elem;
   tree lhs, arg, block, var, elem_type, array_type;
@@ -2097,33 +2223,55 @@ fold_builtin_alloca_with_align (gimple stmt)
   size = tree_to_uhwi (arg);
 
   /* Heuristic: don't fold large allocas.  */
-  threshold = (unsigned HOST_WIDE_INT)PARAM_VALUE (PARAM_LARGE_STACK_FRAME);
+  threshold = (unsigned HOST_WIDE_INT)param_large_stack_frame;
   /* In case the alloca is located at function entry, it has the same lifetime
      as a declared array, so we allow a larger size.  */
   block = gimple_block (stmt);
   if (!(cfun->after_inlining
+       && block
         && TREE_CODE (BLOCK_SUPERCONTEXT (block)) == FUNCTION_DECL))
     threshold /= 10;
   if (size > threshold)
     return NULL_TREE;
 
+  /* We have to be able to move points-to info.  We used to assert
+     that we can but IPA PTA might end up with two UIDs here
+     as it might need to handle more than one instance being
+     live at the same time.  Instead of trying to detect this case
+     (using the first UID would be OK) just give up for now.  */
+  struct ptr_info_def *pi = SSA_NAME_PTR_INFO (lhs);
+  unsigned uid = 0;
+  if (pi != NULL
+      && !pi->pt.anything
+      && !pt_solution_singleton_or_null_p (&pi->pt, &uid))
+    return NULL_TREE;
+
   /* Declare array.  */
   elem_type = build_nonstandard_integer_type (BITS_PER_UNIT, 1);
   n_elem = size * 8 / BITS_PER_UNIT;
   array_type = build_array_type_nelts (elem_type, n_elem);
-  var = create_tmp_var (array_type);
-  DECL_ALIGN (var) = TREE_INT_CST_LOW (gimple_call_arg (stmt, 1));
-  {
-    struct ptr_info_def *pi = SSA_NAME_PTR_INFO (lhs);
-    if (pi != NULL && !pi->pt.anything)
-      {
-       bool singleton_p;
-       unsigned uid;
-       singleton_p = pt_solution_singleton_p (&pi->pt, &uid);
-       gcc_assert (singleton_p);
-       SET_DECL_PT_UID (var, uid);
-      }
-  }
+
+  if (tree ssa_name = SSA_NAME_IDENTIFIER (lhs))
+    {
+      /* Give the temporary a name derived from the name of the VLA
+        declaration so it can be referenced in diagnostics.  */
+      const char *name = IDENTIFIER_POINTER (ssa_name);
+      var = create_tmp_var (array_type, name);
+    }
+  else
+    var = create_tmp_var (array_type);
+
+  if (gimple *lhsdef = SSA_NAME_DEF_STMT (lhs))
+    {
+      /* Set the temporary's location to that of the VLA declaration
+        so it can be pointed to in diagnostics.  */
+      location_t loc = gimple_location (lhsdef);
+      DECL_SOURCE_LOCATION (var) = loc;
+    }
+
+  SET_DECL_ALIGN (var, TREE_INT_CST_LOW (gimple_call_arg (stmt, 1)));
+  if (uid != 0)
+    SET_DECL_PT_UID (var, uid);
 
   /* Fold alloca to the address of the array.  */
   return fold_convert (TREE_TYPE (lhs), build_fold_addr_expr (var));
@@ -2132,10 +2280,10 @@ fold_builtin_alloca_with_align (gimple stmt)
 /* Fold the stmt at *GSI with CCP specific information that propagating
    and regular folding does not catch.  */
 
-static bool
-ccp_fold_stmt (gimple_stmt_iterator *gsi)
+bool
+ccp_folder::fold_stmt (gimple_stmt_iterator *gsi)
 {
-  gimple stmt = gsi_stmt (*gsi);
+  gimple *stmt = gsi_stmt (*gsi);
 
   switch (gimple_code (stmt))
     {
@@ -2154,9 +2302,9 @@ ccp_fold_stmt (gimple_stmt_iterator *gsi)
        if (dump_file)
          {
            fprintf (dump_file, "Folding predicate ");
-           print_gimple_expr (dump_file, stmt, 0, 0);
+           print_gimple_expr (dump_file, stmt, 0);
            fprintf (dump_file, " to ");
-           print_generic_expr (dump_file, val.value, 0);
+           print_generic_expr (dump_file, val.value);
            fprintf (dump_file, "\n");
          }
 
@@ -2205,7 +2353,8 @@ ccp_fold_stmt (gimple_stmt_iterator *gsi)
         /* The heuristic of fold_builtin_alloca_with_align differs before and
           after inlining, so we don't require the arg to be changed into a
           constant for folding, but just to be constant.  */
-        if (gimple_call_builtin_p (stmt, BUILT_IN_ALLOCA_WITH_ALIGN))
+        if (gimple_call_builtin_p (stmt, BUILT_IN_ALLOCA_WITH_ALIGN)
+           || gimple_call_builtin_p (stmt, BUILT_IN_ALLOCA_WITH_ALIGN_AND_MAX))
           {
             tree new_rhs = fold_builtin_alloca_with_align (stmt);
             if (new_rhs)
@@ -2218,6 +2367,32 @@ ccp_fold_stmt (gimple_stmt_iterator *gsi)
              }
           }
 
+       /* If there's no extra info from an assume_aligned call,
+          drop it so it doesn't act as otherwise useless dataflow
+          barrier.  */
+       if (gimple_call_builtin_p (stmt, BUILT_IN_ASSUME_ALIGNED))
+         {
+           tree ptr = gimple_call_arg (stmt, 0);
+           ccp_prop_value_t ptrval = get_value_for_expr (ptr, true);
+           if (ptrval.lattice_val == CONSTANT
+               && TREE_CODE (ptrval.value) == INTEGER_CST
+               && ptrval.mask != 0)
+             {
+               ccp_prop_value_t val
+                 = bit_value_assume_aligned (stmt, NULL_TREE, ptrval, false);
+               unsigned int ptralign = least_bit_hwi (ptrval.mask.to_uhwi ());
+               unsigned int align = least_bit_hwi (val.mask.to_uhwi ());
+               if (ptralign == align
+                   && ((TREE_INT_CST_LOW (ptrval.value) & (align - 1))
+                       == (TREE_INT_CST_LOW (val.value) & (align - 1))))
+                 {
+                   bool res = update_call_from_tree (gsi, ptr);
+                   gcc_assert (res);
+                   return true;
+                 }
+             }
+         }
+
        /* Propagate into the call arguments.  Compared to replace_uses_in
           this can use the argument slot types for type verification
           instead of the current argument type.  We also can safely
@@ -2275,7 +2450,7 @@ ccp_fold_stmt (gimple_stmt_iterator *gsi)
    are handled here.  */
 
 static enum ssa_prop_result
-visit_assignment (gimple stmt, tree *output_p)
+visit_assignment (gimple *stmt, tree *output_p)
 {
   ccp_prop_value_t val;
   enum ssa_prop_result retval = SSA_PROP_NOT_INTERESTING;
@@ -2308,7 +2483,7 @@ visit_assignment (gimple stmt, tree *output_p)
    SSA_PROP_VARYING.  */
 
 static enum ssa_prop_result
-visit_cond_stmt (gimple stmt, edge *taken_edge_p)
+visit_cond_stmt (gimple *stmt, edge *taken_edge_p)
 {
   ccp_prop_value_t val;
   basic_block block;
@@ -2340,8 +2515,8 @@ visit_cond_stmt (gimple stmt, edge *taken_edge_p)
    value, set *TAKEN_EDGE_P accordingly.  If STMT produces a varying
    value, return SSA_PROP_VARYING.  */
 
-static enum ssa_prop_result
-ccp_visit_stmt (gimple stmt, edge *taken_edge_p, tree *output_p)
+enum ssa_prop_result
+ccp_propagate::visit_stmt (gimple *stmt, edge *taken_edge_p, tree *output_p)
 {
   tree def;
   ssa_op_iter iter;
@@ -2393,17 +2568,26 @@ ccp_visit_stmt (gimple stmt, edge *taken_edge_p, tree *output_p)
 }
 
 
-/* Main entry point for SSA Conditional Constant Propagation.  */
+/* Main entry point for SSA Conditional Constant Propagation.  If NONZERO_P,
+   record nonzero bits.  */
 
 static unsigned int
-do_ssa_ccp (void)
+do_ssa_ccp (bool nonzero_p)
 {
   unsigned int todo = 0;
   calculate_dominance_info (CDI_DOMINATORS);
+
   ccp_initialize ();
-  ssa_propagate (ccp_visit_stmt, ccp_visit_phi_node);
-  if (ccp_finalize ())
-    todo = (TODO_cleanup_cfg | TODO_update_ssa);
+  class ccp_propagate ccp_propagate;
+  ccp_propagate.ssa_propagate ();
+  if (ccp_finalize (nonzero_p || flag_ipa_bit_cp))
+    {
+      todo = (TODO_cleanup_cfg | TODO_update_ssa);
+
+      /* ccp_finalize does not preserve loop-closed ssa.  */
+      loops_state_clear (LOOP_CLOSED_SSA);
+    }
+
   free_dominance_info (CDI_DOMINATORS);
   return todo;
 }
@@ -2428,14 +2612,22 @@ class pass_ccp : public gimple_opt_pass
 {
 public:
   pass_ccp (gcc::context *ctxt)
-    : gimple_opt_pass (pass_data_ccp, ctxt)
+    : gimple_opt_pass (pass_data_ccp, ctxt), nonzero_p (false)
   {}
 
   /* opt_pass methods: */
   opt_pass * clone () { return new pass_ccp (m_ctxt); }
+  void set_pass_param (unsigned int n, bool param)
+    {
+      gcc_assert (n == 0);
+      nonzero_p = param;
+    }
   virtual bool gate (function *) { return flag_tree_ccp != 0; }
-  virtual unsigned int execute (function *) { return do_ssa_ccp (); }
+  virtual unsigned int execute (function *) { return do_ssa_ccp (nonzero_p); }
 
+ private:
+  /* Determines whether the pass instance records nonzero bits.  */
+  bool nonzero_p;
 }; // class pass_ccp
 
 } // anon namespace
@@ -2458,10 +2650,10 @@ static tree
 optimize_stack_restore (gimple_stmt_iterator i)
 {
   tree callee;
-  gimple stmt;
+  gimple *stmt;
 
   basic_block bb = gsi_bb (i);
-  gimple call = gsi_stmt (i);
+  gimple *call = gsi_stmt (i);
 
   if (gimple_code (call) != GIMPLE_CALL
       || gimple_call_num_args (call) != 1
@@ -2479,13 +2671,12 @@ optimize_stack_restore (gimple_stmt_iterator i)
 
       callee = gimple_call_fndecl (stmt);
       if (!callee
-         || DECL_BUILT_IN_CLASS (callee) != BUILT_IN_NORMAL
+         || !fndecl_built_in_p (callee, BUILT_IN_NORMAL)
          /* All regular builtins are ok, just obviously not alloca.  */
-         || DECL_FUNCTION_CODE (callee) == BUILT_IN_ALLOCA
-         || DECL_FUNCTION_CODE (callee) == BUILT_IN_ALLOCA_WITH_ALIGN)
+         || ALLOCA_FUNCTION_CODE_P (DECL_FUNCTION_CODE (callee)))
        return NULL_TREE;
 
-      if (DECL_FUNCTION_CODE (callee) == BUILT_IN_STACK_RESTORE)
+      if (fndecl_built_in_p (callee, BUILT_IN_STACK_RESTORE))
        goto second_stack_restore;
     }
 
@@ -2512,13 +2703,11 @@ optimize_stack_restore (gimple_stmt_iterator i)
      or not is irrelevant to removing the call to __builtin_stack_restore.  */
   if (has_single_use (gimple_call_arg (call, 0)))
     {
-      gimple stack_save = SSA_NAME_DEF_STMT (gimple_call_arg (call, 0));
+      gimple *stack_save = SSA_NAME_DEF_STMT (gimple_call_arg (call, 0));
       if (is_gimple_call (stack_save))
        {
          callee = gimple_call_fndecl (stack_save);
-         if (callee
-             && DECL_BUILT_IN_CLASS (callee) == BUILT_IN_NORMAL
-             && DECL_FUNCTION_CODE (callee) == BUILT_IN_STACK_SAVE)
+         if (callee && fndecl_built_in_p (callee, BUILT_IN_STACK_SAVE))
            {
              gimple_stmt_iterator stack_save_gsi;
              tree rhs;
@@ -2540,15 +2729,12 @@ optimize_stack_restore (gimple_stmt_iterator i)
    pointer assignment.  */
 
 static tree
-optimize_stdarg_builtin (gimple call)
+optimize_stdarg_builtin (gimple *call)
 {
   tree callee, lhs, rhs, cfun_va_list;
   bool va_list_simple_ptr;
   location_t loc = gimple_location (call);
 
-  if (gimple_code (call) != GIMPLE_CALL)
-    return NULL_TREE;
-
   callee = gimple_call_fndecl (call);
 
   cfun_va_list = targetm.fn_abi_va_list (callee);
@@ -2618,7 +2804,7 @@ optimize_unreachable (gimple_stmt_iterator i)
 {
   basic_block bb = gsi_bb (i);
   gimple_stmt_iterator gsi;
-  gimple stmt;
+  gimple *stmt;
   edge_iterator ei;
   edge e;
   bool ret;
@@ -2669,7 +2855,8 @@ optimize_unreachable (gimple_stmt_iterator i)
        }
       else
        {
-         /* Todo: handle other cases, f.i. switch statement.  */
+         /* Todo: handle other cases.  Note that unreachable switch case
+            statements have already been removed.  */
          continue;
        }
 
@@ -2679,6 +2866,365 @@ optimize_unreachable (gimple_stmt_iterator i)
   return ret;
 }
 
+/* Optimize
+     mask_2 = 1 << cnt_1;
+     _4 = __atomic_fetch_or_* (ptr_6, mask_2, _3);
+     _5 = _4 & mask_2;
+   to
+     _4 = ATOMIC_BIT_TEST_AND_SET (ptr_6, cnt_1, 0, _3);
+     _5 = _4;
+   If _5 is only used in _5 != 0 or _5 == 0 comparisons, 1
+   is passed instead of 0, and the builtin just returns a zero
+   or 1 value instead of the actual bit.
+   Similarly for __sync_fetch_and_or_* (without the ", _3" part
+   in there), and/or if mask_2 is a power of 2 constant.
+   Similarly for xor instead of or, use ATOMIC_BIT_TEST_AND_COMPLEMENT
+   in that case.  And similarly for and instead of or, except that
+   the second argument to the builtin needs to be one's complement
+   of the mask instead of mask.  */
+
+static void
+optimize_atomic_bit_test_and (gimple_stmt_iterator *gsip,
+                             enum internal_fn fn, bool has_model_arg,
+                             bool after)
+{
+  gimple *call = gsi_stmt (*gsip);
+  tree lhs = gimple_call_lhs (call);
+  use_operand_p use_p;
+  gimple *use_stmt;
+  tree mask, bit;
+  optab optab;
+
+  if (!flag_inline_atomics
+      || optimize_debug
+      || !gimple_call_builtin_p (call, BUILT_IN_NORMAL)
+      || !lhs
+      || SSA_NAME_OCCURS_IN_ABNORMAL_PHI (lhs)
+      || !single_imm_use (lhs, &use_p, &use_stmt)
+      || !is_gimple_assign (use_stmt)
+      || gimple_assign_rhs_code (use_stmt) != BIT_AND_EXPR
+      || !gimple_vdef (call))
+    return;
+
+  switch (fn)
+    {
+    case IFN_ATOMIC_BIT_TEST_AND_SET:
+      optab = atomic_bit_test_and_set_optab;
+      break;
+    case IFN_ATOMIC_BIT_TEST_AND_COMPLEMENT:
+      optab = atomic_bit_test_and_complement_optab;
+      break;
+    case IFN_ATOMIC_BIT_TEST_AND_RESET:
+      optab = atomic_bit_test_and_reset_optab;
+      break;
+    default:
+      return;
+    }
+
+  if (optab_handler (optab, TYPE_MODE (TREE_TYPE (lhs))) == CODE_FOR_nothing)
+    return;
+
+  mask = gimple_call_arg (call, 1);
+  tree use_lhs = gimple_assign_lhs (use_stmt);
+  if (!use_lhs)
+    return;
+
+  if (TREE_CODE (mask) == INTEGER_CST)
+    {
+      if (fn == IFN_ATOMIC_BIT_TEST_AND_RESET)
+       mask = const_unop (BIT_NOT_EXPR, TREE_TYPE (mask), mask);
+      mask = fold_convert (TREE_TYPE (lhs), mask);
+      int ibit = tree_log2 (mask);
+      if (ibit < 0)
+       return;
+      bit = build_int_cst (TREE_TYPE (lhs), ibit);
+    }
+  else if (TREE_CODE (mask) == SSA_NAME)
+    {
+      gimple *g = SSA_NAME_DEF_STMT (mask);
+      if (fn == IFN_ATOMIC_BIT_TEST_AND_RESET)
+       {
+         if (!is_gimple_assign (g)
+             || gimple_assign_rhs_code (g) != BIT_NOT_EXPR)
+           return;
+         mask = gimple_assign_rhs1 (g);
+         if (TREE_CODE (mask) != SSA_NAME)
+           return;
+         g = SSA_NAME_DEF_STMT (mask);
+       }
+      if (!is_gimple_assign (g)
+         || gimple_assign_rhs_code (g) != LSHIFT_EXPR
+         || !integer_onep (gimple_assign_rhs1 (g)))
+       return;
+      bit = gimple_assign_rhs2 (g);
+    }
+  else
+    return;
+
+  if (gimple_assign_rhs1 (use_stmt) == lhs)
+    {
+      if (!operand_equal_p (gimple_assign_rhs2 (use_stmt), mask, 0))
+       return;
+    }
+  else if (gimple_assign_rhs2 (use_stmt) != lhs
+          || !operand_equal_p (gimple_assign_rhs1 (use_stmt), mask, 0))
+    return;
+
+  bool use_bool = true;
+  bool has_debug_uses = false;
+  imm_use_iterator iter;
+  gimple *g;
+
+  if (SSA_NAME_OCCURS_IN_ABNORMAL_PHI (use_lhs))
+    use_bool = false;
+  FOR_EACH_IMM_USE_STMT (g, iter, use_lhs)
+    {
+      enum tree_code code = ERROR_MARK;
+      tree op0 = NULL_TREE, op1 = NULL_TREE;
+      if (is_gimple_debug (g))
+       {
+         has_debug_uses = true;
+         continue;
+       }
+      else if (is_gimple_assign (g))
+       switch (gimple_assign_rhs_code (g))
+         {
+         case COND_EXPR:
+           op1 = gimple_assign_rhs1 (g);
+           code = TREE_CODE (op1);
+           op0 = TREE_OPERAND (op1, 0);
+           op1 = TREE_OPERAND (op1, 1);
+           break;
+         case EQ_EXPR:
+         case NE_EXPR:
+           code = gimple_assign_rhs_code (g);
+           op0 = gimple_assign_rhs1 (g);
+           op1 = gimple_assign_rhs2 (g);
+           break;
+         default:
+           break;
+         }
+      else if (gimple_code (g) == GIMPLE_COND)
+       {
+         code = gimple_cond_code (g);
+         op0 = gimple_cond_lhs (g);
+         op1 = gimple_cond_rhs (g);
+       }
+
+      if ((code == EQ_EXPR || code == NE_EXPR)
+         && op0 == use_lhs
+         && integer_zerop (op1))
+       {
+         use_operand_p use_p;
+         int n = 0;
+         FOR_EACH_IMM_USE_ON_STMT (use_p, iter)
+           n++;
+         if (n == 1)
+           continue;
+       }
+
+      use_bool = false;
+      BREAK_FROM_IMM_USE_STMT (iter);
+    }
+
+  tree new_lhs = make_ssa_name (TREE_TYPE (lhs));
+  tree flag = build_int_cst (TREE_TYPE (lhs), use_bool);
+  if (has_model_arg)
+    g = gimple_build_call_internal (fn, 4, gimple_call_arg (call, 0),
+                                   bit, flag, gimple_call_arg (call, 2));
+  else
+    g = gimple_build_call_internal (fn, 3, gimple_call_arg (call, 0),
+                                   bit, flag);
+  gimple_call_set_lhs (g, new_lhs);
+  gimple_set_location (g, gimple_location (call));
+  gimple_move_vops (g, call);
+  bool throws = stmt_can_throw_internal (cfun, call);
+  gimple_call_set_nothrow (as_a <gcall *> (g),
+                          gimple_call_nothrow_p (as_a <gcall *> (call)));
+  gimple_stmt_iterator gsi = *gsip;
+  gsi_insert_after (&gsi, g, GSI_NEW_STMT);
+  edge e = NULL;
+  if (throws)
+    {
+      maybe_clean_or_replace_eh_stmt (call, g);
+      if (after || (use_bool && has_debug_uses))
+       e = find_fallthru_edge (gsi_bb (gsi)->succs);
+    }
+  if (after)
+    {
+      /* The internal function returns the value of the specified bit
+        before the atomic operation.  If we are interested in the value
+        of the specified bit after the atomic operation (makes only sense
+        for xor, otherwise the bit content is compile time known),
+        we need to invert the bit.  */
+      g = gimple_build_assign (make_ssa_name (TREE_TYPE (lhs)),
+                              BIT_XOR_EXPR, new_lhs,
+                              use_bool ? build_int_cst (TREE_TYPE (lhs), 1)
+                                       : mask);
+      new_lhs = gimple_assign_lhs (g);
+      if (throws)
+       {
+         gsi_insert_on_edge_immediate (e, g);
+         gsi = gsi_for_stmt (g);
+       }
+      else
+       gsi_insert_after (&gsi, g, GSI_NEW_STMT);
+    }
+  if (use_bool && has_debug_uses)
+    {
+      tree temp = NULL_TREE;
+      if (!throws || after || single_pred_p (e->dest))
+       {
+         temp = make_node (DEBUG_EXPR_DECL);
+         DECL_ARTIFICIAL (temp) = 1;
+         TREE_TYPE (temp) = TREE_TYPE (lhs);
+         SET_DECL_MODE (temp, TYPE_MODE (TREE_TYPE (lhs)));
+         tree t = build2 (LSHIFT_EXPR, TREE_TYPE (lhs), new_lhs, bit);
+         g = gimple_build_debug_bind (temp, t, g);
+         if (throws && !after)
+           {
+             gsi = gsi_after_labels (e->dest);
+             gsi_insert_before (&gsi, g, GSI_SAME_STMT);
+           }
+         else
+           gsi_insert_after (&gsi, g, GSI_NEW_STMT);
+       }
+      FOR_EACH_IMM_USE_STMT (g, iter, use_lhs)
+       if (is_gimple_debug (g))
+         {
+           use_operand_p use_p;
+           if (temp == NULL_TREE)
+             gimple_debug_bind_reset_value (g);
+           else
+             FOR_EACH_IMM_USE_ON_STMT (use_p, iter)
+               SET_USE (use_p, temp);
+           update_stmt (g);
+         }
+    }
+  SSA_NAME_OCCURS_IN_ABNORMAL_PHI (new_lhs)
+    = SSA_NAME_OCCURS_IN_ABNORMAL_PHI (use_lhs);
+  replace_uses_by (use_lhs, new_lhs);
+  gsi = gsi_for_stmt (use_stmt);
+  gsi_remove (&gsi, true);
+  release_defs (use_stmt);
+  gsi_remove (gsip, true);
+  release_ssa_name (lhs);
+}
+
+/* Optimize
+   a = {};
+   b = a;
+   into
+   a = {};
+   b = {};
+   Similarly for memset (&a, ..., sizeof (a)); instead of a = {};
+   and/or memcpy (&b, &a, sizeof (a)); instead of b = a;  */
+
+static void
+optimize_memcpy (gimple_stmt_iterator *gsip, tree dest, tree src, tree len)
+{
+  gimple *stmt = gsi_stmt (*gsip);
+  if (gimple_has_volatile_ops (stmt))
+    return;
+
+  tree vuse = gimple_vuse (stmt);
+  if (vuse == NULL)
+    return;
+
+  gimple *defstmt = SSA_NAME_DEF_STMT (vuse);
+  tree src2 = NULL_TREE, len2 = NULL_TREE;
+  poly_int64 offset, offset2;
+  tree val = integer_zero_node;
+  if (gimple_store_p (defstmt)
+      && gimple_assign_single_p (defstmt)
+      && TREE_CODE (gimple_assign_rhs1 (defstmt)) == CONSTRUCTOR
+      && !gimple_clobber_p (defstmt))
+    src2 = gimple_assign_lhs (defstmt);
+  else if (gimple_call_builtin_p (defstmt, BUILT_IN_MEMSET)
+          && TREE_CODE (gimple_call_arg (defstmt, 0)) == ADDR_EXPR
+          && TREE_CODE (gimple_call_arg (defstmt, 1)) == INTEGER_CST)
+    {
+      src2 = TREE_OPERAND (gimple_call_arg (defstmt, 0), 0);
+      len2 = gimple_call_arg (defstmt, 2);
+      val = gimple_call_arg (defstmt, 1);
+      /* For non-0 val, we'd have to transform stmt from assignment
+        into memset (only if dest is addressable).  */
+      if (!integer_zerop (val) && is_gimple_assign (stmt))
+       src2 = NULL_TREE;
+    }
+
+  if (src2 == NULL_TREE)
+    return;
+
+  if (len == NULL_TREE)
+    len = (TREE_CODE (src) == COMPONENT_REF
+          ? DECL_SIZE_UNIT (TREE_OPERAND (src, 1))
+          : TYPE_SIZE_UNIT (TREE_TYPE (src)));
+  if (len2 == NULL_TREE)
+    len2 = (TREE_CODE (src2) == COMPONENT_REF
+           ? DECL_SIZE_UNIT (TREE_OPERAND (src2, 1))
+           : TYPE_SIZE_UNIT (TREE_TYPE (src2)));
+  if (len == NULL_TREE
+      || !poly_int_tree_p (len)
+      || len2 == NULL_TREE
+      || !poly_int_tree_p (len2))
+    return;
+
+  src = get_addr_base_and_unit_offset (src, &offset);
+  src2 = get_addr_base_and_unit_offset (src2, &offset2);
+  if (src == NULL_TREE
+      || src2 == NULL_TREE
+      || maybe_lt (offset, offset2))
+    return;
+
+  if (!operand_equal_p (src, src2, 0))
+    return;
+
+  /* [ src + offset2, src + offset2 + len2 - 1 ] is set to val.
+     Make sure that
+     [ src + offset, src + offset + len - 1 ] is a subset of that.  */
+  if (maybe_gt (wi::to_poly_offset (len) + (offset - offset2),
+               wi::to_poly_offset (len2)))
+    return;
+
+  if (dump_file && (dump_flags & TDF_DETAILS))
+    {
+      fprintf (dump_file, "Simplified\n  ");
+      print_gimple_stmt (dump_file, stmt, 0, dump_flags);
+      fprintf (dump_file, "after previous\n  ");
+      print_gimple_stmt (dump_file, defstmt, 0, dump_flags);
+    }
+
+  /* For simplicity, don't change the kind of the stmt,
+     turn dest = src; into dest = {}; and memcpy (&dest, &src, len);
+     into memset (&dest, val, len);
+     In theory we could change dest = src into memset if dest
+     is addressable (maybe beneficial if val is not 0), or
+     memcpy (&dest, &src, len) into dest = {} if len is the size
+     of dest, dest isn't volatile.  */
+  if (is_gimple_assign (stmt))
+    {
+      tree ctor = build_constructor (TREE_TYPE (dest), NULL);
+      gimple_assign_set_rhs_from_tree (gsip, ctor);
+      update_stmt (stmt);
+    }
+  else /* If stmt is memcpy, transform it into memset.  */
+    {
+      gcall *call = as_a <gcall *> (stmt);
+      tree fndecl = builtin_decl_implicit (BUILT_IN_MEMSET);
+      gimple_call_set_fndecl (call, fndecl);
+      gimple_call_set_fntype (call, TREE_TYPE (fndecl));
+      gimple_call_set_arg (call, 1, val);
+      update_stmt (stmt);
+    }
+
+  if (dump_file && (dump_flags & TDF_DETAILS))
+    {
+      fprintf (dump_file, "into\n  ");
+      print_gimple_stmt (dump_file, stmt, 0, dump_flags);
+    }
+}
+
 /* A simple pass that attempts to fold all builtin functions.  This pass
    is run after we've propagated as many constants as we can.  */
 
@@ -2722,7 +3268,7 @@ pass_fold_builtins::execute (function *fun)
       gimple_stmt_iterator i;
       for (i = gsi_start_bb (bb); !gsi_end_p (i); )
        {
-          gimple stmt, old_stmt;
+         gimple *stmt, *old_stmt;
          tree callee;
          enum built_in_function fcode;
 
@@ -2745,12 +3291,15 @@ pass_fold_builtins::execute (function *fun)
                      continue;
                    }
                }
+             else if (gimple_assign_load_p (stmt) && gimple_store_p (stmt))
+               optimize_memcpy (&i, gimple_assign_lhs (stmt),
+                                gimple_assign_rhs1 (stmt), NULL_TREE);
              gsi_next (&i);
              continue;
            }
 
          callee = gimple_call_fndecl (stmt);
-         if (!callee || DECL_BUILT_IN_CLASS (callee) != BUILT_IN_NORMAL)
+         if (!callee || !fndecl_built_in_p (callee, BUILT_IN_NORMAL))
            {
              gsi_next (&i);
              continue;
@@ -2788,14 +3337,97 @@ pass_fold_builtins::execute (function *fun)
                    cfg_changed = true;
                  break;
 
+               case BUILT_IN_ATOMIC_FETCH_OR_1:
+               case BUILT_IN_ATOMIC_FETCH_OR_2:
+               case BUILT_IN_ATOMIC_FETCH_OR_4:
+               case BUILT_IN_ATOMIC_FETCH_OR_8:
+               case BUILT_IN_ATOMIC_FETCH_OR_16:
+                 optimize_atomic_bit_test_and (&i,
+                                               IFN_ATOMIC_BIT_TEST_AND_SET,
+                                               true, false);
+                 break;
+               case BUILT_IN_SYNC_FETCH_AND_OR_1:
+               case BUILT_IN_SYNC_FETCH_AND_OR_2:
+               case BUILT_IN_SYNC_FETCH_AND_OR_4:
+               case BUILT_IN_SYNC_FETCH_AND_OR_8:
+               case BUILT_IN_SYNC_FETCH_AND_OR_16:
+                 optimize_atomic_bit_test_and (&i,
+                                               IFN_ATOMIC_BIT_TEST_AND_SET,
+                                               false, false);
+                 break;
+
+               case BUILT_IN_ATOMIC_FETCH_XOR_1:
+               case BUILT_IN_ATOMIC_FETCH_XOR_2:
+               case BUILT_IN_ATOMIC_FETCH_XOR_4:
+               case BUILT_IN_ATOMIC_FETCH_XOR_8:
+               case BUILT_IN_ATOMIC_FETCH_XOR_16:
+                 optimize_atomic_bit_test_and
+                       (&i, IFN_ATOMIC_BIT_TEST_AND_COMPLEMENT, true, false);
+                 break;
+               case BUILT_IN_SYNC_FETCH_AND_XOR_1:
+               case BUILT_IN_SYNC_FETCH_AND_XOR_2:
+               case BUILT_IN_SYNC_FETCH_AND_XOR_4:
+               case BUILT_IN_SYNC_FETCH_AND_XOR_8:
+               case BUILT_IN_SYNC_FETCH_AND_XOR_16:
+                 optimize_atomic_bit_test_and
+                       (&i, IFN_ATOMIC_BIT_TEST_AND_COMPLEMENT, false, false);
+                 break;
+
+               case BUILT_IN_ATOMIC_XOR_FETCH_1:
+               case BUILT_IN_ATOMIC_XOR_FETCH_2:
+               case BUILT_IN_ATOMIC_XOR_FETCH_4:
+               case BUILT_IN_ATOMIC_XOR_FETCH_8:
+               case BUILT_IN_ATOMIC_XOR_FETCH_16:
+                 optimize_atomic_bit_test_and
+                       (&i, IFN_ATOMIC_BIT_TEST_AND_COMPLEMENT, true, true);
+                 break;
+               case BUILT_IN_SYNC_XOR_AND_FETCH_1:
+               case BUILT_IN_SYNC_XOR_AND_FETCH_2:
+               case BUILT_IN_SYNC_XOR_AND_FETCH_4:
+               case BUILT_IN_SYNC_XOR_AND_FETCH_8:
+               case BUILT_IN_SYNC_XOR_AND_FETCH_16:
+                 optimize_atomic_bit_test_and
+                       (&i, IFN_ATOMIC_BIT_TEST_AND_COMPLEMENT, false, true);
+                 break;
+
+               case BUILT_IN_ATOMIC_FETCH_AND_1:
+               case BUILT_IN_ATOMIC_FETCH_AND_2:
+               case BUILT_IN_ATOMIC_FETCH_AND_4:
+               case BUILT_IN_ATOMIC_FETCH_AND_8:
+               case BUILT_IN_ATOMIC_FETCH_AND_16:
+                 optimize_atomic_bit_test_and (&i,
+                                               IFN_ATOMIC_BIT_TEST_AND_RESET,
+                                               true, false);
+                 break;
+               case BUILT_IN_SYNC_FETCH_AND_AND_1:
+               case BUILT_IN_SYNC_FETCH_AND_AND_2:
+               case BUILT_IN_SYNC_FETCH_AND_AND_4:
+               case BUILT_IN_SYNC_FETCH_AND_AND_8:
+               case BUILT_IN_SYNC_FETCH_AND_AND_16:
+                 optimize_atomic_bit_test_and (&i,
+                                               IFN_ATOMIC_BIT_TEST_AND_RESET,
+                                               false, false);
+                 break;
+
+               case BUILT_IN_MEMCPY:
+                 if (gimple_call_builtin_p (stmt, BUILT_IN_NORMAL)
+                     && TREE_CODE (gimple_call_arg (stmt, 0)) == ADDR_EXPR
+                     && TREE_CODE (gimple_call_arg (stmt, 1)) == ADDR_EXPR
+                     && TREE_CODE (gimple_call_arg (stmt, 2)) == INTEGER_CST)
+                   {
+                     tree dest = TREE_OPERAND (gimple_call_arg (stmt, 0), 0);
+                     tree src = TREE_OPERAND (gimple_call_arg (stmt, 1), 0);
+                     tree len = gimple_call_arg (stmt, 2);
+                     optimize_memcpy (&i, dest, src, len);
+                   }
+                 break;
+
                case BUILT_IN_VA_START:
                case BUILT_IN_VA_END:
                case BUILT_IN_VA_COPY:
                  /* These shouldn't be folded before pass_stdarg.  */
                  result = optimize_stdarg_builtin (stmt);
-                 if (result)
-                   break;
-                 /* FALLTHRU */
+                 break;
 
                default:;
                }
@@ -2842,8 +3474,7 @@ pass_fold_builtins::execute (function *fun)
            }
          callee = gimple_call_fndecl (stmt);
          if (!callee
-              || DECL_BUILT_IN_CLASS (callee) != BUILT_IN_NORMAL
-             || DECL_FUNCTION_CODE (callee) == fcode)
+             || !fndecl_built_in_p (callee, fcode))
            gsi_next (&i);
        }
     }
@@ -2862,3 +3493,98 @@ make_pass_fold_builtins (gcc::context *ctxt)
 {
   return new pass_fold_builtins (ctxt);
 }
+
+/* A simple pass that emits some warnings post IPA.  */
+
+namespace {
+
+const pass_data pass_data_post_ipa_warn =
+{
+  GIMPLE_PASS, /* type */
+  "post_ipa_warn", /* name */
+  OPTGROUP_NONE, /* optinfo_flags */
+  TV_NONE, /* tv_id */
+  ( PROP_cfg | PROP_ssa ), /* properties_required */
+  0, /* properties_provided */
+  0, /* properties_destroyed */
+  0, /* todo_flags_start */
+  0, /* todo_flags_finish */
+};
+
+class pass_post_ipa_warn : public gimple_opt_pass
+{
+public:
+  pass_post_ipa_warn (gcc::context *ctxt)
+    : gimple_opt_pass (pass_data_post_ipa_warn, ctxt)
+  {}
+
+  /* opt_pass methods: */
+  opt_pass * clone () { return new pass_post_ipa_warn (m_ctxt); }
+  virtual bool gate (function *) { return warn_nonnull != 0; }
+  virtual unsigned int execute (function *);
+
+}; // class pass_fold_builtins
+
+unsigned int
+pass_post_ipa_warn::execute (function *fun)
+{
+  basic_block bb;
+
+  FOR_EACH_BB_FN (bb, fun)
+    {
+      gimple_stmt_iterator gsi;
+      for (gsi = gsi_start_bb (bb); !gsi_end_p (gsi); gsi_next (&gsi))
+       {
+         gimple *stmt = gsi_stmt (gsi);
+         if (!is_gimple_call (stmt) || gimple_no_warning_p (stmt))
+           continue;
+
+         if (warn_nonnull)
+           {
+             bitmap nonnullargs
+               = get_nonnull_args (gimple_call_fntype (stmt));
+             if (nonnullargs)
+               {
+                 for (unsigned i = 0; i < gimple_call_num_args (stmt); i++)
+                   {
+                     tree arg = gimple_call_arg (stmt, i);
+                     if (TREE_CODE (TREE_TYPE (arg)) != POINTER_TYPE)
+                       continue;
+                     if (!integer_zerop (arg))
+                       continue;
+                     if (!bitmap_empty_p (nonnullargs)
+                         && !bitmap_bit_p (nonnullargs, i))
+                       continue;
+
+                     location_t loc = gimple_location (stmt);
+                     auto_diagnostic_group d;
+                     if (warning_at (loc, OPT_Wnonnull,
+                                     "%Gargument %u null where non-null "
+                                     "expected", stmt, i + 1))
+                       {
+                         tree fndecl = gimple_call_fndecl (stmt);
+                         if (fndecl && DECL_IS_BUILTIN (fndecl))
+                           inform (loc, "in a call to built-in function %qD",
+                                   fndecl);
+                         else if (fndecl)
+                           inform (DECL_SOURCE_LOCATION (fndecl),
+                                   "in a call to function %qD declared here",
+                                   fndecl);
+
+                       }
+                   }
+                 BITMAP_FREE (nonnullargs);
+               }
+           }
+       }
+    }
+  return 0;
+}
+
+} // anon namespace
+
+gimple_opt_pass *
+make_pass_post_ipa_warn (gcc::context *ctxt)
+{
+  return new pass_post_ipa_warn (ctxt);
+}