]> git.ipfire.org Git - people/ms/gcc.git/commitdiff
OpenACC 2.6 manual deep copy support (attach/detach)
authorJulian Brown <julian@codesourcery.com>
Fri, 4 Jan 2019 01:58:51 +0000 (17:58 -0800)
committerThomas Schwinge <thomas@codesourcery.com>
Tue, 3 Mar 2020 11:11:50 +0000 (12:11 +0100)
2018-12-14  Julian Brown  <julian@codesourcery.com>

gcc/c-family/
* c-pragma.h (pragma_omp_clause): Add PRAGMA_OACC_CLAUSE_ATTACH and
PRAGMA_OACC_CLAUSE_DETACH.
* c-common.h (c_omp_map_clause_name): Add prototype.
* c-omp.c (c_omp_map_clause_name): New function.

gcc/c/
* c-parser.c (c_parser_omp_clause_name): Add parsing of attach and
detach clauses.
(c_parser_omp_variable_list): Add ALLOW_DEREF optional parameter.
Allow deref (->) in variable lists if true.
(c_parser_omp_var_list_parens): Add ALLOW_DEREF optional parameter.
Pass to c_parser_omp_variable_list.
(c_parser_oacc_data_clause): Support attach and detach clauses.  Update
call to c_parser_omp_variable_list.
(c_parser_oacc_all_clauses): Support attach and detach clauses.
(OACC_DATA_CLAUSE_MASK, OACC_ENTER_DATA_CLAUSE_MASK)
(OACC_KERNELS_CLAUSE_MASK, OACC_PARALLEL_CLAUSE_MASK): Add
PRAGMA_OACC_CLAUSE_ATTACH.
(OACC_EXIT_DATA_CLAUSE_MASK): Add PRAGMA_OACC_CLAUSE_DETACH.
* c-typeck.c (handle_omp_array_sections_1): Reject subarrays for attach
and detach.  Support deref.
(c_oacc_check_attachments): New function.
(c_finish_omp_clauses): Check attach/detach arguments for being
pointers using above.  Support deref.

gcc/cp/
* parser.c (cp_parser_omp_clause_name): Support attach and detach
clauses.
(cp_parser_omp_var_list_no_open): Add ALLOW_DEREF optional parameter.
Parse deref if true.
(cp_parser_omp_var_list): Add ALLOW_DEREF optional parameter.  Pass to
cp_parser_omp_var_list_no_open.
(cp_parser_oacc_data_clause): Support attach and detach clauses.
Update call to cp_parser_omp_var_list_no_open.
(cp_parser_oacc_all_clauses): Support attach and detach.
(OACC_DATA_CLAUSE_MASK, OACC_ENTER_DATA_CLAUSE_MASK)
(OACC_KERNELS_CLAUSE_MASK, OACC_PARALLEL_CLAUSE_MASK): Add
PRAGMA_OACC_CLAUSE_ATTACH.
(OACC_EXIT_DATA_CLAUSE_MASK): Add PRAGMA_OACC_CLAUSE_DETACH.
* semantics.c (handle_omp_array_sections_1): Reject subarrays for
attach and detach.
(cp_oacc_check_attachments): New function.
(finish_omp_clauses): Use above function.  Allow structure fields and
class members to appear in OpenACC data clauses.  Support deref.

gcc/fortran/
* gfortran.h (gfc_omp_map_op): Add OMP_MAP_ATTACH, OMP_MAP_DETACH.
* openmp.c (gfc_match_omp_variable_list): Add allow_derived parameter.
Parse derived-type member accesses if true.
(omp_mask2): Add OMP_CLAUSE_ATTACH and OMP_CLAUSE_DETACH.
(gfc_match_omp_map_clause): Add allow_derived parameter.  Pass to
gfc_match_omp_variable_list.
(gfc_match_omp_clauses): Support attach and detach.  Support derived
types for appropriate OpenACC directives.
(OACC_PARALLEL_CLAUSES, OACC_KERNELS_CLAUSES, OACC_DATA_CLAUSES)
(OACC_ENTER_DATA_CLAUSES): Add OMP_CLAUSE_ATTACH.
(OACC_EXIT_DATA_CLAUSES): Add OMP_CLAUSE_DETACH.
(check_symbol_not_pointer): Don't disallow pointer objects of derived
type.
(resolve_oacc_data_clauses): Don't disallow allocatable derived types.
(resolve_omp_clauses): Perform duplicate checking only for non-derived
type component accesses (plain variables and arrays or array sections).
Support component refs.
* trans-openmp.c (gfc_omp_privatize_by_reference): Support component
refs.
(gfc_trans_omp_clauses): Support component refs, attach and detach
clauses.

gcc/
* gimplify.c (gimplify_omp_var_data): Add GOVD_MAP_HAS_ATTACHMENTS.
(insert_struct_component_mapping): Support derived-type member mappings
for arrays with descriptors which use GOMP_MAP_TO_PSET.
(gimplify_scan_omp_clauses): Rewrite GOMP_MAP_ALWAYS_POINTER to
GOMP_MAP_ATTACH for OpenACC struct/derived-type component pointers.
Handle pointer mappings that use GOMP_MAP_TO_PSET.  Handle attach/detach
clauses.
(gimplify_adjust_omp_clauses_1): Skip adjustments for explicit
attach/detach clauses.
(gimplify_omp_target_update): Handle finalize for detach.
* omp-low.c (lower_omp_target): Support GOMP_MAP_ATTACH,
GOMP_MAP_DETACH, GOMP_MAP_FORCE_DETACH.
* tree-pretty-print.c (dump_omp_clause): Likewise.

include/
* gomp-constants.h (GOMP_MAP_DEEP_COPY): Define.
(gomp_map_kind): Add GOMP_MAP_ATTACH, GOMP_MAP_DETACH,
GOMP_MAP_FORCE_DETACH.

gcc/testsuite/
* c-c++-common/goacc/mdc-1.c: New test.
* c-c++-common/goacc/mdc-2.c: New test.
* gcc.dg/goacc/mdc.C: New test.
* gfortran.dg/goacc/data-clauses.f95: New test.
* gfortran.dg/goacc/derived-types.f90: New test.
* gfortran.dg/goacc/enter-exit-data.f95: New test.

libgomp/
* libgomp.h (struct target_var_desc): Add do_detach flag.
(VREFCOUNT_LINK_KEY): New macro.
(struct splay_tree_key_s): Put link_key and new attach_count field into
a new union.  Substitute dynamic_refcount field for virtual_refcount.
(struct acc_dispatch_t): Remove data_environ field.
(enum gomp_map_vars_kind): Add GOMP_MAP_VARS_OPENACC_ENTER_DATA.
(gomp_acc_insert_pointer): Remove prototype.
(gomp_acc_remove_pointer): Update prototype.
(struct gomp_coalesce_buf): Add forward declaration.
(gomp_map_val, gomp_attach_pointer, gomp_detach_pointer): Add
prototypes.
* libgomp.map (OACC_2.6): New section. Add acc_attach, acc_attach_async,
acc_detach, acc_detach_async, acc_detach_finalize,
acc_detach_finalize_async.
* oacc-async.c (goacc_remove_var_async): New function.
* oacc-host.c (host_dispatch): Don't initialise removed data_environ
field.
* oacc-init.c (acc_shutdown_1): Use gomp_remove_var instead of
gomp_unmap_vars to remove mappings by splay tree key instead of target
memory descriptor.
* oacc-int.h (splay_tree_key_s): Add forward declaration.
(goacc_remove_var_async): Add prototype.
* oacc-mem.c (lookup_dev_1): New function.
(lookup_dev): Reimplement using above.
(acc_free, acc_hostptr): Update calls to lookup_dev.
(acc_map_data): Likewise.  Don't add to data_environ list.
(acc_unmap_data): Remove call to gomp_unmap_vars.  Fix semantics to
remove mapping, but not mapped data.
(present_create_copy): Use virtual_refcount instead of
dynamic_refcount.  Don't manipulate data_environ.  Fix target pointer
return value.
(delete_copyout): Update for virtual_refcount semantics.  Use
goacc_remove_var_async for asynchronous delete/copyouts.
(gomp_acc_insert_pointer): Remove function.
(gomp_acc_remove_pointer): Reimplement.
(acc_attach_async, acc_attach, goacc_detach_internal, acc_detach)
(acc_detach_async, acc_detach_finalize, acc_detach_finalize_async): New
functions.
* oacc-parallel.c (find_pointer): Support attach/detach.  Make a little
more strict.
(GOACC_parallel_keyed): Use gomp_map_val to calculate device addresses.
(GOACC_enter_exit_data): Support attach/detach and GOMP_MAP_STRUCT.
Don't call gomp_acc_insert_pointer.
* openacc.h (acc_attach, acc_attach_async, acc_detach)
(acc_detach_async, acc_detach_finalize, acc_detach_finalize_async): Add
prototypes.
* target.c (gomp_map_vars_existing): Initialise do_detach field of
tgt_var_desc.
(gomp_attach_pointer, gomp_detach_pointer): New functions.
(gomp_map_val): Make global.
(gomp_map_vars_async): Handle GOMP_MAP_VARS_OPENACC_ENTER_DATA.  Update
for virtual_refcount semantics.  Support attach and detach.
(gomp_remove_var): Free attach count array if present.
(gomp_unmap_vars_async): Support detach and update for virtual_refcount
semantics.  Disambiguate link_key/attach_count using virtual_refcount
with magic value as a tag.
(gomp_load_image_to_device): Zero-initialise virtual_refcount fields.
(gomp_free_memmap): Remove function.
(gomp_exit_data): Check virtual_refcount for tag value before using
link_key.
(omp_target_associate_ptr): Zero-initialise virtual_refcount and
link_key splay tree key fields.
(gomp_target_init): Don't initialise removed data_environ field.
* testsuite/libgomp.oacc-c-c++-common/context-2.c: Use correct API to
deallocate acc_copyin'd data.
* testsuite/libgomp.oacc-c-c++-common/context-4.c: Likewise.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-1.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-2.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-3.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-4.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-5.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-6.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-7.c: New test.
* testsuite/libgomp.oacc-c-c++-common/deep-copy-8.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-1.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-2.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-3.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-4.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-5.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-6.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-7.c: New test.
* testsuite/libgomp.oacc-fortran/deep-copy-8.c: New test.
* testsuite/libgomp.oacc-fortran/data-2.f90: Update test.
* testsuite/libgomp.oacc-fortran/derived-type-1.f90: New test.
* testsuite/libgomp.oacc-fortran/update-2.f90: New test.

(cherry picked from openacc-gcc-9-branch commit
1242d5e6581365913f4dc3968206893970be4d07)

57 files changed:
gcc/ChangeLog.omp
gcc/c-family/ChangeLog.omp [new file with mode: 0644]
gcc/c-family/c-common.h
gcc/c-family/c-omp.c
gcc/c-family/c-pragma.h
gcc/c/ChangeLog.omp [new file with mode: 0644]
gcc/c/c-parser.c
gcc/c/c-typeck.c
gcc/cp/ChangeLog.omp [new file with mode: 0644]
gcc/cp/parser.c
gcc/cp/semantics.c
gcc/fortran/ChangeLog.omp
gcc/fortran/gfortran.h
gcc/fortran/openmp.c
gcc/fortran/trans-openmp.c
gcc/gimplify.c
gcc/omp-low.c
gcc/testsuite/ChangeLog.omp [new file with mode: 0644]
gcc/testsuite/c-c++-common/goacc/mdc-1.c [new file with mode: 0644]
gcc/testsuite/c-c++-common/goacc/mdc-2.c [new file with mode: 0644]
gcc/testsuite/g++.dg/goacc/mdc.C [new file with mode: 0644]
gcc/testsuite/gfortran.dg/goacc/data-clauses.f95
gcc/testsuite/gfortran.dg/goacc/derived-types.f90 [new file with mode: 0644]
gcc/testsuite/gfortran.dg/goacc/enter-exit-data.f95
gcc/tree-pretty-print.c
include/ChangeLog.omp
include/gomp-constants.h
libgomp/ChangeLog.omp
libgomp/libgomp.h
libgomp/libgomp.map
libgomp/oacc-host.c
libgomp/oacc-init.c
libgomp/oacc-mem.c
libgomp/oacc-parallel.c
libgomp/openacc.h
libgomp/target.c
libgomp/testsuite/libgomp.oacc-c-c++-common/context-2.c
libgomp/testsuite/libgomp.oacc-c-c++-common/context-4.c
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-1.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-2.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-3.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-4.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-5.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-6.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-7.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-8.c [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/data-2.f90
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-1.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-2.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-3.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-4.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-5.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-6.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-7.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/deep-copy-8.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/derived-type-1.f90 [new file with mode: 0644]
libgomp/testsuite/libgomp.oacc-fortran/update-2.f90 [new file with mode: 0644]

index 412c7525918c079ce988be6d9ddcd681265c36c7..b923fc36c829e388caad5249cb592f5ba37fb225 100644 (file)
@@ -1,3 +1,19 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * gimplify.c (gimplify_omp_var_data): Add GOVD_MAP_HAS_ATTACHMENTS.
+       (insert_struct_component_mapping): Support derived-type member mappings
+       for arrays with descriptors which use GOMP_MAP_TO_PSET.
+       (gimplify_scan_omp_clauses): Rewrite GOMP_MAP_ALWAYS_POINTER to
+       GOMP_MAP_ATTACH for OpenACC struct/derived-type component pointers.
+       Handle pointer mappings that use GOMP_MAP_TO_PSET.  Handle attach/detach
+       clauses.
+       (gimplify_adjust_omp_clauses_1): Skip adjustments for explicit
+       attach/detach clauses.
+       (gimplify_omp_target_update): Handle finalize for detach.
+       * omp-low.c (lower_omp_target): Support GOMP_MAP_ATTACH,
+       GOMP_MAP_DETACH, GOMP_MAP_FORCE_DETACH.
+       * tree-pretty-print.c (dump_omp_clause): Likewise.
+
 2018-11-10  Julian Brown  <julian@codesourcery.com>
 
        * gimplify.c (insert_struct_comp_map, check_base_and_compare_lt): New.
diff --git a/gcc/c-family/ChangeLog.omp b/gcc/c-family/ChangeLog.omp
new file mode 100644 (file)
index 0000000..20f26d1
--- /dev/null
@@ -0,0 +1,7 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * c-pragma.h (pragma_omp_clause): Add PRAGMA_OACC_CLAUSE_ATTACH and
+       PRAGMA_OACC_CLAUSE_DETACH.
+       * c-common.h (c_omp_map_clause_name): Add prototype.
+       * c-omp.c (c_omp_map_clause_name): New function.
+
index 1cf2cae63951ede2ab14c258c62120655f523829..c99f7b4228665cbeecbb3090222b109045964175 100644 (file)
@@ -1185,6 +1185,7 @@ extern void c_omp_split_clauses (location_t, enum tree_code, omp_clause_mask,
 extern tree c_omp_declare_simd_clauses_to_numbers (tree, tree);
 extern void c_omp_declare_simd_clauses_to_decls (tree, tree);
 extern enum omp_clause_default_kind c_omp_predetermined_sharing (tree);
+extern const char *c_omp_map_clause_name (tree, bool);
 
 /* Return next tree in the chain for chain_next walking of tree nodes.  */
 static inline tree
index 16e71981887193bb5b19df6387cc776cbe4571da..d1204562b2bf5ff46dcf1783d22e53ad3ba1b048 100644 (file)
@@ -2038,3 +2038,36 @@ c_omp_predetermined_sharing (tree decl)
 
   return OMP_CLAUSE_DEFAULT_UNSPECIFIED;
 }
+
+/* For OpenACC, the OMP_CLAUSE_MAP_KIND of an OMP_CLAUSE_MAP is used internally
+   to distinguish clauses as seen by the user.  Return the "friendly" clause
+   name for error messages etc., where possible.  See also
+   c/c-parser.c:c_parser_oacc_data_clause and
+   cp/parser.c:cp_parser_oacc_data_clause.  */
+
+const char *
+c_omp_map_clause_name (tree clause, bool oacc)
+{
+  if (oacc && OMP_CLAUSE_CODE (clause) == OMP_CLAUSE_MAP)
+    switch (OMP_CLAUSE_MAP_KIND (clause))
+    {
+    case GOMP_MAP_FORCE_ALLOC:
+    case GOMP_MAP_ALLOC: return "create";
+    case GOMP_MAP_FORCE_TO:
+    case GOMP_MAP_TO: return "copyin";
+    case GOMP_MAP_FORCE_FROM:
+    case GOMP_MAP_FROM: return "copyout";
+    case GOMP_MAP_FORCE_TOFROM:
+    case GOMP_MAP_TOFROM: return "copy";
+    case GOMP_MAP_RELEASE: return "delete";
+    case GOMP_MAP_FORCE_PRESENT: return "present";
+    case GOMP_MAP_ATTACH: return "attach";
+    case GOMP_MAP_FORCE_DETACH:
+    case GOMP_MAP_DETACH: return "detach";
+    case GOMP_MAP_DEVICE_RESIDENT: return "device_resident";
+    case GOMP_MAP_LINK: return "link";
+    case GOMP_MAP_FORCE_DEVICEPTR: return "deviceptr";
+    default: break;
+    }
+  return omp_clause_code_name[OMP_CLAUSE_CODE (clause)];
+}
index 2bbb27975255624e84b06d268fa802b9e58f3fe6..4746d41fe4e8ca09c5f252f12249b85d1b29b6de 100644 (file)
@@ -136,11 +136,13 @@ enum pragma_omp_clause {
 
   /* Clauses for OpenACC.  */
   PRAGMA_OACC_CLAUSE_ASYNC,
+  PRAGMA_OACC_CLAUSE_ATTACH,
   PRAGMA_OACC_CLAUSE_AUTO,
   PRAGMA_OACC_CLAUSE_COPY,
   PRAGMA_OACC_CLAUSE_COPYOUT,
   PRAGMA_OACC_CLAUSE_CREATE,
   PRAGMA_OACC_CLAUSE_DELETE,
+  PRAGMA_OACC_CLAUSE_DETACH,
   PRAGMA_OACC_CLAUSE_DEVICEPTR,
   PRAGMA_OACC_CLAUSE_DEVICE_RESIDENT,
   PRAGMA_OACC_CLAUSE_FINALIZE,
diff --git a/gcc/c/ChangeLog.omp b/gcc/c/ChangeLog.omp
new file mode 100644 (file)
index 0000000..e05fe9a
--- /dev/null
@@ -0,0 +1,21 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * c-parser.c (c_parser_omp_clause_name): Add parsing of attach and
+       detach clauses.
+       (c_parser_omp_variable_list): Add ALLOW_DEREF optional parameter.
+       Allow deref (->) in variable lists if true.
+       (c_parser_omp_var_list_parens): Add ALLOW_DEREF optional parameter.
+       Pass to c_parser_omp_variable_list.
+       (c_parser_oacc_data_clause): Support attach and detach clauses.  Update
+       call to c_parser_omp_variable_list.
+       (c_parser_oacc_all_clauses): Support attach and detach clauses.
+       (OACC_DATA_CLAUSE_MASK, OACC_ENTER_DATA_CLAUSE_MASK)
+       (OACC_KERNELS_CLAUSE_MASK, OACC_PARALLEL_CLAUSE_MASK): Add
+       PRAGMA_OACC_CLAUSE_ATTACH.
+       (OACC_EXIT_DATA_CLAUSE_MASK): Add PRAGMA_OACC_CLAUSE_DETACH.
+       * c-typeck.c (handle_omp_array_sections_1): Reject subarrays for attach
+       and detach.  Support deref.
+       (c_oacc_check_attachments): New function.
+       (c_finish_omp_clauses): Check attach/detach arguments for being
+       pointers using above.  Support deref.
+
index 741d172ff307f44030c0e70705c76e3a2e5cbd4d..b745e607497ff775f515aefa55b9bb8014072d33 100644 (file)
@@ -11657,6 +11657,8 @@ c_parser_omp_clause_name (c_parser *parser)
            result = PRAGMA_OMP_CLAUSE_ALIGNED;
          else if (!strcmp ("async", p))
            result = PRAGMA_OACC_CLAUSE_ASYNC;
+         else if (!strcmp ("attach", p))
+           result = PRAGMA_OACC_CLAUSE_ATTACH;
          break;
        case 'c':
          if (!strcmp ("collapse", p))
@@ -11679,6 +11681,8 @@ c_parser_omp_clause_name (c_parser *parser)
            result = PRAGMA_OACC_CLAUSE_DELETE;
          else if (!strcmp ("depend", p))
            result = PRAGMA_OMP_CLAUSE_DEPEND;
+         else if (!strcmp ("detach", p))
+           result = PRAGMA_OACC_CLAUSE_DETACH;
          else if (!strcmp ("device", p))
            result = PRAGMA_OMP_CLAUSE_DEVICE;
          else if (!strcmp ("deviceptr", p))
@@ -11923,12 +11927,16 @@ c_parser_oacc_wait_list (c_parser *parser, location_t clause_loc, tree list)
    If KIND is nonzero, CLAUSE_LOC is the location of the clause.
 
    If KIND is zero, create a TREE_LIST with the decl in TREE_PURPOSE;
-   return the list created.  */
+   return the list created.
+
+   The optional ALLOW_DEREF argument is true if list items can use the deref
+   (->) operator.  */
 
 static tree
 c_parser_omp_variable_list (c_parser *parser,
                            location_t clause_loc,
-                           enum omp_clause_code kind, tree list)
+                           enum omp_clause_code kind, tree list,
+                           bool allow_deref = false)
 {
   auto_vec<c_token> tokens;
   unsigned int tokens_avail = 0;
@@ -12041,9 +12049,13 @@ c_parser_omp_variable_list (c_parser *parser,
            case OMP_CLAUSE_MAP:
            case OMP_CLAUSE_FROM:
            case OMP_CLAUSE_TO:
-             while (c_parser_next_token_is (parser, CPP_DOT))
+             while (c_parser_next_token_is (parser, CPP_DOT)
+                    || (allow_deref
+                        && c_parser_next_token_is (parser, CPP_DEREF)))
                {
                  location_t op_loc = c_parser_peek_token (parser)->location;
+                 if (c_parser_next_token_is (parser, CPP_DEREF))
+                   t = build_simple_mem_ref (t);
                  c_parser_consume_token (parser);
                  if (!c_parser_next_token_is (parser, CPP_NAME))
                    {
@@ -12164,11 +12176,12 @@ c_parser_omp_variable_list (c_parser *parser,
 }
 
 /* Similarly, but expect leading and trailing parenthesis.  This is a very
-   common case for OpenACC and OpenMP clauses.  */
+   common case for OpenACC and OpenMP clauses.  The optional ALLOW_DEREF
+   argument is true if list items can use the deref (->) operator.  */
 
 static tree
 c_parser_omp_var_list_parens (c_parser *parser, enum omp_clause_code kind,
-                             tree list)
+                             tree list, bool allow_deref = false)
 {
   /* The clauses location.  */
   location_t loc = c_parser_peek_token (parser)->location;
@@ -12176,18 +12189,20 @@ c_parser_omp_var_list_parens (c_parser *parser, enum omp_clause_code kind,
   matching_parens parens;
   if (parens.require_open (parser))
     {
-      list = c_parser_omp_variable_list (parser, loc, kind, list);
+      list = c_parser_omp_variable_list (parser, loc, kind, list, allow_deref);
       parens.skip_until_found_close (parser);
     }
   return list;
 }
 
-/* OpenACC 2.0:
+/* OpenACC 2.5:
+   attach ( variable-list )
    copy ( variable-list )
    copyin ( variable-list )
    copyout ( variable-list )
    create ( variable-list )
    delete ( variable-list )
+   detach ( variable-list )
    present ( variable-list ) */
 
 static tree
@@ -12197,6 +12212,9 @@ c_parser_oacc_data_clause (c_parser *parser, pragma_omp_clause c_kind,
   enum gomp_map_kind kind;
   switch (c_kind)
     {
+    case PRAGMA_OACC_CLAUSE_ATTACH:
+      kind = GOMP_MAP_ATTACH;
+      break;
     case PRAGMA_OACC_CLAUSE_COPY:
       kind = GOMP_MAP_TOFROM;
       break;
@@ -12212,6 +12230,9 @@ c_parser_oacc_data_clause (c_parser *parser, pragma_omp_clause c_kind,
     case PRAGMA_OACC_CLAUSE_DELETE:
       kind = GOMP_MAP_RELEASE;
       break;
+    case PRAGMA_OACC_CLAUSE_DETACH:
+      kind = GOMP_MAP_DETACH;
+      break;
     case PRAGMA_OACC_CLAUSE_DEVICE:
       kind = GOMP_MAP_FORCE_TO;
       break;
@@ -12231,7 +12252,7 @@ c_parser_oacc_data_clause (c_parser *parser, pragma_omp_clause c_kind,
       gcc_unreachable ();
     }
   tree nl, c;
-  nl = c_parser_omp_var_list_parens (parser, OMP_CLAUSE_MAP, list);
+  nl = c_parser_omp_var_list_parens (parser, OMP_CLAUSE_MAP, list, true);
 
   for (c = nl; c != list; c = OMP_CLAUSE_CHAIN (c))
     OMP_CLAUSE_SET_MAP_KIND (c, kind);
@@ -14815,6 +14836,10 @@ c_parser_oacc_all_clauses (c_parser *parser, omp_clause_mask mask,
                                                 clauses);
          c_name = "auto";
          break;
+       case PRAGMA_OACC_CLAUSE_ATTACH:
+         clauses = c_parser_oacc_data_clause (parser, c_kind, clauses);
+         c_name = "attach";
+         break;
        case PRAGMA_OACC_CLAUSE_COLLAPSE:
          clauses = c_parser_omp_clause_collapse (parser, clauses);
          c_name = "collapse";
@@ -14843,6 +14868,10 @@ c_parser_oacc_all_clauses (c_parser *parser, omp_clause_mask mask,
          clauses = c_parser_omp_clause_default (parser, clauses, true);
          c_name = "default";
          break;
+       case PRAGMA_OACC_CLAUSE_DETACH:
+         clauses = c_parser_oacc_data_clause (parser, c_kind, clauses);
+         c_name = "detach";
+         break;
        case PRAGMA_OACC_CLAUSE_DEVICE:
          clauses = c_parser_oacc_data_clause (parser, c_kind, clauses);
          c_name = "device";
@@ -15321,7 +15350,8 @@ c_parser_oacc_cache (location_t loc, c_parser *parser)
 */
 
 #define OACC_DATA_CLAUSE_MASK                                          \
-       ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
+       ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_CREATE)              \
@@ -15504,6 +15534,7 @@ c_parser_oacc_declare (c_parser *parser)
 #define OACC_ENTER_DATA_CLAUSE_MASK                                    \
        ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_IF)                  \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_CREATE)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_WAIT) )
@@ -15513,6 +15544,7 @@ c_parser_oacc_declare (c_parser *parser)
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_DELETE)              \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_DETACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_FINALIZE)            \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_WAIT) )
 
@@ -15647,6 +15679,7 @@ c_parser_oacc_loop (location_t loc, c_parser *parser, char *p_name,
 
 #define OACC_KERNELS_CLAUSE_MASK                                       \
        ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
@@ -15662,6 +15695,7 @@ c_parser_oacc_loop (location_t loc, c_parser *parser, char *p_name,
 
 #define OACC_PARALLEL_CLAUSE_MASK                                      \
        ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
index 8286b7d33298afcc60bf4f0d33533b8cd8f96fcf..d3383db662836a39a394f12b8eded5d70c9b5f4e 100644 (file)
@@ -12849,7 +12849,6 @@ handle_omp_array_sections_1 (tree c, tree t, vec<tree> &types,
          return error_mark_node;
        }
       if (TREE_CODE (t) == COMPONENT_REF
-         && ort == C_ORT_OMP
          && (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_MAP
              || OMP_CLAUSE_CODE (c) == OMP_CLAUSE_TO
              || OMP_CLAUSE_CODE (c) == OMP_CLAUSE_FROM))
@@ -12871,6 +12870,15 @@ handle_omp_array_sections_1 (tree c, tree t, vec<tree> &types,
                }
              t = TREE_OPERAND (t, 0);
            }
+         if (ort == C_ORT_ACC && TREE_CODE (t) == MEM_REF)
+           {
+             if (maybe_ne (mem_ref_offset (t), 0))
+               error_at (OMP_CLAUSE_LOCATION (c),
+                         "cannot dereference %qE in %qs clause", t,
+                         c_omp_map_clause_name (c, true));
+             else
+               t = TREE_OPERAND (t, 0);
+           }
        }
       if (!VAR_P (t) && TREE_CODE (t) != PARM_DECL)
        {
@@ -12955,7 +12963,18 @@ handle_omp_array_sections_1 (tree c, tree t, vec<tree> &types,
     length = fold_convert (sizetype, length);
   if (low_bound == NULL_TREE)
     low_bound = integer_zero_node;
-
+  if (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_MAP
+      && (OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_ATTACH
+         || OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_DETACH))
+    {
+      if (length != integer_one_node)
+       {
+         error_at (OMP_CLAUSE_LOCATION (c),
+                   "expected single pointer in %qs clause",
+                   c_omp_map_clause_name (c, ort == C_ORT_ACC));
+         return error_mark_node;
+       }
+    }
   if (length != NULL_TREE)
     {
       if (!integer_nonzerop (length))
@@ -13632,6 +13651,35 @@ c_omp_finish_iterators (tree iter)
   return ret;
 }
 
+/* Ensure that pointers are used in OpenACC attach and detach clauses.
+   Return true if an error has been detected.  */
+
+static bool
+c_oacc_check_attachments (tree c)
+{
+  if (OMP_CLAUSE_CODE (c) != OMP_CLAUSE_MAP)
+    return false;
+
+  /* OpenACC attach / detach clauses must be pointers.  */
+  if (OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_ATTACH
+      || OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_DETACH)
+    {
+      tree t = OMP_CLAUSE_DECL (c);
+
+      while (TREE_CODE (t) == TREE_LIST)
+       t = TREE_CHAIN (t);
+
+      if (TREE_CODE (TREE_TYPE (t)) != POINTER_TYPE)
+       {
+         error_at (OMP_CLAUSE_LOCATION (c), "expected pointer in %qs clause",
+                   c_omp_map_clause_name (c, true));
+         return true;
+       }
+    }
+
+  return false;
+}
+
 /* For all elements of CLAUSES, validate them against their constraints.
    Remove any elements from the list that are invalid.  */
 
@@ -14356,6 +14404,8 @@ c_finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
                        }
                    }
                }
+             if (c_oacc_check_attachments (c))
+               remove = true;
              break;
            }
          if (t == error_mark_node)
@@ -14363,8 +14413,13 @@ c_finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
              remove = true;
              break;
            }
+         /* OpenACC attach / detach clauses must be pointers.  */
+         if (c_oacc_check_attachments (c))
+           {
+             remove = true;
+             break;
+           }
          if (TREE_CODE (t) == COMPONENT_REF
-             && (ort & C_ORT_OMP)
              && OMP_CLAUSE_CODE (c) != OMP_CLAUSE__CACHE_)
            {
              if (DECL_BIT_FIELD (TREE_OPERAND (t, 1)))
@@ -14402,6 +14457,15 @@ c_finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
                }
              if (remove)
                break;
+             if (ort == C_ORT_ACC && TREE_CODE (t) == MEM_REF)
+               {
+                 if (maybe_ne (mem_ref_offset (t), 0))
+                   error_at (OMP_CLAUSE_LOCATION (c),
+                             "cannot dereference %qE in %qs clause", t,
+                             c_omp_map_clause_name (c, true));
+                 else
+                   t = TREE_OPERAND (t, 0);
+               }
              if (VAR_P (t) || TREE_CODE (t) == PARM_DECL)
                {
                  if (bitmap_bit_p (&map_field_head, DECL_UID (t)))
diff --git a/gcc/cp/ChangeLog.omp b/gcc/cp/ChangeLog.omp
new file mode 100644 (file)
index 0000000..5351c49
--- /dev/null
@@ -0,0 +1,21 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * parser.c (cp_parser_omp_clause_name): Support attach and detach
+       clauses.
+       (cp_parser_omp_var_list_no_open): Add ALLOW_DEREF optional parameter.
+       Parse deref if true.
+       (cp_parser_omp_var_list): Add ALLOW_DEREF optional parameter.  Pass to
+       cp_parser_omp_var_list_no_open.
+       (cp_parser_oacc_data_clause): Support attach and detach clauses.
+       Update call to cp_parser_omp_var_list_no_open.
+       (cp_parser_oacc_all_clauses): Support attach and detach.
+       (OACC_DATA_CLAUSE_MASK, OACC_ENTER_DATA_CLAUSE_MASK)
+       (OACC_KERNELS_CLAUSE_MASK, OACC_PARALLEL_CLAUSE_MASK): Add
+       PRAGMA_OACC_CLAUSE_ATTACH.
+       (OACC_EXIT_DATA_CLAUSE_MASK): Add PRAGMA_OACC_CLAUSE_DETACH.
+       * semantics.c (handle_omp_array_sections_1): Reject subarrays for
+       attach and detach.
+       (cp_oacc_check_attachments): New function.
+       (finish_omp_clauses): Use above function.  Allow structure fields and
+       class members to appear in OpenACC data clauses.  Support deref.
+
index 3d908916ae3f7d4c1daaafc3b4858b4d9a94a74a..ed90aa2f5cd8168da2fb35fce8efe457e22e2572 100644 (file)
@@ -32201,6 +32201,8 @@ cp_parser_omp_clause_name (cp_parser *parser)
            result = PRAGMA_OMP_CLAUSE_ALIGNED;
          else if (!strcmp ("async", p))
            result = PRAGMA_OACC_CLAUSE_ASYNC;
+         else if (!strcmp ("attach", p))
+           result = PRAGMA_OACC_CLAUSE_ATTACH;
          break;
        case 'c':
          if (!strcmp ("collapse", p))
@@ -32221,6 +32223,8 @@ cp_parser_omp_clause_name (cp_parser *parser)
            result = PRAGMA_OMP_CLAUSE_DEFAULTMAP;
          else if (!strcmp ("depend", p))
            result = PRAGMA_OMP_CLAUSE_DEPEND;
+         else if (!strcmp ("detach", p))
+           result = PRAGMA_OACC_CLAUSE_DETACH;
          else if (!strcmp ("device", p))
            result = PRAGMA_OMP_CLAUSE_DEVICE;
          else if (!strcmp ("deviceptr", p))
@@ -32423,11 +32427,15 @@ check_no_duplicate_clause (tree clauses, enum omp_clause_code code,
 
    COLON can be NULL if only closing parenthesis should end the list,
    or pointer to bool which will receive false if the list is terminated
-   by closing parenthesis or true if the list is terminated by colon.  */
+   by closing parenthesis or true if the list is terminated by colon.
+
+   The optional ALLOW_DEREF argument is true if list items can use the deref
+   (->) operator.  */
 
 static tree
 cp_parser_omp_var_list_no_open (cp_parser *parser, enum omp_clause_code kind,
-                               tree list, bool *colon)
+                               tree list, bool *colon,
+                               bool allow_deref = false)
 {
   cp_token *token;
   bool saved_colon_corrects_to_scope_p = parser->colon_corrects_to_scope_p;
@@ -32500,15 +32508,20 @@ cp_parser_omp_var_list_no_open (cp_parser *parser, enum omp_clause_code kind,
            case OMP_CLAUSE_MAP:
            case OMP_CLAUSE_FROM:
            case OMP_CLAUSE_TO:
-             while (cp_lexer_next_token_is (parser->lexer, CPP_DOT))
+             while (cp_lexer_next_token_is (parser->lexer, CPP_DOT)
+                    || (allow_deref
+                        && cp_lexer_next_token_is (parser->lexer, CPP_DEREF)))
                {
+                 cpp_ttype ttype
+                   = cp_lexer_next_token_is (parser->lexer, CPP_DOT)
+                     ? CPP_DOT : CPP_DEREF;
                  location_t loc
                    = cp_lexer_peek_token (parser->lexer)->location;
                  cp_id_kind idk = CP_ID_KIND_NONE;
                  cp_lexer_consume_token (parser->lexer);
                  decl = convert_from_reference (decl);
                  decl
-                   = cp_parser_postfix_dot_deref_expression (parser, CPP_DOT,
+                   = cp_parser_postfix_dot_deref_expression (parser, ttype,
                                                              decl, false,
                                                              &idk, loc);
                }
@@ -32626,19 +32639,23 @@ cp_parser_omp_var_list_no_open (cp_parser *parser, enum omp_clause_code kind,
    common case for omp clauses.  */
 
 static tree
-cp_parser_omp_var_list (cp_parser *parser, enum omp_clause_code kind, tree list)
+cp_parser_omp_var_list (cp_parser *parser, enum omp_clause_code kind, tree list,
+                       bool allow_deref = false)
 {
   if (cp_parser_require (parser, CPP_OPEN_PAREN, RT_OPEN_PAREN))
-    return cp_parser_omp_var_list_no_open (parser, kind, list, NULL);
+    return cp_parser_omp_var_list_no_open (parser, kind, list, NULL,
+                                          allow_deref);
   return list;
 }
 
-/* OpenACC 2.0:
+/* OpenACC 2.5:
+   attach ( variable-list )
    copy ( variable-list )
    copyin ( variable-list )
    copyout ( variable-list )
    create ( variable-list )
    delete ( variable-list )
+   detach ( variable-list )
    present ( variable-list ) */
 
 static tree
@@ -32648,6 +32665,9 @@ cp_parser_oacc_data_clause (cp_parser *parser, pragma_omp_clause c_kind,
   enum gomp_map_kind kind;
   switch (c_kind)
     {
+    case PRAGMA_OACC_CLAUSE_ATTACH:
+      kind = GOMP_MAP_ATTACH;
+      break;
     case PRAGMA_OACC_CLAUSE_COPY:
       kind = GOMP_MAP_TOFROM;
       break;
@@ -32663,6 +32683,9 @@ cp_parser_oacc_data_clause (cp_parser *parser, pragma_omp_clause c_kind,
     case PRAGMA_OACC_CLAUSE_DELETE:
       kind = GOMP_MAP_RELEASE;
       break;
+    case PRAGMA_OACC_CLAUSE_DETACH:
+      kind = GOMP_MAP_DETACH;
+      break;
     case PRAGMA_OACC_CLAUSE_DEVICE:
       kind = GOMP_MAP_FORCE_TO;
       break;
@@ -32682,7 +32705,7 @@ cp_parser_oacc_data_clause (cp_parser *parser, pragma_omp_clause c_kind,
       gcc_unreachable ();
     }
   tree nl, c;
-  nl = cp_parser_omp_var_list (parser, OMP_CLAUSE_MAP, list);
+  nl = cp_parser_omp_var_list (parser, OMP_CLAUSE_MAP, list, true);
 
   for (c = nl; c != list; c = OMP_CLAUSE_CHAIN (c))
     OMP_CLAUSE_SET_MAP_KIND (c, kind);
@@ -35018,6 +35041,10 @@ cp_parser_oacc_all_clauses (cp_parser *parser, omp_clause_mask mask,
                                                  clauses);
          c_name = "auto";
          break;
+       case PRAGMA_OACC_CLAUSE_ATTACH:
+         clauses = cp_parser_oacc_data_clause (parser, c_kind, clauses);
+         c_name = "attach";
+         break;
        case PRAGMA_OACC_CLAUSE_COLLAPSE:
          clauses = cp_parser_omp_clause_collapse (parser, clauses, here);
          c_name = "collapse";
@@ -35046,6 +35073,10 @@ cp_parser_oacc_all_clauses (cp_parser *parser, omp_clause_mask mask,
          clauses = cp_parser_omp_clause_default (parser, clauses, here, true);
          c_name = "default";
          break;
+       case PRAGMA_OACC_CLAUSE_DETACH:
+         clauses = cp_parser_oacc_data_clause (parser, c_kind, clauses);
+         c_name = "detach";
+         break;
        case PRAGMA_OACC_CLAUSE_DEVICE:
          clauses = cp_parser_oacc_data_clause (parser, c_kind, clauses);
          c_name = "device";
@@ -38695,10 +38726,12 @@ cp_parser_oacc_cache (cp_parser *parser, cp_token *pragma_tok)
      structured-block  */
 
 #define OACC_DATA_CLAUSE_MASK                                          \
-       ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
+       ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_CREATE)              \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_DETACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_DEVICEPTR)           \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_IF)                  \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_PRESENT) )
@@ -38898,6 +38931,7 @@ cp_parser_oacc_declare (cp_parser *parser, cp_token *pragma_tok)
 
 #define OACC_ENTER_DATA_CLAUSE_MASK                                    \
        ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_IF)                  \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_CREATE)              \
@@ -38908,6 +38942,7 @@ cp_parser_oacc_declare (cp_parser *parser, cp_token *pragma_tok)
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_DELETE)              \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_DETACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_FINALIZE)            \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_WAIT) )
 
@@ -39011,6 +39046,7 @@ cp_parser_oacc_loop (cp_parser *parser, cp_token *pragma_tok, char *p_name,
 
 #define OACC_KERNELS_CLAUSE_MASK                                       \
        ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
@@ -39026,6 +39062,7 @@ cp_parser_oacc_loop (cp_parser *parser, cp_token *pragma_tok, char *p_name,
 
 #define OACC_PARALLEL_CLAUSE_MASK                                      \
        ( (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ASYNC)               \
+       | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_ATTACH)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPY)                \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYIN)              \
        | (OMP_CLAUSE_MASK_1 << PRAGMA_OACC_CLAUSE_COPYOUT)             \
index 3ae9cf050fb8155fa3fb7f60419c26cd7b93d353..b7701701ead076a4a478dc8ea97542afa6204438 100644 (file)
@@ -4652,7 +4652,6 @@ handle_omp_array_sections_1 (tree c, tree t, vec<tree> &types,
        t = TREE_OPERAND (t, 0);
       ret = t;
       if (TREE_CODE (t) == COMPONENT_REF
-         && ort == C_ORT_OMP
          && (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_MAP
              || OMP_CLAUSE_CODE (c) == OMP_CLAUSE_TO
              || OMP_CLAUSE_CODE (c) == OMP_CLAUSE_FROM)
@@ -4775,6 +4774,18 @@ handle_omp_array_sections_1 (tree c, tree t, vec<tree> &types,
   if (low_bound == NULL_TREE)
     low_bound = integer_zero_node;
 
+  if (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_MAP
+      && (OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_ATTACH
+         || OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_DETACH))
+    {
+      if (length != integer_one_node)
+       {
+         error_at (OMP_CLAUSE_LOCATION (c),
+                   "expected single pointer in %qs clause",
+                   c_omp_map_clause_name (c, ort == C_ORT_ACC));
+         return error_mark_node;
+       }
+    }
   if (length != NULL_TREE)
     {
       if (!integer_nonzerop (length))
@@ -6133,6 +6144,41 @@ cp_omp_finish_iterators (tree iter)
   return ret;
 }
 
+/* Ensure that pointers are used in OpenACC attach and detach clauses.
+   Return true if an error has been detected.  */
+
+static bool
+cp_oacc_check_attachments (tree c)
+{
+  if (OMP_CLAUSE_CODE (c) != OMP_CLAUSE_MAP)
+    return false;
+
+  /* OpenACC attach / detach clauses must be pointers.  */
+  if (OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_ATTACH
+      || OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_DETACH)
+    {
+      tree t = OMP_CLAUSE_DECL (c);
+      tree type;
+
+      while (TREE_CODE (t) == TREE_LIST)
+       t = TREE_CHAIN (t);
+
+      type = TREE_TYPE (t);
+
+      if (TREE_CODE (type) == REFERENCE_TYPE)
+       type = TREE_TYPE (type);
+
+      if (TREE_CODE (type) != POINTER_TYPE)
+       {
+         error_at (OMP_CLAUSE_LOCATION (c), "expected pointer in %qs clause",
+                   c_omp_map_clause_name (c, true));
+         return true;
+       }
+    }
+
+  return false;
+}
+
 /* For all elements of CLAUSES, validate them vs OpenMP constraints.
    Remove any elements from the list that are invalid.  */
 
@@ -6373,7 +6419,7 @@ finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
            t = OMP_CLAUSE_DECL (c);
        check_dup_generic_t:
          if (t == current_class_ptr
-             && (ort != C_ORT_OMP_DECLARE_SIMD
+             && ((ort != C_ORT_OMP_DECLARE_SIMD && ort != C_ORT_ACC)
                  || (OMP_CLAUSE_CODE (c) != OMP_CLAUSE_LINEAR
                      && OMP_CLAUSE_CODE (c) != OMP_CLAUSE_UNIFORM)))
            {
@@ -6437,8 +6483,7 @@ finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
        handle_field_decl:
          if (!remove
              && TREE_CODE (t) == FIELD_DECL
-             && t == OMP_CLAUSE_DECL (c)
-             && ort != C_ORT_ACC)
+             && t == OMP_CLAUSE_DECL (c))
            {
              OMP_CLAUSE_DECL (c)
                = omp_privatize_field (t, (OMP_CLAUSE_CODE (c)
@@ -6505,7 +6550,7 @@ finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
            omp_note_field_privatization (t, OMP_CLAUSE_DECL (c));
          else
            t = OMP_CLAUSE_DECL (c);
-         if (t == current_class_ptr)
+         if (ort != C_ORT_ACC && t == current_class_ptr)
            {
              error_at (OMP_CLAUSE_LOCATION (c),
                        "%<this%> allowed in OpenMP only in %<declare simd%>"
@@ -6992,7 +7037,7 @@ finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
            }
          if (t == error_mark_node)
            remove = true;
-         else if (t == current_class_ptr)
+         else if (ort != C_ORT_ACC && t == current_class_ptr)
            {
              error_at (OMP_CLAUSE_LOCATION (c),
                        "%<this%> allowed in OpenMP only in %<declare simd%>"
@@ -7122,6 +7167,8 @@ finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
                        }
                    }
                }
+             if (cp_oacc_check_attachments (c))
+               remove = true;
              break;
            }
          if (t == error_mark_node)
@@ -7129,14 +7176,25 @@ finish_omp_clauses (tree clauses, enum c_omp_region_type ort)
              remove = true;
              break;
            }
+         /* OpenACC attach / detach clauses must be pointers.  */
+         if (cp_oacc_check_attachments (c))
+           {
+             remove = true;
+             break;
+           }
          if (REFERENCE_REF_P (t)
              && TREE_CODE (TREE_OPERAND (t, 0)) == COMPONENT_REF)
            {
              t = TREE_OPERAND (t, 0);
              OMP_CLAUSE_DECL (c) = t;
            }
+         if (ort == C_ORT_ACC
+             && TREE_CODE (t) == COMPONENT_REF
+             && TREE_CODE (TREE_OPERAND (t, 0)) == INDIRECT_REF)
+           t = TREE_OPERAND (TREE_OPERAND (t, 0), 0);
          if (TREE_CODE (t) == COMPONENT_REF
-             && (ort & C_ORT_OMP_DECLARE_SIMD) == C_ORT_OMP
+             && ((ort & C_ORT_OMP_DECLARE_SIMD) == C_ORT_OMP
+                 || ort == C_ORT_ACC)
              && OMP_CLAUSE_CODE (c) != OMP_CLAUSE__CACHE_)
            {
              if (type_dependent_expression_p (t))
index 88dfde119f1390ef1dc3335f61e2d7907d0ca46e..86ed18bdad13b18772a40e3f5cf3e2a23eb4536e 100644 (file)
@@ -1,3 +1,27 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * gfortran.h (gfc_omp_map_op): Add OMP_MAP_ATTACH, OMP_MAP_DETACH.
+       * openmp.c (gfc_match_omp_variable_list): Add allow_derived parameter.
+       Parse derived-type member accesses if true.
+       (omp_mask2): Add OMP_CLAUSE_ATTACH and OMP_CLAUSE_DETACH.
+       (gfc_match_omp_map_clause): Add allow_derived parameter.  Pass to
+       gfc_match_omp_variable_list.
+       (gfc_match_omp_clauses): Support attach and detach.  Support derived
+       types for appropriate OpenACC directives.
+       (OACC_PARALLEL_CLAUSES, OACC_KERNELS_CLAUSES, OACC_DATA_CLAUSES)
+       (OACC_ENTER_DATA_CLAUSES): Add OMP_CLAUSE_ATTACH.
+       (OACC_EXIT_DATA_CLAUSES): Add OMP_CLAUSE_DETACH.
+       (check_symbol_not_pointer): Don't disallow pointer objects of derived
+       type.
+       (resolve_oacc_data_clauses): Don't disallow allocatable derived types.
+       (resolve_omp_clauses): Perform duplicate checking only for non-derived
+       type component accesses (plain variables and arrays or array sections).
+       Support component refs.
+       * trans-openmp.c (gfc_omp_privatize_by_reference): Support component
+       refs.
+       (gfc_trans_omp_clauses): Support component refs, attach and detach
+       clauses.
+
 2015-08-20  Joseph Myers  <joseph@codesourcery.com>
 
        PR libgomp/81886
index 23d01b10728086fcb367e86a5eb4cc9693851433..7e039e50f6c461b11f85693fe0bc4ff687a24bad 100644 (file)
@@ -1187,10 +1187,12 @@ enum gfc_omp_depend_op
 enum gfc_omp_map_op
 {
   OMP_MAP_ALLOC,
+  OMP_MAP_ATTACH,
   OMP_MAP_TO,
   OMP_MAP_FROM,
   OMP_MAP_TOFROM,
   OMP_MAP_DELETE,
+  OMP_MAP_DETACH,
   OMP_MAP_FORCE_ALLOC,
   OMP_MAP_FORCE_TO,
   OMP_MAP_FORCE_FROM,
index 1c7bce6c30000dbf17544b7252c6df1a072d9596..b08593a2317c95718f0b612562806b77356b9e5a 100644 (file)
@@ -222,7 +222,8 @@ static match
 gfc_match_omp_variable_list (const char *str, gfc_omp_namelist **list,
                             bool allow_common, bool *end_colon = NULL,
                             gfc_omp_namelist ***headp = NULL,
-                            bool allow_sections = false)
+                            bool allow_sections = false,
+                            bool allow_derived = false)
 {
   gfc_omp_namelist *head, *tail, *p;
   locus old_loc, cur_loc;
@@ -248,7 +249,8 @@ gfc_match_omp_variable_list (const char *str, gfc_omp_namelist **list,
        case MATCH_YES:
          gfc_expr *expr;
          expr = NULL;
-         if (allow_sections && gfc_peek_ascii_char () == '(')
+         if ((allow_sections && gfc_peek_ascii_char () == '(')
+             || (allow_derived && gfc_peek_ascii_char () == '%'))
            {
              gfc_current_locus = cur_loc;
              m = gfc_match_variable (&expr, 0);
@@ -785,7 +787,7 @@ enum omp_mask1
   OMP_MASK1_LAST
 };
 
-/* OpenACC 2.0 specific clauses. */
+/* OpenACC 2.0+ specific clauses. */
 enum omp_mask2
 {
   OMP_CLAUSE_ASYNC,
@@ -811,6 +813,8 @@ enum omp_mask2
   OMP_CLAUSE_TILE,
   OMP_CLAUSE_IF_PRESENT,
   OMP_CLAUSE_FINALIZE,
+  OMP_CLAUSE_ATTACH,
+  OMP_CLAUSE_DETACH,
   /* This must come last.  */
   OMP_MASK2_LAST
 };
@@ -914,10 +918,12 @@ omp_inv_mask::omp_inv_mask (const omp_mask &m) : omp_mask (m)
    mapping.  */
 
 static bool
-gfc_match_omp_map_clause (gfc_omp_namelist **list, gfc_omp_map_op map_op)
+gfc_match_omp_map_clause (gfc_omp_namelist **list, gfc_omp_map_op map_op,
+                         bool allow_derived = false)
 {
   gfc_omp_namelist **head = NULL;
-  if (gfc_match_omp_variable_list ("", list, false, NULL, &head, true)
+  if (gfc_match_omp_variable_list ("", list, false, NULL, &head, true,
+                                  allow_derived)
       == MATCH_YES)
     {
       gfc_omp_namelist *n;
@@ -939,6 +945,14 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
 {
   gfc_omp_clauses *c = gfc_get_omp_clauses ();
   locus old_loc;
+  /* Determine whether we're dealing with an OpenACC directive that permits
+     derived type member accesses.  This in particular disallows
+     "!$acc declare" from using such accesses, because it's not clear if/how
+     that should work.  */
+  bool allow_derived = (openacc
+                       && ((mask & OMP_CLAUSE_ATTACH)
+                           || (mask & OMP_CLAUSE_DETACH)
+                           || (mask & OMP_CLAUSE_HOST_SELF)));
 
   gcc_checking_assert (OMP_MASK1_LAST <= 64 && OMP_MASK2_LAST <= 64);
   *cp = NULL;
@@ -1012,6 +1026,11 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
              needs_space = true;
              continue;
            }
+         if ((mask & OMP_CLAUSE_ATTACH)
+             && gfc_match ("attach ( ") == MATCH_YES
+             && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
+                                          OMP_MAP_ATTACH, allow_derived))
+           continue;
          break;
        case 'c':
          if ((mask & OMP_CLAUSE_COLLAPSE)
@@ -1039,7 +1058,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_COPY)
              && gfc_match ("copy ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_TOFROM))
+                                          OMP_MAP_TOFROM, allow_derived))
            continue;
          if (mask & OMP_CLAUSE_COPYIN)
            {
@@ -1047,7 +1066,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
                {
                  if (gfc_match ("copyin ( ") == MATCH_YES
                      && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                                  OMP_MAP_TO))
+                                                  OMP_MAP_TO, allow_derived))
                    continue;
                }
              else if (gfc_match_omp_variable_list ("copyin (",
@@ -1058,7 +1077,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_COPYOUT)
              && gfc_match ("copyout ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FROM))
+                                          OMP_MAP_FROM, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_COPYPRIVATE)
              && gfc_match_omp_variable_list ("copyprivate (",
@@ -1068,7 +1087,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_CREATE)
              && gfc_match ("create ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_ALLOC))
+                                          OMP_MAP_ALLOC, allow_derived))
            continue;
          break;
        case 'd':
@@ -1104,7 +1123,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_DELETE)
              && gfc_match ("delete ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_RELEASE))
+                                          OMP_MAP_RELEASE, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_DEPEND)
              && gfc_match ("depend ( ") == MATCH_YES)
@@ -1147,6 +1166,11 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
              else
                gfc_current_locus = old_loc;
            }
+         if ((mask & OMP_CLAUSE_DETACH)
+             && gfc_match ("detach ( ") == MATCH_YES
+             && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
+                                          OMP_MAP_DETACH, allow_derived))
+           continue;
          if ((mask & OMP_CLAUSE_DEVICE)
              && !openacc
              && c->device == NULL
@@ -1156,12 +1180,13 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
              && openacc
              && gfc_match ("device ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FORCE_TO))
+                                          OMP_MAP_FORCE_TO, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_DEVICEPTR)
              && gfc_match ("deviceptr ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FORCE_DEVICEPTR))
+                                          OMP_MAP_FORCE_DEVICEPTR,
+                                          allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_DEVICE_RESIDENT)
              && gfc_match_omp_variable_list
@@ -1239,7 +1264,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_HOST_SELF)
              && gfc_match ("host ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FORCE_FROM))
+                                          OMP_MAP_FORCE_FROM, allow_derived))
            continue;
          break;
        case 'i':
@@ -1511,47 +1536,48 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_COPY)
              && gfc_match ("pcopy ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_TOFROM))
+                                          OMP_MAP_TOFROM, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_COPYIN)
              && gfc_match ("pcopyin ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_TO))
+                                          OMP_MAP_TO, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_COPYOUT)
              && gfc_match ("pcopyout ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FROM))
+                                          OMP_MAP_FROM, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_CREATE)
              && gfc_match ("pcreate ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_ALLOC))
+                                          OMP_MAP_ALLOC, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_PRESENT)
              && gfc_match ("present ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FORCE_PRESENT))
+                                          OMP_MAP_FORCE_PRESENT,
+                                          allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_COPY)
              && gfc_match ("present_or_copy ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_TOFROM))
+                                          OMP_MAP_TOFROM, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_COPYIN)
              && gfc_match ("present_or_copyin ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_TO))
+                                          OMP_MAP_TO, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_COPYOUT)
              && gfc_match ("present_or_copyout ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FROM))
+                                          OMP_MAP_FROM, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_CREATE)
              && gfc_match ("present_or_create ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_ALLOC))
+                                          OMP_MAP_ALLOC, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_PRIORITY)
              && c->priority == NULL
@@ -1669,8 +1695,8 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
 
              if (gfc_match_omp_variable_list (" :",
                                               &c->lists[OMP_LIST_REDUCTION],
-                                              false, NULL, &head,
-                                              openacc) == MATCH_YES)
+                                              false, NULL, &head, openacc,
+                                              allow_derived) == MATCH_YES)
                {
                  gfc_omp_namelist *n;
                  if (rop == OMP_REDUCTION_NONE)
@@ -1769,7 +1795,7 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
          if ((mask & OMP_CLAUSE_HOST_SELF)
              && gfc_match ("self ( ") == MATCH_YES
              && gfc_match_omp_map_clause (&c->lists[OMP_LIST_MAP],
-                                          OMP_MAP_FORCE_FROM))
+                                          OMP_MAP_FORCE_FROM, allow_derived))
            continue;
          if ((mask & OMP_CLAUSE_SEQ)
              && !c->seq
@@ -1937,17 +1963,17 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
    | OMP_CLAUSE_COPY | OMP_CLAUSE_COPYIN | OMP_CLAUSE_COPYOUT                \
    | OMP_CLAUSE_CREATE | OMP_CLAUSE_PRESENT | OMP_CLAUSE_DEVICEPTR           \
    | OMP_CLAUSE_PRIVATE | OMP_CLAUSE_FIRSTPRIVATE | OMP_CLAUSE_DEFAULT       \
-   | OMP_CLAUSE_WAIT)
+   | OMP_CLAUSE_WAIT | OMP_CLAUSE_ATTACH)
 #define OACC_KERNELS_CLAUSES \
   (omp_mask (OMP_CLAUSE_IF) | OMP_CLAUSE_ASYNC | OMP_CLAUSE_NUM_GANGS        \
    | OMP_CLAUSE_NUM_WORKERS | OMP_CLAUSE_VECTOR_LENGTH | OMP_CLAUSE_DEVICEPTR \
    | OMP_CLAUSE_COPY | OMP_CLAUSE_COPYIN | OMP_CLAUSE_COPYOUT                \
    | OMP_CLAUSE_CREATE | OMP_CLAUSE_PRESENT | OMP_CLAUSE_DEFAULT             \
-   | OMP_CLAUSE_WAIT)
+   | OMP_CLAUSE_WAIT | OMP_CLAUSE_ATTACH)
 #define OACC_DATA_CLAUSES \
   (omp_mask (OMP_CLAUSE_IF) | OMP_CLAUSE_DEVICEPTR  | OMP_CLAUSE_COPY        \
    | OMP_CLAUSE_COPYIN | OMP_CLAUSE_COPYOUT | OMP_CLAUSE_CREATE                      \
-   | OMP_CLAUSE_PRESENT)
+   | OMP_CLAUSE_PRESENT | OMP_CLAUSE_ATTACH)
 #define OACC_LOOP_CLAUSES \
   (omp_mask (OMP_CLAUSE_COLLAPSE) | OMP_CLAUSE_GANG | OMP_CLAUSE_WORKER              \
    | OMP_CLAUSE_VECTOR | OMP_CLAUSE_SEQ | OMP_CLAUSE_INDEPENDENT             \
@@ -1968,10 +1994,11 @@ gfc_match_omp_clauses (gfc_omp_clauses **cp, const omp_mask mask,
    | OMP_CLAUSE_DEVICE | OMP_CLAUSE_WAIT | OMP_CLAUSE_IF_PRESENT)
 #define OACC_ENTER_DATA_CLAUSES \
   (omp_mask (OMP_CLAUSE_IF) | OMP_CLAUSE_ASYNC | OMP_CLAUSE_WAIT             \
-   | OMP_CLAUSE_COPYIN | OMP_CLAUSE_CREATE)
+   | OMP_CLAUSE_COPYIN | OMP_CLAUSE_CREATE | OMP_CLAUSE_ATTACH)
 #define OACC_EXIT_DATA_CLAUSES \
   (omp_mask (OMP_CLAUSE_IF) | OMP_CLAUSE_ASYNC | OMP_CLAUSE_WAIT             \
-   | OMP_CLAUSE_COPYOUT | OMP_CLAUSE_DELETE | OMP_CLAUSE_FINALIZE)
+   | OMP_CLAUSE_COPYOUT | OMP_CLAUSE_DELETE | OMP_CLAUSE_FINALIZE            \
+   | OMP_CLAUSE_DETACH)
 #define OACC_WAIT_CLAUSES \
   omp_mask (OMP_CLAUSE_ASYNC)
 #define OACC_ROUTINE_CLAUSES \
@@ -3804,9 +3831,6 @@ resolve_nonnegative_int_expr (gfc_expr *expr, const char *clause)
 static void
 check_symbol_not_pointer (gfc_symbol *sym, locus loc, const char *name)
 {
-  if (sym->ts.type == BT_DERIVED && sym->attr.pointer)
-    gfc_error ("POINTER object %qs of derived type in %s clause at %L",
-              sym->name, name, &loc);
   if (sym->ts.type == BT_DERIVED && sym->attr.cray_pointer)
     gfc_error ("Cray pointer object %qs of derived type in %s clause at %L",
               sym->name, name, &loc);
@@ -3851,9 +3875,6 @@ check_array_not_assumed (gfc_symbol *sym, locus loc, const char *name)
 static void
 resolve_oacc_data_clauses (gfc_symbol *sym, locus loc, const char *name)
 {
-  if (sym->ts.type == BT_DERIVED && sym->attr.allocatable)
-    gfc_error ("ALLOCATABLE object %qs of derived type in %s clause at %L",
-              sym->name, name, &loc);
   if ((sym->ts.type == BT_ASSUMED && sym->attr.allocatable)
       || (sym->ts.type == BT_CLASS && CLASS_DATA (sym)
          && CLASS_DATA (sym)->attr.allocatable))
@@ -4223,11 +4244,26 @@ resolve_omp_clauses (gfc_code *code, gfc_omp_clauses *omp_clauses,
        && (list != OMP_LIST_REDUCTION || !openacc))
       for (n = omp_clauses->lists[list]; n; n = n->next)
        {
-         if (n->sym->mark)
-           gfc_error ("Symbol %qs present on multiple clauses at %L",
-                      n->sym->name, &n->where);
-         else
-           n->sym->mark = 1;
+         bool array_only_p = true;
+         /* Disallow duplicate bare variable references and multiple
+            subarrays of the same array here, but allow multiple components of
+            the same (e.g. derived-type) variable.  For the latter, duplicate
+            components are detected elsewhere.  */
+         if (openacc && n->expr && n->expr->expr_type == EXPR_VARIABLE)
+           for (gfc_ref *ref = n->expr->ref; ref; ref = ref->next)
+             if (ref->type != REF_ARRAY)
+               {
+                 array_only_p = false;
+                 break;
+               }
+         if (array_only_p)
+           {
+             if (n->sym->mark)
+               gfc_error ("Symbol %qs present on multiple clauses at %L",
+                          n->sym->name, &n->where);
+             else
+               n->sym->mark = 1;
+           }
        }
 
   gcc_assert (OMP_LIST_LASTPRIVATE == OMP_LIST_FIRSTPRIVATE + 1);
@@ -4418,23 +4454,43 @@ resolve_omp_clauses (gfc_code *code, gfc_omp_clauses *omp_clauses,
                                 "are allowed on ORDERED directive at %L",
                                 &n->where);
                  }
+               gfc_ref *array_ref = NULL;
+               bool resolved = false;
                if (n->expr)
                  {
-                   if (!gfc_resolve_expr (n->expr)
+                   array_ref = n->expr->ref;
+                   resolved = gfc_resolve_expr (n->expr);
+
+                   /* Look through component refs to find last array
+                      reference.  */
+                   if (openacc)
+                     while (resolved
+                            && array_ref
+                            && (array_ref->type == REF_COMPONENT
+                                || (array_ref->type == REF_ARRAY
+                                    && array_ref->next
+                                    && (array_ref->next->type
+                                        == REF_COMPONENT))))
+                       array_ref = array_ref->next;
+                 }
+               if (array_ref
+                   || (n->expr
+                       && (!resolved || n->expr->expr_type != EXPR_VARIABLE)))
+                 {
+                   if (!resolved
                        || n->expr->expr_type != EXPR_VARIABLE
-                       || n->expr->ref == NULL
-                       || n->expr->ref->next
-                       || n->expr->ref->type != REF_ARRAY)
+                       || array_ref->next
+                       || array_ref->type != REF_ARRAY)
                      gfc_error ("%qs in %s clause at %L is not a proper "
                                 "array section", n->sym->name, name,
                                 &n->where);
-                   else if (n->expr->ref->u.ar.codimen)
+                   else if (array_ref->u.ar.codimen)
                      gfc_error ("Coarrays not supported in %s clause at %L",
                                 name, &n->where);
                    else
                      {
                        int i;
-                       gfc_array_ref *ar = &n->expr->ref->u.ar;
+                       gfc_array_ref *ar = &array_ref->u.ar;
                        for (i = 0; i < ar->dimen; i++)
                          if (ar->stride[i])
                            {
index 0eb5956cc5313b97a17ebdbddec3d85b0a2148d9..0fe426a4edba756829dd9b015345628151815757 100644 (file)
@@ -61,6 +61,9 @@ gfc_omp_privatize_by_reference (const_tree decl)
 
   if (TREE_CODE (type) == POINTER_TYPE)
     {
+      while (TREE_CODE (decl) == COMPONENT_REF)
+        decl = TREE_OPERAND (decl, 1);
+
       /* Array POINTER/ALLOCATABLE have aggregate types, all user variables
         that have POINTER_TYPE type and aren't scalar pointers, scalar
         allocatables, Cray pointees or C pointers are supposed to be
@@ -2139,20 +2142,47 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
              tree decl = gfc_get_symbol_decl (n->sym);
              if (DECL_P (decl))
                TREE_ADDRESSABLE (decl) = 1;
-             if (n->expr == NULL || n->expr->ref->u.ar.type == AR_FULL)
+
+             gfc_ref *ref = n->expr ? n->expr->ref : NULL;
+             symbol_attribute *sym_attr = &n->sym->attr;
+             gomp_map_kind ptr_map_kind = GOMP_MAP_POINTER;
+
+             if (ref && n->sym->ts.type == BT_DERIVED)
+               {
+                 if (gfc_omp_privatize_by_reference (decl))
+                   decl = build_fold_indirect_ref (decl);
+
+                 for (; ref && ref->type == REF_COMPONENT; ref = ref->next)
+                   {
+                     tree field = ref->u.c.component->backend_decl;
+                     gcc_assert (field && TREE_CODE (field) == FIELD_DECL);
+                     decl = fold_build3 (COMPONENT_REF, TREE_TYPE (field),
+                                         decl, field, NULL_TREE);
+                     sym_attr = &ref->u.c.component->attr;
+                   }
+
+                 ptr_map_kind = GOMP_MAP_ALWAYS_POINTER;
+               }
+
+             if (ref == NULL || ref->u.ar.type == AR_FULL)
                {
+                 tree field = decl;
+
+                 while (TREE_CODE (field) == COMPONENT_REF)
+                   field = TREE_OPERAND (field, 1);
+
                  if (POINTER_TYPE_P (TREE_TYPE (decl))
                      && (gfc_omp_privatize_by_reference (decl)
-                         || GFC_DECL_GET_SCALAR_POINTER (decl)
-                         || GFC_DECL_GET_SCALAR_ALLOCATABLE (decl)
-                         || GFC_DECL_CRAY_POINTEE (decl)
+                         || GFC_DECL_GET_SCALAR_POINTER (field)
+                         || GFC_DECL_GET_SCALAR_ALLOCATABLE (field)
+                         || GFC_DECL_CRAY_POINTEE (field)
                          || GFC_DESCRIPTOR_TYPE_P
-                                       (TREE_TYPE (TREE_TYPE (decl)))))
+                                       (TREE_TYPE (TREE_TYPE (field)))))
                    {
                      tree orig_decl = decl;
                      node4 = build_omp_clause (input_location,
                                                OMP_CLAUSE_MAP);
-                     OMP_CLAUSE_SET_MAP_KIND (node4, GOMP_MAP_POINTER);
+                     OMP_CLAUSE_SET_MAP_KIND (node4, ptr_map_kind);
                      OMP_CLAUSE_DECL (node4) = decl;
                      OMP_CLAUSE_SIZE (node4) = size_int (0);
                      decl = build_fold_indirect_ref (decl);
@@ -2162,13 +2192,15 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                        {
                          node3 = build_omp_clause (input_location,
                                                    OMP_CLAUSE_MAP);
-                         OMP_CLAUSE_SET_MAP_KIND (node3, GOMP_MAP_POINTER);
+                         OMP_CLAUSE_SET_MAP_KIND (node3, ptr_map_kind);
                          OMP_CLAUSE_DECL (node3) = decl;
                          OMP_CLAUSE_SIZE (node3) = size_int (0);
                          decl = build_fold_indirect_ref (decl);
                        }
                    }
-                 if (GFC_DESCRIPTOR_TYPE_P (TREE_TYPE (decl)))
+                 if (GFC_DESCRIPTOR_TYPE_P (TREE_TYPE (decl))
+                     && n->u.map_op != OMP_MAP_ATTACH
+                     && n->u.map_op != OMP_MAP_DETACH)
                    {
                      tree type = TREE_TYPE (decl);
                      tree ptr = gfc_conv_descriptor_data_get (decl);
@@ -2183,14 +2215,16 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                      OMP_CLAUSE_SIZE (node2) = TYPE_SIZE_UNIT (type);
                      node3 = build_omp_clause (input_location,
                                                OMP_CLAUSE_MAP);
-                     OMP_CLAUSE_SET_MAP_KIND (node3, GOMP_MAP_POINTER);
+                     OMP_CLAUSE_SET_MAP_KIND (node3, ptr_map_kind);
                      OMP_CLAUSE_DECL (node3)
                        = gfc_conv_descriptor_data_get (decl);
+                     if (ptr_map_kind == GOMP_MAP_ALWAYS_POINTER)
+                       STRIP_NOPS (OMP_CLAUSE_DECL (node3));
                      OMP_CLAUSE_SIZE (node3) = size_int (0);
 
                      /* We have to check for n->sym->attr.dimension because
                         of scalar coarrays.  */
-                     if (n->sym->attr.pointer && n->sym->attr.dimension)
+                     if (sym_attr->pointer && sym_attr->dimension)
                        {
                          stmtblock_t cond_block;
                          tree size
@@ -2220,11 +2254,11 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                                                             else_b));
                          OMP_CLAUSE_SIZE (node) = size;
                        }
-                     else if (n->sym->attr.dimension)
+                     else if (sym_attr->dimension)
                        OMP_CLAUSE_SIZE (node)
                          = gfc_full_array_size (block, decl,
                                                 GFC_TYPE_ARRAY_RANK (type));
-                     if (n->sym->attr.dimension)
+                     if (sym_attr->dimension)
                        {
                          tree elemsz
                            = TYPE_SIZE_UNIT (gfc_get_element_type (type));
@@ -2237,11 +2271,11 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                  else
                    OMP_CLAUSE_DECL (node) = decl;
                }
-             else
+             else if (ref)
                {
                  tree ptr, ptr2;
                  gfc_init_se (&se, NULL);
-                 if (n->expr->ref->u.ar.type == AR_ELEMENT)
+                 if (ref->u.ar.type == AR_ELEMENT)
                    {
                      gfc_conv_expr_reference (&se, n->expr);
                      gfc_add_block_to_block (block, &se.pre);
@@ -2275,7 +2309,7 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                    {
                      node4 = build_omp_clause (input_location,
                                                OMP_CLAUSE_MAP);
-                     OMP_CLAUSE_SET_MAP_KIND (node4, GOMP_MAP_POINTER);
+                     OMP_CLAUSE_SET_MAP_KIND (node4, ptr_map_kind);
                      OMP_CLAUSE_DECL (node4) = decl;
                      OMP_CLAUSE_SIZE (node4) = size_int (0);
                      decl = build_fold_indirect_ref (decl);
@@ -2292,9 +2326,11 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                      OMP_CLAUSE_SIZE (node2) = TYPE_SIZE_UNIT (type);
                      node3 = build_omp_clause (input_location,
                                                OMP_CLAUSE_MAP);
-                     OMP_CLAUSE_SET_MAP_KIND (node3, GOMP_MAP_POINTER);
+                     OMP_CLAUSE_SET_MAP_KIND (node3, ptr_map_kind);
                      OMP_CLAUSE_DECL (node3)
                        = gfc_conv_descriptor_data_get (decl);
+                     if (ptr_map_kind == GOMP_MAP_ALWAYS_POINTER)
+                       STRIP_NOPS (OMP_CLAUSE_DECL (node3));
                    }
                  else
                    {
@@ -2307,18 +2343,23 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                        }
                      node3 = build_omp_clause (input_location,
                                                OMP_CLAUSE_MAP);
-                     OMP_CLAUSE_SET_MAP_KIND (node3, GOMP_MAP_POINTER);
+                     OMP_CLAUSE_SET_MAP_KIND (node3, ptr_map_kind);
                      OMP_CLAUSE_DECL (node3) = decl;
                    }
                  ptr2 = fold_convert (sizetype, ptr2);
                  OMP_CLAUSE_SIZE (node3)
                    = fold_build2 (MINUS_EXPR, sizetype, ptr, ptr2);
                }
+             else
+               gcc_unreachable ();
              switch (n->u.map_op)
                {
                case OMP_MAP_ALLOC:
                  OMP_CLAUSE_SET_MAP_KIND (node, GOMP_MAP_ALLOC);
                  break;
+               case OMP_MAP_ATTACH:
+                 OMP_CLAUSE_SET_MAP_KIND (node, GOMP_MAP_ATTACH);
+                 break;
                case OMP_MAP_TO:
                  OMP_CLAUSE_SET_MAP_KIND (node, GOMP_MAP_TO);
                  break;
@@ -2343,6 +2384,9 @@ gfc_trans_omp_clauses (stmtblock_t *block, gfc_omp_clauses *clauses,
                case OMP_MAP_DELETE:
                  OMP_CLAUSE_SET_MAP_KIND (node, GOMP_MAP_DELETE);
                  break;
+               case OMP_MAP_DETACH:
+                 OMP_CLAUSE_SET_MAP_KIND (node, GOMP_MAP_DETACH);
+                 break;
                case OMP_MAP_FORCE_ALLOC:
                  OMP_CLAUSE_SET_MAP_KIND (node, GOMP_MAP_FORCE_ALLOC);
                  break;
index 43f67f9fa924c47f9976b620affa7306741e3c73..eb67d1a79cb5012fae0ea56e683a954bbdcb93d8 100644 (file)
@@ -113,6 +113,10 @@ enum gimplify_omp_var_data
 
   GOVD_NONTEMPORAL = 4194304,
 
+  /* Flag for GOVD_MAP: (struct) vars that have pointer attachments for
+     fields.  */
+  GOVD_MAP_HAS_ATTACHMENTS = 8388608,
+
   GOVD_DATA_SHARE_CLASS = (GOVD_SHARED | GOVD_PRIVATE | GOVD_FIRSTPRIVATE
                           | GOVD_LASTPRIVATE | GOVD_REDUCTION | GOVD_LINEAR
                           | GOVD_LOCAL)
@@ -8066,7 +8070,13 @@ insert_struct_comp_map (enum tree_code code, tree c, tree struct_node,
   OMP_CLAUSE_SET_MAP_KIND (c2, mkind);
   OMP_CLAUSE_DECL (c2) = unshare_expr (OMP_CLAUSE_DECL (c));
   OMP_CLAUSE_CHAIN (c2) = scp ? *scp : prev_node;
-  OMP_CLAUSE_SIZE (c2) = TYPE_SIZE_UNIT (ptr_type_node);
+  if (OMP_CLAUSE_CHAIN (prev_node) != c
+      && OMP_CLAUSE_CODE (OMP_CLAUSE_CHAIN (prev_node)) == OMP_CLAUSE_MAP
+      && (OMP_CLAUSE_MAP_KIND (OMP_CLAUSE_CHAIN (prev_node))
+         == GOMP_MAP_TO_PSET))
+    OMP_CLAUSE_SIZE (c2) = OMP_CLAUSE_SIZE (OMP_CLAUSE_CHAIN (prev_node));
+  else
+    OMP_CLAUSE_SIZE (c2) = TYPE_SIZE_UNIT (ptr_type_node);
   if (struct_node)
     OMP_CLAUSE_CHAIN (struct_node) = c2;
 
@@ -8660,7 +8670,9 @@ gimplify_scan_omp_clauses (tree *list_p, gimple_seq *pre_p,
                  remove = true;
                  break;
                }
-             if (DECL_P (decl))
+             if (DECL_P (decl)
+                 && OMP_CLAUSE_MAP_KIND (c) != GOMP_MAP_TO_PSET
+                 && code != OACC_UPDATE)
                {
                  if (error_operand_p (decl))
                    {
@@ -8713,16 +8725,40 @@ gimplify_scan_omp_clauses (tree *list_p, gimple_seq *pre_p,
                    = splay_tree_lookup (ctx->variables, (splay_tree_key)decl);
                  bool ptr = (OMP_CLAUSE_MAP_KIND (c)
                              == GOMP_MAP_ALWAYS_POINTER);
+                 bool attach = OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_ATTACH
+                               || OMP_CLAUSE_MAP_KIND (c) == GOMP_MAP_DETACH;
+                 bool has_attachments = false;
+                 /* For OpenACC, pointers in structs should trigger an
+                    attach action.  */
+                 if (ptr && (region_type & ORT_ACC) != 0)
+                   {
+                     /* Turning a GOMP_MAP_ALWAYS_POINTER clause into a
+                        GOMP_MAP_ATTACH clause after we have detected a case
+                        that needs a GOMP_MAP_STRUCT mapping added.  */
+                     gomp_map_kind k
+                       = (code == OACC_EXIT_DATA) ? GOMP_MAP_DETACH
+                                                  : GOMP_MAP_ATTACH;
+                     OMP_CLAUSE_SET_MAP_KIND (c, k);
+                     has_attachments = true;
+                   }
                  if (n == NULL || (n->value & GOVD_MAP) == 0)
                    {
                      tree l = build_omp_clause (OMP_CLAUSE_LOCATION (c),
                                                 OMP_CLAUSE_MAP);
-                     OMP_CLAUSE_SET_MAP_KIND (l, GOMP_MAP_STRUCT);
+                     gomp_map_kind k = attach ? GOMP_MAP_FORCE_PRESENT
+                                              : GOMP_MAP_STRUCT;
+
+                     OMP_CLAUSE_SET_MAP_KIND (l, k);
                      if (!base_eq_orig_base)
                        OMP_CLAUSE_DECL (l) = unshare_expr (orig_base);
                      else
                        OMP_CLAUSE_DECL (l) = decl;
-                     OMP_CLAUSE_SIZE (l) = size_int (1);
+                     OMP_CLAUSE_SIZE (l)
+                       = (!attach
+                          ? size_int (1)
+                          : DECL_P (OMP_CLAUSE_DECL (l))
+                          ? DECL_SIZE_UNIT (OMP_CLAUSE_DECL (l))
+                          : TYPE_SIZE_UNIT (TREE_TYPE (OMP_CLAUSE_DECL (l))));
                      if (struct_map_to_clause == NULL)
                        struct_map_to_clause = new hash_map<tree, tree>;
                      struct_map_to_clause->put (decl, l);
@@ -8754,9 +8790,11 @@ gimplify_scan_omp_clauses (tree *list_p, gimple_seq *pre_p,
                      flags = GOVD_MAP | GOVD_EXPLICIT;
                      if (GOMP_MAP_ALWAYS_P (OMP_CLAUSE_MAP_KIND (c)) || ptr)
                        flags |= GOVD_SEEN;
+                     if (has_attachments)
+                       flags |= GOVD_MAP_HAS_ATTACHMENTS;
                      goto do_add_decl;
                    }
-                 else
+                 else if (struct_map_to_clause)
                    {
                      tree *osc = struct_map_to_clause->get (decl);
                      tree *sc = NULL, *scp = NULL;
@@ -8765,8 +8803,10 @@ gimplify_scan_omp_clauses (tree *list_p, gimple_seq *pre_p,
                      sc = &OMP_CLAUSE_CHAIN (*osc);
                      if (*sc != c
                          && (OMP_CLAUSE_MAP_KIND (*sc)
-                             == GOMP_MAP_FIRSTPRIVATE_REFERENCE)) 
+                             == GOMP_MAP_FIRSTPRIVATE_REFERENCE))
                        sc = &OMP_CLAUSE_CHAIN (*sc);
+                     /* Here "prev_list_p" is the end of the inserted
+                        alloc/release nodes after the struct node, OSC.  */
                      for (; *sc != c; sc = &OMP_CLAUSE_CHAIN (*sc))
                        if (ptr && sc == prev_list_p)
                          break;
@@ -8825,9 +8865,10 @@ gimplify_scan_omp_clauses (tree *list_p, gimple_seq *pre_p,
                          }
                      if (remove)
                        break;
-                     OMP_CLAUSE_SIZE (*osc)
-                       = size_binop (PLUS_EXPR, OMP_CLAUSE_SIZE (*osc),
-                                     size_one_node);
+                     if (!attach)
+                       OMP_CLAUSE_SIZE (*osc)
+                         = size_binop (PLUS_EXPR, OMP_CLAUSE_SIZE (*osc),
+                                       size_one_node);
                      if (ptr)
                        {
                          tree cl = insert_struct_comp_map (code, c, NULL,
@@ -8858,11 +8899,15 @@ gimplify_scan_omp_clauses (tree *list_p, gimple_seq *pre_p,
                }
              if (!remove
                  && OMP_CLAUSE_MAP_KIND (c) != GOMP_MAP_ALWAYS_POINTER
+                 && OMP_CLAUSE_MAP_KIND (c) != GOMP_MAP_TO_PSET
                  && OMP_CLAUSE_CHAIN (c)
                  && OMP_CLAUSE_CODE (OMP_CLAUSE_CHAIN (c)) == OMP_CLAUSE_MAP
-                 && (OMP_CLAUSE_MAP_KIND (OMP_CLAUSE_CHAIN (c))
-                     == GOMP_MAP_ALWAYS_POINTER))
+                 && ((OMP_CLAUSE_MAP_KIND (OMP_CLAUSE_CHAIN (c))
+                      == GOMP_MAP_ALWAYS_POINTER)
+                     || (OMP_CLAUSE_MAP_KIND (OMP_CLAUSE_CHAIN (c))
+                         == GOMP_MAP_TO_PSET)))
                prev_list_p = list_p;
+
              break;
            }
          flags = GOVD_MAP | GOVD_EXPLICIT;
@@ -9484,6 +9529,8 @@ gimplify_adjust_omp_clauses_1 (splay_tree_node n, void *data)
     return 0;
   if ((flags & GOVD_SEEN) == 0)
     return 0;
+  if ((flags & GOVD_MAP_HAS_ATTACHMENTS) != 0)
+    return 0;
   if (flags & GOVD_DEBUG_PRIVATE)
     {
       gcc_assert ((flags & GOVD_DATA_SHARE_CLASS) == GOVD_SHARED);
@@ -11876,8 +11923,9 @@ gimplify_omp_target_update (tree *expr_p, gimple_seq *pre_p)
           && omp_find_clause (OMP_STANDALONE_CLAUSES (expr),
                               OMP_CLAUSE_FINALIZE))
     {
-      /* Use GOMP_MAP_DELETE/GOMP_MAP_FORCE_FROM to denote that "finalize"
-        semantics apply to all mappings of this OpenACC directive.  */
+      /* Use GOMP_MAP_DELETE, GOMP_MAP_FORCE_DETACH, and
+        GOMP_MAP_FORCE_FROM to denote that "finalize" semantics apply
+        to all mappings of this OpenACC directive.  */
       bool finalize_marked = false;
       for (tree c = OMP_STANDALONE_CLAUSES (expr); c; c = OMP_CLAUSE_CHAIN (c))
        if (OMP_CLAUSE_CODE (c) == OMP_CLAUSE_MAP)
@@ -11891,10 +11939,19 @@ gimplify_omp_target_update (tree *expr_p, gimple_seq *pre_p)
              OMP_CLAUSE_SET_MAP_KIND (c, GOMP_MAP_DELETE);
              finalize_marked = true;
              break;
+           case GOMP_MAP_DETACH:
+             OMP_CLAUSE_SET_MAP_KIND (c, GOMP_MAP_FORCE_DETACH);
+             finalize_marked = true;
+             break;
+           case GOMP_MAP_STRUCT:
+           case GOMP_MAP_FORCE_PRESENT:
+             /* Skip over an initial struct or force_present mapping.  */
+             break;
            default:
-             /* Check consistency: libgomp relies on the very first data
-                mapping clause being marked, so make sure we did that before
-                any other mapping clauses.  */
+             /* Check consistency: libgomp relies on the very first
+                non-struct, non-force-present data mapping clause being
+                marked, so make sure we did that before any other mapping
+                clauses.  */
              gcc_assert (finalize_marked);
              break;
            }
index 874781ac5b5135242fa492fb365cf75ac225ed77..77a2f547a2463b2f578b6a84a81a769230692bcf 100644 (file)
@@ -9164,6 +9164,9 @@ lower_omp_target (gimple_stmt_iterator *gsi_p, omp_context *ctx)
          case GOMP_MAP_FORCE_DEVICEPTR:
          case GOMP_MAP_DEVICE_RESIDENT:
          case GOMP_MAP_LINK:
+         case GOMP_MAP_ATTACH:
+         case GOMP_MAP_DETACH:
+         case GOMP_MAP_FORCE_DETACH:
            gcc_assert (is_gimple_omp_oacc (stmt));
            break;
          default:
diff --git a/gcc/testsuite/ChangeLog.omp b/gcc/testsuite/ChangeLog.omp
new file mode 100644 (file)
index 0000000..2c61855
--- /dev/null
@@ -0,0 +1,9 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * c-c++-common/goacc/mdc-1.c: New test.
+       * c-c++-common/goacc/mdc-2.c: New test.
+       * gcc.dg/goacc/mdc.C: New test.
+       * gfortran.dg/goacc/data-clauses.f95: New test.
+       * gfortran.dg/goacc/derived-types.f90: New test.
+       * gfortran.dg/goacc/enter-exit-data.f95: New test.
+
diff --git a/gcc/testsuite/c-c++-common/goacc/mdc-1.c b/gcc/testsuite/c-c++-common/goacc/mdc-1.c
new file mode 100644 (file)
index 0000000..b8d03a0
--- /dev/null
@@ -0,0 +1,55 @@
+/* Test OpenACC's support for manual deep copy, including the attach
+   and detach clauses.  */
+
+/* { dg-do compile { target int32 } } */
+/* { dg-additional-options "-fdump-tree-omplower" } */
+
+void
+t1 ()
+{
+  struct foo {
+    int *a, *b, c, d, *e;
+  } s;
+
+  int *a, *z;
+
+#pragma acc enter data copyin(s)
+  {
+#pragma acc data copy(s.a[0:10]) copy(z[0:10])
+    {
+      s.e = z;
+#pragma acc parallel loop attach(s.e)
+      for (int i = 0; i < 10; i++)
+        s.a[i] = s.e[i];
+
+
+      a = s.e;
+#pragma acc enter data attach(a)
+#pragma acc exit data detach(a)
+    }
+
+#pragma acc enter data copyin(a)
+#pragma acc acc enter data attach(s.e)
+#pragma acc exit data detach(s.e)
+
+#pragma acc data attach(s.e)
+    {
+    }
+#pragma acc exit data delete(a)
+
+#pragma acc exit data detach(a) finalize
+#pragma acc exit data detach(s.a) finalize
+  }
+}
+
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data map.to:s .len: 32.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_data map.tofrom:.z .len: 40.. map.struct:s .len: 1.. map.alloc:s.a .len: 8.. map.tofrom:._1 .len: 40.. map.attach:s.a .len: 0.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_parallel map.force_present:s .len: 32.. map.attach:s.e .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data map.attach:a .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data map.detach:a .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data map.to:a .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data map.force_present:s .len: 32.. map.detach:s.e .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_data map.force_present:s .len: 32.. map.attach:s.e .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data map.release:a .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data finalize map.force_detach:a .len: 8.." 1 "omplower" } } */
+/* { dg-final { scan-tree-dump-times "pragma omp target oacc_enter_exit_data finalize map.force_present:s .len: 32.. map.force_detach:s.a .len: 8.." 1 "omplower" } } */
diff --git a/gcc/testsuite/c-c++-common/goacc/mdc-2.c b/gcc/testsuite/c-c++-common/goacc/mdc-2.c
new file mode 100644 (file)
index 0000000..fae8667
--- /dev/null
@@ -0,0 +1,62 @@
+/* Test OpenACC's support for manual deep copy, including the attach
+   and detach clauses.  */
+
+void
+t1 ()
+{
+  struct foo {
+    int *a, *b, c, d, *e;
+  } s;
+
+  int *a, *z, scalar, **y;
+
+#pragma acc enter data copyin(s) detach(z) /* { dg-error ".detach. is not valid for" } */
+  {
+#pragma acc data copy(s.a[0:10]) copy(z[0:10])
+    {
+      s.e = z;
+#pragma acc parallel loop attach(s.e) detach(s.b) /* { dg-error ".detach. is not valid for" } */
+      for (int i = 0; i < 10; i++)
+        s.a[i] = s.e[i];
+
+      a = s.e;
+#pragma acc enter data attach(a) detach(s.c) /* { dg-error ".detach. is not valid for" } */
+#pragma acc exit data detach(a)
+    }
+
+#pragma acc enter data attach(z[:5]) /* { dg-error "expected single pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(z[:5]) /* { dg-error "expected single pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(z[1:]) /* { dg-error "expected single pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(z[1:]) /* { dg-error "expected single pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(z[:]) /* { dg-error "expected single pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(z[:]) /* { dg-error "expected single pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(z[3]) /* { dg-error "expected pointer in .attach. clause" } */
+#pragma acc exit data detach(z[3]) /* { dg-error "expected pointer in .detach. clause" } */
+
+#pragma acc acc enter data attach(s.e)
+#pragma acc exit data detach(s.e) attach(z) /* { dg-error ".attach. is not valid for" } */
+
+#pragma acc data attach(s.e)
+    {
+    }
+#pragma acc exit data delete(a) attach(s.a) /* { dg-error ".attach. is not valid for" } */
+
+#pragma acc enter data attach(scalar) /* { dg-error "expected pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(scalar) /* { dg-error "expected pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(s) /* { dg-error "expected pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(s) /* { dg-error "expected pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+  }
+
+#pragma acc enter data attach(y[10])
+#pragma acc exit data detach(y[10])
+}
diff --git a/gcc/testsuite/g++.dg/goacc/mdc.C b/gcc/testsuite/g++.dg/goacc/mdc.C
new file mode 100644 (file)
index 0000000..b3abab3
--- /dev/null
@@ -0,0 +1,68 @@
+/* Test OpenACC's support for manual deep copy, including the attach
+   and detach clauses.  */
+
+void
+t1 ()
+{
+  struct foo {
+    int *a, *b, c, d, *e;
+  } s;
+
+  struct foo& rs = s;
+  
+  int *a, *z, scalar, **y;
+  int* const &ra = a;
+  int* const &rz = z;
+  int& rscalar = scalar;
+  int** const &ry = y;
+
+#pragma acc enter data copyin(rs) detach(rz) /* { dg-error ".detach. is not valid for" } */
+  {
+#pragma acc data copy(rs.a[0:10]) copy(rz[0:10])
+    {
+      s.e = z;
+#pragma acc parallel loop attach(rs.e) detach(rs.b) /* { dg-error ".detach. is not valid for" } */
+      for (int i = 0; i < 10; i++)
+        s.a[i] = s.e[i];
+
+      a = s.e;
+#pragma acc enter data attach(ra) detach(rs.c) /* { dg-error ".detach. is not valid for" } */
+#pragma acc exit data detach(ra)
+    }
+
+#pragma acc enter data attach(rz[:5]) /* { dg-error "expected single pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(rz[:5]) /* { dg-error "expected single pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(rz[1:]) /* { dg-error "expected single pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(rz[1:]) /* { dg-error "expected single pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(rz[:]) /* { dg-error "expected single pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(rz[:]) /* { dg-error "expected single pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(rz[3]) /* { dg-error "expected pointer in .attach. clause" } */
+#pragma acc exit data detach(rz[3]) /* { dg-error "expected pointer in .detach. clause" } */
+
+#pragma acc acc enter data attach(rs.e)
+#pragma acc exit data detach(rs.e) attach(rz) /* { dg-error ".attach. is not valid for" } */
+
+#pragma acc data attach(rs.e)
+    {
+    }
+#pragma acc exit data delete(ra) attach(rs.a) /* { dg-error ".attach. is not valid for" } */
+
+#pragma acc enter data attach(rscalar) /* { dg-error "expected pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(rscalar) /* { dg-error "expected pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc enter data attach(rs) /* { dg-error "expected pointer in .attach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+#pragma acc exit data detach(rs) /* { dg-error "expected pointer in .detach. clause" } */
+/* { dg-error "has no data movement clause" "" { target *-*-* } .-1 } */
+  }
+
+#pragma acc enter data attach(ry[10])
+#pragma acc exit data detach(ry[10])
+}
index b94214e8b63eeff1d7733d86514c50eb282301a9..1a4a67199870dc006ec7142d49e7f7eb2bd04182 100644 (file)
@@ -39,9 +39,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel copy (tip) ! { dg-error "POINTER" }
+  !$acc parallel copy (tip)
   !$acc end parallel
-  !$acc parallel copy (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel copy (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) copy (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -54,9 +54,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel copyin (tip) ! { dg-error "POINTER" }
+  !$acc parallel copyin (tip)
   !$acc end parallel
-  !$acc parallel copyin (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel copyin (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) copyin (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -71,9 +71,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel copyout (tip) ! { dg-error "POINTER" }
+  !$acc parallel copyout (tip)
   !$acc end parallel
-  !$acc parallel copyout (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel copyout (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) copyout (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -90,9 +90,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel create (tip) ! { dg-error "POINTER" }
+  !$acc parallel create (tip)
   !$acc end parallel
-  !$acc parallel create (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel create (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) create (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -111,9 +111,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel present (tip) ! { dg-error "POINTER" }
+  !$acc parallel present (tip)
   !$acc end parallel
-  !$acc parallel present (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel present (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) present (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -144,9 +144,9 @@ contains
   !$acc end parallel
 
 
-  !$acc parallel present_or_copy (tip) ! { dg-error "POINTER" }
+  !$acc parallel present_or_copy (tip)
   !$acc end parallel
-  !$acc parallel present_or_copy (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel present_or_copy (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) present_or_copy (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -169,9 +169,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel present_or_copyin (tip) ! { dg-error "POINTER" }
+  !$acc parallel present_or_copyin (tip)
   !$acc end parallel
-  !$acc parallel present_or_copyin (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel present_or_copyin (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) present_or_copyin (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -196,9 +196,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel present_or_copyout (tip) ! { dg-error "POINTER" }
+  !$acc parallel present_or_copyout (tip)
   !$acc end parallel
-  !$acc parallel present_or_copyout (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel present_or_copyout (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) present_or_copyout (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -225,9 +225,9 @@ contains
   !$acc end data
 
 
-  !$acc parallel present_or_create (tip) ! { dg-error "POINTER" }
+  !$acc parallel present_or_create (tip)
   !$acc end parallel
-  !$acc parallel present_or_create (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc parallel present_or_create (tia)
   !$acc end parallel
   !$acc parallel deviceptr (i) present_or_create (i) ! { dg-error "multiple clauses" }
   !$acc end parallel
@@ -256,4 +256,4 @@ contains
   !$acc end data
 
   end subroutine foo
-end module test
\ No newline at end of file
+end module test
diff --git a/gcc/testsuite/gfortran.dg/goacc/derived-types.f90 b/gcc/testsuite/gfortran.dg/goacc/derived-types.f90
new file mode 100644 (file)
index 0000000..5fb2981
--- /dev/null
@@ -0,0 +1,77 @@
+! Test ACC UPDATE with derived types.
+
+module dt
+  integer, parameter :: n = 10
+  type inner
+     integer :: d(n)
+  end type inner
+  type dtype
+     integer(8) :: a, b, c(n)
+     type(inner) :: in
+  end type dtype
+end module dt
+
+program derived_acc
+  use dt
+  
+  implicit none
+  type(dtype):: var
+  integer i
+  !$acc declare create(var)
+  !$acc declare pcopy(var%a) ! { dg-error "Syntax error in OpenMP" }
+
+  !$acc update host(var)
+  !$acc update host(var%a)
+  !$acc update device(var)
+  !$acc update device(var%a)
+  !$acc update self(var)
+  !$acc update self(var%a)
+  
+  !$acc enter data copyin(var)
+  !$acc enter data copyin(var%a)
+
+  !$acc exit data copyout(var)
+  !$acc exit data copyout(var%a)
+
+  !$acc data copy(var)
+  !$acc end data
+
+  !$acc data copyout(var%a)
+  !$acc end data
+
+  !$acc parallel loop pcopyout(var)
+  do i = 1, 10
+  end do  
+  !$acc end parallel loop
+
+  !$acc parallel loop copyout(var%a)
+  do i = 1, 10
+  end do
+  !$acc end parallel loop
+
+  !$acc parallel pcopy(var)
+  !$acc end parallel
+
+  !$acc parallel pcopy(var%a)
+  do i = 1, 10
+  end do
+  !$acc end parallel
+  
+  !$acc kernels pcopyin(var)
+  !$acc end kernels
+
+  !$acc kernels pcopy(var%a)
+  do i = 1, 10
+  end do
+  !$acc end kernels
+
+  !$acc kernels loop pcopyin(var)
+  do i = 1, 10
+  end do
+  !$acc end kernels loop
+
+  !$acc kernels loop pcopy(var%a)
+  do i = 1, 10
+  end do
+  !$acc end kernels loop
+end program derived_acc
index 805459c1bb0ac3beb6cabb87fbf2506b1ea5b7e0..b616b398a1411dcc7c1c60b8c3fbd0489088570a 100644 (file)
@@ -44,14 +44,14 @@ contains
   !$acc enter data wait (i, 1) 
   !$acc enter data wait (a) ! { dg-error "INTEGER" }
   !$acc enter data wait (b(5:6)) ! { dg-error "INTEGER" }
-  !$acc enter data copyin (tip) ! { dg-error "POINTER" }
-  !$acc enter data copyin (tia) ! { dg-error "ALLOCATABLE" }
-  !$acc enter data create (tip) ! { dg-error "POINTER" }
-  !$acc enter data create (tia) ! { dg-error "ALLOCATABLE" }
-  !$acc enter data present_or_copyin (tip) ! { dg-error "POINTER" }
-  !$acc enter data present_or_copyin (tia) ! { dg-error "ALLOCATABLE" }
-  !$acc enter data present_or_create (tip) ! { dg-error "POINTER" }
-  !$acc enter data present_or_create (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc enter data copyin (tip)
+  !$acc enter data copyin (tia)
+  !$acc enter data create (tip)
+  !$acc enter data create (tia)
+  !$acc enter data present_or_copyin (tip)
+  !$acc enter data present_or_copyin (tia)
+  !$acc enter data present_or_create (tip)
+  !$acc enter data present_or_create (tia)
   !$acc enter data copyin (i) create (i) ! { dg-error "multiple clauses" }
   !$acc enter data copyin (i) present_or_copyin (i) ! { dg-error "multiple clauses" }
   !$acc enter data create (i) present_or_copyin (i) ! { dg-error "multiple clauses" }
@@ -79,10 +79,10 @@ contains
   !$acc exit data wait (i, 1) 
   !$acc exit data wait (a) ! { dg-error "INTEGER" }
   !$acc exit data wait (b(5:6)) ! { dg-error "INTEGER" }
-  !$acc exit data copyout (tip) ! { dg-error "POINTER" }
-  !$acc exit data copyout (tia) ! { dg-error "ALLOCATABLE" }
-  !$acc exit data delete (tip) ! { dg-error "POINTER" }
-  !$acc exit data delete (tia) ! { dg-error "ALLOCATABLE" }
+  !$acc exit data copyout (tip)
+  !$acc exit data copyout (tia)
+  !$acc exit data delete (tip)
+  !$acc exit data delete (tia)
   !$acc exit data copyout (i) delete (i) ! { dg-error "multiple clauses" }
   !$acc exit data finalize
   !$acc exit data finalize copyout (i)
index ae0a6c120723986dc3083f694f7560c436c0ecc5..2df1f2345bf6d7b47225cfab35801847a53908d7 100644 (file)
@@ -826,6 +826,15 @@ dump_omp_clause (pretty_printer *pp, tree clause, int spc, dump_flags_t flags)
        case GOMP_MAP_LINK:
          pp_string (pp, "link");
          break;
+       case GOMP_MAP_ATTACH:
+         pp_string (pp, "attach");
+         break;
+       case GOMP_MAP_DETACH:
+         pp_string (pp, "detach");
+         break;
+       case GOMP_MAP_FORCE_DETACH:
+         pp_string (pp, "force_detach");
+         break;
        default:
          gcc_unreachable ();
        }
index e7f9f85c18e80cfd9c06ebce4c74e7271779027b..a9e948f406810cc8abc090213cfeb3ed157cde9a 100644 (file)
@@ -1,3 +1,9 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * gomp-constants.h (GOMP_MAP_DEEP_COPY): Define.
+       (gomp_map_kind): Add GOMP_MAP_ATTACH, GOMP_MAP_DETACH,
+       GOMP_MAP_FORCE_DETACH.
+
 2019-02-26  Chung-Lin Tang  <cltang@codesourcery.com>
 
        * gomp-constants.h (GOMP_ASYNC_DEFAULT): Define.
index 8b93634f1b8bd2256db97d09392ad9b74e14bd0c..6ea28fd55afc5435a1167fc2c66f82e9e32d8b43 100644 (file)
 #define GOMP_MAP_FLAG_SPECIAL_0                (1 << 2)
 #define GOMP_MAP_FLAG_SPECIAL_1                (1 << 3)
 #define GOMP_MAP_FLAG_SPECIAL_2                (1 << 4)
+#define GOMP_MAP_FLAG_SPECIAL_4                (1 << 6)
 #define GOMP_MAP_FLAG_SPECIAL          (GOMP_MAP_FLAG_SPECIAL_1 \
                                         | GOMP_MAP_FLAG_SPECIAL_0)
+#define GOMP_MAP_DEEP_COPY             (GOMP_MAP_FLAG_SPECIAL_4 \
+                                        | GOMP_MAP_FLAG_SPECIAL_2)
 /* Flag to force a specific behavior (or else, trigger a run-time error).  */
 #define GOMP_MAP_FLAG_FORCE            (1 << 7)
 
@@ -128,6 +131,13 @@ enum gomp_map_kind
     /* Decrement usage count and deallocate if zero.  */
     GOMP_MAP_RELEASE =                 (GOMP_MAP_FLAG_SPECIAL_2
                                         | GOMP_MAP_DELETE),
+    /* In OpenACC, attach a pointer to a mapped struct field.  */
+    GOMP_MAP_ATTACH =                  (GOMP_MAP_DEEP_COPY | 0),
+    /* In OpenACC, detach a pointer to a mapped struct field.  */
+    GOMP_MAP_DETACH =                  (GOMP_MAP_DEEP_COPY | 1),
+    /* In OpenACC, detach a pointer to a mapped struct field.  */
+    GOMP_MAP_FORCE_DETACH =            (GOMP_MAP_DEEP_COPY
+                                        | GOMP_MAP_FLAG_FORCE | 1),
 
     /* Internal to GCC, not used in libgomp.  */
     /* Do not map, but pointer assign a pointer instead.  */
index aeeabefb6b00c211bf7bcfc90d43ba3ddb264d53..58010c60285e152cc7508556fdd12c7ad943d957 100644 (file)
@@ -1,3 +1,91 @@
+2018-12-14  Julian Brown  <julian@codesourcery.com>
+
+       * libgomp.h (struct target_var_desc): Add do_detach flag.
+       (VREFCOUNT_LINK_KEY): New macro.
+       (struct splay_tree_key_s): Put link_key and new attach_count field into
+       a new union.  Substitute dynamic_refcount field for virtual_refcount.
+       (struct acc_dispatch_t): Remove data_environ field.
+       (enum gomp_map_vars_kind): Add GOMP_MAP_VARS_OPENACC_ENTER_DATA.
+       (gomp_acc_insert_pointer): Remove prototype.
+       (gomp_acc_remove_pointer): Update prototype.
+       (struct gomp_coalesce_buf): Add forward declaration.
+       (gomp_map_val, gomp_attach_pointer, gomp_detach_pointer): Add
+       prototypes.
+       * libgomp.map (OACC_2.6): New section. Add acc_attach, acc_attach_async,
+       acc_detach, acc_detach_async, acc_detach_finalize,
+       acc_detach_finalize_async.
+       * oacc-async.c (goacc_remove_var_async): New function.
+       * oacc-host.c (host_dispatch): Don't initialise removed data_environ
+       field.
+       * oacc-init.c (acc_shutdown_1): Use gomp_remove_var instead of
+       gomp_unmap_vars to remove mappings by splay tree key instead of target
+       memory descriptor.
+       * oacc-int.h (splay_tree_key_s): Add forward declaration.
+       (goacc_remove_var_async): Add prototype.
+       * oacc-mem.c (lookup_dev_1): New function.
+       (lookup_dev): Reimplement using above.
+       (acc_free, acc_hostptr): Update calls to lookup_dev.
+       (acc_map_data): Likewise.  Don't add to data_environ list.
+       (acc_unmap_data): Remove call to gomp_unmap_vars.  Fix semantics to
+       remove mapping, but not mapped data.
+       (present_create_copy): Use virtual_refcount instead of
+       dynamic_refcount.  Don't manipulate data_environ.  Fix target pointer
+       return value.
+       (delete_copyout): Update for virtual_refcount semantics.  Use
+       goacc_remove_var_async for asynchronous delete/copyouts.
+       (gomp_acc_insert_pointer): Remove function.
+       (gomp_acc_remove_pointer): Reimplement.
+       (acc_attach_async, acc_attach, goacc_detach_internal, acc_detach)
+       (acc_detach_async, acc_detach_finalize, acc_detach_finalize_async): New
+       functions.
+       * oacc-parallel.c (find_pointer): Support attach/detach.  Make a little
+       more strict.
+       (GOACC_parallel_keyed): Use gomp_map_val to calculate device addresses.
+       (GOACC_enter_exit_data): Support attach/detach and GOMP_MAP_STRUCT.
+       Don't call gomp_acc_insert_pointer.
+       * openacc.h (acc_attach, acc_attach_async, acc_detach)
+       (acc_detach_async, acc_detach_finalize, acc_detach_finalize_async): Add
+       prototypes.
+       * target.c (gomp_map_vars_existing): Initialise do_detach field of
+       tgt_var_desc.
+       (gomp_attach_pointer, gomp_detach_pointer): New functions.
+       (gomp_map_val): Make global.
+       (gomp_map_vars_async): Handle GOMP_MAP_VARS_OPENACC_ENTER_DATA.  Update
+       for virtual_refcount semantics.  Support attach and detach.
+       (gomp_remove_var): Free attach count array if present.
+       (gomp_unmap_vars_async): Support detach and update for virtual_refcount
+       semantics.  Disambiguate link_key/attach_count using virtual_refcount
+       with magic value as a tag.
+       (gomp_load_image_to_device): Zero-initialise virtual_refcount fields.
+       (gomp_free_memmap): Remove function.
+       (gomp_exit_data): Check virtual_refcount for tag value before using
+       link_key.
+       (omp_target_associate_ptr): Zero-initialise virtual_refcount and
+       link_key splay tree key fields.
+       (gomp_target_init): Don't initialise removed data_environ field.
+       * testsuite/libgomp.oacc-c-c++-common/context-2.c: Use correct API to
+       deallocate acc_copyin'd data.
+       * testsuite/libgomp.oacc-c-c++-common/context-4.c: Likewise.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-1.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-2.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-3.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-4.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-5.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-6.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-7.c: New test.
+       * testsuite/libgomp.oacc-c-c++-common/deep-copy-8.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-1.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-2.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-3.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-4.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-5.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-6.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-7.c: New test.
+       * testsuite/libgomp.oacc-fortran/deep-copy-8.c: New test.
+       * testsuite/libgomp.oacc-fortran/data-2.f90: Update test.
+       * testsuite/libgomp.oacc-fortran/derived-type-1.f90: New test.
+       * testsuite/libgomp.oacc-fortran/update-2.f90: New test.
+
 2018-11-10  Julian Brown  <julian@codesourcery.com>
 
        * libgomp.h (OFFSET_INLINED, OFFSET_POINTER, OFFSET_STRUCT): Define.
index 884a732c2961baee60591d9887aaf6c01054e57d..d8262951fa70a2afa6c3c5907b2dac4c9e2a29c4 100644 (file)
@@ -867,6 +867,8 @@ struct target_var_desc {
   bool copy_from;
   /* True if data always should be copied from device to host at the end.  */
   bool always_copy_from;
+  /* True if variable should be detached at end of region.  */
+  bool do_detach;
   /* Relative offset against key host_start.  */
   uintptr_t offset;
   /* Actual length.  */
@@ -908,6 +910,10 @@ struct target_mem_desc {
 #define OFFSET_POINTER (~(uintptr_t) 1)
 #define OFFSET_STRUCT (~(uintptr_t) 2)
 
+/* A special tag value for "virtual_refcount" in the splay_tree_key_s structure
+   below.  */
+#define VREFCOUNT_LINK_KEY (~(uintptr_t) 0)
+
 struct splay_tree_key_s {
   /* Address of the host object.  */
   uintptr_t host_start;
@@ -919,10 +925,21 @@ struct splay_tree_key_s {
   uintptr_t tgt_offset;
   /* Reference count.  */
   uintptr_t refcount;
-  /* Dynamic reference count.  */
-  uintptr_t dynamic_refcount;
-  /* Pointer to the original mapping of "omp declare target link" object.  */
-  splay_tree_key link_key;
+  /* Reference counts beyond those that represent genuine references in the
+     linked splay tree key/target memory structures, e.g. for multiple OpenACC
+     "present increment" operations (via "acc enter data") referring to the same
+     host-memory block.
+     If set to VREFCOUNT_LINK_KEY (for OpenMP, where this field is not otherwise
+     needed), the union below represents a link key.  */
+  uintptr_t virtual_refcount;
+  union {
+    /* For a block with attached pointers, the attachment counters for each.
+       Only used for OpenACC.  */
+    uintptr_t *attach_count;
+    /* Pointer to the original mapping of "omp declare target link" object.
+       Only used for OpenMP.  */
+    splay_tree_key link_key;
+  } u;
 };
 
 /* The comparison function.  */
@@ -944,13 +961,6 @@ splay_compare (splay_tree_key x, splay_tree_key y)
 
 typedef struct acc_dispatch_t
 {
-  /* This is a linked list of data mapped using the
-     acc_map_data/acc_unmap_data or "acc enter data"/"acc exit data" pragmas.
-     Unlike mapped_data in the goacc_thread struct, unmapping can
-     happen out-of-order with respect to mapping.  */
-  /* This is guarded by the lock in the "outer" struct gomp_device_descr.  */
-  struct target_mem_desc *data_environ;
-
   /* Execute.  */
   __typeof (GOMP_OFFLOAD_openacc_exec) *exec_func;
 
@@ -1060,13 +1070,15 @@ struct gomp_device_descr
 enum gomp_map_vars_kind
 {
   GOMP_MAP_VARS_OPENACC,
+  GOMP_MAP_VARS_OPENACC_ENTER_DATA,
   GOMP_MAP_VARS_TARGET,
   GOMP_MAP_VARS_DATA,
   GOMP_MAP_VARS_ENTER_DATA
 };
 
-extern void gomp_acc_insert_pointer (size_t, void **, size_t *, void *, int);
-extern void gomp_acc_remove_pointer (void *, size_t, bool, int, int, int);
+extern void gomp_acc_remove_pointer (struct gomp_device_descr *, void **,
+                                    size_t *, unsigned short *, int, bool,
+                                    int);
 extern void gomp_acc_declare_allocate (bool, size_t, void **, size_t *,
                                       unsigned short *);
 struct gomp_coalesce_buf;
@@ -1076,6 +1088,14 @@ extern void gomp_copy_host2dev (struct gomp_device_descr *,
 extern void gomp_copy_dev2host (struct gomp_device_descr *,
                                struct goacc_asyncqueue *, void *, const void *,
                                size_t);
+extern uintptr_t gomp_map_val (struct target_mem_desc *, void **, size_t);
+extern void gomp_attach_pointer (struct gomp_device_descr *,
+                                struct goacc_asyncqueue *, splay_tree,
+                                splay_tree_key, uintptr_t, size_t,
+                                struct gomp_coalesce_buf *);
+extern void gomp_detach_pointer (struct gomp_device_descr *,
+                                struct goacc_asyncqueue *, splay_tree_key,
+                                uintptr_t, bool, struct gomp_coalesce_buf *);
 
 extern struct target_mem_desc *gomp_map_vars (struct gomp_device_descr *,
                                              size_t, void **, void **,
@@ -1092,10 +1112,11 @@ extern void gomp_unmap_vars_async (struct target_mem_desc *, bool,
                                   struct goacc_asyncqueue *);
 extern void gomp_init_device (struct gomp_device_descr *);
 extern bool gomp_fini_device (struct gomp_device_descr *);
-extern void gomp_free_memmap (struct splay_tree_s *);
 extern void gomp_unload_device (struct gomp_device_descr *);
 extern bool gomp_remove_var (struct gomp_device_descr *, splay_tree_key);
 extern bool gomp_offload_target_available_p (int);
+extern void gomp_remove_var_async (struct gomp_device_descr *, splay_tree_key,
+                                  struct goacc_asyncqueue *);
 
 /* work.c */
 
index b633df43852939947f28eee546bb3fd89e3d1829..f662bc864d657ec28f4e785db570118aee64532f 100644 (file)
@@ -476,6 +476,16 @@ OACC_2.5 {
        acc_update_self_async_array_h_;
 } OACC_2.0.1;
 
+OACC_2.6 {
+  global:
+       acc_attach;
+       acc_attach_async;
+       acc_detach;
+       acc_detach_async;
+       acc_detach_finalize;
+       acc_detach_finalize_async;
+} OACC_2.5;
+
 GOACC_2.0 {
   global:
        GOACC_data_end;
index 00484b9f6ed9c58b704fcf0f51ad4e41ae5f80cb..78de88e84942191529fc27f7c2fff7294bf61429 100644 (file)
@@ -265,8 +265,6 @@ static struct gomp_device_descr host_dispatch =
     .state = GOMP_DEVICE_UNINITIALIZED,
 
     .openacc = {
-      .data_environ = NULL,
-
       .exec_func = host_openacc_exec,
 
       .create_thread_data_func = host_openacc_create_thread_data,
index 77db0653a1ad36c8d6065f127332a45ed56ccf8d..c92f9395e49496f5497ad285a77b6072257fd455 100644 (file)
@@ -302,9 +302,13 @@ acc_shutdown_1 (acc_device_t d)
 
       if (walk->dev)
        {
-         gomp_mutex_lock (&walk->dev->lock);
-         gomp_free_memmap (&walk->dev->mem_map);
-         gomp_mutex_unlock (&walk->dev->lock);
+         while (walk->dev->mem_map.root)
+           {
+             splay_tree_key k = &walk->dev->mem_map.root->key;
+             if (k->virtual_refcount == VREFCOUNT_LINK_KEY)
+               k->u.link_key = NULL;
+             gomp_remove_var (walk->dev, k);
+           }
 
          walk->dev = NULL;
          walk->base_dev = NULL;
index 03df0d4fbf63c2cc18385cb818dd2cb044236bff..06801070d6e4dc60edbd57bbd06576a1a5750f7e 100644 (file)
@@ -52,6 +52,25 @@ lookup_host (struct gomp_device_descr *dev, void *h, size_t s)
   return key;
 }
 
+/* Helper for lookup_dev.  Iterate over splay tree.  */
+
+static splay_tree_key
+lookup_dev_1 (splay_tree_node node, uintptr_t d, size_t s)
+{
+  splay_tree_key k = &node->key;
+  struct target_mem_desc *t = k->tgt;
+
+  if (d >= t->tgt_start && d + s <= t->tgt_end)
+    return k;
+
+  if (node->left)
+    return lookup_dev_1 (node->left, d, s);
+  if (node->right)
+    return lookup_dev_1 (node->right, d, s);
+
+  return NULL;
+}
+
 /* Return block containing [D->S), or NULL if not contained.
    The list isn't ordered by device address, so we have to iterate
    over the whole array.  This is not expected to be a common
@@ -59,35 +78,12 @@ lookup_host (struct gomp_device_descr *dev, void *h, size_t s)
    remains locked on exit.  */
 
 static splay_tree_key
-lookup_dev (struct target_mem_desc *tgt, void *d, size_t s)
+lookup_dev (splay_tree mem_map, void *d, size_t s)
 {
-  int i;
-  struct target_mem_desc *t;
-
-  if (!tgt)
-    return NULL;
-
-  for (t = tgt; t != NULL; t = t->prev)
-    {
-      if (t->tgt_start <= (uintptr_t) d && t->tgt_end >= (uintptr_t) d + s)
-        break;
-    }
-
-  if (!t)
+  if (!mem_map || !mem_map->root)
     return NULL;
 
-  for (i = 0; i < t->list_count; i++)
-    {
-      void * offset;
-
-      splay_tree_key k = &t->array[i].key;
-      offset = d - t->tgt_start + k->tgt_offset;
-
-      if (k->host_start + offset <= (void *) k->host_end)
-        return k;
-    }
-
-  return NULL;
+  return lookup_dev_1 (mem_map->root, (uintptr_t) d, s);
 }
 
 /* OpenACC is silent on how memory exhaustion is indicated.  We return
@@ -136,7 +132,7 @@ acc_free (void *d)
   /* We don't have to call lazy open here, as the ptr value must have
      been returned by acc_malloc.  It's not permitted to pass NULL in
      (unless you got that null from acc_malloc).  */
-  if ((k = lookup_dev (acc_dev->openacc.data_environ, d, 1)))
+  if ((k = lookup_dev (&acc_dev->mem_map, d, 1)))
     {
       void *offset;
 
@@ -260,7 +256,7 @@ acc_hostptr (void *d)
 
   gomp_mutex_lock (&acc_dev->lock);
 
-  n = lookup_dev (acc_dev->openacc.data_environ, d, 1);
+  n = lookup_dev (&acc_dev->mem_map, d, 1);
 
   if (!n)
     {
@@ -348,7 +344,7 @@ acc_map_data (void *h, void *d, size_t s)
                      (int)s);
        }
 
-      if (lookup_dev (thr->dev->openacc.data_environ, d, s))
+      if (lookup_dev (&thr->dev->mem_map, d, s))
         {
          gomp_mutex_unlock (&acc_dev->lock);
          gomp_fatal ("device address [%p, +%d] is already mapped", (void *)d,
@@ -361,11 +357,6 @@ acc_map_data (void *h, void *d, size_t s)
                           &kinds, true, GOMP_MAP_VARS_OPENACC);
       tgt->list[0].key->refcount = REFCOUNT_INFINITY;
     }
-
-  gomp_mutex_lock (&acc_dev->lock);
-  tgt->prev = acc_dev->openacc.data_environ;
-  acc_dev->openacc.data_environ = tgt;
-  gomp_mutex_unlock (&acc_dev->lock);
 }
 
 void
@@ -373,6 +364,7 @@ acc_unmap_data (void *h)
 {
   struct goacc_thread *thr = goacc_thread ();
   struct gomp_device_descr *acc_dev = thr->dev;
+  struct splay_tree_key_s cur_node;
 
   /* No need to call lazy open, as the address must have been mapped.  */
 
@@ -380,12 +372,11 @@ acc_unmap_data (void *h)
   if (acc_dev->capabilities & GOMP_OFFLOAD_CAP_SHARED_MEM)
     return;
 
-  size_t host_size;
-
   gomp_mutex_lock (&acc_dev->lock);
 
-  splay_tree_key n = lookup_host (acc_dev, h, 1);
-  struct target_mem_desc *t;
+  cur_node.host_start = (uintptr_t) h;
+  cur_node.host_end = cur_node.host_start + 1;
+  splay_tree_key n = splay_tree_lookup (&acc_dev->mem_map, &cur_node);
 
   if (!n)
     {
@@ -393,46 +384,27 @@ acc_unmap_data (void *h)
       gomp_fatal ("%p is not a mapped block", (void *)h);
     }
 
-  host_size = n->host_end - n->host_start;
-
   if (n->host_start != (uintptr_t) h)
     {
+      size_t host_size = n->host_end - n->host_start;
       gomp_mutex_unlock (&acc_dev->lock);
       gomp_fatal ("[%p,%d] surrounds %p",
                  (void *) n->host_start, (int) host_size, (void *) h);
     }
 
-  /* Mark for removal.  */
-  n->refcount = 1;
+  splay_tree_remove (&acc_dev->mem_map, n);
 
-  t = n->tgt;
+  struct target_mem_desc *tgt = n->tgt;
 
-  if (t->refcount == 2)
+  if (tgt->refcount > 0)
+    tgt->refcount--;
+  else
     {
-      struct target_mem_desc *tp;
-
-      /* This is the last reference, so pull the descriptor off the
-         chain. This avoids gomp_unmap_vars via gomp_unmap_tgt from
-         freeing the device memory. */
-      t->tgt_end = 0;
-      t->to_free = 0;
-
-      for (tp = NULL, t = acc_dev->openacc.data_environ; t != NULL;
-          tp = t, t = t->prev)
-       if (n->tgt == t)
-         {
-           if (tp)
-             tp->prev = t->prev;
-           else
-             acc_dev->openacc.data_environ = t->prev;
-
-           break;
-         }
+      free (tgt->array);
+      free (tgt);
     }
 
   gomp_mutex_unlock (&acc_dev->lock);
-
-  gomp_unmap_vars (t, true);
 }
 
 #define FLAG_PRESENT (1 << 0)
@@ -476,11 +448,14 @@ present_create_copy (unsigned f, void *h, size_t s, int async)
          gomp_fatal ("[%p,+%d] not mapped", (void *)h, (int)s);
        }
 
+      assert (n->virtual_refcount != VREFCOUNT_LINK_KEY);
+
       if (n->refcount != REFCOUNT_INFINITY)
        {
          n->refcount++;
-         n->dynamic_refcount++;
+         n->virtual_refcount++;
        }
+
       gomp_mutex_unlock (&acc_dev->lock);
     }
   else if (!(f & FLAG_CREATE))
@@ -490,7 +465,6 @@ present_create_copy (unsigned f, void *h, size_t s, int async)
     }
   else
     {
-      struct target_mem_desc *tgt;
       size_t mapnum = 1;
       unsigned short kinds;
       void *hostaddrs = h;
@@ -504,17 +478,14 @@ present_create_copy (unsigned f, void *h, size_t s, int async)
 
       goacc_aq aq = get_goacc_asyncqueue (async);
 
-      tgt = gomp_map_vars_async (acc_dev, aq, mapnum, &hostaddrs, NULL, &s,
-                                &kinds, true, GOMP_MAP_VARS_OPENACC);
-      /* Initialize dynamic refcount.  */
-      tgt->list[0].key->dynamic_refcount = 1;
+      gomp_map_vars_async (acc_dev, aq, mapnum, &hostaddrs, NULL, &s, &kinds,
+                          true, GOMP_MAP_VARS_OPENACC_ENTER_DATA);
 
       gomp_mutex_lock (&acc_dev->lock);
-
-      d = tgt->to_free;
-      tgt->prev = acc_dev->openacc.data_environ;
-      acc_dev->openacc.data_environ = tgt;
-
+      n = lookup_host (acc_dev, h, s);
+      assert (n != NULL);
+      d = (void *) (n->tgt->tgt_start + n->tgt_offset + (uintptr_t) h
+                   - n->host_start);
       gomp_mutex_unlock (&acc_dev->lock);
     }
 
@@ -592,7 +563,6 @@ delete_copyout (unsigned f, void *h, size_t s, int async, const char *libfnname)
 {
   size_t host_size;
   splay_tree_key n;
-  void *d;
   struct goacc_thread *thr = goacc_thread ();
   struct gomp_device_descr *acc_dev = thr->dev;
 
@@ -612,8 +582,7 @@ delete_copyout (unsigned f, void *h, size_t s, int async, const char *libfnname)
       gomp_fatal ("[%p,%d] is not mapped", (void *)h, (int)s);
     }
 
-  d = (void *) (n->tgt->tgt_start + n->tgt_offset
-               + (uintptr_t) h - n->host_start);
+  assert (n->virtual_refcount != VREFCOUNT_LINK_KEY);
 
   host_size = n->host_end - n->host_start;
 
@@ -627,48 +596,34 @@ delete_copyout (unsigned f, void *h, size_t s, int async, const char *libfnname)
   if (n->refcount == REFCOUNT_INFINITY)
     {
       n->refcount = 0;
-      n->dynamic_refcount = 0;
-    }
-  if (n->refcount < n->dynamic_refcount)
-    {
-      gomp_mutex_unlock (&acc_dev->lock);
-      gomp_fatal ("Dynamic reference counting assert fail\n");
+      n->virtual_refcount = 0;
     }
 
   if (f & FLAG_FINALIZE)
     {
-      n->refcount -= n->dynamic_refcount;
-      n->dynamic_refcount = 0;
+      n->refcount -= n->virtual_refcount;
+      n->virtual_refcount = 0;
     }
-  else if (n->dynamic_refcount)
+
+  if (n->virtual_refcount > 0)
     {
-      n->dynamic_refcount--;
       n->refcount--;
+      n->virtual_refcount--;
     }
+  else if (n->refcount > 0)
+    n->refcount--;
 
   if (n->refcount == 0)
     {
-      if (n->tgt->refcount == 2)
-       {
-         struct target_mem_desc *tp, *t;
-         for (tp = NULL, t = acc_dev->openacc.data_environ; t != NULL;
-              tp = t, t = t->prev)
-           if (n->tgt == t)
-             {
-               if (tp)
-                 tp->prev = t->prev;
-               else
-                 acc_dev->openacc.data_environ = t->prev;
-               break;
-             }
-       }
+      goacc_aq aq = get_goacc_asyncqueue (async);
 
       if (f & FLAG_COPYOUT)
-       {
-         goacc_aq aq = get_goacc_asyncqueue (async);
+        {
+         void *d = (void *) (n->tgt->tgt_start + n->tgt_offset
+                             + (uintptr_t) h - n->host_start);
          gomp_copy_dev2host (acc_dev, aq, h, d, s);
        }
-      gomp_remove_var (acc_dev, n);
+      gomp_remove_var_async (acc_dev, n, aq);
     }
 
   gomp_mutex_unlock (&acc_dev->lock);
@@ -785,140 +740,160 @@ acc_update_self_async (void *h, size_t s, int async)
 }
 
 void
-gomp_acc_insert_pointer (size_t mapnum, void **hostaddrs, size_t *sizes,
-                        void *kinds, int async)
+gomp_acc_remove_pointer (struct gomp_device_descr *acc_dev, void **hostaddrs,
+                        size_t *sizes, unsigned short *kinds, int async,
+                        bool finalize, int mapnum)
 {
-  struct target_mem_desc *tgt;
-  struct goacc_thread *thr = goacc_thread ();
-  struct gomp_device_descr *acc_dev = thr->dev;
+  struct splay_tree_key_s cur_node;
+  splay_tree_key n;
+
+  gomp_mutex_lock (&acc_dev->lock);
 
-  if (acc_is_present (*hostaddrs, *sizes))
+  for (int i = 0; i < mapnum; i++)
     {
-      splay_tree_key n;
-      gomp_mutex_lock (&acc_dev->lock);
-      n = lookup_host (acc_dev, *hostaddrs, *sizes);
-      gomp_mutex_unlock (&acc_dev->lock);
+      int kind = kinds[i] & 0xff;
+      bool copyfrom = false;
 
-      tgt = n->tgt;
-      for (size_t i = 0; i < tgt->list_count; i++)
-       if (tgt->list[i].key == n)
-         {
-           for (size_t j = 0; j < mapnum; j++)
-             if (i + j < tgt->list_count && tgt->list[i + j].key)
-               {
-                 tgt->list[i + j].key->refcount++;
-                 tgt->list[i + j].key->dynamic_refcount++;
-               }
-           return;
-         }
-      /* Should not reach here.  */
-      gomp_fatal ("Dynamic refcount incrementing failed for pointer/pset");
-    }
+      switch (kind)
+        {
+       case GOMP_MAP_FROM:
+       case GOMP_MAP_FORCE_FROM:
+       case GOMP_MAP_ALWAYS_FROM:
+         copyfrom = true;
+         /* Fallthrough.  */
+
+       case GOMP_MAP_TO_PSET:
+       case GOMP_MAP_POINTER:
+       case GOMP_MAP_DELETE:
+       case GOMP_MAP_RELEASE:
+       case GOMP_MAP_DETACH:
+       case GOMP_MAP_FORCE_DETACH:
+         cur_node.host_start = (uintptr_t) hostaddrs[i];
+         cur_node.host_end = cur_node.host_start
+                             + ((kind == GOMP_MAP_DETACH
+                                 || kind == GOMP_MAP_FORCE_DETACH
+                                 || kind == GOMP_MAP_POINTER)
+                                ? sizeof (void *) : sizes[i]);
+         n = splay_tree_lookup (&acc_dev->mem_map, &cur_node);
+
+         if (n == NULL)
+           continue;
+
+         assert (n->virtual_refcount != VREFCOUNT_LINK_KEY);
+
+         if (n->refcount == REFCOUNT_INFINITY)
+           {
+             n->refcount = 1;
+             n->virtual_refcount = 0;
+           }
 
-  gomp_debug (0, "  %s: prepare mappings\n", __FUNCTION__);
-  goacc_aq aq = get_goacc_asyncqueue (async);
-  tgt = gomp_map_vars_async (acc_dev, aq, mapnum, hostaddrs,
-                            NULL, sizes, kinds, true, GOMP_MAP_VARS_OPENACC);
-  gomp_debug (0, "  %s: mappings prepared\n", __FUNCTION__);
+         if (finalize)
+           {
+             n->refcount -= n->virtual_refcount;
+             n->virtual_refcount = 0;
+           }
+
+         if (n->virtual_refcount > 0)
+           {
+             n->refcount--;
+             n->virtual_refcount--;
+           }
+         else if (n->refcount > 0)
+           n->refcount--;
 
-  /* Initialize dynamic refcount.  */
-  tgt->list[0].key->dynamic_refcount = 1;
+         if (copyfrom)
+           gomp_copy_dev2host (acc_dev, NULL, (void *) cur_node.host_start,
+                               (void *) (n->tgt->tgt_start + n->tgt_offset
+                                         + cur_node.host_start
+                                         - n->host_start),
+                               cur_node.host_end - cur_node.host_start);
+
+         if (n->refcount == 0)
+           gomp_remove_var (acc_dev, n);
+         break;
+
+       default:
+         gomp_mutex_unlock (&acc_dev->lock);
+         gomp_fatal ("gomp_acc_remove_pointer unhandled kind 0x%.2x",
+                     kind);
+       }
+    }
 
-  gomp_mutex_lock (&acc_dev->lock);
-  tgt->prev = acc_dev->openacc.data_environ;
-  acc_dev->openacc.data_environ = tgt;
   gomp_mutex_unlock (&acc_dev->lock);
 }
 
 void
-gomp_acc_remove_pointer (void *h, size_t s, bool force_copyfrom, int async,
-                        int finalize, int mapnum)
+acc_attach_async (void **hostaddr, int async)
 {
   struct goacc_thread *thr = goacc_thread ();
   struct gomp_device_descr *acc_dev = thr->dev;
+  goacc_aq aq = get_goacc_asyncqueue (async);
+
+  struct splay_tree_key_s cur_node;
   splay_tree_key n;
-  struct target_mem_desc *t;
-  int minrefs = (mapnum == 1) ? 2 : 3;
 
-  if (!acc_is_present (h, s))
+  if (thr->dev->capabilities & GOMP_OFFLOAD_CAP_SHARED_MEM)
     return;
 
-  gomp_mutex_lock (&acc_dev->lock);
+  cur_node.host_start = (uintptr_t) hostaddr;
+  cur_node.host_end = cur_node.host_start + sizeof (void *);
+  n = splay_tree_lookup (&acc_dev->mem_map, &cur_node);
 
-  n = lookup_host (acc_dev, h, 1);
+  if (n == NULL)
+    gomp_fatal ("struct not mapped for acc_attach");
 
-  if (!n)
-    {
-      gomp_mutex_unlock (&acc_dev->lock);
-      gomp_fatal ("%p is not a mapped block", (void *)h);
-    }
+  gomp_attach_pointer (acc_dev, aq, &acc_dev->mem_map, n, (uintptr_t) hostaddr,
+                      0, NULL);
+}
 
-  gomp_debug (0, "  %s: restore mappings\n", __FUNCTION__);
+void
+acc_attach (void **hostaddr)
+{
+  acc_attach_async (hostaddr, acc_async_sync);
+}
 
-  t = n->tgt;
+static void
+goacc_detach_internal (void **hostaddr, int async, bool finalize)
+{
+  struct goacc_thread *thr = goacc_thread ();
+  struct gomp_device_descr *acc_dev = thr->dev;
+  struct splay_tree_key_s cur_node;
+  splay_tree_key n;
+  struct goacc_asyncqueue *aq = get_goacc_asyncqueue (async);
 
-  if (n->refcount < n->dynamic_refcount)
-    {
-      gomp_mutex_unlock (&acc_dev->lock);
-      gomp_fatal ("Dynamic reference counting assert fail\n");
-    }
+  if (thr->dev->capabilities & GOMP_OFFLOAD_CAP_SHARED_MEM)
+    return;
 
-  if (finalize)
-    {
-      n->refcount -= n->dynamic_refcount;
-      n->dynamic_refcount = 0;
-    }
-  else if (n->dynamic_refcount)
-    {
-      n->dynamic_refcount--;
-      n->refcount--;
-    }
+  cur_node.host_start = (uintptr_t) hostaddr;
+  cur_node.host_end = cur_node.host_start + sizeof (void *);
+  n = splay_tree_lookup (&acc_dev->mem_map, &cur_node);
 
-  gomp_mutex_unlock (&acc_dev->lock);
+  if (n == NULL)
+    gomp_fatal ("struct not mapped for acc_detach");
 
-  if (n->refcount == 0)
-    {
-      if (t->refcount == minrefs)
-       {
-         /* This is the last reference, so pull the descriptor off the
-            chain. This prevents gomp_unmap_vars via gomp_unmap_tgt from
-            freeing the device memory. */
-         struct target_mem_desc *tp;
-         for (tp = NULL, t = acc_dev->openacc.data_environ; t != NULL;
-              tp = t, t = t->prev)
-           {
-             if (n->tgt == t)
-               {
-                 if (tp)
-                   tp->prev = t->prev;
-                 else
-                   acc_dev->openacc.data_environ = t->prev;
-                 break;
-               }
-           }
-       }
+  gomp_detach_pointer (acc_dev, aq, n, (uintptr_t) hostaddr, finalize, NULL);
+}
 
-      /* Set refcount to 1 to allow gomp_unmap_vars to unmap it.  */
-      n->refcount = 1;
-      t->refcount = minrefs;
-      for (size_t i = 0; i < t->list_count; i++)
-       if (t->list[i].key == n)
-         {
-           t->list[i].copy_from = force_copyfrom ? 1 : 0;
-           break;
-         }
-
-      /* If running synchronously, unmap immediately.  */
-      if (async < acc_async_noval)
-       gomp_unmap_vars (t, true);
-      else
-       {
-         goacc_aq aq = get_goacc_asyncqueue (async);
-         gomp_unmap_vars_async (t, true, aq);
-       }
-    }
+void
+acc_detach (void **hostaddr)
+{
+  goacc_detach_internal (hostaddr, acc_async_sync, false);
+}
 
-  gomp_mutex_unlock (&acc_dev->lock);
+void
+acc_detach_async (void **hostaddr, int async)
+{
+  goacc_detach_internal (hostaddr, async, false);
+}
 
-  gomp_debug (0, "  %s: mappings restored\n", __FUNCTION__);
+void
+acc_detach_finalize (void **hostaddr)
+{
+  goacc_detach_internal (hostaddr, acc_async_sync, true);
+}
+
+void
+acc_detach_finalize_async (void **hostaddr, int async)
+{
+  goacc_detach_internal (hostaddr, async, true);
 }
index dc2984cb40f5040df81871397a5d42ef33f880c0..bd810e3d0862d3aaa08f55359adbded7ca4d588a 100644 (file)
@@ -57,12 +57,32 @@ find_pointer (int pos, size_t mapnum, unsigned short *kinds)
   if (pos + 1 >= mapnum)
     return 0;
 
-  unsigned char kind = kinds[pos+1] & 0xff;
+  unsigned char kind0 = kinds[pos] & 0xff;
 
-  if (kind == GOMP_MAP_TO_PSET)
-    return 3;
-  else if (kind == GOMP_MAP_POINTER)
-    return 2;
+  switch (kind0)
+    {
+    case GOMP_MAP_TO:
+    case GOMP_MAP_FORCE_TO:
+    case GOMP_MAP_FROM:
+    case GOMP_MAP_FORCE_FROM:
+    case GOMP_MAP_TOFROM:
+    case GOMP_MAP_FORCE_TOFROM:
+    case GOMP_MAP_ALLOC:
+    case GOMP_MAP_RELEASE:
+      {
+       unsigned char kind1 = kinds[pos + 1] & 0xff;
+       if (kind1 == GOMP_MAP_POINTER
+           || kind1 == GOMP_MAP_ALWAYS_POINTER
+           || kind1 == GOMP_MAP_ATTACH
+           || kind1 == GOMP_MAP_DETACH
+           || kind1 == GOMP_MAP_FORCE_DETACH)
+         return 2;
+       else if (kind1 == GOMP_MAP_TO_PSET)
+         return 3;
+      }
+    default:
+      /* empty.  */;
+    }
 
   return 0;
 }
@@ -240,9 +260,8 @@ GOACC_parallel_keyed (int flags_m, void (*fn) (void *),
   
   devaddrs = gomp_alloca (sizeof (void *) * mapnum);
   for (i = 0; i < mapnum; i++)
-    devaddrs[i] = (void *) (tgt->list[i].key->tgt->tgt_start
-                           + tgt->list[i].key->tgt_offset
-                           + tgt->list[i].offset);
+    devaddrs[i] = (void *) gomp_map_val (tgt, hostaddrs, i);
+
   if (aq == NULL)
     {
       acc_dev->openacc.exec_func (tgt_fn, mapnum, hostaddrs, devaddrs,
@@ -361,6 +380,10 @@ GOACC_enter_exit_data (int flags_m, size_t mapnum,
   if (mapnum > 0)
     {
       unsigned char kind = kinds[0] & 0xff;
+
+      if (kind == GOMP_MAP_STRUCT || kind == GOMP_MAP_FORCE_PRESENT)
+        kind = kinds[1] & 0xff;
+
       if (kind == GOMP_MAP_DELETE
          || kind == GOMP_MAP_FORCE_FROM)
        finalize = true;
@@ -371,11 +394,14 @@ GOACC_enter_exit_data (int flags_m, size_t mapnum,
     {
       unsigned char kind = kinds[i] & 0xff;
 
-      if (kind == GOMP_MAP_POINTER || kind == GOMP_MAP_TO_PSET)
+      if (kind == GOMP_MAP_POINTER
+         || kind == GOMP_MAP_TO_PSET
+         || kind == GOMP_MAP_STRUCT
+         || kind == GOMP_MAP_FORCE_PRESENT)
        continue;
 
       if (kind == GOMP_MAP_FORCE_ALLOC
-         || kind == GOMP_MAP_FORCE_PRESENT
+         || kind == GOMP_MAP_ATTACH
          || kind == GOMP_MAP_FORCE_TO
          || kind == GOMP_MAP_TO
          || kind == GOMP_MAP_ALLOC)
@@ -386,6 +412,8 @@ GOACC_enter_exit_data (int flags_m, size_t mapnum,
 
       if (kind == GOMP_MAP_RELEASE
          || kind == GOMP_MAP_DELETE
+         || kind == GOMP_MAP_DETACH
+         || kind == GOMP_MAP_FORCE_DETACH
          || kind == GOMP_MAP_FROM
          || kind == GOMP_MAP_FORCE_FROM)
        break;
@@ -424,6 +452,19 @@ GOACC_enter_exit_data (int flags_m, size_t mapnum,
                case GOMP_MAP_FORCE_TO:
                  acc_copyin_async (hostaddrs[i], sizes[i], async);
                  break;
+               case GOMP_MAP_STRUCT:
+                 {
+                   int elems = sizes[i];
+                   goacc_aq aq = get_goacc_asyncqueue (async);
+                   gomp_map_vars_async (acc_dev, aq, elems + 1, &hostaddrs[i],
+                                        NULL, &sizes[i], &kinds[i], true,
+                                        GOMP_MAP_VARS_OPENACC_ENTER_DATA);
+                   i += elems;
+                 }
+                 break;
+               case GOMP_MAP_ATTACH:
+               case GOMP_MAP_FORCE_PRESENT:
+                 break;
                default:
                  gomp_fatal (">>>> GOACC_enter_exit_data UNHANDLED kind 0x%.2x",
                              kind);
@@ -432,8 +473,14 @@ GOACC_enter_exit_data (int flags_m, size_t mapnum,
            }
          else
            {
-             gomp_acc_insert_pointer (pointer, &hostaddrs[i],
-                                      &sizes[i], &kinds[i], async);
+             goacc_aq aq = get_goacc_asyncqueue (async);
+             for (int j = 0; j < 2; j++)
+               gomp_map_vars_async (acc_dev, aq,
+                                    (j == 0 || pointer == 2) ? 1 : 2,
+                                    &hostaddrs[i + j], NULL,
+                                    &sizes[i + j], &kinds[i + j], true,
+                                    GOMP_MAP_VARS_OPENACC_ENTER_DATA);
+
              /* Increment 'i' by two because OpenACC requires fortran
                 arrays to be contiguous, so each PSET is associated with
                 one of MAP_FORCE_ALLOC/MAP_FORCE_PRESET/MAP_FORCE_TO, and
@@ -441,51 +488,140 @@ GOACC_enter_exit_data (int flags_m, size_t mapnum,
              i += pointer - 1;
            }
        }
+
+      /* This loop only handles explicit "attach" clauses that are not an
+        implicit part of a copy{,in,out}, etc. mapping.  */
+      for (i = 0; i < mapnum; i++)
+        {
+         unsigned char kind = kinds[i] & 0xff;
+
+         /* Scan for pointers and PSETs.  */
+         int pointer = find_pointer (i, mapnum, kinds);
+
+         if (!pointer)
+           {
+             if (kind == GOMP_MAP_ATTACH)
+               acc_attach (hostaddrs[i]);
+             else if (kind == GOMP_MAP_STRUCT)
+               i += sizes[i];
+           }
+         else
+           i += pointer - 1;
+       }
     }
   else
-    for (i = 0; i < mapnum; ++i)
-      {
-       unsigned char kind = kinds[i] & 0xff;
+    {
+      /* Handle "detach" before copyback/deletion of mapped data.  */
+      for (i = 0; i < mapnum; i++)
+        {
+         unsigned char kind = kinds[i] & 0xff;
 
-       int pointer = find_pointer (i, mapnum, kinds);
+         int pointer = find_pointer (i, mapnum, kinds);
 
-       if (!pointer)
-         {
-           switch (kind)
-             {
-             case GOMP_MAP_RELEASE:
-             case GOMP_MAP_DELETE:
-               if (acc_is_present (hostaddrs[i], sizes[i]))
+         if (!pointer)
+           {
+             if (kind == GOMP_MAP_DETACH)
+               acc_detach (hostaddrs[i]);
+             else if (kind == GOMP_MAP_FORCE_DETACH)
+               acc_detach_finalize (hostaddrs[i]);
+             else if (kind == GOMP_MAP_STRUCT)
+               i += sizes[i];
+           }
+         else
+           {
+             unsigned char kind2 = kinds[i + pointer - 1] & 0xff;
+
+             if (kind2 == GOMP_MAP_DETACH)
+               acc_detach (hostaddrs[i + pointer - 1]);
+             else if (kind2 == GOMP_MAP_FORCE_DETACH)
+               acc_detach_finalize (hostaddrs[i + pointer - 1]);
+
+             i += pointer - 1;
+           }
+       }
+
+      for (i = 0; i < mapnum; ++i)
+       {
+         unsigned char kind = kinds[i] & 0xff;
+
+         int pointer = find_pointer (i, mapnum, kinds);
+
+         if (!pointer)
+           {
+             switch (kind)
+               {
+               case GOMP_MAP_RELEASE:
+               case GOMP_MAP_DELETE:
+                 if (acc_is_present (hostaddrs[i], sizes[i]))
+                   {
+                     if (finalize)
+                       acc_delete_finalize_async (hostaddrs[i], sizes[i],
+                                                  async);
+                     else
+                       acc_delete_async (hostaddrs[i], sizes[i], async);
+                   }
+                 break;
+               case GOMP_MAP_DETACH:
+               case GOMP_MAP_FORCE_DETACH:
+               case GOMP_MAP_FORCE_PRESENT:
+                 break;
+               case GOMP_MAP_FROM:
+               case GOMP_MAP_FORCE_FROM:
+                 if (finalize)
+                   acc_copyout_finalize_async (hostaddrs[i], sizes[i], async);
+                 else
+                   acc_copyout_async (hostaddrs[i], sizes[i], async);
+                 break;
+               case GOMP_MAP_STRUCT:
                  {
-                   if (finalize)
-                     acc_delete_finalize_async (hostaddrs[i], sizes[i], async);
-                   else
-                     acc_delete_async (hostaddrs[i], sizes[i], async);
+                   int elems = sizes[i];
+                   goacc_aq aq = get_goacc_asyncqueue (async);
+                   for (int j = 1; j <= elems; j++)
+                     {
+                       struct splay_tree_key_s k;
+                       k.host_start = (uintptr_t) hostaddrs[i + j];
+                       k.host_end = k.host_start + sizes[i + j];
+                       splay_tree_key str;
+                       gomp_mutex_lock (&acc_dev->lock);
+                       str = splay_tree_lookup (&acc_dev->mem_map, &k);
+                       gomp_mutex_unlock (&acc_dev->lock);
+                       if (str)
+                         {
+                           assert (str->virtual_refcount
+                                   != VREFCOUNT_LINK_KEY);
+                           if (finalize)
+                             {
+                               str->refcount -= str->virtual_refcount;
+                               str->virtual_refcount = 0;
+                             }
+                           if (str->virtual_refcount > 0)
+                             {
+                               str->refcount--;
+                               str->virtual_refcount--;
+                             }
+                           else if (str->refcount > 0)
+                             str->refcount--;
+                           if (str->refcount == 0)
+                             gomp_remove_var_async (acc_dev, str, aq);
+                         }
+                     }
+                   i += elems;
                  }
-               break;
-             case GOMP_MAP_FROM:
-             case GOMP_MAP_FORCE_FROM:
-               if (finalize)
-                 acc_copyout_finalize_async (hostaddrs[i], sizes[i], async);
-               else
-                 acc_copyout_async (hostaddrs[i], sizes[i], async);
-               break;
-             default:
-               gomp_fatal (">>>> GOACC_enter_exit_data UNHANDLED kind 0x%.2x",
-                           kind);
-               break;
-             }
-         }
-       else
-         {
-           bool copyfrom = (kind == GOMP_MAP_FORCE_FROM
-                            || kind == GOMP_MAP_FROM);
-           gomp_acc_remove_pointer (hostaddrs[i], sizes[i], copyfrom, async,
-                                    finalize, pointer);
-           /* See the above comment.  */
-           i += pointer - 1;
-         }
-      }
+                 break;
+               default:
+                 gomp_fatal (">>>> GOACC_enter_exit_data UNHANDLED kind 0x%.2x",
+                             kind);
+                 break;
+               }
+           }
+         else
+           {
+             gomp_acc_remove_pointer (acc_dev, &hostaddrs[i], &sizes[i],
+                                      &kinds[i], async, finalize, pointer);
+             i += pointer - 1;
+           }
+       }
+    }
 }
 
 static void
index fa5b3ae5dbccc53130fe0511cb0d167a1f8db67a..8af3478f36665c6001bf68f918e4ec139983df58 100644 (file)
@@ -110,12 +110,18 @@ void *acc_hostptr (void *) __GOACC_NOTHROW;
 int acc_is_present (void *, size_t) __GOACC_NOTHROW;
 void acc_memcpy_to_device (void *, void *, size_t) __GOACC_NOTHROW;
 void acc_memcpy_from_device (void *, void *, size_t) __GOACC_NOTHROW;
+void acc_attach (void **) __GOACC_NOTHROW;
+void acc_attach_async (void **, int) __GOACC_NOTHROW;
+void acc_detach (void **) __GOACC_NOTHROW;
+void acc_detach_async (void **, int) __GOACC_NOTHROW;
 
 /* Finalize versions of copyout/delete functions, specified in OpenACC 2.5.  */
 void acc_copyout_finalize (void *, size_t) __GOACC_NOTHROW;
 void acc_copyout_finalize_async (void *, size_t, int) __GOACC_NOTHROW;
 void acc_delete_finalize (void *, size_t) __GOACC_NOTHROW;
 void acc_delete_finalize_async (void *, size_t, int) __GOACC_NOTHROW;
+void acc_detach_finalize (void **) __GOACC_NOTHROW;
+void acc_detach_finalize_async (void **, int) __GOACC_NOTHROW;
 
 /* Async functions, specified in OpenACC 2.5.  */
 void acc_copyin_async (void *, size_t, int) __GOACC_NOTHROW;
index a97af02ebfef7c50792e1e1e14b38e0bb6be2d2e..7e3889db0182f2a3757fb7dacd02806ae693cac3 100644 (file)
@@ -372,6 +372,7 @@ gomp_map_vars_existing (struct gomp_device_descr *devicep,
   tgt_var->key = oldn;
   tgt_var->copy_from = GOMP_MAP_COPY_FROM_P (kind);
   tgt_var->always_copy_from = GOMP_MAP_ALWAYS_FROM_P (kind);
+  tgt_var->do_detach = kind == GOMP_MAP_ATTACH;
   tgt_var->offset = newn->host_start - oldn->host_start;
   tgt_var->length = newn->host_end - newn->host_start;
 
@@ -505,7 +506,136 @@ gomp_map_fields_existing (struct target_mem_desc *tgt,
              (void *) cur_node.host_end);
 }
 
-static inline uintptr_t
+void
+gomp_attach_pointer (struct gomp_device_descr *devicep,
+                    struct goacc_asyncqueue *aq, splay_tree mem_map,
+                    splay_tree_key n, uintptr_t attach_to, size_t bias,
+                    struct gomp_coalesce_buf *cbufp)
+{
+  struct splay_tree_key_s s;
+  size_t size, idx;
+
+  if (n == NULL)
+    {
+      gomp_mutex_unlock (&devicep->lock);
+      gomp_fatal ("enclosing struct not mapped for attach");
+    }
+
+  size = (n->host_end - n->host_start + sizeof (void *) - 1) / sizeof (void *);
+  /* We might have a pointer in a packed struct: however we cannot have more
+     than one such pointer in each pointer-sized portion of the struct, so
+     this is safe.  */
+  idx = (attach_to - n->host_start) / sizeof (void *);
+
+  assert (n->virtual_refcount != VREFCOUNT_LINK_KEY);
+
+  if (!n->u.attach_count)
+    n->u.attach_count
+      = gomp_malloc_cleared (sizeof (*n->u.attach_count) * size);
+
+  if (n->u.attach_count[idx] < UINTPTR_MAX)
+    n->u.attach_count[idx]++;
+  else
+    {
+      gomp_mutex_unlock (&devicep->lock);
+      gomp_fatal ("attach count overflow");
+    }
+
+  if (n->u.attach_count[idx] == 1)
+    {
+      uintptr_t devptr = n->tgt->tgt_start + n->tgt_offset + attach_to
+                        - n->host_start;
+      uintptr_t target = (uintptr_t) *(void **) attach_to;
+      splay_tree_key tn;
+      uintptr_t data;
+
+      if ((void *) target == NULL)
+       {
+         gomp_mutex_unlock (&devicep->lock);
+         gomp_fatal ("attempt to attach null pointer");
+       }
+
+      s.host_start = target + bias;
+      s.host_end = s.host_start + 1;
+      tn = splay_tree_lookup (mem_map, &s);
+
+      if (!tn)
+       {
+         gomp_mutex_unlock (&devicep->lock);
+         gomp_fatal ("pointer target not mapped for attach");
+       }
+
+      data = tn->tgt->tgt_start + tn->tgt_offset + target - tn->host_start;
+
+      gomp_debug (1,
+                 "%s: attaching host %p, target %p (struct base %p) to %p\n",
+                 __FUNCTION__, (void *) attach_to, (void *) devptr,
+                 (void *) (n->tgt->tgt_start + n->tgt_offset), (void *) data);
+
+      gomp_copy_host2dev (devicep, aq, (void *) devptr, (void *) &data,
+                         sizeof (void *), cbufp);
+    }
+  else
+    gomp_debug (1, "%s: attach count for %p -> %u\n", __FUNCTION__,
+               (void *) attach_to, (int) n->u.attach_count[idx]);
+}
+
+void
+gomp_detach_pointer (struct gomp_device_descr *devicep,
+                    struct goacc_asyncqueue *aq, splay_tree_key n,
+                    uintptr_t detach_from, bool finalize,
+                    struct gomp_coalesce_buf *cbufp)
+{
+  size_t idx;
+
+  if (n == NULL)
+    {
+      gomp_mutex_unlock (&devicep->lock);
+      gomp_fatal ("enclosing struct not mapped for detach");
+    }
+
+  idx = (detach_from - n->host_start) / sizeof (void *);
+
+  assert (n->virtual_refcount != VREFCOUNT_LINK_KEY);
+
+  if (!n->u.attach_count)
+    {
+      gomp_mutex_unlock (&devicep->lock);
+      gomp_fatal ("no attachment counters for struct");
+    }
+
+  if (finalize)
+    n->u.attach_count[idx] = 1;
+
+  if (n->u.attach_count[idx] == 0)
+    {
+      gomp_mutex_unlock (&devicep->lock);
+      gomp_fatal ("attach count underflow");
+    }
+  else
+    n->u.attach_count[idx]--;
+
+  if (n->u.attach_count[idx] == 0)
+    {
+      uintptr_t devptr = n->tgt->tgt_start + n->tgt_offset + detach_from
+                        - n->host_start;
+      uintptr_t target = (uintptr_t) *(void **) detach_from;
+
+      gomp_debug (1,
+                 "%s: detaching host %p, target %p (struct base %p) to %p\n",
+                 __FUNCTION__, (void *) detach_from, (void *) devptr,
+                 (void *) (n->tgt->tgt_start + n->tgt_offset),
+                 (void *) target);
+
+      gomp_copy_host2dev (devicep, aq, (void *) devptr, (void *) &target,
+                         sizeof (void *), cbufp);
+    }
+  else
+    gomp_debug (1, "%s: attach count for %p -> %u\n", __FUNCTION__,
+               (void *) detach_from, (int) n->u.attach_count[idx]);
+}
+
+uintptr_t
 gomp_map_val (struct target_mem_desc *tgt, void **hostaddrs, size_t i)
 {
   if (tgt->list[i].key != NULL)
@@ -549,7 +679,8 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
   struct target_mem_desc *tgt
     = gomp_malloc (sizeof (*tgt) + sizeof (tgt->list[0]) * mapnum);
   tgt->list_count = mapnum;
-  tgt->refcount = pragma_kind == GOMP_MAP_VARS_ENTER_DATA ? 0 : 1;
+  tgt->refcount = (pragma_kind == GOMP_MAP_VARS_ENTER_DATA
+                  || pragma_kind == GOMP_MAP_VARS_OPENACC_ENTER_DATA) ? 0 : 1;
   tgt->device_descr = devicep;
   struct gomp_coalesce_buf cbuf, *cbufp = NULL;
 
@@ -664,8 +795,15 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
          has_firstprivate = true;
          continue;
        }
+      else if ((kind & typemask) == GOMP_MAP_ATTACH)
+       {
+         tgt->list[i].key = NULL;
+         has_firstprivate = true;
+         continue;
+       }
       cur_node.host_start = (uintptr_t) hostaddrs[i];
-      if (!GOMP_MAP_POINTER_P (kind & typemask))
+      if (!GOMP_MAP_POINTER_P (kind & typemask)
+          && (kind & typemask) != GOMP_MAP_ATTACH)
        cur_node.host_end = cur_node.host_start + sizes[i];
       else
        cur_node.host_end = cur_node.host_start + sizeof (void *);
@@ -872,6 +1010,32 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
                cur_node.tgt_offset = n->tgt->tgt_start + n->tgt_offset
                                      + cur_node.host_start - n->host_start;
                continue;
+             case GOMP_MAP_ATTACH:
+               {
+                 cur_node.host_start = (uintptr_t) hostaddrs[i];
+                 cur_node.host_end = cur_node.host_start + sizeof (void *);
+                 splay_tree_key n = splay_tree_lookup (mem_map, &cur_node);
+                 if (n != NULL)
+                   {
+                     tgt->list[i].key = n;
+                     tgt->list[i].offset = cur_node.host_start - n->host_start;
+                     tgt->list[i].length = n->host_end - n->host_start;
+                     tgt->list[i].copy_from = false;
+                     tgt->list[i].always_copy_from = false;
+                     tgt->list[i].do_detach
+                       = (pragma_kind != GOMP_MAP_VARS_OPENACC_ENTER_DATA);
+                     n->refcount++;
+                   }
+                 else
+                   {
+                     gomp_mutex_unlock (&devicep->lock);
+                     gomp_fatal ("outer struct not mapped for attach");
+                   }
+                 gomp_attach_pointer (devicep, aq, mem_map, n,
+                                      (uintptr_t) hostaddrs[i], sizes[i],
+                                      cbufp);
+                 continue;
+               }
              default:
                break;
              }
@@ -889,13 +1053,15 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
                                      kind & typemask, cbufp);
            else
              {
-               k->link_key = NULL;
+               if (k->virtual_refcount == VREFCOUNT_LINK_KEY)
+                 k->u.link_key = NULL;
                if (n && n->refcount == REFCOUNT_LINK)
                  {
                    /* Replace target address of the pointer with target address
                       of mapped object in the splay tree.  */
                    splay_tree_remove (mem_map, n);
-                   k->link_key = n;
+                   k->u.link_key = n;
+                   k->virtual_refcount = VREFCOUNT_LINK_KEY;
                  }
                size_t align = (size_t) 1 << (kind >> rshift);
                tgt->list[i].key = k;
@@ -916,10 +1082,12 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
                tgt->list[i].copy_from = GOMP_MAP_COPY_FROM_P (kind & typemask);
                tgt->list[i].always_copy_from
                  = GOMP_MAP_ALWAYS_FROM_P (kind & typemask);
+               tgt->list[i].do_detach = false;
                tgt->list[i].offset = 0;
                tgt->list[i].length = k->host_end - k->host_start;
                k->refcount = 1;
-               k->dynamic_refcount = 0;
+               k->virtual_refcount = 0;
+               k->u.attach_count = NULL;
                tgt->refcount++;
                array->left = NULL;
                array->right = NULL;
@@ -970,6 +1138,7 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
                          tgt->list[j].key = k;
                          tgt->list[j].copy_from = false;
                          tgt->list[j].always_copy_from = false;
+                         tgt->list[j].do_detach = false;
                          if (k->refcount != REFCOUNT_INFINITY)
                            k->refcount++;
                          gomp_map_pointer (tgt, aq,
@@ -1013,7 +1182,7 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
                                kind);
                  }
 
-               if (k->link_key)
+               if (k->virtual_refcount == VREFCOUNT_LINK_KEY && k->u.link_key)
                  {
                    /* Set link pointer on target to the device address of the
                       mapped object.  */
@@ -1057,8 +1226,20 @@ gomp_map_vars_internal (struct gomp_device_descr *devicep,
   /* If the variable from "omp target enter data" map-list was already mapped,
      tgt is not needed.  Otherwise tgt will be freed by gomp_unmap_vars or
      gomp_exit_data.  */
-  if (pragma_kind == GOMP_MAP_VARS_ENTER_DATA && tgt->refcount == 0)
-    {
+  if ((pragma_kind == GOMP_MAP_VARS_ENTER_DATA
+       || pragma_kind == GOMP_MAP_VARS_OPENACC_ENTER_DATA)
+      && tgt->refcount == 0)
+    {
+      /* If we're about to discard a target_mem_desc with no "structural"
+        references (tgt->refcount == 0), any splay keys linked in the tgt's
+        list must have their virtual refcount incremented to represent that
+        "lost" reference in order to implement the semantics of the OpenACC
+        "present increment" operation properly.  */
+      if (pragma_kind == GOMP_MAP_VARS_OPENACC_ENTER_DATA)
+       for (i = 0; i < tgt->list_count; i++)
+         if (tgt->list[i].key)
+           tgt->list[i].key->virtual_refcount++;
+
       free (tgt);
       tgt = NULL;
     }
@@ -1098,32 +1279,68 @@ gomp_unmap_tgt (struct target_mem_desc *tgt)
   free (tgt);
 }
 
-attribute_hidden bool
-gomp_remove_var (struct gomp_device_descr *devicep, splay_tree_key k)
+static bool
+gomp_unref_tgt (void *ptr)
 {
   bool is_tgt_unmapped = false;
-  splay_tree_remove (&devicep->mem_map, k);
-  if (k->link_key)
-    splay_tree_insert (&devicep->mem_map, (splay_tree_node) k->link_key);
-  if (k->tgt->refcount > 1)
-    k->tgt->refcount--;
+
+  struct target_mem_desc *tgt = (struct target_mem_desc *) ptr;
+
+  if (tgt->refcount > 1)
+    tgt->refcount--;
   else
     {
+      gomp_unmap_tgt (tgt);
       is_tgt_unmapped = true;
-      gomp_unmap_tgt (k->tgt);
     }
+
   return is_tgt_unmapped;
 }
 
 static void
-gomp_unref_tgt (void *ptr)
+gomp_unref_tgt_void (void *ptr)
 {
-  struct target_mem_desc *tgt = (struct target_mem_desc *) ptr;
+  (void) gomp_unref_tgt (ptr);
+}
 
-  if (tgt->refcount > 1)
-    tgt->refcount--;
+static inline __attribute__((always_inline)) bool
+gomp_remove_var_internal (struct gomp_device_descr *devicep, splay_tree_key k,
+                         struct goacc_asyncqueue *aq)
+{
+  bool is_tgt_unmapped = false;
+  splay_tree_remove (&devicep->mem_map, k);
+  if (k->virtual_refcount == VREFCOUNT_LINK_KEY)
+    {
+      if (k->u.link_key)
+       splay_tree_insert (&devicep->mem_map, (splay_tree_node) k->u.link_key);
+    }
+  else if (k->u.attach_count)
+    free (k->u.attach_count);
+  if (aq)
+    devicep->openacc.async.queue_callback_func (aq, gomp_unref_tgt_void,
+                                               (void *) k->tgt);
   else
-    gomp_unmap_tgt (tgt);
+    is_tgt_unmapped = gomp_unref_tgt ((void *) k->tgt);
+  return is_tgt_unmapped;
+}
+
+attribute_hidden bool
+gomp_remove_var (struct gomp_device_descr *devicep, splay_tree_key k)
+{
+  return gomp_remove_var_internal (devicep, k, NULL);
+}
+
+/* Remove a variable asynchronously.  This actually removes the variable
+   mapping immediately, but retains the linked target_mem_desc until the
+   asynchronous operation has completed (as it may still refer to target
+   memory).  The device lock must be held before entry, and remains locked on
+   exit.  */
+
+attribute_hidden void
+gomp_remove_var_async (struct gomp_device_descr *devicep, splay_tree_key k,
+                      struct goacc_asyncqueue *aq)
+{
+  (void) gomp_remove_var_internal (devicep, k, aq);
 }
 
 /* Unmap variables described by TGT.  If DO_COPYFROM is true, copy relevant
@@ -1152,6 +1369,18 @@ gomp_unmap_vars_internal (struct target_mem_desc *tgt, bool do_copyfrom,
     }
 
   size_t i;
+
+  /* We must perform detachments before any copies back to the host.  */
+  for (i = 0; i < tgt->list_count; i++)
+    {
+      splay_tree_key k = tgt->list[i].key;
+
+      if (k != NULL && tgt->list[i].do_detach)
+       gomp_detach_pointer (devicep, aq, k, tgt->list[i].key->host_start
+                                            + tgt->list[i].offset,
+                            k->refcount == 1, NULL);
+    }
+
   for (i = 0; i < tgt->list_count; i++)
     {
       splay_tree_key k = tgt->list[i].key;
@@ -1159,7 +1388,15 @@ gomp_unmap_vars_internal (struct target_mem_desc *tgt, bool do_copyfrom,
        continue;
 
       bool do_unmap = false;
-      if (k->refcount > 1 && k->refcount != REFCOUNT_INFINITY)
+      if (k->tgt == tgt
+         && k->virtual_refcount > 0
+         && k->virtual_refcount != VREFCOUNT_LINK_KEY
+         && k->refcount != REFCOUNT_INFINITY)
+       {
+         k->virtual_refcount--;
+         k->refcount--;
+       }
+      else if (k->refcount > 1 && k->refcount != REFCOUNT_INFINITY)
        k->refcount--;
       else if (k->refcount == 1)
        {
@@ -1179,7 +1416,7 @@ gomp_unmap_vars_internal (struct target_mem_desc *tgt, bool do_copyfrom,
     }
 
   if (aq)
-    devicep->openacc.async.queue_callback_func (aq, gomp_unref_tgt,
+    devicep->openacc.async.queue_callback_func (aq, gomp_unref_tgt_void,
                                                (void *) tgt);
   else
     gomp_unref_tgt ((void *) tgt);
@@ -1316,7 +1553,8 @@ gomp_load_image_to_device (struct gomp_device_descr *devicep, unsigned version,
       k->tgt = tgt;
       k->tgt_offset = target_table[i].start;
       k->refcount = REFCOUNT_INFINITY;
-      k->link_key = NULL;
+      k->virtual_refcount = 0;
+      k->u.attach_count = NULL;
       array->left = NULL;
       array->right = NULL;
       splay_tree_insert (&devicep->mem_map, array);
@@ -1348,7 +1586,8 @@ gomp_load_image_to_device (struct gomp_device_descr *devicep, unsigned version,
       k->tgt = tgt;
       k->tgt_offset = target_var->start;
       k->refcount = target_size & link_bit ? REFCOUNT_LINK : REFCOUNT_INFINITY;
-      k->link_key = NULL;
+      k->virtual_refcount = 0;
+      k->u.attach_count = NULL;
       array->left = NULL;
       array->right = NULL;
       splay_tree_insert (&devicep->mem_map, array);
@@ -1585,22 +1824,6 @@ gomp_unload_device (struct gomp_device_descr *devicep)
     }
 }
 
-/* Free address mapping tables.  MM must be locked on entry, and remains locked
-   on return.  */
-
-attribute_hidden void
-gomp_free_memmap (struct splay_tree_s *mem_map)
-{
-  while (mem_map->root)
-    {
-      struct target_mem_desc *tgt = mem_map->root->key.tgt;
-
-      splay_tree_remove (mem_map, &mem_map->root->key);
-      free (tgt->array);
-      free (tgt);
-    }
-}
-
 /* Do we have offload data available for the given offload target type?
    Instead of verifying that *all* offload data is available that could
    possibly be required, we instead just look for *any*.  If we later find any
@@ -2128,9 +2351,9 @@ gomp_exit_data (struct gomp_device_descr *devicep, size_t mapnum,
          if (k->refcount == 0)
            {
              splay_tree_remove (&devicep->mem_map, k);
-             if (k->link_key)
+             if (k->virtual_refcount == VREFCOUNT_LINK_KEY && k->u.link_key)
                splay_tree_insert (&devicep->mem_map,
-                                  (splay_tree_node) k->link_key);
+                                  (splay_tree_node) k->u.link_key);
              if (k->tgt->refcount > 1)
                k->tgt->refcount--;
              else
@@ -2667,6 +2890,8 @@ omp_target_associate_ptr (const void *host_ptr, const void *device_ptr,
       k->tgt = tgt;
       k->tgt_offset = (uintptr_t) device_ptr + device_offset;
       k->refcount = REFCOUNT_INFINITY;
+      k->virtual_refcount = 0;
+      k->u.link_key = NULL;
       array->left = NULL;
       array->right = NULL;
       splay_tree_insert (&devicep->mem_map, array);
@@ -3127,8 +3352,6 @@ gomp_target_init (void)
                current_device.type = current_device.get_type_func ();
                current_device.mem_map.root = NULL;
                current_device.state = GOMP_DEVICE_UNINITIALIZED;
-               current_device.openacc.data_environ = NULL;
-
                /* Augment DEVICES and NUM_DEVICES.  */
                devices = gomp_realloc (devices,
                                        ((num_devices + new_num_devices)
index 6a52f746dcb977a7165176b943ba600156a8d5ad..6bdcfe7d42924e7c66ae7ef5cddb77700cada34b 100644 (file)
@@ -182,13 +182,13 @@ main (int argc, char **argv)
         exit (EXIT_FAILURE);
     }
 
+    acc_delete (&h_X[0], N * sizeof (float));
+    acc_delete (&h_Y1[0], N * sizeof (float));
+
     free (h_X);
     free (h_Y1);
     free (h_Y2);
 
-    acc_free (d_X);
-    acc_free (d_Y);
-
     context_check (pctx);
 
     s = cublasDestroy (h);
index 71365e8ed32e84f7b3887de9d63fe8faa378db0b..b403a5cf5cb48d9096fe5fba249a6d0f0ce12f49 100644 (file)
@@ -176,13 +176,13 @@ main (int argc, char **argv)
         exit (EXIT_FAILURE);
     }
 
+    acc_delete (&h_X[0], N * sizeof (float));
+    acc_delete (&h_Y1[0], N * sizeof (float));
+
     free (h_X);
     free (h_Y1);
     free (h_Y2);
 
-    acc_free (d_X);
-    acc_free (d_Y);
-
     context_check (pctx);
 
     s = cublasDestroy (h);
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-1.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-1.c
new file mode 100644 (file)
index 0000000..d8d7067
--- /dev/null
@@ -0,0 +1,24 @@
+#include <stdlib.h>
+#include <assert.h>
+
+struct dc
+{
+  int a;
+  int *b;
+};
+
+int
+main ()
+{
+  int n = 100, i;
+  struct dc v = { .a = 3, .b = (int *) malloc (sizeof (int) * n) };
+
+#pragma acc parallel loop copy(v.a, v.b[:n])
+  for (i = 0; i < n; i++)
+    v.b[i] = v.a;
+
+  for (i = 0; i < 10; i++)
+    assert (v.b[i] == v.a);
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-2.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-2.c
new file mode 100644 (file)
index 0000000..7e26e9a
--- /dev/null
@@ -0,0 +1,29 @@
+#include <assert.h>
+#include <stdlib.h>
+
+int
+main(int argc, char* argv[])
+{
+  struct foo {
+    int *a, *b, c, d, *e;
+  } s;
+
+  s.a = (int *) malloc (16 * sizeof (int));
+  s.b = (int *) malloc (16 * sizeof (int));
+  s.e = (int *) malloc (16 * sizeof (int));
+
+  #pragma acc data copy(s)
+  {
+    #pragma acc data copy(s.a[0:10])
+    {
+      #pragma acc parallel loop attach(s.a)
+      for (int i = 0; i < 10; i++)
+       s.a[i] = i;
+    }
+  }
+
+  for (int i = 0; i < 10; i++)
+    assert (s.a[i] == i);
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-3.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-3.c
new file mode 100644 (file)
index 0000000..cec764b
--- /dev/null
@@ -0,0 +1,34 @@
+#include <assert.h>
+#include <stdlib.h>
+#include <openacc.h>
+
+int
+main ()
+{
+  int n = 100, i;
+  int *a = (int *) malloc (sizeof (int) * n);
+  int *b;
+
+  for (i = 0; i < n; i++)
+    a[i] = i+1;
+
+#pragma acc enter data copyin(a[:n]) create(b)
+
+  b = a;
+  acc_attach ((void **)&b);
+
+#pragma acc parallel loop present (b[:n])
+  for (i = 0; i < n; i++)
+    b[i] = i+1;
+
+  acc_detach ((void **)&b);
+
+#pragma acc exit data copyout(a[:n], b)
+
+  for (i = 0; i < 10; i++)
+    assert (a[i] == b[i]);
+
+  free (a);
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-4.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-4.c
new file mode 100644 (file)
index 0000000..8874ca0
--- /dev/null
@@ -0,0 +1,87 @@
+#include <assert.h>
+#include <stdlib.h>
+
+#define LIST_LENGTH 10
+
+struct node
+{
+  struct node *next;
+  int val;
+};
+
+int
+sum_nodes (struct node *head)
+{
+  int i = 0, sum = 0;
+
+#pragma acc parallel reduction(+:sum) present(head[:1])
+  {
+    for (; head != NULL; head = head->next)
+      sum += head->val;
+  }
+
+  return sum;
+}
+
+void
+insert (struct node *head, int val)
+{
+  struct node *n = (struct node *) malloc (sizeof (struct node));
+
+  if (head->next)
+    {
+#pragma acc exit data detach(head->next)
+    }
+
+  n->val = val;
+  n->next = head->next;
+  head->next = n;
+
+#pragma acc enter data copyin(n[:1])
+#pragma acc enter data attach(head->next)
+  if (n->next)
+    {
+#pragma acc enter data attach(n->next)
+    }
+}
+
+void
+destroy (struct node *head)
+{
+  while (head->next != NULL)
+    {
+#pragma acc exit data detach(head->next)
+      struct node * n = head->next;
+      head->next = n->next;
+      if (n->next)
+       {
+#pragma acc exit data detach(n->next)
+       }
+#pragma acc exit data delete (n[:1])
+      if (head->next)
+       {
+#pragma acc enter data attach(head->next)
+       }
+      free (n);
+    }
+}
+
+int
+main ()
+{
+  struct node list = { .next = NULL, .val = 0 };
+  int i;
+
+#pragma acc enter data copyin(list)
+
+  for (i = 0; i < LIST_LENGTH; i++)
+    insert (&list, i + 1);
+
+  assert (sum_nodes (&list) == (LIST_LENGTH * LIST_LENGTH + LIST_LENGTH) / 2);
+
+  destroy (&list);
+
+#pragma acc exit data delete(list)
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-5.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-5.c
new file mode 100644 (file)
index 0000000..89cafbb
--- /dev/null
@@ -0,0 +1,81 @@
+#include <assert.h>
+#include <stdlib.h>
+#include <openacc.h>
+
+struct node
+{
+  struct node *next;
+  int val;
+};
+
+int
+sum_nodes (struct node *head)
+{
+  int i = 0, sum = 0;
+
+#pragma acc parallel reduction(+:sum) present(head[:1])
+  {
+    for (; head != NULL; head = head->next)
+      sum += head->val;
+  }
+
+  return sum;
+}
+
+void
+insert (struct node *head, int val)
+{
+  struct node *n = (struct node *) malloc (sizeof (struct node));
+
+  if (head->next)
+    acc_detach ((void **) &head->next);
+
+  n->val = val;
+  n->next = head->next;
+  head->next = n;
+
+  acc_copyin (n, sizeof (struct node));
+  acc_attach((void **) &head->next);
+
+  if (n->next)
+    acc_attach ((void **) &n->next);
+}
+
+void
+destroy (struct node *head)
+{
+  while (head->next != NULL)
+    {
+      acc_detach ((void **) &head->next);
+      struct node * n = head->next;
+      head->next = n->next;
+      if (n->next)
+       acc_detach ((void **) &n->next);
+
+      acc_delete (n, sizeof (struct node));
+      if (head->next)
+       acc_attach((void **) &head->next);
+
+      free (n);
+    }
+}
+
+int
+main ()
+{
+  struct node list = { .next = NULL, .val = 0 };
+  int i;
+
+  acc_copyin (&list, sizeof (struct node));
+
+  for (i = 0; i < 10; i++)
+    insert (&list, 2);
+
+  assert (sum_nodes (&list) == 10 * 2);
+
+  destroy (&list);
+
+  acc_delete (&list, sizeof (struct node));
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-6.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-6.c
new file mode 100644 (file)
index 0000000..81c1c5e
--- /dev/null
@@ -0,0 +1,59 @@
+/* { dg-do run { target { ! openacc_host_selected } } } */
+
+#include <stdlib.h>
+#include <assert.h>
+#include <openacc.h>
+
+struct dc
+{
+  int a;
+  int **b;
+};
+
+int
+main ()
+{
+  int n = 100, i, j, k;
+  struct dc v = { .a = 3 };
+
+  v.b = (int **) malloc (sizeof (int *) * n);
+  for (i = 0; i < n; i++)
+    v.b[i] = (int *) malloc (sizeof (int) * n);
+
+  for (k = 0; k < 16; k++)
+    {
+#pragma acc data copy(v)
+      {
+#pragma acc data copy(v.b[:n])
+       {
+         for (i = 0; i < n; i++)
+           {
+             acc_copyin (v.b[i], sizeof (int) * n);
+             acc_attach ((void **) &v.b[i]);
+           }
+
+#pragma acc parallel loop
+         for (i = 0; i < n; i++)
+           for (j = 0; j < n; j++)
+             v.b[i][j] = v.a + i + j;
+
+         for (i = 0; i < n; i++)
+           {
+             acc_detach ((void **) &v.b[i]);
+             acc_copyout (v.b[i], sizeof (int) * n);
+           }
+       }
+      }
+
+      for (i = 0; i < n; i++)
+       for (j = 0; j < n; j++)
+         assert (v.b[i][j] == v.a + i + j);
+
+      assert (!acc_is_present (&v, sizeof (v)));
+      assert (!acc_is_present (v.b, sizeof (int *) * n));
+      for (i = 0; i < n; i++)
+        assert (!acc_is_present (v.b[i], sizeof (int) * n));
+    }
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-7.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-7.c
new file mode 100644 (file)
index 0000000..a59047a
--- /dev/null
@@ -0,0 +1,45 @@
+/* { dg-do run { target { ! openacc_host_selected } } } */
+
+#include <stdlib.h>
+#include <assert.h>
+#include <openacc.h>
+
+struct dc
+{
+  int a;
+  int *b;
+};
+
+int
+main ()
+{
+  int n = 100, i, j, k;
+  struct dc v = { .a = 3 };
+
+  v.b = (int *) malloc (sizeof (int) * n);
+
+  for (k = 0; k < 16; k++)
+    {
+      /* Here, we do not explicitly copy the enclosing structure, but work
+        with fields directly.  Make sure attachment counters and reference
+        counters work properly in that case.  */
+#pragma acc enter data copyin(v.a, v.b[0:n])
+#pragma acc enter data pcopyin(v.b[0:n])
+#pragma acc enter data pcopyin(v.b[0:n])
+
+#pragma acc parallel loop present(v.a, v.b)
+      for (i = 0; i < n; i++)
+       v.b[i] = v.a + i;
+
+#pragma acc exit data copyout(v.b[:n]) finalize
+#pragma acc exit data delete(v.a)
+
+      for (i = 0; i < n; i++)
+       assert (v.b[i] == v.a + i);
+
+      assert (!acc_is_present (&v, sizeof (v)));
+      assert (!acc_is_present (v.b, sizeof (int *) * n));
+    }
+
+  return 0;
+}
diff --git a/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-8.c b/libgomp/testsuite/libgomp.oacc-c-c++-common/deep-copy-8.c
new file mode 100644 (file)
index 0000000..0ca5990
--- /dev/null
@@ -0,0 +1,54 @@
+/* { dg-do run { target { ! openacc_host_selected } } } */
+
+#include <stdlib.h>
+#include <assert.h>
+#include <openacc.h>
+
+struct dc
+{
+  int a;
+  int *b;
+  int *c;
+  int *d;
+};
+
+int
+main ()
+{
+  int n = 100, i, j, k;
+  struct dc v = { .a = 3 };
+
+  v.b = (int *) malloc (sizeof (int) * n);
+  v.c = (int *) malloc (sizeof (int) * n);
+  v.d = (int *) malloc (sizeof (int) * n);
+
+#pragma acc enter data copyin(v)
+
+  for (k = 0; k < 16; k++)
+    {
+#pragma acc enter data copyin(v.a, v.b[:n], v.c[:n], v.d[:n])
+
+#pragma acc parallel loop
+      for (i = 0; i < n; i++)
+       v.b[i] = v.a + i;
+
+#pragma acc exit data copyout(v.b[:n])
+#pragma acc exit data copyout(v.c[:n])
+#pragma acc exit data copyout(v.d[:n])
+#pragma acc exit data copyout(v.a)
+
+      for (i = 0; i < n; i++)
+       assert (v.b[i] == v.a + i);
+
+      assert (acc_is_present (&v, sizeof (v)));
+      assert (!acc_is_present (v.b, sizeof (int *) * n));
+      assert (!acc_is_present (v.c, sizeof (int *) * n));
+      assert (!acc_is_present (v.d, sizeof (int *) * n));
+    }
+
+#pragma acc exit data copyout(v)
+
+  assert (!acc_is_present (&v, sizeof (v)));
+
+  return 0;
+}
index 83a540070e6b66af90c313beee35b6f654de3f1a..6bb92c12ed1e123e02b3eb9033e26f127f14dbc9 100644 (file)
@@ -1,4 +1,5 @@
 ! { dg-do run }
+! { dg-additional-options "-cpp" }
 
 program test
   use openacc
@@ -70,10 +71,14 @@ program test
     end do
   !$acc end parallel
   
-  !$acc exit data copyout (d(1:N)) async
+  !$acc exit data delete (c(1:N)) copyout (d(1:N)) async
   !$acc exit data async
   !$acc wait
 
+#if !ACC_MEM_SHARED
+  if (acc_is_present (c) .eqv. .TRUE.) call abort
+#endif
+
   do i = 1, N
     if (d(i) .ne. 4.0) call abort
   end do
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-1.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-1.f90
new file mode 100644 (file)
index 0000000..c4cea11
--- /dev/null
@@ -0,0 +1,35 @@
+! { dg-do run }
+
+! Test of attach/detach with "acc data".
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+
+!$acc data copy(var)
+!$acc data copy(var%a)
+
+!$acc parallel loop
+  do i = 1,n
+    var%a(i) = i
+  end do
+!$acc end parallel loop
+
+!$acc end data
+!$acc end data
+
+  do i = 1,n
+    if (i .ne. var%a(i)) stop 1
+  end do
+
+  deallocate(var%a)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-2.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-2.f90
new file mode 100644 (file)
index 0000000..3593661
--- /dev/null
@@ -0,0 +1,33 @@
+! { dg-do run }
+
+! Test of attach/detach with "acc data", two clauses at once.
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+
+!$acc data copy(var) copy(var%a)
+
+!$acc parallel loop
+  do i = 1,n
+    var%a(i) = i
+  end do
+!$acc end parallel loop
+
+!$acc end data
+
+  do i = 1,n
+    if (i .ne. var%a(i)) stop 1
+  end do
+
+  deallocate(var%a)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-3.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-3.f90
new file mode 100644 (file)
index 0000000..667d944
--- /dev/null
@@ -0,0 +1,34 @@
+! { dg-do run }
+
+! Test of attach/detach with "acc parallel".
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+    integer, allocatable :: b(:)
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+  allocate(var%b(1:n))
+
+!$acc parallel loop copy(var) copy(var%a(1:n)) copy(var%b(1:n))
+  do i = 1,n
+    var%a(i) = i
+    var%b(i) = i
+  end do
+!$acc end parallel loop
+
+  do i = 1,n
+    if (i .ne. var%a(i)) stop 1
+    if (i .ne. var%b(i)) stop 2
+  end do
+
+  deallocate(var%a)
+  deallocate(var%b)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-4.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-4.f90
new file mode 100644 (file)
index 0000000..6949e12
--- /dev/null
@@ -0,0 +1,49 @@
+! { dg-do run }
+
+! Test of attach/detach with "acc enter/exit data".
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+    integer, allocatable :: b(:)
+  end type mytype
+  integer, allocatable :: r(:)
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+  allocate(var%b(1:n))
+  allocate(r(1:n))
+
+!$acc enter data copyin(var)
+
+!$acc enter data copyin(var%a, var%b, r)
+
+!$acc parallel loop
+  do i = 1,n
+    var%a(i) = i
+    var%b(i) = i * 2
+    r(i) = i * 3
+  end do
+!$acc end parallel loop
+
+!$acc exit data copyout(var%a)
+!$acc exit data copyout(var%b)
+!$acc exit data copyout(r)
+
+  do i = 1,n
+    if (i .ne. var%a(i)) stop 1
+    if (i * 2 .ne. var%b(i)) stop 2
+    if (i * 3 .ne. r(i)) stop 3
+  end do
+
+!$acc exit data delete(var)
+
+  deallocate(var%a)
+  deallocate(var%b)
+  deallocate(r)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-5.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-5.f90
new file mode 100644 (file)
index 0000000..6843cf1
--- /dev/null
@@ -0,0 +1,57 @@
+! { dg-do run }
+
+! Test of attach/detach, "enter data" inside "data", and subarray.
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+    integer, allocatable :: b(:)
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+  allocate(var%b(1:n))
+
+!$acc data copy(var)
+
+  do i = 1, n
+    var%a(i) = 0
+    var%b(i) = 0
+  end do
+
+!$acc enter data copyin(var%a(5:n - 5), var%b(5:n - 5))
+
+!$acc parallel loop
+  do i = 5,n - 5
+    var%a(i) = i
+    var%b(i) = i * 2
+  end do
+!$acc end parallel loop
+
+!$acc exit data copyout(var%a(5:n - 5), var%b(5:n - 5))
+
+!$acc end data
+
+  do i = 1,4
+    if (var%a(i) .ne. 0) stop 1
+    if (var%b(i) .ne. 0) stop 2
+  end do
+
+  do i = 5,n - 5
+    if (i .ne. var%a(i)) stop 3
+    if (i * 2 .ne. var%b(i)) stop 4
+  end do
+
+  do i = n - 4,n
+    if (var%a(i) .ne. 0) stop 5
+    if (var%b(i) .ne. 0) stop 6
+  end do
+
+  deallocate(var%a)
+  deallocate(var%b)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-6.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-6.f90
new file mode 100644 (file)
index 0000000..12910d0
--- /dev/null
@@ -0,0 +1,61 @@
+! { dg-do run }
+
+! Test of attachment counters and finalize.
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+    integer, allocatable :: b(:)
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+  allocate(var%b(1:n))
+
+!$acc data copy(var)
+
+  do i = 1, n
+    var%a(i) = 0
+    var%b(i) = 0
+  end do
+
+!$acc enter data copyin(var%a(5:n - 5), var%b(5:n - 5))
+
+  do i = 1,20
+    !$acc enter data attach(var%a)
+  end do
+
+!$acc parallel loop
+  do i = 5,n - 5
+    var%a(i) = i
+    var%b(i) = i * 2
+  end do
+!$acc end parallel loop
+
+!$acc exit data copyout(var%a(5:n - 5), var%b(5:n - 5)) finalize
+
+!$acc end data
+
+  do i = 1,4
+    if (var%a(i) .ne. 0) stop 1
+    if (var%b(i) .ne. 0) stop 2
+  end do
+
+  do i = 5,n - 5
+    if (i .ne. var%a(i)) stop 3
+    if (i * 2 .ne. var%b(i)) stop 4
+  end do
+
+  do i = n - 4,n
+    if (var%a(i) .ne. 0) stop 5
+    if (var%b(i) .ne. 0) stop 6
+  end do
+
+  deallocate(var%a)
+  deallocate(var%b)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-7.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-7.f90
new file mode 100644 (file)
index 0000000..ab44f0a
--- /dev/null
@@ -0,0 +1,89 @@
+! { dg-do run }
+
+! Test of attach/detach with scalar elements and nested derived types.
+
+program dtype
+  implicit none
+  integer, parameter :: n = 512
+  type subtype
+    integer :: g, h
+    integer, allocatable :: q(:)
+  end type subtype
+  type mytype
+    integer, allocatable :: a(:)
+    integer, allocatable :: c, d
+    integer, allocatable :: b(:)
+    integer :: f
+    type(subtype) :: s
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+  allocate(var%b(1:n))
+  allocate(var%c)
+  allocate(var%d)
+  allocate(var%s%q(1:n))
+
+  var%c = 16
+  var%d = 20
+  var%f = 7
+  var%s%g = 21
+  var%s%h = 38
+
+!$acc enter data copyin(var)
+
+  do i = 1, n
+    var%a(i) = 0
+    var%b(i) = 0
+    var%s%q(i) = 0
+  end do
+
+!$acc data copy(var%a(5:n - 5), var%b(5:n - 5), var%c, var%d) &
+!$acc & copy(var%s%q)
+
+!$acc parallel loop default(none) present(var)
+  do i = 5,n - 5
+    var%a(i) = i
+    var%b(i) = i * 2
+    var%s%q(i) = i * 3
+    var%s%g = 100
+    var%s%h = 101
+  end do
+!$acc end parallel loop
+
+!$acc end data
+
+!$acc exit data copyout(var)
+
+  do i = 1,4
+    if (var%a(i) .ne. 0) stop 1
+    if (var%b(i) .ne. 0) stop 2
+    if (var%s%q(i) .ne. 0) stop 3
+  end do
+
+  do i = 5,n - 5
+    if (i .ne. var%a(i)) stop 4
+    if (i * 2 .ne. var%b(i)) stop 5
+    if (i * 3 .ne. var%s%q(i)) stop 6
+  end do
+
+  do i = n - 4,n
+    if (var%a(i) .ne. 0) stop 7
+    if (var%b(i) .ne. 0) stop 8
+    if (var%s%q(i) .ne. 0) stop 9
+  end do
+
+  if (var%c .ne. 16) stop 10
+  if (var%d .ne. 20) stop 11
+  if (var%s%g .ne. 100 .or. var%s%h .ne. 101) stop 12
+  if (var%f .ne. 7) stop 13
+
+  deallocate(var%a)
+  deallocate(var%b)
+  deallocate(var%c)
+  deallocate(var%d)
+  deallocate(var%s%q)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-8.f90 b/libgomp/testsuite/libgomp.oacc-fortran/deep-copy-8.f90
new file mode 100644 (file)
index 0000000..d142763
--- /dev/null
@@ -0,0 +1,41 @@
+! { dg-do run }
+
+! Test of explicit attach/detach clauses and attachment counters. There are no
+! acc_attach/acc_detach API routines in Fortran.
+
+program dtype
+  use openacc
+  implicit none
+  integer, parameter :: n = 512
+  type mytype
+    integer, allocatable :: a(:)
+  end type mytype
+  integer i
+
+  type(mytype) :: var
+
+  allocate(var%a(1:n))
+
+  call acc_copyin(var)
+  call acc_copyin(var%a)
+
+  !$acc enter data attach(var%a)
+
+!$acc parallel loop attach(var%a)
+  do i = 1,n
+    var%a(i) = i
+  end do
+!$acc end parallel loop
+
+  !$acc exit data detach(var%a)
+
+  call acc_copyout(var%a)
+  call acc_copyout(var)
+
+  do i = 1,n
+    if (i .ne. var%a(i)) stop 1
+  end do
+
+  deallocate(var%a)
+
+end program dtype
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/derived-type-1.f90 b/libgomp/testsuite/libgomp.oacc-fortran/derived-type-1.f90
new file mode 100644 (file)
index 0000000..eb7812d
--- /dev/null
@@ -0,0 +1,28 @@
+! Test derived types with subarrays
+
+! { dg-do run }
+
+  implicit none
+  type dtype
+     integer :: a, b, c
+  end type dtype
+  integer, parameter :: n = 100
+  integer i
+  type (dtype), dimension(n) :: d
+
+  !$acc data copy(d(1:n))
+  !$acc parallel loop
+  do i = 1, n
+     d(i)%a = i
+     d(i)%b = i-1
+     d(i)%c = i+1
+  end do
+  !$acc end data
+
+  do i = 1, n
+     if (d(i)%a /= i) stop 1
+     if (d(i)%b /= i-1) stop 2
+     if (d(i)%c /= i+1) stop 3
+  end do
+end program
+
diff --git a/libgomp/testsuite/libgomp.oacc-fortran/update-2.f90 b/libgomp/testsuite/libgomp.oacc-fortran/update-2.f90
new file mode 100644 (file)
index 0000000..c3c8a07
--- /dev/null
@@ -0,0 +1,284 @@
+! Test ACC UPDATE with derived types.
+
+! { dg-do run }
+
+module dt
+  integer, parameter :: n = 10
+  type inner
+     integer :: d(n)
+  end type inner
+  type mytype
+     integer(8) :: a, b, c(n)
+     type(inner) :: in
+  end type mytype
+end module dt
+
+program derived_acc
+  use dt
+
+  implicit none
+  integer i, res
+  type(mytype) :: var
+
+  var%a = 0
+  var%b = 1
+  var%c(:) = 10
+  var%in%d(:) = 100
+
+  var%c(:) = 10
+
+  !$acc enter data copyin(var)
+
+  !$acc parallel loop present(var)
+  do i = 1, 1
+     var%a = var%b
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%a)
+
+  if (var%a /= var%b) stop 1
+
+  var%b = 100
+
+  !$acc update device(var%b)
+
+  !$acc parallel loop present(var)
+  do i = 1, 1
+     var%a = var%b
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%a)
+
+  if (var%a /= var%b) stop 2
+
+  !$acc parallel loop present (var)
+  do i = 1, n
+     var%c(i) = i
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%c)
+
+  var%a = -1
+
+  do i = 1, n
+     if (var%c(i) /= i) stop 3
+     var%c(i) = var%a
+  end do
+
+  !$acc update device(var%a)
+  !$acc update device(var%c)
+
+  res = 0
+
+  !$acc parallel loop present(var) reduction(+:res)
+  do i = 1, n
+     if (var%c(i) /= var%a) res = res + 1
+  end do
+
+  if (res /= 0) stop 4
+
+  var%c(:) = 0
+
+  !$acc update device(var%c)
+
+  !$acc parallel loop present(var)
+  do i = 5, 5
+     var%c(i) = 1
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%c(5))
+
+  do i = 1, n
+     if (i /= 5 .and. var%c(i) /= 0) stop 5
+     if (i == 5 .and. var%c(i) /= 1) stop 6
+  end do
+
+  !$acc parallel loop present(var)
+  do i = 1, n
+     var%in%d = var%a
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%in%d)
+
+  do i = 1, n
+     if (var%in%d(i) /= var%a) stop 7
+  end do
+
+  var%c(:) = 0
+
+  !$acc update device(var%c)
+
+  var%c(:) = -1
+
+  !$acc parallel loop present(var)
+  do i = n/2, n
+     var%c(i) = i
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%c(n/2:n))
+
+  do i = 1,n
+     if (i < n/2 .and. var%c(i) /= -1) stop 8
+     if (i >= n/2 .and. var%c(i) /= i) stop 9
+  end do
+
+  var%in%d(:) = 0
+  !$acc update device(var%in%d)
+
+  !$acc parallel loop present(var)
+  do i = 5, 5
+     var%in%d(i) = 1
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%in%d(5))
+
+  do i = 1, n
+     if (i /= 5 .and. var%in%d(i) /= 0) stop 10
+     if (i == 5 .and. var%in%d(i) /= 1) stop 11
+  end do
+
+  !$acc exit data delete(var)
+
+  call derived_acc_subroutine(var)
+end program derived_acc
+
+subroutine derived_acc_subroutine(var)
+  use dt
+
+  implicit none
+  integer i, res
+  type(mytype) :: var
+
+  var%a = 0
+  var%b = 1
+  var%c(:) = 10
+  var%in%d(:) = 100
+
+  var%c(:) = 10
+
+  !$acc enter data copyin(var)
+
+  !$acc parallel loop present(var)
+  do i = 1, 1
+     var%a = var%b
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%a)
+
+  if (var%a /= var%b) stop 12
+
+  var%b = 100
+
+  !$acc update device(var%b)
+
+  !$acc parallel loop present(var)
+  do i = 1, 1
+     var%a = var%b
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%a)
+
+  if (var%a /= var%b) stop 13
+
+  !$acc parallel loop present (var)
+  do i = 1, n
+     var%c(i) = i
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%c)
+
+  var%a = -1
+
+  do i = 1, n
+     if (var%c(i) /= i) stop 14
+     var%c(i) = var%a
+  end do
+
+  !$acc update device(var%a)
+  !$acc update device(var%c)
+
+  res = 0
+
+  !$acc parallel loop present(var) reduction(+:res)
+  do i = 1, n
+     if (var%c(i) /= var%a) res = res + 1
+  end do
+
+  if (res /= 0) stop 15
+
+  var%c(:) = 0
+
+  !$acc update device(var%c)
+
+  !$acc parallel loop present(var)
+  do i = 5, 5
+     var%c(i) = 1
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%c(5))
+
+  do i = 1, n
+     if (i /= 5 .and. var%c(i) /= 0) stop 16
+     if (i == 5 .and. var%c(i) /= 1) stop 17
+  end do
+
+  !$acc parallel loop present(var)
+  do i = 1, n
+     var%in%d = var%a
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%in%d)
+
+  do i = 1, n
+     if (var%in%d(i) /= var%a) stop 18
+  end do
+
+  var%c(:) = 0
+
+  !$acc update device(var%c)
+
+  var%c(:) = -1
+
+  !$acc parallel loop present(var)
+  do i = n/2, n
+     var%c(i) = i
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%c(n/2:n))
+
+  do i = 1,n
+     if (i < n/2 .and. var%c(i) /= -1) stop 19
+     if (i >= n/2 .and. var%c(i) /= i) stop 20
+  end do
+
+  var%in%d(:) = 0
+  !$acc update device(var%in%d)
+
+  !$acc parallel loop present(var)
+  do i = 5, 5
+     var%in%d(i) = 1
+  end do
+  !$acc end parallel loop
+
+  !$acc update host(var%in%d(5))
+
+  do i = 1, n
+     if (i /= 5 .and. var%in%d(i) /= 0) stop 21
+     if (i == 5 .and. var%in%d(i) /= 1) stop 22
+  end do
+
+  !$acc exit data delete(var)
+end subroutine derived_acc_subroutine