drm/i915: Reduce presumption of request ordering for barriers

author Chris Wilson <chris@chris-wilson.co.uk>

Fri, 8 Mar 2019 09:36:56 +0000 (09:36 +0000)

committer Chris Wilson <chris@chris-wilson.co.uk>

Fri, 8 Mar 2019 10:57:08 +0000 (10:57 +0000)
author Chris Wilson <chris@chris-wilson.co.uk>
Fri, 8 Mar 2019 09:36:56 +0000 (09:36 +0000)
committer Chris Wilson <chris@chris-wilson.co.uk>
Fri, 8 Mar 2019 10:57:08 +0000 (10:57 +0000)
diff --git a/drivers/gpu/drm/i915/i915_drv.h b/drivers/gpu/drm/i915/i915_drv.h

index b8a5281d8adf0b458de78855558ac06bca79c7af..c4ffe19ec698d68b3300933a96c046777b4f4b18 100644 (file)
--- a/drivers/gpu/drm/i915/i915_drv.h
+++ b/drivers/gpu/drm/i915/i915_drv.h
@@ -1995,6 +1995,7 @@ struct drm_i915_private {
                         struct list_head hwsp_free_list;
                 } timelines;
  
+               intel_engine_mask_t active_engines;
                 struct list_head active_rings;
                 struct list_head closed_vma;
                 u32 active_requests;
diff --git a/drivers/gpu/drm/i915/i915_gem.c b/drivers/gpu/drm/i915/i915_gem.c

index 539ee78f6d9a2ccb4ad2e781bcc7d7c94b85e2ea..961237b90b40805aaa1790d4fede1d1e1b0da873 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem.c
+++ b/drivers/gpu/drm/i915/i915_gem.c
@@ -2845,7 +2845,8 @@ static void assert_kernel_context_is_current(struct drm_i915_private *i915)
         }
  }
  
-static bool switch_to_kernel_context_sync(struct drm_i915_private *i915)
+static bool switch_to_kernel_context_sync(struct drm_i915_private *i915,
+                                         unsigned long mask)
  {
         bool result = true;
  
@@ -2854,7 +2855,7 @@ static bool switch_to_kernel_context_sync(struct drm_i915_private *i915)
          * to save itself before we report the failure. Yes, this may be a
          * false positive due to e.g. ENOMEM, caveat emptor!
          */
-       if (i915_gem_switch_to_kernel_context(i915))
+       if (i915_gem_switch_to_kernel_context(i915, mask))
                 result = false;
  
         if (i915_gem_wait_for_idle(i915,
@@ -2879,7 +2880,8 @@ static bool switch_to_kernel_context_sync(struct drm_i915_private *i915)
  
  static bool load_power_context(struct drm_i915_private *i915)
  {
-       if (!switch_to_kernel_context_sync(i915))
+       /* Force loading the kernel context on all engines */
+       if (!switch_to_kernel_context_sync(i915, ALL_ENGINES))
                 return false;
  
         /*
@@ -2927,7 +2929,7 @@ i915_gem_idle_work_handler(struct work_struct *work)
             !i915->gt.active_requests) {
                 ++i915->gt.active_requests; /* don't requeue idle */
  
-               switch_to_kernel_context_sync(i915);
+               switch_to_kernel_context_sync(i915, i915->gt.active_engines);
  
                 if (!--i915->gt.active_requests) {
                         __i915_gem_park(i915);
@@ -4380,7 +4382,7 @@ void i915_gem_suspend(struct drm_i915_private *i915)
          * state. Fortunately, the kernel_context is disposable and we do
          * not rely on its state.
          */
-       switch_to_kernel_context_sync(i915);
+       switch_to_kernel_context_sync(i915, i915->gt.active_engines);
  
         mutex_unlock(&i915->drm.struct_mutex);
         i915_reset_flush(i915);
diff --git a/drivers/gpu/drm/i915/i915_gem_context.c b/drivers/gpu/drm/i915/i915_gem_context.c

index 9a3eb4f66d85f7b8ca73f4ab0a10a48ee9981991..486203e9d205f05a8e07de0d8de6d50d8b613540 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem_context.c
+++ b/drivers/gpu/drm/i915/i915_gem_context.c
@@ -704,63 +704,10 @@ last_request_on_engine(struct i915_timeline *timeline,
         return NULL;
  }
  
-static bool engine_has_kernel_context_barrier(struct intel_engine_cs *engine)
-{
-       struct drm_i915_private *i915 = engine->i915;
-       const struct intel_context * const ce =
-               to_intel_context(i915->kernel_context, engine);
-       struct i915_timeline *barrier = ce->ring->timeline;
-       struct intel_ring *ring;
-       bool any_active = false;
-
-       lockdep_assert_held(&i915->drm.struct_mutex);
-       list_for_each_entry(ring, &i915->gt.active_rings, active_link) {
-               struct i915_request *rq;
-
-               rq = last_request_on_engine(ring->timeline, engine);
-               if (!rq)
-                       continue;
-
-               any_active = true;
-
-               if (rq->hw_context == ce)
-                       continue;
-
-               /*
-                * Was this request submitted after the previous
-                * switch-to-kernel-context?
-                */
-               if (!i915_timeline_sync_is_later(barrier, &rq->fence)) {
-                       GEM_TRACE("%s needs barrier for %llx:%lld\n",
-                                 ring->timeline->name,
-                                 rq->fence.context,
-                                 rq->fence.seqno);
-                       return false;
-               }
-
-               GEM_TRACE("%s has barrier after %llx:%lld\n",
-                         ring->timeline->name,
-                         rq->fence.context,
-                         rq->fence.seqno);
-       }
-
-       /*
-        * If any other timeline was still active and behind the last barrier,
-        * then our last switch-to-kernel-context must still be queued and
-        * will run last (leaving the engine in the kernel context when it
-        * eventually idles).
-        */
-       if (any_active)
-               return true;
-
-       /* The engine is idle; check that it is idling in the kernel context. */
-       return engine->last_retired_context == ce;
-}
-
-int i915_gem_switch_to_kernel_context(struct drm_i915_private *i915)
+int i915_gem_switch_to_kernel_context(struct drm_i915_private *i915,
+                                     unsigned long mask)
  {
         struct intel_engine_cs *engine;
-       enum intel_engine_id id;
  
         GEM_TRACE("awake?=%s\n", yesno(i915->gt.awake));
  
@@ -771,17 +718,11 @@ int i915_gem_switch_to_kernel_context(struct drm_i915_private *i915)
         if (i915_terminally_wedged(i915))
                 return 0;
  
-       i915_retire_requests(i915);
-
-       for_each_engine(engine, i915, id) {
+       for_each_engine_masked(engine, i915, mask, mask) {
                 struct intel_ring *ring;
                 struct i915_request *rq;
  
                 GEM_BUG_ON(!to_intel_context(i915->kernel_context, engine));
-               if (engine_has_kernel_context_barrier(engine))
-                       continue;
-
-               GEM_TRACE("emit barrier on %s\n", engine->name);
  
                 rq = i915_request_alloc(engine, i915->kernel_context);
                 if (IS_ERR(rq))
@@ -805,7 +746,6 @@ int i915_gem_switch_to_kernel_context(struct drm_i915_private *i915)
                         i915_sw_fence_await_sw_fence_gfp(&rq->submit,
                                                          &prev->submit,
                                                          I915_FENCE_GFP);
-                       i915_timeline_sync_set(rq->timeline, &prev->fence);
                 }
  
                 i915_request_add(rq);
diff --git a/drivers/gpu/drm/i915/i915_gem_context.h b/drivers/gpu/drm/i915/i915_gem_context.h

index 2f9ef333acaa7e4162bb2bf0eea196e4deba526f..e1188d77a23d98f149bcf2e54d02dc3db8401f7c 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem_context.h
+++ b/drivers/gpu/drm/i915/i915_gem_context.h
@@ -372,7 +372,8 @@ int i915_gem_context_open(struct drm_i915_private *i915,
  void i915_gem_context_close(struct drm_file *file);
  
  int i915_switch_context(struct i915_request *rq);
-int i915_gem_switch_to_kernel_context(struct drm_i915_private *dev_priv);
+int i915_gem_switch_to_kernel_context(struct drm_i915_private *i915,
+                                     unsigned long engine_mask);
  
  void i915_gem_context_release(struct kref *ctx_ref);
  struct i915_gem_context *
diff --git a/drivers/gpu/drm/i915/i915_gem_evict.c b/drivers/gpu/drm/i915/i915_gem_evict.c

index 68d74c50ac392dba58ea511386912790399c2a13..7d8e90dfca8497e6ab2b1325915868cf797757cf 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem_evict.c
+++ b/drivers/gpu/drm/i915/i915_gem_evict.c
@@ -62,7 +62,7 @@ static int ggtt_flush(struct drm_i915_private *i915)
          * the hopes that we can then remove contexts and the like only
          * bound by their active reference.
          */
-       err = i915_gem_switch_to_kernel_context(i915);
+       err = i915_gem_switch_to_kernel_context(i915, i915->gt.active_engines);
         if (err)
                 return err;
  
diff --git a/drivers/gpu/drm/i915/i915_request.c b/drivers/gpu/drm/i915/i915_request.c

index f8a63495114c42c5d2597cb0cd17cded2511be38..9533a85cb0b3fd5931f43ce39b76c787f81d0e7d 100644 (file)
--- a/drivers/gpu/drm/i915/i915_request.c
+++ b/drivers/gpu/drm/i915/i915_request.c
@@ -1068,6 +1068,7 @@ void i915_request_add(struct i915_request *request)
                 GEM_TRACE("marking %s as active\n", ring->timeline->name);
                 list_add(&ring->active_link, &request->i915->gt.active_rings);
         }
+       request->i915->gt.active_engines |= request->engine->mask;
         request->emitted_jiffies = jiffies;
  
         /*
diff --git a/drivers/gpu/drm/i915/intel_engine_cs.c b/drivers/gpu/drm/i915/intel_engine_cs.c

index 555a4590fa239645286806806370dcca113b027c..18174f808fd847c67f5505e8bbb12d5730c553f3 100644 (file)
--- a/drivers/gpu/drm/i915/intel_engine_cs.c
+++ b/drivers/gpu/drm/i915/intel_engine_cs.c
@@ -1106,6 +1106,9 @@ bool intel_engine_has_kernel_context(const struct intel_engine_cs *engine)
  
         lockdep_assert_held(&engine->i915->drm.struct_mutex);
  
+       if (!engine->context_size)
+               return true;
+
         /*
          * Check the last context seen by the engine. If active, it will be
          * the last request that remains in the timeline. When idle, it is
@@ -1205,6 +1208,8 @@ void intel_engines_park(struct drm_i915_private *i915)
                 i915_gem_batch_pool_fini(&engine->batch_pool);
                 engine->execlists.no_priolist = false;
         }
+
+       i915->gt.active_engines = 0;
  }
  
  /**
diff --git a/drivers/gpu/drm/i915/selftests/i915_gem_context.c b/drivers/gpu/drm/i915/selftests/i915_gem_context.c

index 755c4a7304b2a565688e358be81d14951fbc0192..5b8614b2fbe48bdf08db8147847d70e0bbeb2fe4 100644 (file)
--- a/drivers/gpu/drm/i915/selftests/i915_gem_context.c
+++ b/drivers/gpu/drm/i915/selftests/i915_gem_context.c
@@ -1512,7 +1512,8 @@ static int __igt_switch_to_kernel_context(struct drm_i915_private *i915,
                         }
                 }
  
-               err = i915_gem_switch_to_kernel_context(i915);
+               err = i915_gem_switch_to_kernel_context(i915,
+                                                       i915->gt.active_engines);
                 if (err)
                         return err;
  
diff --git a/drivers/gpu/drm/i915/selftests/igt_flush_test.c b/drivers/gpu/drm/i915/selftests/igt_flush_test.c

index e0d3122fd35a0e1e6125e41644079da97285a484..94aee4071a66f4d43d5f428cfacdbe49cb7fe605 100644 (file)
--- a/drivers/gpu/drm/i915/selftests/igt_flush_test.c
+++ b/drivers/gpu/drm/i915/selftests/igt_flush_test.c
@@ -14,7 +14,7 @@ int igt_flush_test(struct drm_i915_private *i915, unsigned int flags)
         cond_resched();
  
         if (flags & I915_WAIT_LOCKED &&
-           i915_gem_switch_to_kernel_context(i915)) {
+           i915_gem_switch_to_kernel_context(i915, i915->gt.active_engines)) {
                 pr_err("Failed to switch back to kernel context; declaring wedged\n");
                 i915_gem_set_wedged(i915);
         }
diff --git a/drivers/gpu/drm/i915/selftests/mock_gem_device.c b/drivers/gpu/drm/i915/selftests/mock_gem_device.c

index b2c7808e0595dc6f01f8cdabb16d3954865b6f4f..54cfb611c0aa3a772d4c53f2683d9f9f547d3bfe 100644 (file)
--- a/drivers/gpu/drm/i915/selftests/mock_gem_device.c
+++ b/drivers/gpu/drm/i915/selftests/mock_gem_device.c
@@ -109,6 +109,10 @@ static void mock_retire_work_handler(struct work_struct *work)
  
  static void mock_idle_work_handler(struct work_struct *work)
  {
+       struct drm_i915_private *i915 =
+               container_of(work, typeof(*i915), gt.idle_work.work);
+
+       i915->gt.active_engines = 0;
  }
  
  static int pm_domain_resume(struct device *dev)
author	Chris Wilson <chris@chris-wilson.co.uk>
	Fri, 8 Mar 2019 09:36:56 +0000 (09:36 +0000)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Fri, 8 Mar 2019 10:57:08 +0000 (10:57 +0000)
drivers/gpu/drm/i915/i915_drv.h		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gem.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gem_context.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gem_context.h		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gem_evict.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_request.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/intel_engine_cs.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/selftests/i915_gem_context.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/selftests/igt_flush_test.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/selftests/mock_gem_device.c		patch \| blob \| blame \| history