#define LPFC_MAX_SG_SLI4_SEG_CNT_DIF 128 /* sg element count per scsi cmnd */
 #define LPFC_MAX_SG_SEG_CNT_DIF 512    /* sg element count per scsi cmnd  */
 #define LPFC_MAX_SG_SEG_CNT    4096    /* sg element count per scsi cmnd */
+#define LPFC_MIN_SG_SEG_CNT    32      /* sg element count per scsi cmnd */
 #define LPFC_MAX_SGL_SEG_CNT   512     /* SGL element count per scsi cmnd */
 #define LPFC_MAX_BPL_SEG_CNT   4096    /* BPL element count per scsi cmnd */
 #define LPFC_MAX_NVME_SEG_CNT  256     /* max SGL element cnt per NVME cmnd */
 
  * this parameter will be limited to 128 if BlockGuard is enabled under SLI4
  * and will be limited to 512 if BlockGuard is enabled under SLI3.
  */
-LPFC_ATTR_R(sg_seg_cnt, LPFC_DEFAULT_SG_SEG_CNT, LPFC_DEFAULT_SG_SEG_CNT,
+LPFC_ATTR_R(sg_seg_cnt, LPFC_MIN_SG_SEG_CNT, LPFC_DEFAULT_SG_SEG_CNT,
            LPFC_MAX_SG_SEG_CNT, "Max Scatter Gather Segment Count");
 
 /*
 
        struct lpfc_mqe *mqe;
        int longs;
        int fof_vectors = 0;
+       int extra;
        uint64_t wwn;
 
        phba->sli4_hba.num_online_cpu = num_online_cpus();
         * The WQ create will allocate the ring.
         */
 
+       /*
+        * 1 for cmd, 1 for rsp, NVME adds an extra one
+        * for boundary conditions in its max_sgl_segment template.
+        */
+       extra = 2;
+       if (phba->cfg_enable_fc4_type & LPFC_ENABLE_NVME)
+               extra++;
+
        /*
         * It doesn't matter what family our adapter is in, we are
         * limited to 2 Pages, 512 SGEs, for our SGL.
         * There are going to be 2 reserved SGEs: 1 FCP cmnd + 1 FCP rsp
         */
        max_buf_size = (2 * SLI4_PAGE_SIZE);
-       if (phba->cfg_sg_seg_cnt > LPFC_MAX_SGL_SEG_CNT - 2)
-               phba->cfg_sg_seg_cnt = LPFC_MAX_SGL_SEG_CNT - 2;
+       if (phba->cfg_sg_seg_cnt > LPFC_MAX_SGL_SEG_CNT - extra)
+               phba->cfg_sg_seg_cnt = LPFC_MAX_SGL_SEG_CNT - extra;
 
        /*
         * Since lpfc_sg_seg_cnt is module param, the sg_dma_buf_size
                 */
                phba->cfg_sg_dma_buf_size = sizeof(struct fcp_cmnd) +
                                sizeof(struct fcp_rsp) +
-                               ((phba->cfg_sg_seg_cnt + 2) *
+                               ((phba->cfg_sg_seg_cnt + extra) *
                                sizeof(struct sli4_sge));
 
                /* Total SGEs for scsi_sg_list */
-               phba->cfg_total_seg_cnt = phba->cfg_sg_seg_cnt + 2;
+               phba->cfg_total_seg_cnt = phba->cfg_sg_seg_cnt + extra;
 
                /*
-                * NOTE: if (phba->cfg_sg_seg_cnt + 2) <= 256 we only
+                * NOTE: if (phba->cfg_sg_seg_cnt + extra) <= 256 we only
                 * need to post 1 page for the SGL.
                 */
        }
 
 static void
 lpfc_release_nvme_buf(struct lpfc_hba *, struct lpfc_nvme_buf *);
 
+static struct nvme_fc_port_template lpfc_nvme_template;
 
 /**
  * lpfc_nvme_create_queue -
 
                first_data_sgl = sgl;
                lpfc_ncmd->seg_cnt = nCmd->sg_cnt;
-               if (lpfc_ncmd->seg_cnt > phba->cfg_nvme_seg_cnt + 1) {
+               if (lpfc_ncmd->seg_cnt > lpfc_nvme_template.max_sgl_segments) {
                        lpfc_printf_log(phba, KERN_ERR, LOG_NVME_IOERR,
                                        "6058 Too many sg segments from "
                                        "NVME Transport.  Max %d, "
 
                return NULL;
        }
 
-       if (rsp->sg_cnt > phba->cfg_nvme_seg_cnt) {
+       if (rsp->sg_cnt > lpfc_tgttemplate.max_sgl_segments) {
                lpfc_printf_log(phba, KERN_ERR, LOG_NVME_IOERR,
                                "6109 NVMET prep FCP wqe: seg cnt err: "
                                "NPORT x%x oxid x%x ste %d cnt %d\n",