/*
  * Alignment according to logical granularity (usually 1MiB)
  */
-static int lba_is_aligned(struct fdisk_context *cxt, fdisk_sector_t lba)
+static int lba_is_aligned(struct fdisk_context *cxt, uintmax_t lba)
 {
        unsigned long granularity = max(cxt->phy_sector_size, cxt->min_io_size);
        uintmax_t offset;
 
        if (cxt->grain > granularity)
                granularity = cxt->grain;
-       offset = (lba * cxt->sector_size) & (granularity - 1);
 
-       return !((granularity + cxt->alignment_offset - offset) & (granularity - 1));
+       offset = (lba * cxt->sector_size) % granularity;
+
+       return !((granularity + cxt->alignment_offset - offset) % granularity);
 }
 
 /*
 static int lba_is_phy_aligned(struct fdisk_context *cxt, fdisk_sector_t lba)
 {
        unsigned long granularity = max(cxt->phy_sector_size, cxt->min_io_size);
-       uintmax_t offset = (lba * cxt->sector_size) & (granularity - 1);
+       uintmax_t offset = (lba * cxt->sector_size) % granularity;
 
-       return !((granularity + cxt->alignment_offset - offset) & (granularity - 1));
+       return !((granularity + cxt->alignment_offset - offset) % granularity);
 }
 
 /**
        }
 
        if (lba != res)
-               DBG(CXT, ul_debugobj(cxt, "LBA %ju -aligned-to-> %ju",
+               DBG(CXT, ul_debugobj(cxt, "LBA %ju -aligned-%s-> %ju [grain=%jus]",
                                (uintmax_t) lba,
-                               (uintmax_t) res));
+                               direction == FDISK_ALIGN_UP ? "up" :
+                               direction == FDISK_ALIGN_DOWN ? "down" : "near",
+                               (uintmax_t) res,
+                               cxt->grain / cxt->sector_size));
+       else
+               DBG(CXT, ul_debugobj(cxt, "LBA %ju -unchanged-", lba));
+
        return res;
 }
 
 
        start = fdisk_align_lba(cxt, start, FDISK_ALIGN_UP);
        stop = fdisk_align_lba(cxt, stop, FDISK_ALIGN_DOWN);
+
+       if (lba > start && lba < stop
+           && (lba - start) < (cxt->grain / cxt->sector_size)) {
+
+               DBG(CXT, ul_debugobj(cxt, "LBA: area smaller than grain, don't align"));
+               res = lba;
+               goto done;
+       }
+
        lba = fdisk_align_lba(cxt, lba, FDISK_ALIGN_NEAREST);
 
        if (lba < start)
        else
                res = lba;
 
+done:
        DBG(CXT, ul_debugobj(cxt, "LBA %ju range:<%ju..%ju>, result: %ju",
                                (uintmax_t) lba,
                                (uintmax_t) start,