metagraph-dev
diff --git a/‎mlir_graphblas/src/lib/GraphBLAS/GraphBLASPasses.cpp‎
Lines changed: 134 additions & 2 deletions b/‎mlir_graphblas/src/lib/GraphBLAS/GraphBLASPasses.cpp‎
Lines changed: 134 additions & 2 deletions
diff --git a/‎mlir_graphblas/src/lowering-test/MatrixSelect.cpp‎
Lines changed: 114 additions & 2 deletions b/‎mlir_graphblas/src/lowering-test/MatrixSelect.cpp‎
Lines changed: 114 additions & 2 deletions
diff --git a/‎mlir_graphblas/src/test/GraphBLAS/lower_select_gt0.mlir‎
Lines changed: 58 additions & 0 deletions b/‎mlir_graphblas/src/test/GraphBLAS/lower_select_gt0.mlir‎
Lines changed: 58 additions & 0 deletions
@@ -181,8 +181,139 @@ class LowerMatrixSelectRewrite : public OpRewritePattern<graphblas::MatrixSelect
 public:
   using OpRewritePattern<graphblas::MatrixSelectOp>::OpRewritePattern;
   LogicalResult matchAndRewrite(graphblas::MatrixSelectOp op, PatternRewriter &rewriter) const {
-    // TODO sanity check that the sparse encoding is sane
-    return failure();
+    ModuleOp module = op->getParentOfType<ModuleOp>();
+    Location loc = op->getLoc();
+
+    Value input = op.input();
+    Type valueType = input.getType().dyn_cast<TensorType>().getElementType();
+    Type int64Type = rewriter.getIntegerType(64);
+    FloatType float64Type = rewriter.getF64Type();
+    Type indexType = rewriter.getIndexType();
+    Type memref1DI64Type = MemRefType::get({-1}, int64Type);
+    Type memref1DValueType = MemRefType::get({-1}, valueType);
+
+    StringRef selector = op.selector();
+
+    bool needs_col = false, needs_val = false;
+    if (selector == "triu")
+    {
+      needs_col = true;
+      needs_val = false;
+    }
+    else if (selector == "tril")
+    {
+      needs_col = true;
+      needs_val = false;
+    }
+    else if (selector == "gt0")
+    {
+      needs_col = false;
+      needs_val = true;
+    }
+    else
+    {
+      return failure();
+    }
+
+    // Initial constants
+    Value c0 = rewriter.create<ConstantIndexOp>(loc, 0);
+    Value c1 = rewriter.create<ConstantIndexOp>(loc, 1);
+    Value c0_64 = rewriter.create<ConstantIntOp>(loc, 0, int64Type);
+    Value c1_64 = rewriter.create<ConstantIntOp>(loc, 1, int64Type);
+    Value cf0 = rewriter.create<ConstantFloatOp>(loc, APFloat(0.0), float64Type);
+
+    // Get sparse tensor info
+    Value nrow = rewriter.create<memref::DimOp>(loc, input, c0);
+    Value Ap = rewriter.create<sparse_tensor::ToPointersOp>(loc, memref1DI64Type, input, c1);
+    Value Aj = rewriter.create<sparse_tensor::ToIndicesOp>(loc, memref1DI64Type, input, c1);
+    Value Ax = rewriter.create<sparse_tensor::ToValuesOp>(loc, memref1DValueType, input);
+
+    Value output = callDupTensor(rewriter, module, loc, input).getResult(0);
+    Value Bp = rewriter.create<sparse_tensor::ToPointersOp>(loc, memref1DI64Type, output, c1);
+    Value Bj = rewriter.create<sparse_tensor::ToIndicesOp>(loc, memref1DI64Type, output, c1);
+    Value Bx = rewriter.create<sparse_tensor::ToValuesOp>(loc, memref1DValueType, output);
+
+    rewriter.create<memref::StoreOp>(loc, c0_64, Bp, c0);
+    // Loop
+    scf::ForOp outerLoop = rewriter.create<scf::ForOp>(loc, c0, nrow, c1);
+    Value row = outerLoop.getInductionVar();
+
+    rewriter.setInsertionPointToStart(outerLoop.getBody());
+    Value row_plus1 = rewriter.create<mlir::AddIOp>(loc, row, c1);
+    Value bp_curr_count = rewriter.create<memref::LoadOp>(loc, Bp, row);
+    rewriter.create<memref::StoreOp>(loc, bp_curr_count, Bp, row_plus1);
+
+    Value j_start_64 = rewriter.create<memref::LoadOp>(loc, Ap, row);
+    Value j_end_64 = rewriter.create<memref::LoadOp>(loc, Ap, row_plus1);
+    Value j_start = rewriter.create<mlir::IndexCastOp>(loc, j_start_64, indexType);
+    Value j_end = rewriter.create<mlir::IndexCastOp>(loc, j_end_64, indexType);
+
+    scf::ForOp innerLoop = rewriter.create<scf::ForOp>(loc, j_start, j_end, c1);
+
+    Value jj = innerLoop.getInductionVar();
+
+    rewriter.setInsertionPointToStart(innerLoop.getBody());
+    Value col_64, col, val, keep;
+    if (needs_col)
+    {
+      col_64 = rewriter.create<memref::LoadOp>(loc, Aj, jj);
+      col = rewriter.create<mlir::IndexCastOp>(loc, col_64, indexType);
+    }
+    if (needs_val)
+    {
+      val = rewriter.create<memref::LoadOp>(loc, Ax, jj);
+    }
+    if (selector == "triu")
+    {
+      keep = rewriter.create<mlir::CmpIOp>(loc, mlir::CmpIPredicate::ugt, col, row);
+    }
+    else if (selector == "tril")
+    {
+      keep = rewriter.create<mlir::CmpIOp>(loc, mlir::CmpIPredicate::ult, col, row);
+    }
+    else if (selector == "gt0")
+    {
+      keep = rewriter.create<mlir::CmpFOp>(loc, mlir::CmpFPredicate::OGT, val, cf0);
+    }
+    else
+    {
+      return failure();
+    }
+
+    scf::IfOp ifKeep = rewriter.create<scf::IfOp>(loc, keep, false /* no else region */);
+
+    rewriter.setInsertionPointToStart(ifKeep.thenBlock());
+
+    Value bj_pos_64 = rewriter.create<memref::LoadOp>(loc, Bp, row_plus1);
+    Value bj_pos = rewriter.create<mlir::IndexCastOp>(loc, bj_pos_64, indexType);
+
+    if (!needs_col)
+    {
+      col_64 = rewriter.create<memref::LoadOp>(loc, Aj, jj);
+    }
+    rewriter.create<memref::StoreOp>(loc, col_64, Bj, bj_pos);
+
+    if (!needs_val)
+    {
+      val = rewriter.create<memref::LoadOp>(loc, Ax, jj);
+    }
+    rewriter.create<memref::StoreOp>(loc, val, Bx, bj_pos);
+
+    Value bj_pos_plus1 = rewriter.create<mlir::AddIOp>(loc, bj_pos_64, c1_64);
+    rewriter.create<memref::StoreOp>(loc, bj_pos_plus1, Bp, row_plus1);
+
+    rewriter.setInsertionPointAfter(outerLoop);
+
+    // trim excess values
+    Value nnz_64 = rewriter.create<memref::LoadOp>(loc, Bp, nrow);
+    Value nnz = rewriter.create<mlir::IndexCastOp>(loc, nnz_64, indexType);
+
+    callResizeIndex(rewriter, module, loc, output, c1, nnz);
+    callResizeValues(rewriter, module, loc, output, nnz);
+
+    rewriter.replaceOp(op, output);
+
+    return success();
   };
 };
 
@@ -394,6 +525,7 @@ class LowerMatrixMultiplyRewrite : public OpRewritePattern<graphblas::MatrixMult
 
 void populateGraphBLASLoweringPatterns(RewritePatternSet &patterns) {
   patterns.add<
+    LowerMatrixSelectRewrite,
     LowerMatrixReduceToScalarRewrite,
     LowerMatrixMultiplyRewrite,
     LowerTransposeRewrite,
 
@@ -3,6 +3,7 @@
 #include "mlir/IR/BuiltinOps.h"
 #include "mlir/IR/BuiltinTypes.h"
 #include "mlir/Dialect/StandardOps/IR/Ops.h"
+#include "mlir/Dialect/SCF/SCF.h"
 #include "mlir/IR/MLIRContext.h"
 #include "mlir/IR/Verifier.h"
 #include "mlir/Dialect/SparseTensor/IR/SparseTensor.h"
@@ -18,10 +19,32 @@ void addMatrixSelectFunc(mlir::ModuleOp mod, const std::string &selector)
 {
     MLIRContext *context = mod.getContext();
     OpBuilder builder(mod.getBodyRegion());
+    auto loc = builder.getUnknownLoc();
     builder.setInsertionPointToStart(mod.getBody());
 
-    // Create function signature
+    bool needs_col = false, needs_val = false;
+    if (selector == "triu") {
+        needs_col = true;
+        needs_val = false;
+    } else if (selector == "tril") {
+        needs_col = true;
+        needs_val = false;
+    } else if (selector == "gt0") {
+        needs_col = false;
+        needs_val = true;
+    } else {
+        assert(!"invalid selector");
+    }
+
+    // Types
     auto valueType = builder.getF64Type();
+    auto i64Type = builder.getI64Type();
+    auto f64Type = builder.getF64Type();
+    auto indexType = builder.getIndexType();
+    auto memref1DI64Type = MemRefType::get({-1}, i64Type);
+    auto memref1DValueType = MemRefType::get({-1}, valueType);
+
+    // Create function signature
     RankedTensorType csrTensor = getCSRTensorType(context, valueType);
 
     string func_name = "matrix_select_" + selector;
@@ -33,8 +56,97 @@ void addMatrixSelectFunc(mlir::ModuleOp mod, const std::string &selector)
     auto &entry_block = *func.addEntryBlock();
     builder.setInsertionPointToStart(&entry_block);
 
+    auto input = entry_block.getArgument(0);
+
     // add function body ops here
+    // Initial constants
+    Value c0 = builder.create<ConstantIndexOp>(loc, 0);
+    Value c1 = builder.create<ConstantIndexOp>(loc, 1);
+    Value c0_64 = builder.create<ConstantIntOp>(loc, 0, i64Type);
+    Value c1_64 = builder.create<ConstantIntOp>(loc, 1, i64Type);
+    Value cf0 = builder.create<ConstantFloatOp>(loc, APFloat(0.0), f64Type);
+
+    // Get sparse tensor info
+    Value nrow = builder.create<memref::DimOp>(loc, input, c0);
+    Value ncol = builder.create<memref::DimOp>(loc, input, c1);
+    Value Ap = builder.create<ToPointersOp>(loc, memref1DI64Type, input, c1);
+    Value Aj = builder.create<ToIndicesOp>(loc, memref1DI64Type, input, c1);
+    Value Ax = builder.create<ToValuesOp>(loc, memref1DValueType, input);
+
+    Value output = callDupTensor(builder, mod, loc, input).getResult(0);
+    Value Bp = builder.create<ToPointersOp>(loc, memref1DI64Type, output, c1);
+    Value Bj = builder.create<ToIndicesOp>(loc, memref1DI64Type, output, c1);
+    Value Bx = builder.create<ToValuesOp>(loc, memref1DValueType, output);
+
+    builder.create<memref::StoreOp>(loc, c0_64, Bp, c0);
+    // Loop
+    auto outerLoop = builder.create<scf::ForOp>(loc, c0, nrow, c1);
+    Value row = outerLoop.getInductionVar();
+
+    builder.setInsertionPointToStart(outerLoop.getBody());
+    Value row_plus1 = builder.create<mlir::AddIOp>(loc, row, c1);
+    Value bp_curr_count = builder.create<memref::LoadOp>(loc, Bp, row);
+    builder.create<memref::StoreOp>(loc, bp_curr_count, Bp, row_plus1);
+
+    Value j_start_64 = builder.create<memref::LoadOp>(loc, Ap, row);
+    Value j_end_64 = builder.create<memref::LoadOp>(loc, Ap, row_plus1);
+    Value j_start = builder.create<mlir::IndexCastOp>(loc, j_start_64, indexType);
+    Value j_end = builder.create<mlir::IndexCastOp>(loc, j_end_64, indexType);
+
+    auto innerLoop = builder.create<scf::ForOp>(loc, j_start, j_end, c1);
+
+    Value jj = innerLoop.getInductionVar();
+
+    builder.setInsertionPointToStart(innerLoop.getBody());
+    Value col_64, col, val, keep;
+    if (needs_col) {
+        col_64 = builder.create<memref::LoadOp>(loc, Aj, jj);
+        col = builder.create<mlir::IndexCastOp>(loc, col_64, indexType);
+    }
+    if (needs_val) {
+        val = builder.create<memref::LoadOp>(loc, Ax, jj);
+    }
+    if (selector == "triu") {
+        keep = builder.create<mlir::CmpIOp>(loc, mlir::CmpIPredicate::ugt, col, row);
+    }
+    else if (selector == "tril") {
+        keep = builder.create<mlir::CmpIOp>(loc, mlir::CmpIPredicate::ult, col, row);
+    }
+    else if (selector == "gt0") {
+        keep = builder.create<mlir::CmpFOp>(loc, mlir::CmpFPredicate::OGT, val, cf0);
+    }
+    else {
+        assert(!"invalid selector");
+    }
+
+    scf::IfOp ifKeep = builder.create<scf::IfOp>(loc, keep, false /* no else region */);
+
+    builder.setInsertionPointToStart(ifKeep.thenBlock());
+
+    Value bj_pos_64 = builder.create<memref::LoadOp>(loc, Bp, row_plus1);
+    Value bj_pos = builder.create<mlir::IndexCastOp>(loc, bj_pos_64, indexType);
+
+    if (!needs_col) {
+        col_64 = builder.create<memref::LoadOp>(loc, Aj, jj);
+    }
+    builder.create<memref::StoreOp>(loc, col_64, Bj, bj_pos);
+
+    if (!needs_val) {
+        val = builder.create<memref::LoadOp>(loc, Ax, jj);
+    }
+    builder.create<memref::StoreOp>(loc, val, Bx, bj_pos);
+
+    Value bj_pos_plus1 = builder.create<mlir::AddIOp>(loc, bj_pos_64, c1_64);
+    builder.create<memref::StoreOp>(loc, bj_pos_plus1, Bp, row_plus1);
+
+    builder.setInsertionPointAfter(outerLoop);
+
+    Value nnz_64 = builder.create<memref::LoadOp>(loc, Bp, nrow);
+    Value nnz = builder.create<mlir::IndexCastOp>(loc, nnz_64, indexType);
+
+    callResizeIndex(builder, mod, loc, output, c1, nnz);
+    callResizeValues(builder, mod, loc, output, nnz);
 
     // Add return op
-    builder.create<ReturnOp>(builder.getUnknownLoc());
+    builder.create<ReturnOp>(builder.getUnknownLoc(), output);
 }
@@ -0,0 +1,58 @@
+// RUN: graphblas-opt %s | graphblas-opt --graphblas-lower | FileCheck %s
+
+#CSR64 = #sparse_tensor.encoding<{
+  dimLevelType = [ "dense", "compressed" ],
+  dimOrdering = affine_map<(i,j) -> (i,j)>,
+  pointerBitWidth = 64,
+  indexBitWidth = 64
+}>
+
+// CHECK-LABEL:   func @select_gt0(
+// CHECK-SAME:                     %[[VAL_0:.*]]: tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>) -> tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> {
+// CHECK:           %[[VAL_1:.*]] = constant 0 : index
+// CHECK:           %[[VAL_2:.*]] = constant 1 : index
+// CHECK:           %[[VAL_3:.*]] = constant 0 : i64
+// CHECK:           %[[VAL_4:.*]] = constant 1 : i64
+// CHECK:           %[[VAL_5:.*]] = constant 0.000000e+00 : f64
+// CHECK:           %[[VAL_6:.*]] = memref.dim %[[VAL_0]], %[[VAL_1]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>
+// CHECK:           %[[VAL_8:.*]] = sparse_tensor.pointers %[[VAL_0]], %[[VAL_2]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> to memref<?xi64>
+// CHECK:           %[[VAL_9:.*]] = sparse_tensor.indices %[[VAL_0]], %[[VAL_2]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> to memref<?xi64>
+// CHECK:           %[[VAL_10:.*]] = sparse_tensor.values %[[VAL_0]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> to memref<?xf64>
+// CHECK:           %[[VAL_11:.*]] = call @dup_tensor(%[[VAL_0]]) : (tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>) -> tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>
+// CHECK:           %[[VAL_12:.*]] = sparse_tensor.pointers %[[VAL_11]], %[[VAL_2]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> to memref<?xi64>
+// CHECK:           %[[VAL_13:.*]] = sparse_tensor.indices %[[VAL_11]], %[[VAL_2]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> to memref<?xi64>
+// CHECK:           %[[VAL_14:.*]] = sparse_tensor.values %[[VAL_11]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>> to memref<?xf64>
+// CHECK:           memref.store %[[VAL_3]], %[[VAL_12]]{{\[}}%[[VAL_1]]] : memref<?xi64>
+// CHECK:           scf.for %[[VAL_15:.*]] = %[[VAL_1]] to %[[VAL_6]] step %[[VAL_2]] {
+// CHECK:             %[[VAL_16:.*]] = addi %[[VAL_15]], %[[VAL_2]] : index
+// CHECK:             %[[VAL_17:.*]] = memref.load %[[VAL_12]]{{\[}}%[[VAL_15]]] : memref<?xi64>
+// CHECK:             memref.store %[[VAL_17]], %[[VAL_12]]{{\[}}%[[VAL_16]]] : memref<?xi64>
+// CHECK:             %[[VAL_18:.*]] = memref.load %[[VAL_8]]{{\[}}%[[VAL_15]]] : memref<?xi64>
+// CHECK:             %[[VAL_19:.*]] = memref.load %[[VAL_8]]{{\[}}%[[VAL_16]]] : memref<?xi64>
+// CHECK:             %[[VAL_20:.*]] = index_cast %[[VAL_18]] : i64 to index
+// CHECK:             %[[VAL_21:.*]] = index_cast %[[VAL_19]] : i64 to index
+// CHECK:             scf.for %[[VAL_22:.*]] = %[[VAL_20]] to %[[VAL_21]] step %[[VAL_2]] {
+// CHECK:               %[[VAL_23:.*]] = memref.load %[[VAL_10]]{{\[}}%[[VAL_22]]] : memref<?xf64>
+// CHECK:               %[[VAL_24:.*]] = cmpf ogt, %[[VAL_23]], %[[VAL_5]] : f64
+// CHECK:               scf.if %[[VAL_24]] {
+// CHECK:                 %[[VAL_25:.*]] = memref.load %[[VAL_12]]{{\[}}%[[VAL_16]]] : memref<?xi64>
+// CHECK:                 %[[VAL_26:.*]] = index_cast %[[VAL_25]] : i64 to index
+// CHECK:                 %[[VAL_27:.*]] = memref.load %[[VAL_9]]{{\[}}%[[VAL_22]]] : memref<?xi64>
+// CHECK:                 memref.store %[[VAL_27]], %[[VAL_13]]{{\[}}%[[VAL_26]]] : memref<?xi64>
+// CHECK:                 memref.store %[[VAL_23]], %[[VAL_14]]{{\[}}%[[VAL_26]]] : memref<?xf64>
+// CHECK:                 %[[VAL_28:.*]] = addi %[[VAL_25]], %[[VAL_4]] : i64
+// CHECK:                 memref.store %[[VAL_28]], %[[VAL_12]]{{\[}}%[[VAL_16]]] : memref<?xi64>
+// CHECK:               }
+// CHECK:             }
+// CHECK:           }
+// CHECK:           %[[VAL_29:.*]] = memref.load %[[VAL_12]]{{\[}}%[[VAL_6]]] : memref<?xi64>
+// CHECK:           %[[VAL_30:.*]] = index_cast %[[VAL_29]] : i64 to index
+// CHECK:           call @resize_index(%[[VAL_11]], %[[VAL_2]], %[[VAL_30]]) : (tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>, index, index) -> ()
+// CHECK:           call @resize_values(%[[VAL_11]], %[[VAL_30]]) : (tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>, index) -> ()
+// CHECK:           return %[[VAL_11]] : tensor<?x?xf64, #sparse_tensor.encoding<{ dimLevelType = [ "dense", "compressed" ], dimOrdering = affine_map<(d0, d1) -> (d0, d1)>, pointerBitWidth = 64, indexBitWidth = 64 }>>
+// CHECK:         }
+
+func @select_gt0(%sparse_tensor: tensor<?x?xf64, #CSR64>) -> tensor<?x?xf64, #CSR64> {
+    %answer = graphblas.matrix_select %sparse_tensor { selector = "gt0" } : tensor<?x?xf64, #CSR64>
+    return %answer : tensor<?x?xf64, #CSR64>
+}