Add tests for the first and firstOrNull functions

Allex-Nik · Allex-Nik · commit 6007bbcdb57e · 2025-11-27T17:53:39.000+01:00
diff --git a/core/src/test/kotlin/org/jetbrains/kotlinx/dataframe/api/first.kt b/core/src/test/kotlin/org/jetbrains/kotlinx/dataframe/api/first.kt
@@ -1,8 +1,14 @@
 package org.jetbrains.kotlinx.dataframe.api
 
 import io.kotest.assertions.throwables.shouldThrow
+import io.kotest.matchers.shouldBe
+import org.jetbrains.kotlinx.dataframe.nrow
+import org.jetbrains.kotlinx.dataframe.samples.api.age
 import org.jetbrains.kotlinx.dataframe.samples.api.firstName
+import org.jetbrains.kotlinx.dataframe.samples.api.isHappy
+import org.jetbrains.kotlinx.dataframe.samples.api.lastName
 import org.jetbrains.kotlinx.dataframe.samples.api.name
+import org.jetbrains.kotlinx.dataframe.samples.api.weight
 import org.junit.Test
 
 class FirstTests : ColumnsSelectionDslTests() {
@@ -36,8 +42,227 @@ class FirstTests : ColumnsSelectionDslTests() {
             df.select { "name".firstCol { col -> col.any { it == "Alice" } } },
             df.select { Person::name.firstCol { col -> col.any { it == "Alice" } } },
             df.select { NonDataSchemaPerson::name.firstCol { col -> col.any { it == "Alice" } } },
+            df.select { pathOf("name").firstCol() },
             df.select { pathOf("name").firstCol { col -> col.any { it == "Alice" } } },
             df.select { it["name"].asColumnGroup().firstCol { col -> col.any { it == "Alice" } } },
         ).shouldAllBeEqual()
     }
+
+    @Test
+    fun `first on DataColumn`() {
+        df.name.lastName.first() shouldBe "Cooper"
+        df.age.first { it in 18..<40 } shouldBe 20
+
+        shouldThrow<IndexOutOfBoundsException> {
+            df.drop(df.nrow).isHappy.first()
+        }
+    }
+
+    @Test
+    fun `firstOrNull on DataColumn`() {
+        df.name.lastName.firstOrNull() shouldBe "Cooper"
+        df.drop(2).weight.firstOrNull() shouldBe null
+        df.drop(df.nrow).age.firstOrNull() shouldBe null
+
+        df.age.firstOrNull { it in 21..30 } shouldBe 30
+        df.age.firstOrNull { it > 50 } shouldBe null
+    }
+
+    @Test
+    fun `first on DataFrame`() {
+        df.first().name.lastName shouldBe "Cooper"
+        df.first { !isHappy }.name.lastName shouldBe "Daniels"
+
+        shouldThrow<NoSuchElementException> {
+            df.drop(df.nrow).first()
+        }
+        shouldThrow<NoSuchElementException> {
+            df.first { age > 50 }
+        }
+        shouldThrow<NoSuchElementException> {
+            df.drop(df.nrow).first { isHappy }
+        }
+    }
+
+    @Test
+    fun `firstOrNull on DataFrame`() {
+        df.firstOrNull()?.name?.lastName shouldBe "Cooper"
+        df.drop(df.nrow).firstOrNull() shouldBe null
+
+        df.firstOrNull { !isHappy }?.name?.lastName shouldBe "Daniels"
+        df.firstOrNull { age > 50 } shouldBe null
+        df.drop(df.nrow).firstOrNull { isHappy } shouldBe null
+    }
+
+    @Test
+    fun `first on GroupBy`() {
+        val grouped = df.groupBy { isHappy }
+        val reducedGrouped = grouped.first()
+        val firstHappy = reducedGrouped.values()[0]
+        val firstUnhappy = reducedGrouped.values()[1]
+
+        firstHappy shouldBe dataFrameOf(
+            "isHappy" to columnOf(true),
+            "name" to columnOf(
+                "firstName" to columnOf("Alice"),
+                "lastName" to columnOf("Cooper"),
+            ),
+            "age" to columnOf(15),
+            "city" to columnOf("London"),
+            "weight" to columnOf(54),
+        )[0]
+
+        firstUnhappy shouldBe dataFrameOf(
+            "isHappy" to columnOf(false),
+            "name" to columnOf(
+                "firstName" to columnOf("Charlie"),
+                "lastName" to columnOf("Daniels")
+            ),
+            "age" to columnOf(20),
+            "city" to columnOf("Moscow"),
+            "weight" to columnOf(null),
+        )[0]
+    }
+
+    @Test
+    fun `first on GroupBy with predicate`() {
+        val grouped = df.groupBy { isHappy }
+        val reducedGrouped = grouped.first{ it["age"] as Int > 17 && it["city"] != "Moscow" }
+        val firstHappy = reducedGrouped.values()[0]
+        val firstUnhappy = reducedGrouped.values()[1]
+
+        firstHappy shouldBe dataFrameOf(
+            "isHappy" to columnOf(true),
+            "name" to columnOf(
+                "firstName" to columnOf("Bob"),
+                "lastName" to columnOf("Dylan"),
+            ),
+            "age" to columnOf(45),
+            "city" to columnOf("Dubai"),
+            "weight" to columnOf(87),
+        )[0]
+
+        firstUnhappy shouldBe dataFrameOf(
+            "isHappy" to columnOf(false),
+            "name" to columnOf(
+                "firstName" to columnOf("Alice"),
+                "lastName" to columnOf("Wolf")
+            ),
+            "age" to columnOf(20),
+            "city" to columnOf(null),
+            "weight" to columnOf(55),
+        )[0]
+    }
+
+    @Test
+    fun `first on Pivot`() {
+        val pivot = df.pivot { isHappy }
+        val reducedPivot = pivot.first()
+        val firstHappy = reducedPivot.values()[0]
+        val firstUnhappy = reducedPivot.values()[1]
+        firstHappy shouldBe dataFrameOf(
+            "name" to columnOf(
+                "firstName" to columnOf("Alice"),
+                "lastName" to columnOf("Cooper")
+            ),
+            "age" to columnOf(15),
+            "city" to columnOf("London"),
+            "weight" to columnOf(54),
+        )[0]
+
+        firstUnhappy shouldBe dataFrameOf(
+            "name" to columnOf(
+                "firstName" to columnOf("Charlie"),
+                "lastName" to columnOf("Daniels")
+            ),
+            "age" to columnOf(20),
+            "city" to columnOf("Moscow"),
+            "weight" to columnOf(null),
+        )[0]
+    }
+
+    @Test
+    fun `first on Pivot with predicate`() {
+        val pivot = df.pivot { isHappy }
+        val reducedPivotAdults = pivot.first { age > 17 }
+        val firstHappyAdult = reducedPivotAdults.values()[0]
+        val firstUnhappyAdult = reducedPivotAdults.values()[1]
+
+        firstHappyAdult shouldBe dataFrameOf(
+            "name" to columnOf(
+                "firstName" to columnOf("Bob"),
+                "lastName" to columnOf("Dylan")
+            ),
+            "age" to columnOf(45),
+            "city" to columnOf("Dubai"),
+            "weight" to columnOf(87),
+        )[0]
+
+        firstUnhappyAdult shouldBe dataFrameOf(
+            "name" to columnOf(
+                "firstName" to columnOf("Charlie"),
+                "lastName" to columnOf("Daniels")
+            ),
+            "age" to columnOf(20),
+            "city" to columnOf("Moscow"),
+            "weight" to columnOf(null),
+        )[0]
+    }
+
+    @Test
+    fun `first on PivotGroupBy`() {
+        val students = dataFrameOf(
+            "name" to columnOf("Alice", "Alice", "Alice", "Alice", "Bob", "Bob", "Bob", "Bob"),
+            "age" to columnOf(15, 15, 20, 20, 15, 15, 20, 20),
+            "group" to columnOf(1, 2, 1, 2, 1, 2, 1, 2)
+        )
+        val studentsPivotGrouped = students.pivot("age").groupBy("name")
+        val studentsPivotGroupedReduced = studentsPivotGrouped.first().values()
+        val expectedDf = dataFrameOf(
+            "name" to columnOf("Alice", "Bob"),
+            "age" to columnOf(
+                "15" to columnOf(1, 1),
+                "20" to columnOf(1, 1),
+            )
+        )
+        studentsPivotGroupedReduced shouldBe expectedDf
+    }
+
+    @Test
+    fun `first on PivotGroupBy with predicate`() {
+        val students = dataFrameOf(
+            "name" to columnOf("Alice", "Alice", "Alice", "Alice", "Bob", "Bob", "Bob", "Bob"),
+            "age" to columnOf(15, 15, 20, 20, 15, 15, 20, 20),
+            "group" to columnOf(1, 2, 1, 2, 1, 2, 1, 2)
+        )
+        val studentsPivotGrouped = students.pivot("age").groupBy("name")
+        val studentsPivotGroupedReduced = studentsPivotGrouped.first { it["group"] == 2 }.values()
+        val expected = dataFrameOf(
+            "name" to columnOf("Alice", "Bob"),
+            "age" to columnOf(
+                "15" to columnOf(2, 2),
+                "20" to columnOf(2, 2),
+            )
+        )
+        studentsPivotGroupedReduced shouldBe expected
+    }
+
+    @Test
+    fun `first on PivotGroupBy with predicate without match`() {
+        val students = dataFrameOf(
+            "name" to columnOf("Alice", "Alice", "Alice", "Alice", "Bob", "Bob", "Bob", "Bob"),
+            "age" to columnOf(15, 15, 20, 20, 15, 15, 20, 20),
+            "group" to columnOf(1, 2, 1, 2, 1, 2, 1, 2)
+        )
+        val studentsPivotGrouped = students.pivot("age").groupBy("name")
+        val studentsPivotGroupedReduced = studentsPivotGrouped.first { it["group"] == 3 }.values()
+        val expected = dataFrameOf(
+            "name" to columnOf("Alice", "Bob"),
+            "age" to columnOf(
+                "15" to columnOf(null, null),
+                "20" to columnOf(null, null),
+            )
+        )
+        studentsPivotGroupedReduced shouldBe expected
+    }
 }