andrewDoing · andrewDoing · Mar 19, 2026 · Mar 17, 2026 · Mar 17, 2026 · Mar 17, 2026
diff --git a/.gitignore b/.gitignore
@@ -17,6 +17,7 @@ env/
 
 # Test / coverage
 .pytest_cache/
+backend/pytest-unit-results.xml
 coverage.xml
 htmlcov/
 

diff --git a/backend/app/adapters/repos/base.py b/backend/app/adapters/repos/base.py
@@ -32,9 +32,10 @@ async def list_gt_paginated(
         tags: list[str] | None = None,
         exclude_tags: list[str] | None = None,
         item_id: str | None = None,
-        ref_url: str | None = None,
+        plugin_filters: dict[str, str] | None = None,
         keyword: str | None = None,
         sort_by: SortField | None = None,
+        plugin_sort: str | None = None,
         sort_order: SortOrder | None = None,
         page: int = 1,
         limit: int = 25,

diff --git a/backend/app/adapters/repos/cosmos_repo.py b/backend/app/adapters/repos/cosmos_repo.py
diff --git a/backend/app/adapters/repos/memory_repo.py b/backend/app/adapters/repos/memory_repo.py
@@ -5,6 +5,7 @@
 from typing import Iterable
 from uuid import UUID
 
+from app.domain.conversation_fields import answer_text_from_item, question_text_from_item
 from app.domain.enums import GroundTruthStatus, SortField, SortOrder
 from app.domain.models import (
     AgenticGroundTruthEntry,
@@ -15,6 +16,8 @@
     PaginationMetadata,
     Stats,
 )
+from app.plugins.base import PluginPackRegistry
+from app.plugins.pack_registry import get_default_pack_registry
 
 ZERO_UUID = UUID("00000000-0000-0000-0000-000000000000")
 
@@ -25,12 +28,14 @@ def __init__(
         *,
         items: list[AgenticGroundTruthEntry] | None = None,
         curation_instructions: list[DatasetCurationInstructions] | None = None,
+        plugin_pack_registry: PluginPackRegistry | None = None,
     ) -> None:
         self.items: dict[str, AgenticGroundTruthEntry] = {}
         self._locations: dict[tuple[str, UUID, str], str] = {}
         self._assignment_docs: dict[tuple[str, str], AssignmentDocument] = {}
         self._curation: dict[str, DatasetCurationInstructions] = {}
         self._etag_version = 0
+        self._plugin_pack_registry = plugin_pack_registry or get_default_pack_registry()
 
         for item in items or []:
             self._store_initial_item(item)
@@ -45,7 +50,9 @@ def _next_etag(self) -> str:
         return f"memory-etag-{self._etag_version}"
 
     def _clone_item(self, item: AgenticGroundTruthEntry) -> AgenticGroundTruthEntry:
-        return AgenticGroundTruthEntry.model_validate(item.model_dump(by_alias=True))
+        return AgenticGroundTruthEntry.model_validate(
+            item.model_dump(by_alias=True, exclude={"tags"})
+        )
 
     def _clone_instruction(self, doc: DatasetCurationInstructions) -> DatasetCurationInstructions:
         return DatasetCurationInstructions.model_validate(doc.model_dump(by_alias=True))
@@ -104,28 +111,30 @@ def _matches_location(
         )
 
     def _collect_urls(self, item: AgenticGroundTruthEntry) -> Iterable[str]:
-        for ref in item.refs:
-            yield ref.url
-        for turn in item.history or []:
-            for ref in getattr(turn, "refs", None) or []:
-                yield ref.url
+        for doc in self._plugin_pack_registry.collect_search_documents(item):
+            url = doc.get("url")
+            if isinstance(url, str) and url:
+                yield url
 
     def _collect_text(self, item: AgenticGroundTruthEntry) -> str:
         parts = [
             item.id,
             item.datasetName,
-            item.synth_question or "",
-            item.edited_question or "",
-            item.answer or "",
+            question_text_from_item(item),
+            answer_text_from_item(item),
             item.comment or "",
         ]
         for turn in item.history or []:
             parts.append(turn.msg)
-        for ref in item.refs:
-            parts.extend([ref.title or "", ref.url, ref.content or "", ref.keyExcerpt or ""])
-        for turn in item.history or []:
-            for ref in getattr(turn, "refs", None) or []:
-                parts.extend([ref.title or "", ref.url, ref.content or "", ref.keyExcerpt or ""])
+        for doc in self._plugin_pack_registry.collect_search_documents(item):
+            parts.extend(
+                [
+                    str(doc.get("id") or ""),
+                    str(doc.get("title") or ""),
+                    str(doc.get("url") or ""),
+                    str(doc.get("chunk") or ""),
+                ]
+            )
         return " ".join(parts).lower()
 
     def _is_unassigned_candidate(self, item: AgenticGroundTruthEntry) -> bool:
@@ -138,24 +147,27 @@ def _sort_items(
         self,
         items: list[AgenticGroundTruthEntry],
         sort_by: SortField | None,
+        plugin_sort: str | None,
         sort_order: SortOrder | None,
     ) -> list[AgenticGroundTruthEntry]:
         field = sort_by or SortField.reviewed_at
         reverse = (sort_order or SortOrder.desc) == SortOrder.desc
 
         def key(item: AgenticGroundTruthEntry):
+            if plugin_sort:
+                plugin_value = self._plugin_pack_registry.plugin_sort_value(item, plugin_sort)
+                return (
+                    plugin_value if plugin_value is not None else -1,
+                    item.updated_at or datetime.min.replace(tzinfo=timezone.utc),
+                    item.id,
+                )
             if field == SortField.updated_at:
                 return item.updated_at or datetime.min.replace(tzinfo=timezone.utc)
             if field == SortField.id:
                 return item.id
             if field == SortField.has_answer:
                 return (
-                    1 if (item.answer or "").strip() else 0,
-                    item.updated_at or datetime.min.replace(tzinfo=timezone.utc),
-                )
-            if field == SortField.totalReferences:
-                return (
-                    item.totalReferences,
+                    1 if answer_text_from_item(item) else 0,
                     item.updated_at or datetime.min.replace(tzinfo=timezone.utc),
                 )
             if field == SortField.tag_count:
@@ -194,7 +206,7 @@ async def list_gt_by_dataset(
             items = [item for item in items if item.status == status]
         return [
             self._clone_item(item)
-            for item in self._sort_items(items, SortField.updated_at, SortOrder.desc)
+            for item in self._sort_items(items, SortField.updated_at, None, SortOrder.desc)
         ]
 
     async def list_all_gt(
@@ -205,7 +217,7 @@ async def list_all_gt(
             items = [item for item in items if item.status == status]
         return [
             self._clone_item(item)
-            for item in self._sort_items(items, SortField.updated_at, SortOrder.desc)
+            for item in self._sort_items(items, SortField.updated_at, None, SortOrder.desc)
         ]
 
     async def list_gt_paginated(
@@ -215,9 +227,10 @@ async def list_gt_paginated(
         tags: list[str] | None = None,
         exclude_tags: list[str] | None = None,
         item_id: str | None = None,
-        ref_url: str | None = None,
+        plugin_filters: dict[str, str] | None = None,
         keyword: str | None = None,
         sort_by: SortField | None = None,
+        plugin_sort: str | None = None,
         sort_order: SortOrder | None = None,
         page: int = 1,
         limit: int = 25,
@@ -235,15 +248,17 @@ async def list_gt_paginated(
             filtered = [item for item in filtered if not banned.intersection(set(item.tags))]
         if item_id:
             filtered = [item for item in filtered if item_id in item.id]
-        if ref_url:
+        if plugin_filters:
             filtered = [
-                item for item in filtered if any(ref_url in url for url in self._collect_urls(item))
+                item
+                for item in filtered
+                if self._plugin_pack_registry.matches_query_filters(item, plugin_filters)
             ]
         if keyword:
             lowered = keyword.lower()
             filtered = [item for item in filtered if lowered in self._collect_text(item)]
 
-        sorted_items = self._sort_items(filtered, sort_by, sort_order)
+        sorted_items = self._sort_items(filtered, sort_by, plugin_sort, sort_order)
         total = len(sorted_items)
         start = (page - 1) * limit
         end = start + limit
@@ -325,7 +340,7 @@ async def list_unassigned(self, limit: int) -> list[AgenticGroundTruthEntry]:
         items = [item for item in self.items.values() if self._is_unassigned_candidate(item)]
         return [
             self._clone_item(item)
-            for item in self._sort_items(items, SortField.updated_at, SortOrder.desc)[:limit]
+            for item in self._sort_items(items, SortField.updated_at, None, SortOrder.desc)[:limit]
         ]
 
     async def sample_unassigned(
@@ -346,7 +361,7 @@ async def query_unassigned_by_dataset_prefix(
         ]
         return [
             self._clone_item(item)
-            for item in self._sort_items(items, SortField.updated_at, SortOrder.desc)[:take]
+            for item in self._sort_items(items, SortField.updated_at, None, SortOrder.desc)[:take]
         ]
 
     async def query_unassigned_global(
@@ -360,7 +375,7 @@ async def query_unassigned_global(
         ]
         return [
             self._clone_item(item)
-            for item in self._sort_items(items, SortField.updated_at, SortOrder.desc)[:take]
+            for item in self._sort_items(items, SortField.updated_at, None, SortOrder.desc)[:take]
         ]
 
     async def assign_to(self, item_id: str, user_id: str) -> bool:
@@ -399,7 +414,7 @@ async def list_assigned(self, user_id: str) -> list[AgenticGroundTruthEntry]:
         ]
         return [
             self._clone_item(item)
-            for item in self._sort_items(items, SortField.updated_at, SortOrder.desc)
+            for item in self._sort_items(items, SortField.updated_at, None, SortOrder.desc)
         ]
 
     async def upsert_assignment_doc(

diff --git a/backend/app/adapters/search/demo_search.py b/backend/app/adapters/search/demo_search.py
@@ -1,11 +1,18 @@
 from __future__ import annotations
 
 from app.domain.models import AgenticGroundTruthEntry
+from app.plugins.base import PluginPackRegistry
+from app.plugins.pack_registry import get_default_pack_registry
 
 
 class DemoSearchAdapter:
-    def __init__(self, items: list[AgenticGroundTruthEntry]) -> None:
+    def __init__(
+        self,
+        items: list[AgenticGroundTruthEntry],
+        plugin_pack_registry: PluginPackRegistry | None = None,
+    ) -> None:
         self._items = items
+        self._plugin_pack_registry = plugin_pack_registry or get_default_pack_registry()
 
     async def query(self, q: str, top: int = 5) -> list[dict[str, object]]:
         query = q.strip().lower()
@@ -15,30 +22,32 @@ async def query(self, q: str, top: int = 5) -> list[dict[str, object]]:
         matches: list[dict[str, object]] = []
         seen_urls: set[str] = set()
         for item in self._items:
-            refs = list(item.refs)
-            for turn in item.history or []:
-                refs.extend(getattr(turn, "refs", None) or [])
-            for ref in refs:
+            for ref in self._plugin_pack_registry.collect_search_documents(item):
+                doc_id = ref.get("id")
+                url = ref.get("url")
+                if not isinstance(url, str) or not url:
+                    continue
                 haystack = " ".join(
                     [
-                        ref.url,
-                        ref.title or "",
-                        ref.content or "",
-                        ref.keyExcerpt or "",
+                        str(doc_id or ""),
+                        url,
+                        str(ref.get("title") or ""),
+                        str(ref.get("chunk") or ""),
                         item.datasetName,
                         item.id,
                     ]
                 ).lower()
                 if query not in haystack:
                     continue
-                if ref.url in seen_urls:
+                if url in seen_urls:
                     continue
-                seen_urls.add(ref.url)
+                seen_urls.add(url)
                 matches.append(
                     {
-                        "url": ref.url,
-                        "title": ref.title,
-                        "chunk": ref.content or ref.keyExcerpt or f"Reference for {item.id}",
+                        "id": doc_id,
+                        "url": url,
+                        "title": ref.get("title"),
+                        "chunk": ref.get("chunk") or f"Reference for {item.id}",
                     }
                 )
                 if len(matches) >= top:

diff --git a/backend/app/api/v1/assignments.py b/backend/app/api/v1/assignments.py
@@ -27,7 +27,6 @@
     ETagRequiredError,
     apply_shared_update,
     persist_shared_update,
-    read_legacy_compat_update,
 )
 from app.services.validation_service import (
     ApprovalValidationError,
@@ -137,7 +136,6 @@ async def update_item(
     original_assigned_to = it.assignedTo
 
     provided_fields: Set[str] = set(payload.model_fields_set)
-    payload_extras = payload.model_extra or {}
     try:
         mutation = apply_shared_update(
             it,
@@ -157,7 +155,6 @@ async def update_item(
             status=payload.status,
             approve=bool(payload.approve),
             actor_user_id=user.user_id,
-            legacy_update=read_legacy_compat_update(payload_extras),
             clear_assignment_on_statuses={
                 GroundTruthStatus.approved,
                 GroundTruthStatus.deleted,