refactor: use default device for embeddings

mplatzer · web-flow · commit efb2b00eee9b · 2024-12-08T17:55:22.000+01:00
diff --git a/mostlyai/qa/_sampling.py b/mostlyai/qa/_sampling.py
@@ -32,7 +32,6 @@
 import numpy as np
 import pandas as pd
 import pyarrow as pa
-import torch
 
 from mostlyai.qa._common import (
     CTX_COLUMN_PREFIX,
@@ -243,7 +242,7 @@ def calculate_embeddings(
 ) -> np.ndarray:
     t0 = time.time()
     # load embedder
-    embedder = load_embedder(device="cuda" if torch.cuda.is_available() else "cpu")
+    embedder = load_embedder()
     # split into buckets for calculating embeddings to avoid memory issues and report continuous progress
     steps = progress_to - progress_from if progress_to is not None and progress_from is not None else 1
     buckets = np.array_split(strings, steps)
diff --git a/mostlyai/qa/assets/__init__.py b/mostlyai/qa/assets/__init__.py
@@ -37,8 +37,8 @@ def load_tokenizer():
     return GPT2Tokenizer.from_pretrained(_MODULE_DIR / "tokenizers" / "transformers" / "gpt2")
 
 
-def load_embedder(device: str):
+def load_embedder():
     from sentence_transformers import SentenceTransformer
 
     path = _MODULE_DIR / "embedders" / "sentence-transformers" / "all-MiniLM-L6-v2"
-    return SentenceTransformer(str(path), local_files_only=True, device=device)
+    return SentenceTransformer(str(path), local_files_only=True)