From 1b85e7c1652da50d28ca37325b279be2a6c4e68f Mon Sep 17 00:00:00 2001
From: Urcra <urcra@urcra.com>
Date: Thu, 18 Aug 2022 00:09:27 +0200
Subject: [PATCH 1/3] use CPU if no cuda device

---
 ldm/models/diffusion/ddim.py    |  4 +++-
 ldm/models/diffusion/plms.py    |  4 +++-
 ldm/modules/encoders/modules.py | 14 +++++++-------
 notebook_helpers.py             |  4 ++--
 scripts/knn2img.py              |  7 +++++--
 scripts/sample_diffusion.py     |  2 +-
 scripts/txt2img.py              |  2 +-
 7 files changed, 22 insertions(+), 15 deletions(-)

diff --git a/ldm/models/diffusion/ddim.py b/ldm/models/diffusion/ddim.py
index edf1eaff9..b17d9fdca 100644
--- a/ldm/models/diffusion/ddim.py
+++ b/ldm/models/diffusion/ddim.py
@@ -17,8 +17,10 @@ def __init__(self, model, schedule="linear", **kwargs):
 
     def register_buffer(self, name, attr):
         if type(attr) == torch.Tensor:
-            if attr.device != torch.device("cuda"):
+            if attr.device != torch.device("cuda") and torch.cuda.is_available():
                 attr = attr.to(torch.device("cuda"))
+            else:
+                attr = attr.to(torch.device("cpu"))
         setattr(self, name, attr)
 
     def make_schedule(self, ddim_num_steps, ddim_discretize="uniform", ddim_eta=0., verbose=True):
diff --git a/ldm/models/diffusion/plms.py b/ldm/models/diffusion/plms.py
index 78eeb1003..63a6d46c5 100644
--- a/ldm/models/diffusion/plms.py
+++ b/ldm/models/diffusion/plms.py
@@ -17,8 +17,10 @@ def __init__(self, model, schedule="linear", **kwargs):
 
     def register_buffer(self, name, attr):
         if type(attr) == torch.Tensor:
-            if attr.device != torch.device("cuda"):
+            if attr.device != torch.device("cuda") and torch.cuda.is_available():
                 attr = attr.to(torch.device("cuda"))
+            else:
+                attr = attr.to(torch.device("cpu"))
         setattr(self, name, attr)
 
     def make_schedule(self, ddim_num_steps, ddim_discretize="uniform", ddim_eta=0., verbose=True):
diff --git a/ldm/modules/encoders/modules.py b/ldm/modules/encoders/modules.py
index aa3031df6..4699e33b4 100644
--- a/ldm/modules/encoders/modules.py
+++ b/ldm/modules/encoders/modules.py
@@ -35,9 +35,9 @@ def forward(self, batch, key=None):
 
 class TransformerEmbedder(AbstractEncoder):
     """Some transformer encoder layers"""
-    def __init__(self, n_embed, n_layer, vocab_size, max_seq_len=77, device="cuda"):
+    def __init__(self, n_embed, n_layer, vocab_size, max_seq_len=77, device="cuda" if torch.cuda.is_available() else "cpu"):
         super().__init__()
-        self.device = device
+        self.device = device 
         self.transformer = TransformerWrapper(num_tokens=vocab_size, max_seq_len=max_seq_len,
                                               attn_layers=Encoder(dim=n_embed, depth=n_layer))
 
@@ -52,11 +52,11 @@ def encode(self, x):
 
 class BERTTokenizer(AbstractEncoder):
     """ Uses a pretrained BERT tokenizer by huggingface. Vocab size: 30522 (?)"""
-    def __init__(self, device="cuda", vq_interface=True, max_length=77):
+    def __init__(self, device="cuda" if torch.cuda.is_available() else "cpu", vq_interface=True, max_length=77):
         super().__init__()
         from transformers import BertTokenizerFast  # TODO: add to reuquirements
         self.tokenizer = BertTokenizerFast.from_pretrained("bert-base-uncased")
-        self.device = device
+        self.device = device 
         self.vq_interface = vq_interface
         self.max_length = max_length
 
@@ -80,12 +80,12 @@ def decode(self, text):
 class BERTEmbedder(AbstractEncoder):
     """Uses the BERT tokenizr model and add some transformer encoder layers"""
     def __init__(self, n_embed, n_layer, vocab_size=30522, max_seq_len=77,
-                 device="cuda",use_tokenizer=True, embedding_dropout=0.0):
+                 device="cuda" if torch.cuda.is_available() else "cpu", use_tokenizer=True, embedding_dropout=0.0):
         super().__init__()
         self.use_tknz_fn = use_tokenizer
         if self.use_tknz_fn:
             self.tknz_fn = BERTTokenizer(vq_interface=False, max_length=max_seq_len)
-        self.device = device
+        self.device = device 
         self.transformer = TransformerWrapper(num_tokens=vocab_size, max_seq_len=max_seq_len,
                                               attn_layers=Encoder(dim=n_embed, depth=n_layer),
                                               emb_dropout=embedding_dropout)
@@ -139,7 +139,7 @@ class FrozenCLIPTextEmbedder(nn.Module):
     """
     Uses the CLIP transformer encoder for text.
     """
-    def __init__(self, version='ViT-L/14', device="cuda", max_length=77, n_repeat=1, normalize=True):
+    def __init__(self, version='ViT-L/14', device="cuda" if torch.cuda.is_available() else "cpu", max_length=77, n_repeat=1, normalize=True):
         super().__init__()
         self.model, _ = clip.load(version, jit=False, device="cpu")
         self.device = device
diff --git a/notebook_helpers.py b/notebook_helpers.py
index 5d0ebd7e1..df137a338 100644
--- a/notebook_helpers.py
+++ b/notebook_helpers.py
@@ -44,7 +44,7 @@ def load_model_from_config(config, ckpt):
     sd = pl_sd["state_dict"]
     model = instantiate_from_config(config.model)
     m, u = model.load_state_dict(sd, strict=False)
-    model.cuda()
+    model.cuda() if torch.cuda.is_available() else model.cpu()
     model.eval()
     return {"model": model}, global_step
 
@@ -117,7 +117,7 @@ def get_cond(mode, selected_path):
         c = rearrange(c, '1 c h w -> 1 h w c')
         c = 2. * c - 1.
 
-        c = c.to(torch.device("cuda"))
+        c = c.to(torch.device("cuda")) if torch.cuda.is_available() else c.to(torch.device("cpu"))
         example["LR_image"] = c
         example["image"] = c_up
 
diff --git a/scripts/knn2img.py b/scripts/knn2img.py
index e6eaaecab..664fdc1c6 100644
--- a/scripts/knn2img.py
+++ b/scripts/knn2img.py
@@ -53,7 +53,7 @@ def load_model_from_config(config, ckpt, verbose=False):
         print("unexpected keys:")
         print(u)
 
-    model.cuda()
+    model.cuda() if torch.cuda.is_available() else model.cpu()
     model.eval()
     return model
 
@@ -124,6 +124,8 @@ def load_retriever(self, version='ViT-L/14', ):
         model = FrozenClipImageEmbedder(model=version)
         if torch.cuda.is_available():
             model.cuda()
+        else:
+            model.cpu()
         model.eval()
         return model
 
@@ -358,7 +360,8 @@ def __call__(self, x, n):
                     uc = None
                     if searcher is not None:
                         nn_dict = searcher(c, opt.knn)
-                        c = torch.cat([c, torch.from_numpy(nn_dict['nn_embeddings']).cuda()], dim=1)
+                        nn_embeddings = torch.from_numpy(nn_dict['nn_embeddings']).cuda() if torch.cuda.is_available() else torch.from_numpy(nn_dict['nn_embeddings']).cpu()
+                        c = torch.cat([c, nn_embeddings], dim=1)
                     if opt.scale != 1.0:
                         uc = torch.zeros_like(c)
                     if isinstance(prompts, tuple):
diff --git a/scripts/sample_diffusion.py b/scripts/sample_diffusion.py
index 876fe3c36..134471d99 100644
--- a/scripts/sample_diffusion.py
+++ b/scripts/sample_diffusion.py
@@ -220,7 +220,7 @@ def get_parser():
 def load_model_from_config(config, sd):
     model = instantiate_from_config(config)
     model.load_state_dict(sd,strict=False)
-    model.cuda()
+    model.cuda() if torch.cuda.is_available() else model.cpu()
     model.eval()
     return model
 
diff --git a/scripts/txt2img.py b/scripts/txt2img.py
index 613de5e1d..c5f9f642b 100644
--- a/scripts/txt2img.py
+++ b/scripts/txt2img.py
@@ -25,7 +25,7 @@ def load_model_from_config(config, ckpt, verbose=False):
         print("unexpected keys:")
         print(u)
 
-    model.cuda()
+    model.cuda() if torch.cuda.is_available() else model.cpu()
     model.eval()
     return model
 

From b233b55cb70e49188e32abcd43bcb83f453ff2c8 Mon Sep 17 00:00:00 2001
From: Urcra <urcra@urcra.com>
Date: Thu, 18 Aug 2022 19:54:08 +0200
Subject: [PATCH 2/3] Remove unnecesary moves to the CPU if its already there

---
 ldm/models/diffusion/ddim.py    | 2 --
 ldm/models/diffusion/plms.py    | 2 --
 ldm/modules/encoders/modules.py | 6 +++---
 notebook_helpers.py             | 6 ++++--
 scripts/knn2img.py              | 5 ++---
 scripts/sample_diffusion.py     | 3 ++-
 scripts/txt2img.py              | 3 ++-
 7 files changed, 13 insertions(+), 14 deletions(-)

diff --git a/ldm/models/diffusion/ddim.py b/ldm/models/diffusion/ddim.py
index b17d9fdca..32b2b8b47 100644
--- a/ldm/models/diffusion/ddim.py
+++ b/ldm/models/diffusion/ddim.py
@@ -19,8 +19,6 @@ def register_buffer(self, name, attr):
         if type(attr) == torch.Tensor:
             if attr.device != torch.device("cuda") and torch.cuda.is_available():
                 attr = attr.to(torch.device("cuda"))
-            else:
-                attr = attr.to(torch.device("cpu"))
         setattr(self, name, attr)
 
     def make_schedule(self, ddim_num_steps, ddim_discretize="uniform", ddim_eta=0., verbose=True):
diff --git a/ldm/models/diffusion/plms.py b/ldm/models/diffusion/plms.py
index 63a6d46c5..102957df6 100644
--- a/ldm/models/diffusion/plms.py
+++ b/ldm/models/diffusion/plms.py
@@ -19,8 +19,6 @@ def register_buffer(self, name, attr):
         if type(attr) == torch.Tensor:
             if attr.device != torch.device("cuda") and torch.cuda.is_available():
                 attr = attr.to(torch.device("cuda"))
-            else:
-                attr = attr.to(torch.device("cpu"))
         setattr(self, name, attr)
 
     def make_schedule(self, ddim_num_steps, ddim_discretize="uniform", ddim_eta=0., verbose=True):
diff --git a/ldm/modules/encoders/modules.py b/ldm/modules/encoders/modules.py
index 4699e33b4..6c7e06440 100644
--- a/ldm/modules/encoders/modules.py
+++ b/ldm/modules/encoders/modules.py
@@ -37,7 +37,7 @@ class TransformerEmbedder(AbstractEncoder):
     """Some transformer encoder layers"""
     def __init__(self, n_embed, n_layer, vocab_size, max_seq_len=77, device="cuda" if torch.cuda.is_available() else "cpu"):
         super().__init__()
-        self.device = device 
+        self.device = device
         self.transformer = TransformerWrapper(num_tokens=vocab_size, max_seq_len=max_seq_len,
                                               attn_layers=Encoder(dim=n_embed, depth=n_layer))
 
@@ -56,7 +56,7 @@ def __init__(self, device="cuda" if torch.cuda.is_available() else "cpu", vq_int
         super().__init__()
         from transformers import BertTokenizerFast  # TODO: add to reuquirements
         self.tokenizer = BertTokenizerFast.from_pretrained("bert-base-uncased")
-        self.device = device 
+        self.device = device
         self.vq_interface = vq_interface
         self.max_length = max_length
 
@@ -85,7 +85,7 @@ def __init__(self, n_embed, n_layer, vocab_size=30522, max_seq_len=77,
         self.use_tknz_fn = use_tokenizer
         if self.use_tknz_fn:
             self.tknz_fn = BERTTokenizer(vq_interface=False, max_length=max_seq_len)
-        self.device = device 
+        self.device = device
         self.transformer = TransformerWrapper(num_tokens=vocab_size, max_seq_len=max_seq_len,
                                               attn_layers=Encoder(dim=n_embed, depth=n_layer),
                                               emb_dropout=embedding_dropout)
diff --git a/notebook_helpers.py b/notebook_helpers.py
index df137a338..9e3dec352 100644
--- a/notebook_helpers.py
+++ b/notebook_helpers.py
@@ -44,7 +44,8 @@ def load_model_from_config(config, ckpt):
     sd = pl_sd["state_dict"]
     model = instantiate_from_config(config.model)
     m, u = model.load_state_dict(sd, strict=False)
-    model.cuda() if torch.cuda.is_available() else model.cpu()
+    if torch.cuda.is_available():
+        model.cuda()
     model.eval()
     return {"model": model}, global_step
 
@@ -117,7 +118,8 @@ def get_cond(mode, selected_path):
         c = rearrange(c, '1 c h w -> 1 h w c')
         c = 2. * c - 1.
 
-        c = c.to(torch.device("cuda")) if torch.cuda.is_available() else c.to(torch.device("cpu"))
+        if torch.cuda.is_available():
+            c = c.to(torch.device("cuda")) 
         example["LR_image"] = c
         example["image"] = c_up
 
diff --git a/scripts/knn2img.py b/scripts/knn2img.py
index 664fdc1c6..31c737b44 100644
--- a/scripts/knn2img.py
+++ b/scripts/knn2img.py
@@ -53,7 +53,8 @@ def load_model_from_config(config, ckpt, verbose=False):
         print("unexpected keys:")
         print(u)
 
-    model.cuda() if torch.cuda.is_available() else model.cpu()
+    if torch.cuda.is_available():
+        model.cuda() 
     model.eval()
     return model
 
@@ -124,8 +125,6 @@ def load_retriever(self, version='ViT-L/14', ):
         model = FrozenClipImageEmbedder(model=version)
         if torch.cuda.is_available():
             model.cuda()
-        else:
-            model.cpu()
         model.eval()
         return model
 
diff --git a/scripts/sample_diffusion.py b/scripts/sample_diffusion.py
index 134471d99..3a82185ff 100644
--- a/scripts/sample_diffusion.py
+++ b/scripts/sample_diffusion.py
@@ -220,7 +220,8 @@ def get_parser():
 def load_model_from_config(config, sd):
     model = instantiate_from_config(config)
     model.load_state_dict(sd,strict=False)
-    model.cuda() if torch.cuda.is_available() else model.cpu()
+    if torch.cuda.is_available():
+        model.cuda() 
     model.eval()
     return model
 
diff --git a/scripts/txt2img.py b/scripts/txt2img.py
index c5f9f642b..ed0c8cd53 100644
--- a/scripts/txt2img.py
+++ b/scripts/txt2img.py
@@ -25,7 +25,8 @@ def load_model_from_config(config, ckpt, verbose=False):
         print("unexpected keys:")
         print(u)
 
-    model.cuda() if torch.cuda.is_available() else model.cpu()
+    if torch.cuda.is_available():
+        model.cuda() 
     model.eval()
     return model
 

From ce67cd47430b4ccb5ab982218d7ffdf14af99619 Mon Sep 17 00:00:00 2001
From: Urcra <urcra@urcra.com>
Date: Thu, 18 Aug 2022 19:58:05 +0200
Subject: [PATCH 3/3] Split nn_embeddings over multiple lines

---
 scripts/knn2img.py | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/scripts/knn2img.py b/scripts/knn2img.py
index 31c737b44..a40ce7105 100644
--- a/scripts/knn2img.py
+++ b/scripts/knn2img.py
@@ -359,7 +359,9 @@ def __call__(self, x, n):
                     uc = None
                     if searcher is not None:
                         nn_dict = searcher(c, opt.knn)
-                        nn_embeddings = torch.from_numpy(nn_dict['nn_embeddings']).cuda() if torch.cuda.is_available() else torch.from_numpy(nn_dict['nn_embeddings']).cpu()
+                        nn_embeddings = torch.from_numpy(nn_dict['nn_embeddings'])
+                        if torch.cuda.is_available():
+                            nn_embeddings = nn_embeddings.cuda()
                         c = torch.cat([c, nn_embeddings], dim=1)
                     if opt.scale != 1.0:
                         uc = torch.zeros_like(c)