[WIP] Prepare to stream tokens for GPU - remove redundant comment about fallback to regular list access in Llama.java

mikepapadim · mikepapadim · commit a35b0132b025 · 2025-05-12T17:49:44.000+03:00
diff --git a/src/main/java/com/example/inference/engine/impl/Llama.java b/src/main/java/com/example/inference/engine/impl/Llama.java
@@ -218,7 +218,6 @@ public static List<Integer> generateTokensGPU(Llama model, State state, int star
             // Try to extract the underlying array for faster access
             try {
                 // This is a performance optimization that may not work on all JVMs
-                // Fall back to regular list access if it fails
                 promptTokenArray = promptTokens.stream().mapToInt(Integer::intValue).toArray();
             } catch (Exception e) {
                 // Fall back to list access