bd73-com · bd73-com · Apr 1, 2026 · Apr 1, 2026 · Apr 1, 2026 · Apr 1, 2026
diff --git a/server/routes.ts b/server/routes.ts
@@ -19,7 +19,7 @@ import { ErrorLogger } from "./services/logger";
 import { notificationTablesExist, channelTablesExist } from "./services/notificationReady";
 import { BrowserlessUsageTracker, getMonthResetDate } from "./services/browserlessTracker";
 import { ResendUsageTracker, getResendResetDate } from "./services/resendTracker";
-import { errorLogs, monitorMetrics } from "@shared/schema";
+import { errorLogs, monitorMetrics, monitors } from "@shared/schema";
 import {
   generalRateLimiter,
   createMonitorRateLimiter,
@@ -248,6 +248,7 @@ export async function registerRoutes(
         pauseReason: null,
         healthAlertSentAt: null,
         lastHealthyAt: null,
+        pendingRetryAt: null,
         createdAt: new Date()
       };
 
@@ -585,6 +586,16 @@ export async function registerRoutes(
       if (!existing) return res.status(404).json({ message: "Not found" });
       if (String(existing.userId) !== String(req.user.claims.sub)) return res.status(403).json({ message: "Forbidden" });
 
+      // Clear any pending auto-retry before the manual check to prevent
+      // a narrow race where the scheduler cron fires a duplicate check.
+      await db.update(monitors)
+        .set({ pendingRetryAt: null })
+        .where(eq(monitors.id, id))
+        .catch((err: unknown) => {
+          console.error(`[AutoRetry] Failed to clear pendingRetryAt for monitor ${id}:`,
+            err instanceof Error ? err.message : err);
+        });
+
       const result = await checkMonitor(existing);
       res.json(result);
     } catch (error: any) {

diff --git a/server/services/scheduler.test.ts b/server/services/scheduler.test.ts
@@ -8,6 +8,7 @@ const {
   mockGetAllActiveMonitors,
   mockCleanupPollutedValues,
   mockDbExecute,
+  mockDbUpdateSet,
   cronCallbacks,
   mockMonitorsNeedingRetry,
   mockDeliverWebhook,
@@ -16,6 +17,7 @@ const {
   mockGetAllActiveMonitors: vi.fn().mockResolvedValue([]),
   mockCleanupPollutedValues: vi.fn().mockResolvedValue(undefined),
   mockDbExecute: vi.fn().mockResolvedValue({ rowCount: 0 }),
+  mockDbUpdateSet: vi.fn(),
   cronCallbacks: {} as Record<string, Array<() => Promise<void>>>,
   mockMonitorsNeedingRetry: new Set<number>(),
   mockDeliverWebhook: vi.fn().mockResolvedValue({ success: true, statusCode: 200 }),
@@ -60,6 +62,14 @@ vi.mock("./logger", () => ({
 vi.mock("../db", () => ({
   db: {
     execute: (...args: any[]) => mockDbExecute(...args),
+    update: vi.fn().mockReturnValue({
+      set: (...args: any[]) => {
+        mockDbUpdateSet(...args);
+        const whereResult = Promise.resolve();
+        const whereFn = vi.fn().mockReturnValue(whereResult);
+        return { where: whereFn };
+      },
+    }),
-    update: vi.fn().mockReturnValue({
-      set: (...args: any[]) => {
-        mockDbUpdateSet(...args);
-        const whereResult = Promise.resolve();
-        const whereFn = vi.fn().mockReturnValue(whereResult);
-        return { where: whereFn };
-      },
-    }),
+    update: vi.fn().mockReturnValue({
+      set: (...args: any[]) => {
+        mockDbUpdateSet(...args);
+        const whereFn = vi.fn((...whereArgs: any[]) => {
+          mockDbUpdateWhere(...whereArgs);
+          return Promise.resolve();
+        });
+        return { where: whereFn };
+      },
+    }),
-    update: vi.fn().mockReturnValue({
-      set: (...args: any[]) => {
-        mockDbUpdateSet(...args);
-        const whereResult = Promise.resolve();
-        const whereFn = vi.fn().mockReturnValue(whereResult);
-        return { where: whereFn };
-      },
-    }),
+    update: vi.fn().mockReturnValue({
+      set: (...args: any[]) => {
+        mockDbUpdateSet(...args);
+        const whereFn = vi.fn((...whereArgs: any[]) => {
+          mockDbUpdateWhere(...whereArgs);
+          return Promise.resolve();
+        });
+        return { where: whereFn };
+      },
+    }),
   },
 }));
 
@@ -163,6 +173,7 @@ function makeMonitor(overrides: Partial<Monitor> = {}): Monitor {
     pauseReason: null,
     healthAlertSentAt: null,
     lastHealthyAt: null,
+    pendingRetryAt: null,
     createdAt: new Date(),
     ...overrides,
   };
@@ -399,6 +410,75 @@ describe("startScheduler", () => {
     resolver!();
     await Promise.resolve();
   });
+
+  // -----------------------------------------------------------------------
+  // auto-retry scheduler pickup (pendingRetryAt)
+  // -----------------------------------------------------------------------
+
+  it("triggers check for monitor with pendingRetryAt <= now", async () => {
+    const monitor = makeMonitor({
+      frequency: "hourly",
+      lastChecked: new Date(Date.now() - 30 * 60 * 1000), // 30 min ago — not normally due
+      pendingRetryAt: new Date(Date.now() - 1000), // 1 second in the past
+    });
+    mockGetAllActiveMonitors.mockResolvedValueOnce([monitor]);
+
+    await startScheduler();
+    await runCron("* * * * *");
+    await vi.advanceTimersByTimeAsync(31000);
+
+    expect(mockCheckMonitor).toHaveBeenCalledWith(monitor);
+  });
+
+  it("does NOT trigger check for monitor with pendingRetryAt in the future", async () => {
+    const monitor = makeMonitor({
+      frequency: "hourly",
+      lastChecked: new Date(Date.now() - 30 * 60 * 1000), // 30 min ago — not normally due
+      pendingRetryAt: new Date(Date.now() + 30 * 60 * 1000), // 30 min in the future
+    });
+    mockGetAllActiveMonitors.mockResolvedValueOnce([monitor]);
+
+    await startScheduler();
+    await runCron("* * * * *");
+    await vi.advanceTimersByTimeAsync(31000);
+
+    expect(mockCheckMonitor).not.toHaveBeenCalled();
+  });
+
+  it("clears pendingRetryAt after retry fires (success path)", async () => {
+    const monitor = makeMonitor({
+      frequency: "hourly",
+      lastChecked: new Date(Date.now() - 30 * 60 * 1000),
+      pendingRetryAt: new Date(Date.now() - 1000),
+    });
+    mockGetAllActiveMonitors.mockResolvedValueOnce([monitor]);
+
+    await startScheduler();
+    await runCron("* * * * *");
+    await vi.advanceTimersByTimeAsync(31000);
+
+    expect(mockCheckMonitor).toHaveBeenCalledWith(monitor);
+    // The finally block should clear pendingRetryAt
+    expect(mockDbUpdateSet).toHaveBeenCalledWith({ pendingRetryAt: null });
+  });
+
+  it("clears pendingRetryAt after retry fires (failure path)", async () => {
+    mockCheckMonitor.mockRejectedValueOnce(new Error("Scrape failed"));
+    const monitor = makeMonitor({
+      frequency: "hourly",
+      lastChecked: new Date(Date.now() - 30 * 60 * 1000),
+      pendingRetryAt: new Date(Date.now() - 1000),
+    });
+    mockGetAllActiveMonitors.mockResolvedValueOnce([monitor]);
+
+    await startScheduler();
+    await runCron("* * * * *");
+    await vi.advanceTimersByTimeAsync(31000);
+
+    expect(mockCheckMonitor).toHaveBeenCalledWith(monitor);
+    // Even on failure, pendingRetryAt should be cleared
+    expect(mockDbUpdateSet).toHaveBeenCalledWith({ pendingRetryAt: null });
+  });
 });
 
 describe("concurrency limiting (runCheckWithLimit)", () => {
@@ -1290,3 +1370,4 @@ describe("webhook retry cumulative backoff", () => {
     }));
   });
 });
+
diff --git a/server/services/scheduler.ts b/server/services/scheduler.ts
@@ -10,7 +10,8 @@ import { ensureMonitorConditionsTable } from "./ensureTables";
 import { processAutomatedCampaigns } from "./automatedCampaigns";
 import { isTransientDbError } from "../utils/dbErrors";
 import { db } from "../db";
-import { sql } from "drizzle-orm";
+import { eq, sql } from "drizzle-orm";
+import { monitors } from "@shared/schema";
 
 // Keep below DB pool max (3, see db.ts) to leave headroom for cron jobs and
 // API requests. Browser POOL_MAX is 1 (browserPool.ts), so the second
@@ -110,9 +111,17 @@ async function runCheckWithLimit(monitor: Parameters<typeof checkMonitor>[0]): P
     console.debug(`[Scheduler] Concurrency limit reached, deferring monitor ${monitor.id}`);
     return false;
   }
+
+  const hadPendingRetry = !!(
+    monitor.pendingRetryAt && new Date(monitor.pendingRetryAt) <= new Date()
+  );
+
   activeChecks++;
   try {
     await checkMonitor(monitor);
+    if (hadPendingRetry) {
+      console.log(`[AutoRetry] Monitor ${monitor.id} — retry completed`);
+    }
     return true;
   } catch (error) {
     await ErrorLogger.error("scheduler", `"${monitor.name}" — scheduled check failed. This is usually a temporary issue. If it persists, verify the URL is still valid and the selector matches the page.`, error instanceof Error ? error : null, {
@@ -124,6 +133,16 @@ async function runCheckWithLimit(monitor: Parameters<typeof checkMonitor>[0]): P
     return true;
   } finally {
     activeChecks--;
+    if (hadPendingRetry) {
+      try {
+        await db.update(monitors)
+          .set({ pendingRetryAt: null })
+          .where(eq(monitors.id, monitor.id));
+      } catch (err: unknown) {
+        console.error(`[AutoRetry] Failed to clear pendingRetryAt for monitor ${monitor.id}:`,
+          err instanceof Error ? err.message : err);
+      }
+    }
   }
 }
 
@@ -218,6 +237,11 @@ export async function startScheduler() {
             }
           }
 
+          // Auto-retry: fire if pendingRetryAt window has elapsed
+          if (!shouldCheck && monitor.pendingRetryAt && new Date(monitor.pendingRetryAt) <= now) {
+            shouldCheck = true;
+          }
+
           if (shouldCheck) {
             const jitterMs = Math.floor(Math.random() * 30000);
             trackTimeout(() => {