From c1fa86b5889e9a08c4de5a0af18d702108bea9ab Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:12:28 +0000
Subject: [PATCH 01/16] Replace Beta/proportion likelihood with negative
 binomial approach

- Implement negative binomial parameter estimation using method of moments
- Replace simple proportion-based likelihood with statrs::NegativeBinomial
- Add robust edge case handling for parameter estimation failures
- Preserve existing bio::stats::bayesian::model interfaces
- Better models overdispersed count data typical in genomic applications

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 66 +++++++++++++++++++++++++++++++------------------
 1 file changed, 42 insertions(+), 24 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index be91fe2..17a3363 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -2,6 +2,7 @@ use anyhow::Result;
 use bio::stats::bayesian::model::{Likelihood, Model, Posterior, Prior};
 use bio::stats::{LogProb, Prob};
 use log::info;
+use statrs::distribution::{Discrete, NegativeBinomial};
 use statrs::statistics::Statistics;
 
 use crate::bam::GenomicRange;
@@ -18,9 +19,10 @@ pub struct ReadCountData {
 }
 
 #[allow(dead_code)]
+#[derive(Clone)]
 pub struct GenomicPrior {
-    pub alpha: f64,
-    pub beta: f64,
+    pub r: f64,      // number of successes parameter
+    pub p: f64,      // success probability parameter
 }
 
 impl Prior for GenomicPrior {
@@ -45,42 +47,52 @@ impl GenomicPrior {
             })
             .collect();
 
+        if non_zero_counts.is_empty() {
+            return Self {
+                r: 1.0,
+                p: 0.5,
+            };
+        }
+
         let mean = non_zero_counts.clone().mean();
         let variance = non_zero_counts.variance();
 
-        let total_mean = mean / total_reads as f64;
-        let total_variance = variance / (total_reads * total_reads) as f64;
-
-        if total_variance >= total_mean * (1.0 - total_mean) {
+        if variance <= mean || variance == 0.0 || mean == 0.0 {
             return Self {
-                alpha: 1.0,
-                beta: 99.0,
+                r: 1.0,
+                p: 0.5,
             };
         }
 
-        let alpha_beta_sum = total_mean * (1.0 - total_mean) / total_variance - 1.0;
-        let alpha = total_mean * alpha_beta_sum;
-        let beta = (1.0 - total_mean) * alpha_beta_sum;
+        let r = (mean * mean) / (variance - mean);
+        let p = mean / variance;
 
         Self {
-            alpha: alpha.max(0.01),
-            beta: beta.max(0.01),
+            r: r.max(0.01),  // Ensure r > 0
+            p: p.clamp(0.01, 0.99),  // Ensure 0 < p < 1
         }
     }
 }
 
-pub struct GenomicLikelihood;
+pub struct GenomicLikelihood {
+    pub r: f64,
+    pub p: f64,
+}
 
 impl Likelihood for GenomicLikelihood {
     type Event = GenomicEvent;
     type Data = ReadCountData;
 
-    fn compute(&self, event: &Self::Event, data: &Self::Data, _payload: &mut ()) -> LogProb {
-        let observed_proportion = data.observed_count as f64 / event.total_reads as f64;
-
-        let likelihood_given_signal = observed_proportion.max(0.5);
-
-        LogProb::from(Prob(likelihood_given_signal))
+    fn compute(&self, _event: &Self::Event, data: &Self::Data, _payload: &mut ()) -> LogProb {
+        match NegativeBinomial::new(self.r, self.p) {
+            Ok(nb_dist) => {
+                let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
+                LogProb::from(log_likelihood)
+            }
+            Err(_) => {
+                LogProb::ln_zero()
+            }
+        }
     }
 }
 
@@ -121,10 +133,13 @@ pub struct BayesianModel {
 
 impl BayesianModel {
     pub fn new(significance_threshold: f64, min_reads: u32) -> Self {
-        let likelihood = GenomicLikelihood;
+        let likelihood = GenomicLikelihood {
+            r: 1.0,
+            p: 0.5,
+        };
         let prior = GenomicPrior {
-            alpha: 1.0,
-            beta: 99.0,
+            r: 1.0,
+            p: 0.5,
         };
         let posterior = GenomicPosterior;
         let model = Model::new(likelihood, prior, posterior);
@@ -152,7 +167,10 @@ impl BayesianModel {
         info!("Applying rust-bio Bayesian model to identify significant bins");
 
         let prior = GenomicPrior::from_bin_counts(bin_counts, total_reads);
-        *self.model.prior_mut() = prior;
+        *self.model.prior_mut() = prior.clone();
+        
+        self.model.likelihood_mut().r = prior.r;
+        self.model.likelihood_mut().p = prior.p;
 
         let mut significant_bins = Vec::new();
         let mut posterior_probs = Vec::new();

From dacc412b65a700e9baa24e89e229225195906f2e Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:19:57 +0000
Subject: [PATCH 02/16] Fix unused variable warning for total_reads parameter

- Prefix total_reads with underscore to indicate intentional non-use
- Resolves clippy error causing CI build failure
- Maintains function signature compatibility

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 17a3363..7696be2 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -35,7 +35,7 @@ impl Prior for GenomicPrior {
 }
 
 impl GenomicPrior {
-    pub fn from_bin_counts(bin_counts: &[(GenomicRange, usize)], total_reads: usize) -> Self {
+    pub fn from_bin_counts(bin_counts: &[(GenomicRange, usize)], _total_reads: usize) -> Self {
         let non_zero_counts: Vec<f64> = bin_counts
             .iter()
             .filter_map(|(_, count)| {

From da2d5bcbf722418015af953fc5bdd476ae771107 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:21:03 +0000
Subject: [PATCH 03/16] Remove unused total_reads parameter entirely

- Remove total_reads parameter from from_bin_counts method signature
- Update call site in identify_significant_bins method
- Cleaner solution than underscore prefix since parameter is not needed
- Resolves clippy error causing CI build failure

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 7696be2..124ba1a 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -35,7 +35,7 @@ impl Prior for GenomicPrior {
 }
 
 impl GenomicPrior {
-    pub fn from_bin_counts(bin_counts: &[(GenomicRange, usize)], _total_reads: usize) -> Self {
+    pub fn from_bin_counts(bin_counts: &[(GenomicRange, usize)]) -> Self {
         let non_zero_counts: Vec<f64> = bin_counts
             .iter()
             .filter_map(|(_, count)| {
@@ -166,7 +166,7 @@ impl BayesianModel {
     ) -> Result<Vec<GenomicRange>> {
         info!("Applying rust-bio Bayesian model to identify significant bins");
 
-        let prior = GenomicPrior::from_bin_counts(bin_counts, total_reads);
+        let prior = GenomicPrior::from_bin_counts(bin_counts);
         *self.model.prior_mut() = prior.clone();
         
         self.model.likelihood_mut().r = prior.r;

From 363c91693a886779ea436d0a91dde9a807000c7d Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:24:18 +0000
Subject: [PATCH 04/16] Apply cargo fmt formatting fixes

- Fix comment alignment and spacing
- Consolidate struct initialization formatting
- Remove unnecessary line breaks in return statements
- Resolves formatting check failure in CI

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 34 ++++++++++------------------------
 1 file changed, 10 insertions(+), 24 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 124ba1a..a14a7dd 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -21,8 +21,8 @@ pub struct ReadCountData {
 #[allow(dead_code)]
 #[derive(Clone)]
 pub struct GenomicPrior {
-    pub r: f64,      // number of successes parameter
-    pub p: f64,      // success probability parameter
+    pub r: f64, // number of successes parameter
+    pub p: f64, // success probability parameter
 }
 
 impl Prior for GenomicPrior {
@@ -48,28 +48,22 @@ impl GenomicPrior {
             .collect();
 
         if non_zero_counts.is_empty() {
-            return Self {
-                r: 1.0,
-                p: 0.5,
-            };
+            return Self { r: 1.0, p: 0.5 };
         }
 
         let mean = non_zero_counts.clone().mean();
         let variance = non_zero_counts.variance();
 
         if variance <= mean || variance == 0.0 || mean == 0.0 {
-            return Self {
-                r: 1.0,
-                p: 0.5,
-            };
+            return Self { r: 1.0, p: 0.5 };
         }
 
         let r = (mean * mean) / (variance - mean);
         let p = mean / variance;
 
         Self {
-            r: r.max(0.01),  // Ensure r > 0
-            p: p.clamp(0.01, 0.99),  // Ensure 0 < p < 1
+            r: r.max(0.01),         // Ensure r > 0
+            p: p.clamp(0.01, 0.99), // Ensure 0 < p < 1
         }
     }
 }
@@ -89,9 +83,7 @@ impl Likelihood for GenomicLikelihood {
                 let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
                 LogProb::from(log_likelihood)
             }
-            Err(_) => {
-                LogProb::ln_zero()
-            }
+            Err(_) => LogProb::ln_zero(),
         }
     }
 }
@@ -133,14 +125,8 @@ pub struct BayesianModel {
 
 impl BayesianModel {
     pub fn new(significance_threshold: f64, min_reads: u32) -> Self {
-        let likelihood = GenomicLikelihood {
-            r: 1.0,
-            p: 0.5,
-        };
-        let prior = GenomicPrior {
-            r: 1.0,
-            p: 0.5,
-        };
+        let likelihood = GenomicLikelihood { r: 1.0, p: 0.5 };
+        let prior = GenomicPrior { r: 1.0, p: 0.5 };
         let posterior = GenomicPosterior;
         let model = Model::new(likelihood, prior, posterior);
 
@@ -168,7 +154,7 @@ impl BayesianModel {
 
         let prior = GenomicPrior::from_bin_counts(bin_counts);
         *self.model.prior_mut() = prior.clone();
-        
+
         self.model.likelihood_mut().r = prior.r;
         self.model.likelihood_mut().p = prior.p;
 

From 0cb0e52d2c2720667b8701c2fe216efef024c313 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:40:56 +0000
Subject: [PATCH 05/16] Fix posterior probability pipeline to preserve Bayesian
 calculations

- Remove hardcoded posterior_prob = 1.0 assignments in bam.rs and genome.rs
- Initialize bins with posterior_prob = 0.0, will be set by Bayesian model
- Fix peak merging to use max() instead of log addition for combining probabilities
- Remove unused imports (LogProb, Prob) from peak_caller.rs
- Simplify unnecessary map identity function in bam.rs
- Ensures calculated negative binomial posterior probabilities flow to output

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bam.rs         | 4 ----
 src/genome.rs      | 4 ++--
 src/peak_caller.rs | 6 ++----
 3 files changed, 4 insertions(+), 10 deletions(-)

diff --git a/src/bam.rs b/src/bam.rs
index b69e01a..2fd7b6d 100644
--- a/src/bam.rs
+++ b/src/bam.rs
@@ -136,10 +136,6 @@ impl BamProcessor {
             .iter()
             .cloned()
             .zip(bin_counts.iter().cloned())
-            .map(|(mut bin, count)| {
-                bin.posterior_prob = 1.0;
-                (bin, count)
-            })
             .collect();
 
         Ok(result)
diff --git a/src/genome.rs b/src/genome.rs
index ac31735..cc9a092 100644
--- a/src/genome.rs
+++ b/src/genome.rs
@@ -115,7 +115,7 @@ impl Genome {
                             chrom: chromosome.to_string(),
                             start,
                             end,
-                            posterior_prob: 1.0, // Initialize posterior probability to 1.0
+                            posterior_prob: 0.0, // Will be set by Bayesian model
                         });
                         start += step;
                     }
@@ -144,7 +144,7 @@ impl Genome {
                             chrom: chrom.clone(),
                             start,
                             end,
-                            posterior_prob: 1.0, // Initialize posterior probability to 1.0
+                            posterior_prob: 0.0, // Will be set by Bayesian model
                         });
                         start += step;
                     }
diff --git a/src/peak_caller.rs b/src/peak_caller.rs
index 9bc3082..df05327 100644
--- a/src/peak_caller.rs
+++ b/src/peak_caller.rs
@@ -4,7 +4,7 @@ use crate::cli::Cli;
 use crate::genome::Genome;
 use anyhow::Result;
 use bio::io::bed::{Record, Writer};
-use bio::stats::{LogProb, Prob};
+
 use log::info;
 use rayon::prelude::*;
 use std::collections::HashMap;
@@ -119,9 +119,7 @@ impl PeakCaller {
                     if bin.start <= current_peak.end + max_distance {
                         current_peak.end = bin.end.max(current_peak.end);
 
-                        let current_log = LogProb::from(Prob(current_peak.posterior_prob));
-                        let bin_log = LogProb::from(Prob(bin.posterior_prob));
-                        current_peak.posterior_prob = *Prob::from(current_log + bin_log);
+                        current_peak.posterior_prob = current_peak.posterior_prob.max(bin.posterior_prob);
                     } else {
                         result.push(current_peak.clone());
                         current_peak = bin.clone();

From c1a09028d407f4a63cbc79e545fddae84ed8cee3 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:47:25 +0000
Subject: [PATCH 06/16] Change peak merging to multiply posterior probabilities

- Replace max() with multiplication for combining bin probabilities
- Implements user-requested statistical approach for merged peaks
- Assumes independence between adjacent bins
- Use *= operator to satisfy clippy lint requirements

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/peak_caller.rs | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/peak_caller.rs b/src/peak_caller.rs
index df05327..f701a00 100644
--- a/src/peak_caller.rs
+++ b/src/peak_caller.rs
@@ -119,7 +119,7 @@ impl PeakCaller {
                     if bin.start <= current_peak.end + max_distance {
                         current_peak.end = bin.end.max(current_peak.end);
 
-                        current_peak.posterior_prob = current_peak.posterior_prob.max(bin.posterior_prob);
+                        current_peak.posterior_prob *= bin.posterior_prob;
                     } else {
                         result.push(current_peak.clone());
                         current_peak = bin.clone();

From 30f6403a1e8f784829924047598d980654a16e27 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 05:54:46 +0000
Subject: [PATCH 07/16] Fix posterior probability bug in
 identify_significant_bins

- Use updated bins from apply_posterior_threshold instead of discarding them
- Ensures calculated Bayesian probabilities flow through to final output
- Fixes issue where all peaks showed posterior_prob of 1.0

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 5 +----
 1 file changed, 1 insertion(+), 4 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index a14a7dd..76a15b0 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -158,7 +158,6 @@ impl BayesianModel {
         self.model.likelihood_mut().r = prior.r;
         self.model.likelihood_mut().p = prior.p;
 
-        let mut significant_bins = Vec::new();
         let mut posterior_probs = Vec::new();
 
         for (bin, count) in bin_counts {
@@ -189,9 +188,7 @@ impl BayesianModel {
         let significant =
             self.apply_posterior_threshold(posterior_probs, self.significance_threshold)?;
 
-        for (bin, _) in significant {
-            significant_bins.push(bin);
-        }
+        let significant_bins: Vec<GenomicRange> = significant.into_iter().map(|(bin, _)| bin).collect();
 
         info!("Found {} significant bins", significant_bins.len());
 

From 94befe79fad522e6d59b83356c8684b41a685762 Mon Sep 17 00:00:00 2001
From: jakevc <jake.vancampen7@gmail.com>
Date: Thu, 29 May 2025 22:58:07 -0700
Subject: [PATCH 08/16] fmt

---
 src/bayesian.rs | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 76a15b0..83a8be1 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -188,7 +188,8 @@ impl BayesianModel {
         let significant =
             self.apply_posterior_threshold(posterior_probs, self.significance_threshold)?;
 
-        let significant_bins: Vec<GenomicRange> = significant.into_iter().map(|(bin, _)| bin).collect();
+        let significant_bins: Vec<GenomicRange> =
+            significant.into_iter().map(|(bin, _)| bin).collect();
 
         info!("Found {} significant bins", significant_bins.len());
 

From aac0bdfd4ae98366ebab9fc88ada39ccc11edeae Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:00:18 +0000
Subject: [PATCH 09/16] Apply cargo fmt to fix CI formatting requirements

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 76a15b0..83a8be1 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -188,7 +188,8 @@ impl BayesianModel {
         let significant =
             self.apply_posterior_threshold(posterior_probs, self.significance_threshold)?;
 
-        let significant_bins: Vec<GenomicRange> = significant.into_iter().map(|(bin, _)| bin).collect();
+        let significant_bins: Vec<GenomicRange> =
+            significant.into_iter().map(|(bin, _)| bin).collect();
 
         info!("Found {} significant bins", significant_bins.len());
 

From dc7606b904b4257761a6286c38fcbc7045782688 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:05:06 +0000
Subject: [PATCH 10/16] Add debug logging to trace posterior probability
 calculations

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 83a8be1..de9b957 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -182,6 +182,7 @@ impl BayesianModel {
                 .unwrap_or(LogProb::ln_zero());
             let posterior_prob = (*Prob::from(posterior_log)).clamp(0.0, 1.0);
 
+            info!("Bin {}:{}-{} calculated posterior_prob: {}", bin.chrom, bin.start, bin.end, posterior_prob);
             posterior_probs.push((bin.clone(), posterior_prob));
         }
 
@@ -207,6 +208,7 @@ impl BayesianModel {
             if posterior_prob >= threshold {
                 let mut bin_clone = bin.clone();
                 bin_clone.posterior_prob = posterior_prob;
+                info!("Setting bin {}:{}-{} posterior_prob to: {}", bin_clone.chrom, bin_clone.start, bin_clone.end, bin_clone.posterior_prob);
                 significant.push((bin_clone, posterior_prob));
             }
         }

From 80e7355280da5baba8fe89c3ad56102a633564c5 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:11:49 +0000
Subject: [PATCH 11/16] Fix posterior probability calculation with proper
 signal vs noise hypothesis differentiation

- Replace identical signal/noise hypotheses with distinct negative binomial parameters
- Signal hypothesis uses estimated parameters from data
- Noise hypothesis uses conservative background parameters (r=1.0, p=0.8)
- Direct posterior computation bypasses model.compute() override issue
- Now produces realistic stratified posterior probabilities instead of hardcoded 1.0

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 121 ++++++++++++++++++++++++++++++++----------------
 1 file changed, 80 insertions(+), 41 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index de9b957..705dfca 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -36,35 +36,39 @@ impl Prior for GenomicPrior {
 
 impl GenomicPrior {
     pub fn from_bin_counts(bin_counts: &[(GenomicRange, usize)]) -> Self {
-        let non_zero_counts: Vec<f64> = bin_counts
-            .iter()
-            .filter_map(|(_, count)| {
-                if *count > 0 {
-                    Some(*count as f64)
-                } else {
-                    None
-                }
-            })
-            .collect();
-
-        if non_zero_counts.is_empty() {
-            return Self { r: 1.0, p: 0.5 };
-        }
-
-        let mean = non_zero_counts.clone().mean();
-        let variance = non_zero_counts.variance();
+        let counts: Vec<f64> = bin_counts.iter().map(|(_, count)| *count as f64).collect();
 
-        if variance <= mean || variance == 0.0 || mean == 0.0 {
-            return Self { r: 1.0, p: 0.5 };
+        if counts.is_empty() || counts.len() < 2 {
+            return Self { r: 2.0, p: 0.3 };
         }
 
-        let r = (mean * mean) / (variance - mean);
-        let p = mean / variance;
-
-        Self {
-            r: r.max(0.01),         // Ensure r > 0
-            p: p.clamp(0.01, 0.99), // Ensure 0 < p < 1
+        let mean = counts.clone().mean();
+        let variance = counts.clone().variance();
+
+        info!(
+            "Count statistics: mean={}, variance={}, n={}",
+            mean,
+            variance,
+            counts.len()
+        );
+
+        if variance > mean && variance.is_finite() && mean > 0.0 {
+            let r = (mean * mean) / (variance - mean);
+            let p = mean / variance;
+
+            if r.is_finite() && r > 0.0 && p.is_finite() && p > 0.0 && p < 1.0 {
+                let final_r = r.clamp(0.1, 100.0); // More reasonable bounds
+                let final_p = p.clamp(0.05, 0.95); // More reasonable bounds
+                info!("Using method of moments: r={}, p={}", final_r, final_p);
+                return Self {
+                    r: final_r,
+                    p: final_p,
+                };
+            }
         }
+
+        info!("Using conservative fallback parameters");
+        Self { r: 2.0, p: 0.3 }
     }
 }
 
@@ -81,9 +85,19 @@ impl Likelihood for GenomicLikelihood {
         match NegativeBinomial::new(self.r, self.p) {
             Ok(nb_dist) => {
                 let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
+                info!(
+                    "NB likelihood: count={}, r={}, p={}, ln_pmf={}",
+                    data.observed_count, self.r, self.p, log_likelihood
+                );
                 LogProb::from(log_likelihood)
             }
-            Err(_) => LogProb::ln_zero(),
+            Err(e) => {
+                info!(
+                    "NegativeBinomial::new failed: r={}, p={}, error={:?}",
+                    self.r, self.p, e
+                );
+                LogProb::ln_zero()
+            }
         }
     }
 }
@@ -99,21 +113,32 @@ impl Posterior for GenomicPosterior {
     where
         F: FnMut(&Self::BaseEvent, &Self::Data) -> LogProb,
     {
-        // Calculate joint probability for signal hypothesis
-        let joint_prob_signal = joint_prob(event, data);
+        // Calculate signal likelihood using current parameters
+        let signal_likelihood = joint_prob(event, data);
 
-        let noise_event = GenomicEvent {
-            bin_count: (data.observed_count as f64 * 0.1) as usize,
-            total_reads: event.total_reads,
+        // Calculate noise likelihood using background parameters (conservative, high p)
+        let noise_likelihood = match NegativeBinomial::new(1.0, 0.8) {
+            Ok(nb_dist) => {
+                let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
+                LogProb::from(log_likelihood)
+            }
+            Err(_) => LogProb::ln_zero(),
         };
 
-        // Calculate joint probability for noise hypothesis
-        let joint_prob_noise = joint_prob(&noise_event, data);
+        let prior_signal = LogProb::from(Prob(0.5));
+        let prior_noise = LogProb::from(Prob(0.5));
+
+        let joint_prob_signal = signal_likelihood + prior_signal;
+        let joint_prob_noise = noise_likelihood + prior_noise;
 
         // Calculate evidence (marginal likelihood)
         let evidence = joint_prob_signal.ln_add_exp(joint_prob_noise);
 
-        joint_prob_signal - evidence
+        let posterior = joint_prob_signal - evidence;
+        info!("Posterior calculation: signal_lik={:?}, noise_lik={:?}, signal_joint={:?}, noise_joint={:?}, evidence={:?}, posterior={:?}", 
+              signal_likelihood, noise_likelihood, joint_prob_signal, joint_prob_noise, evidence, posterior);
+
+        posterior
     }
 }
 
@@ -153,6 +178,10 @@ impl BayesianModel {
         info!("Applying rust-bio Bayesian model to identify significant bins");
 
         let prior = GenomicPrior::from_bin_counts(bin_counts);
+        info!(
+            "Estimated negative binomial parameters: r={}, p={}",
+            prior.r, prior.p
+        );
         *self.model.prior_mut() = prior.clone();
 
         self.model.likelihood_mut().r = prior.r;
@@ -174,15 +203,22 @@ impl BayesianModel {
                 observed_count: *count,
             };
 
-            let universe = vec![event.clone()];
-            let model_instance = self.model.compute(universe, &data);
+            let mut joint_prob_fn = |event: &GenomicEvent, data: &ReadCountData| -> LogProb {
+                let likelihood = self.model.likelihood().compute(event, data, &mut ());
+                let prior = self.model.prior().compute(event);
+                likelihood + prior
+            };
 
-            let posterior_log = model_instance
-                .posterior(&event)
-                .unwrap_or(LogProb::ln_zero());
+            let posterior_log = self
+                .model
+                .posterior()
+                .compute(&event, &data, &mut joint_prob_fn);
             let posterior_prob = (*Prob::from(posterior_log)).clamp(0.0, 1.0);
 
-            info!("Bin {}:{}-{} calculated posterior_prob: {}", bin.chrom, bin.start, bin.end, posterior_prob);
+            info!(
+                "Bin {}:{}-{} count={} posterior_log={:?} posterior_prob={}",
+                bin.chrom, bin.start, bin.end, count, posterior_log, posterior_prob
+            );
             posterior_probs.push((bin.clone(), posterior_prob));
         }
 
@@ -208,7 +244,10 @@ impl BayesianModel {
             if posterior_prob >= threshold {
                 let mut bin_clone = bin.clone();
                 bin_clone.posterior_prob = posterior_prob;
-                info!("Setting bin {}:{}-{} posterior_prob to: {}", bin_clone.chrom, bin_clone.start, bin_clone.end, bin_clone.posterior_prob);
+                info!(
+                    "Setting bin {}:{}-{} posterior_prob to: {}",
+                    bin_clone.chrom, bin_clone.start, bin_clone.end, bin_clone.posterior_prob
+                );
                 significant.push((bin_clone, posterior_prob));
             }
         }

From a1382aba9deaf7948abc5b374d10a7d45bc70b84 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:25:26 +0000
Subject: [PATCH 12/16] Apply cargo fmt formatting to bayesian.rs

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 7 +++----
 1 file changed, 3 insertions(+), 4 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 705dfca..a11e021 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -59,7 +59,7 @@ impl GenomicPrior {
             if r.is_finite() && r > 0.0 && p.is_finite() && p > 0.0 && p < 1.0 {
                 let final_r = r.clamp(0.1, 100.0); // More reasonable bounds
                 let final_p = p.clamp(0.05, 0.95); // More reasonable bounds
-                info!("Using method of moments: r={}, p={}", final_r, final_p);
+
                 return Self {
                     r: final_r,
                     p: final_p,
@@ -67,7 +67,7 @@ impl GenomicPrior {
             }
         }
 
-        info!("Using conservative fallback parameters");
+
         Self { r: 2.0, p: 0.3 }
     }
 }
@@ -135,8 +135,7 @@ impl Posterior for GenomicPosterior {
         let evidence = joint_prob_signal.ln_add_exp(joint_prob_noise);
 
         let posterior = joint_prob_signal - evidence;
-        info!("Posterior calculation: signal_lik={:?}, noise_lik={:?}, signal_joint={:?}, noise_joint={:?}, evidence={:?}, posterior={:?}", 
-              signal_likelihood, noise_likelihood, joint_prob_signal, joint_prob_noise, evidence, posterior);
+
 
         posterior
     }

From f54cc233ebc39bed9923a8b3b8fde589961e2fe7 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:29:28 +0000
Subject: [PATCH 13/16] Fix formatting issues - remove extra blank lines for CI

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 2 --
 1 file changed, 2 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index a11e021..15a1fed 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -67,7 +67,6 @@ impl GenomicPrior {
             }
         }
 
-
         Self { r: 2.0, p: 0.3 }
     }
 }
@@ -136,7 +135,6 @@ impl Posterior for GenomicPosterior {
 
         let posterior = joint_prob_signal - evidence;
 
-
         posterior
     }
 }

From b1c09e99fa81af02c9dad0ebe481e296541b6f59 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:35:44 +0000
Subject: [PATCH 14/16] Fix clippy warning - remove unnecessary let binding

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 15a1fed..0aff1a9 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -133,9 +133,9 @@ impl Posterior for GenomicPosterior {
         // Calculate evidence (marginal likelihood)
         let evidence = joint_prob_signal.ln_add_exp(joint_prob_noise);
 
-        let posterior = joint_prob_signal - evidence;
+        
 
-        posterior
+        joint_prob_signal - evidence
     }
 }
 

From da2a06aba1ebabcf5f23c30e929d21db08cd5f35 Mon Sep 17 00:00:00 2001
From: Devin AI <158243242+devin-ai-integration[bot]@users.noreply.github.com>
Date: Fri, 30 May 2025 06:36:16 +0000
Subject: [PATCH 15/16] Implement conservative negative binomial parameter
 estimation

- Tighten parameter bounds: r (1.0-50.0), p (0.1-0.8) to prevent extreme values
- Use more conservative fallback parameters: r=3.0, p=0.4
- Adjust noise hypothesis to r=2.0, p=0.9 for better signal/noise separation
- Set conservative priors: 0.3 signal, 0.7 noise
- Add enhanced logging for parameter estimation debugging

Co-Authored-By: Jake VanCampen <jake.vancampen7@gmail.com>
---
 src/bayesian.rs | 32 +++++++++++++++++++++-----------
 1 file changed, 21 insertions(+), 11 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 0aff1a9..43b638b 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -57,8 +57,13 @@ impl GenomicPrior {
             let p = mean / variance;
 
             if r.is_finite() && r > 0.0 && p.is_finite() && p > 0.0 && p < 1.0 {
-                let final_r = r.clamp(0.1, 100.0); // More reasonable bounds
-                let final_p = p.clamp(0.05, 0.95); // More reasonable bounds
+                let final_r = r.clamp(1.0, 50.0); // Tighter bounds: min 1.0, max 50.0
+                let final_p = p.clamp(0.1, 0.8); // Tighter bounds: min 0.1, max 0.8
+
+                info!(
+                    "Method-of-moments estimation: raw r={}, p={}, clamped r={}, p={}",
+                    r, p, final_r, final_p
+                );
 
                 return Self {
                     r: final_r,
@@ -67,7 +72,7 @@ impl GenomicPrior {
             }
         }
 
-        Self { r: 2.0, p: 0.3 }
+        Self { r: 3.0, p: 0.4 }
     }
 }
 
@@ -115,17 +120,22 @@ impl Posterior for GenomicPosterior {
         // Calculate signal likelihood using current parameters
         let signal_likelihood = joint_prob(event, data);
 
-        // Calculate noise likelihood using background parameters (conservative, high p)
-        let noise_likelihood = match NegativeBinomial::new(1.0, 0.8) {
+        // Calculate noise likelihood using more restrictive background parameters
+        let noise_likelihood = match NegativeBinomial::new(2.0, 0.9) {
+            // Higher p = lower variance, more restrictive
             Ok(nb_dist) => {
                 let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
+                info!(
+                    "Noise likelihood: count={}, ln_pmf={}",
+                    data.observed_count, log_likelihood
+                );
                 LogProb::from(log_likelihood)
             }
             Err(_) => LogProb::ln_zero(),
         };
 
-        let prior_signal = LogProb::from(Prob(0.5));
-        let prior_noise = LogProb::from(Prob(0.5));
+        let prior_signal = LogProb::from(Prob(0.3)); // Reduced from 0.5 to be more conservative
+        let prior_noise = LogProb::from(Prob(0.7)); // Increased from 0.5 to be more conservative
 
         let joint_prob_signal = signal_likelihood + prior_signal;
         let joint_prob_noise = noise_likelihood + prior_noise;
@@ -133,8 +143,6 @@ impl Posterior for GenomicPosterior {
         // Calculate evidence (marginal likelihood)
         let evidence = joint_prob_signal.ln_add_exp(joint_prob_noise);
 
-        
-
         joint_prob_signal - evidence
     }
 }
@@ -176,8 +184,10 @@ impl BayesianModel {
 
         let prior = GenomicPrior::from_bin_counts(bin_counts);
         info!(
-            "Estimated negative binomial parameters: r={}, p={}",
-            prior.r, prior.p
+            "Estimated negative binomial parameters: r={}, p={} (fallback used: {})",
+            prior.r,
+            prior.p,
+            prior.r == 3.0 && prior.p == 0.4
         );
         *self.model.prior_mut() = prior.clone();
 

From 34ffeab00e500d7b1171900d8a21a7f2e30ab859 Mon Sep 17 00:00:00 2001
From: jakevc <jake.vancampen7@gmail.com>
Date: Fri, 30 May 2025 16:02:10 -0700
Subject: [PATCH 16/16] unlog

---
 src/bayesian.rs    | 71 +++++++++++++++++++++++-----------------------
 src/peak_caller.rs | 17 +++++++++--
 2 files changed, 50 insertions(+), 38 deletions(-)

diff --git a/src/bayesian.rs b/src/bayesian.rs
index 43b638b..61576ee 100644
--- a/src/bayesian.rs
+++ b/src/bayesian.rs
@@ -45,12 +45,12 @@ impl GenomicPrior {
         let mean = counts.clone().mean();
         let variance = counts.clone().variance();
 
-        info!(
-            "Count statistics: mean={}, variance={}, n={}",
-            mean,
-            variance,
-            counts.len()
-        );
+        // info!(
+        //     "Count statistics: mean={}, variance={}, n={}",
+        //     mean,
+        //     variance,
+        //     counts.len()
+        // );
 
         if variance > mean && variance.is_finite() && mean > 0.0 {
             let r = (mean * mean) / (variance - mean);
@@ -60,10 +60,10 @@ impl GenomicPrior {
                 let final_r = r.clamp(1.0, 50.0); // Tighter bounds: min 1.0, max 50.0
                 let final_p = p.clamp(0.1, 0.8); // Tighter bounds: min 0.1, max 0.8
 
-                info!(
-                    "Method-of-moments estimation: raw r={}, p={}, clamped r={}, p={}",
-                    r, p, final_r, final_p
-                );
+                // info!(
+                //     "Method-of-moments estimation: raw r={}, p={}, clamped r={}, p={}",
+                //     r, p, final_r, final_p
+                // );
 
                 return Self {
                     r: final_r,
@@ -89,17 +89,17 @@ impl Likelihood for GenomicLikelihood {
         match NegativeBinomial::new(self.r, self.p) {
             Ok(nb_dist) => {
                 let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
-                info!(
-                    "NB likelihood: count={}, r={}, p={}, ln_pmf={}",
-                    data.observed_count, self.r, self.p, log_likelihood
-                );
+                // info!(
+                //     "NB likelihood: count={}, r={}, p={}, ln_pmf={}",
+                //     data.observed_count, self.r, self.p, log_likelihood
+                // );
                 LogProb::from(log_likelihood)
             }
             Err(e) => {
-                info!(
-                    "NegativeBinomial::new failed: r={}, p={}, error={:?}",
-                    self.r, self.p, e
-                );
+                // info!(
+                //     "NegativeBinomial::new failed: r={}, p={}, error={:?}",
+                //     self.r, self.p, e
+                // );
                 LogProb::ln_zero()
             }
         }
@@ -120,15 +120,14 @@ impl Posterior for GenomicPosterior {
         // Calculate signal likelihood using current parameters
         let signal_likelihood = joint_prob(event, data);
 
-        // Calculate noise likelihood using more restrictive background parameters
-        let noise_likelihood = match NegativeBinomial::new(2.0, 0.9) {
-            // Higher p = lower variance, more restrictive
+        // output is very sensitive to the noise parameters
+        let noise_likelihood = match NegativeBinomial::new(0.7, 0.5) {
             Ok(nb_dist) => {
                 let log_likelihood = nb_dist.ln_pmf(data.observed_count as u64);
-                info!(
-                    "Noise likelihood: count={}, ln_pmf={}",
-                    data.observed_count, log_likelihood
-                );
+                // info!(
+                //     "Noise likelihood: count={}, ln_pmf={}",
+                //     data.observed_count, log_likelihood
+                // );
                 LogProb::from(log_likelihood)
             }
             Err(_) => LogProb::ln_zero(),
@@ -183,12 +182,12 @@ impl BayesianModel {
         info!("Applying rust-bio Bayesian model to identify significant bins");
 
         let prior = GenomicPrior::from_bin_counts(bin_counts);
-        info!(
-            "Estimated negative binomial parameters: r={}, p={} (fallback used: {})",
-            prior.r,
-            prior.p,
-            prior.r == 3.0 && prior.p == 0.4
-        );
+        // info!(
+        //     "Estimated negative binomial parameters: r={}, p={} (fallback used: {})",
+        //     prior.r,
+        //     prior.p,
+        //     prior.r == 3.0 && prior.p == 0.4
+        // );
         *self.model.prior_mut() = prior.clone();
 
         self.model.likelihood_mut().r = prior.r;
@@ -222,10 +221,10 @@ impl BayesianModel {
                 .compute(&event, &data, &mut joint_prob_fn);
             let posterior_prob = (*Prob::from(posterior_log)).clamp(0.0, 1.0);
 
-            info!(
-                "Bin {}:{}-{} count={} posterior_log={:?} posterior_prob={}",
-                bin.chrom, bin.start, bin.end, count, posterior_log, posterior_prob
-            );
+            // info!(
+            //     "Bin {}:{}-{} count={} posterior_log={:?} posterior_prob={}",
+            //     bin.chrom, bin.start, bin.end, count, posterior_log, posterior_prob
+            // );
             posterior_probs.push((bin.clone(), posterior_prob));
         }
 
@@ -235,7 +234,7 @@ impl BayesianModel {
         let significant_bins: Vec<GenomicRange> =
             significant.into_iter().map(|(bin, _)| bin).collect();
 
-        info!("Found {} significant bins", significant_bins.len());
+        // info!("Found {} significant bins", significant_bins.len());
 
         Ok(significant_bins)
     }
diff --git a/src/peak_caller.rs b/src/peak_caller.rs
index f701a00..a637772 100644
--- a/src/peak_caller.rs
+++ b/src/peak_caller.rs
@@ -114,18 +114,21 @@ impl PeakCaller {
                 }
 
                 let mut current_peak = sorted_bins[0].clone();
+                let mut posterior_probs = vec![current_peak.posterior_prob];
 
                 for bin in sorted_bins.iter().skip(1) {
                     if bin.start <= current_peak.end + max_distance {
                         current_peak.end = bin.end.max(current_peak.end);
-
-                        current_peak.posterior_prob *= bin.posterior_prob;
+                        posterior_probs.push(bin.posterior_prob);
                     } else {
+                        current_peak.posterior_prob = median(&mut posterior_probs);
                         result.push(current_peak.clone());
                         current_peak = bin.clone();
+                        posterior_probs = vec![current_peak.posterior_prob];
                     }
                 }
 
+                current_peak.posterior_prob = median(&mut posterior_probs);
                 result.push(current_peak);
                 result
             })
@@ -172,3 +175,13 @@ impl Peaks {
         self.ranges.len()
     }
 }
+
+fn median(values: &mut Vec<f64>) -> f64 {
+    values.sort_by(|a, b| a.partial_cmp(b).unwrap_or(std::cmp::Ordering::Equal));
+    let len = values.len();
+    if len % 2 == 0 {
+        (values[len / 2 - 1] + values[len / 2]) / 2.0
+    } else {
+        values[len / 2]
+    }
+}