updateDependencies throws NullPointerException #1516

prclin · 2025-04-24T07:07:16Z

env:
jupyter-lab
spark:2.4.8
almond:0.6.0
scala: 2.11.12

i am using almond in jupyter, and run spark on k8s in almond;

the first time i use original SparkSession to build SparkSession, i met that can not use map functions in almond, casue serialization problems;

so i use NoteBookSparkSession to build SparkSession, i met no FileSystem schema http， that cause executor can not start up； so i put spark-stubs in executor pod jars dir and remove spark-repl jar in jars, because spark-repl conflicts with spark-stubs.

finally executor pod started up, but not, every action operator runs error like:

Driver stacktrace:
  org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$failJobAndIndependentStages(DAGScheduler.scala:1925)
  org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1913)
  org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1912)
  scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59)
  scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:48)
  org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:1912)
  org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:948)
  org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:948)
  scala.Option.foreach(Option.scala:257)
  org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:948)
  org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:2146)
  org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2095)
  org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2084)
  org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:49)
  org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:759)
  org.apache.spark.SparkContext.runJob(SparkContext.scala:2067)
  org.apache.spark.SparkContext.runJob(SparkContext.scala:2164)
  org.apache.spark.rdd.RDD$$anonfun$fold$1.apply(RDD.scala:1143)
  org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
  org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
  org.apache.spark.rdd.RDD.withScope(RDD.scala:385)
  org.apache.spark.rdd.RDD.fold(RDD.scala:1137)
  org.apache.spark.rdd.DoubleRDDFunctions$$anonfun$sum$1.apply$mcD$sp(DoubleRDDFunctions.scala:35)
  org.apache.spark.rdd.DoubleRDDFunctions$$anonfun$sum$1.apply(DoubleRDDFunctions.scala:35)
  org.apache.spark.rdd.DoubleRDDFunctions$$anonfun$sum$1.apply(DoubleRDDFunctions.scala:35)
  org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
  org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
  org.apache.spark.rdd.RDD.withScope(RDD.scala:385)
  org.apache.spark.rdd.DoubleRDDFunctions.sum(DoubleRDDFunctions.scala:34)
  ammonite.$sess.cmd12$Helper.<init>(cmd12.sc:1)
  ammonite.$sess.cmd12$.<init>(cmd12.sc:7)
  ammonite.$sess.cmd12$.<clinit>(cmd12.sc:-1)
java.lang.NullPointerException
  org.apache.spark.executor.Executor$$anonfun$org$apache$spark$executor$Executor$$updateDependencies$5.apply(Executor.scala:812)
  org.apache.spark.executor.Executor$$anonfun$org$apache$spark$executor$Executor$$updateDependencies$5.apply(Executor.scala:811)
  scala.collection.TraversableLike$WithFilter$$anonfun$foreach$1.apply(TraversableLike.scala:733)
  scala.collection.mutable.HashMap$$anonfun$foreach$1.apply(HashMap.scala:130)
  scala.collection.mutable.HashMap$$anonfun$foreach$1.apply(HashMap.scala:130)
  scala.collection.mutable.HashTable$class.foreachEntry(HashTable.scala:236)
  scala.collection.mutable.HashMap.foreachEntry(HashMap.scala:40)
  scala.collection.mutable.HashMap.foreach(HashMap.scala:130)
  scala.collection.TraversableLike$WithFilter.foreach(TraversableLike.scala:732)
  org.apache.spark.executor.Executor.org$apache$spark$executor$Executor$$updateDependencies(Executor.scala:811)
  org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:378)
  java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
  java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
  java.lang.Thread.run(Thread.java:750)

then i see the source code, found it was because the TaskDescription.addedJars was Empty.

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

updateDependencies throws NullPointerException #1516

updateDependencies throws NullPointerException #1516

prclin commented Apr 24, 2025 •

edited

Loading

updateDependencies throws NullPointerException #1516

updateDependencies throws NullPointerException #1516

Comments

prclin commented Apr 24, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

prclin commented Apr 24, 2025 •

edited

Loading