Spark submit 메모리 오류

2019. 1. 23. 15:09

by. 위지원

2019-01-23 14:56:35 ERROR TaskSchedulerImpl:70 - Lost executor 1 on 203.255.92.x: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
2019-01-23 14:56:36 ERROR TaskSchedulerImpl:70 - Lost executor 0 on 203.255.92.x: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
2019-01-23 14:56:47 ERROR TaskSchedulerImpl:70 - Lost executor 2 on 203.255.92.x: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
2019-01-23 14:57:14 ERROR TaskSchedulerImpl:70 - Lost executor 4 on 203.255.92.x: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
2019-01-23 14:57:14 ERROR TaskSchedulerImpl:70 - Lost executor 3 on 203.255.92.x: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
2019-01-23 14:57:24 ERROR TaskSchedulerImpl:70 - Lost executor 5 on 203.255.92.x: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
2019-01-23 14:57:24 ERROR TaskSetManager:70 - Task 1 in stage 236.1 failed 4 times; aborting job
Exception in thread "main" org.apache.spark.SparkException: Job aborted due to stage failure: Task 1 in stage 236.1 failed 4 times, most recent failure: Lost task 1.3 in stage 236.1 (TID 1464, 203.255.92.x, executor 5): ExecutorLostFailure (executor 5 exited caused by one of the running tasks) Reason: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.
Driver stacktrace:
   at org.apache.spark.scheduler.DAGScheduler.org$apache$spark$scheduler$DAGScheduler$$failJobAndIndependentStages(DAGScheduler.scala:1651)
   at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1639)
   at org.apache.spark.scheduler.DAGScheduler$$anonfun$abortStage$1.apply(DAGScheduler.scala:1638)
   at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59)
   at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:48)
   at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:1638)
   at org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:831)
   at org.apache.spark.scheduler.DAGScheduler$$anonfun$handleTaskSetFailed$1.apply(DAGScheduler.scala:831)
   at scala.Option.foreach(Option.scala:257)
   at org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:831)
   at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:1872)
   at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:1821)
   at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:1810)
   at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:48)
   at org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:642)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2034)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2055)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2074)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2099)
   at org.apache.spark.rdd.RDD$$anonfun$collect$1.apply(RDD.scala:945)
   at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
   at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
   at org.apache.spark.rdd.RDD.withScope(RDD.scala:363)
   at org.apache.spark.rdd.RDD.collect(RDD.scala:944)
   at Master.main$.main(main.scala:96)
   at Master.main.main(main.scala)
   at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
   at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
   at java.lang.reflect.Method.invoke(Method.java:483)
   at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
   at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:894)
   at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
   at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
   at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
   at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

executor의 메모리를 너무 크게 잡아서 생긴 문제로 30g를 20g로 변경하였다. overhead가 많이 발생해서 메모리 낭비로 executor 사망 x(

https://stackoverflow.com/questions/41163135/spark-standalone-cluster-executors-exit-how-to-track-the-source-of-the-error

저작자표시 (새창열림)

'2019년' 카테고리의 다른 글

Error: Cannot retrieve repository metadata (repomd.xml) for repository: c6-media. Please verify its path and try again (0)	2019.02.19
Exception in thread "main" org.apache.spark.SparkException: Task not serializable (0)	2019.01.23
localhost: JAVA_HOME is not set (0)	2019.01.22
-bash-4.1$ 이라고 변경되었따.. (0)	2019.01.22
Insufficient space for shared memory file (0)	2019.01.21

잠깐만요~! 읽으신김에 이런 글들은 어떠세요? 👀

맨 위로

데이터를 사랑하고 궁금해하는 기록쟁이입니다! 😉 Super Data Girl이 되는 그날까지🏃‍♀️ 화이팅!

Spark submit 메모리 오류

'2019년' 카테고리의 다른 글

티스토리툴바

티스토리툴바