问题1:Hive集成Tez引擎跑任务出现异常:TaskAttempt 3 failed, info=[Error: Error while running task ( failure ) : attempt_1597977573448_0002_1_16_000000_3:java.lang.RuntimeException: java.lang.OutOfMemoryError: Java heap space
看yarn 的job平台是success的,所以想到Tez的内存设置问题,因为Tez引擎是纯内存操作,所以对内存大小肯定有要求。所以查看下tez的设置情况: 查看了
SET hive.tez.container.size
;容器大小:如果8G,去除预留和其他组件给4G,4*1024
SET hive.tez.java.opts
;(java内存设置 -Xmx1048m
)值一般是80% * 容器大小
SET hive.am.resource.memory.mb
;
SET hive.am.java.opts
;
以下是调优参数这是:
问题2:如果报以下问题:
Status: Failed
Vertex
's TaskResource is beyond the cluster container capability,Vertex=vertex_1597977573448_0003_1_00 [Map 9], Requested TaskResource=<memory:4096, vCores:1>, Cluster MaxContainerCapability=<memory:2048, vCores:2>
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.tez.TezTask. Vertex's TaskResource is beyond the cluster container capability,Vertex
=vertex_1597977573448_0003_1_00
[Map 9
], Requested TaskResource
=<memory:4096, vCores:1
>, Cluster MaxContainerCapability
=<memory:2048, vCores:2
>
则继续调整tez内存大小,不能超过yarn的单个任务的最大设置。 执行ok了
附录:
一、AM、Container大小设置1、tez.am.resource.memory.mb
默认值:1024
配置文件:tez-site.xml 建议:不小于或者等于yarn.scheduler.minimum-allocation-mb值。
2、hive.tez.container.size
默认值:-1
默认情况下,Tez将生成一个mapper大小的容器。这可以用来覆盖默认值。
配置文件:hive-site-xml 建议:不小于或者是yarn.scheduler.minimum-allocation-mb的倍数
二、AM、Container JVM参数设置
1、tez.am.launch.cmd-opts
默认值:-XX:+PrintGCDetails -verbose:gc -XX:+PrintGCTimeStamps -XX:+UseNUMA -XX:+UseParallelGC
(用于GC
),默认的大小:80%*tez.am.resource.memory.mb 配置文件:tez-site.xml 建议:不要在这些启动选项中设置任何xmx或xms,以便tez可以自动确定它们。
2、hive.tez.java.ops
默认值:Hortonworks建议“–server –Djava.net.preferIPv4Stack
=true–XX:NewRatio
=8 –XX:+UseNUMA –XX:UseG1G”,默认大小:80%*hive.tez.container.size 说明:在hive 2.x的官方文档中没有找到这个参数。看有些博客里面有这个值。 配置文件:hive-site.xml
3、tez.container.max.java.heap.fraction
4、tez.runtime.unordered.output.buffer.size-mb