推广 热搜: 公司  快速  上海  中国  未来    企业  政策  教师  系统 

Impala常见问题

   日期:2024-10-31     作者:caijiyuan    caijiyuan   评论:0    移动:http://keant.xrbh.cn/news/12611.html
核心提示:最近在全权负责的一款数据产品,基于Hive-JDBC执行用户提交的Impala SQL,实现数据集,数据监控,数据推送等功能。Hive-JDBC版本


Impala常见问题

最近在全权负责的一款数据产品,基于Hive-JDBC执行用户提交的Impala SQL,实现数据集,数据监控,数据推送等功能。Hive-JDBC版本​​:

之前CDH版本执行无误的SQL,在CDH集群升级到7.1.7版本后执行失败,具体报错信息如下:​​

即,enable是一个敏感关键词,报语法错误。解决方法:加上反单引号,即:​​​enable​​

SQL里面包含​​函数,SQL执行失败。如图,非hive-jdbc问题,在可视化查询界面执行也是失败的:

Impala常见问题_sql

具体报错信息如下:

通过hive-jdbc提交到大数据平台的SQL执行报错:​​​,没有更多报错日志。原因:大数据平台节点资源紧张,直接抛弃任务。
区别于下面的Cancelled from Impala’s debug web interface报错。
解决方法:重试,优化SQL。貌似没有更好的方法。

具体报错信息如下:

解决方法:重试,优化SQL。貌似没有更好的方法。

报错信息如下:

报错代码片段:

发生在​​处。

任务超时被kill。大数据平台资源有限,不可能让用户的查询SQL无限期执行下去。任务查杀规则综合考虑3方面因素(查询数据量 + 执行时间 + 完成度):

Impala常见问题_hive_02


针对数据块这一问题,非常不建议使用​​​,而列出具体的查询字段,另外加上​​字句限制条数。

具体的报错信息如下:

有时候重试成功,有时候失败。登录到Hadoop集群机器里,查看任务调度执行日志:

Impala常见问题_java_03


发现这个SQL,居然要全表扫描一张1.2W+分区,扫描20.1TB数据。

解决方法:重试,优化SQL。貌似没有更好的方法。

任务执行失败,具体的报错信息如下:

报错原因:数据表不存在。尝试方法:​​​或​​

解决方法:重试,优化SQL。貌似没有更好的方法。

具体报错信息:

提交到大数据平台的SQL需要排队,排队超过3分钟被抛弃。

具体报错信息:

大数据平台设置SQL提交数量,最多运行150个,排队200个,排队超时时间为5分钟。后续提交的SQL,排队连接超时,报错。

有两类报错信息:

  1. Table does not exist:
  1. Could not resolve table reference

区别是什么???

待执行的查询SQL依赖于表rhino_man_checked_hitrule,而表的存储文件损坏,需要重新生成表。

待执行的查询SQL依赖于表rhino_man_checked_hitrule,而表的存储文件损坏,需要重新生成表。

本文地址:http://lianchengexpo.xrbh.cn/news/12611.html    迅博思语资讯 http://lianchengexpo.xrbh.cn/ , 查看更多
 
标签: 常见问题
 
更多>同类行业资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐行业资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号