すべてのプロダクト
Search
ドキュメントセンター

Dataphin:付録: データ探索の一般的なシナリオ

最終更新日:Feb 06, 2025

このトピックでは、さまざまなコンピューティングエンジンでデータ探索タスクを実行する際に発生する一般的な問題とその解決策の概要を示します。

シナリオの詳細は以下のとおりです。

コンピューティングエンジン

カテゴリ

異常の原因

解決策

Cloudera Data Platform 7.x

ノードエラー

エンジンのオプティマイザー機能が正しく機能していません。

set hive.optimize.shared.work = false;

AsiaInfo DP5.3

メモリ オーバーフロー

Map 側と Reduce 側の両方でメモリがオーバーフローします。

set mapreduce.map.memory.mb=10150;

set mapreduce.map.java.opts=-Xmx6144m;

set mapreduce.reduce.memory.mb=10150;

set mapreduce.reduce.java.opts=-Xmx8120m;

E-MapReduce 3.xE-MapReduce 5.xCDH 5.xCDH 6.xFusionInsight 8.xCloudera Data Platform 7.xAsiaInfo DP5.3

実行速度が遅い

同時ジョブ実行数が少なすぎます。

set hive.exec.parallel=true;

set hive.exec.parallel.thread.number=16;