このトピックでは、CPFS-POSIX または CPFS-NFS クライアントを使用して Linux オペレーティングシステムに Cloud Parallel File Storage (CPFS) ファイルシステムをマウントできない場合の一般的な問題と解決策について説明します。
概要
POSIX クライアントマウントポイント
POSIX クライアントマウントポイントの作成時に「在庫が不足しています」というエラーが返された場合はどうすればよいですか。
POSIX クライアントマウントポイントの作成時に「vSwitch の IP アドレス数が不足しています」というエラーが返された場合はどうすればよいですか。
CPFS-POSIX クライアントのマウント
CPFS ファイルシステムのマウント時に「'X86_64' アーキテクチャでサポートされていない OS です」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「kernel-devel のバージョンが kernel と一致していることを確認してください」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「ssh: connect to host A port 22: Connection timed out」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「not active on:」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「Command failed」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「cpfs.sh is running already」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「connect to host B port 22: Connection timed out」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時に「[FATAL] B: Could not connect to B via ssh」というエラーが返された場合はどうすればよいですか。
cpfs add コマンドを実行して CPFS ファイルシステムをマウントする際に YUM リポジトリエラーが発生した場合はどうすればよいですか。
CPFS-NFS クライアントのマウント
CPFS のスケールアウト
POSIX クライアントマウントポイントの作成時に「在庫が不足しています」というエラーが返された場合はどうすればよいですか。
問題:
Cloud Parallel File Storage (CPFS) コンソールでファイルシステムの POSIX クライアントマウントポイントを作成すると、次の図に示すエラーが返されます。
原因:
POSIX マウントポイントを作成すると、CPFS は Alibaba Cloud アカウントに 3 つの従量課金 Elastic Compute Service (ECS) インスタンス (ecs.g*.large) を自動的に作成します。これらのインスタンスは、CPFS-POSIX クライアントクラスターの管理に使用されます。POSIX クライアントマウントポイントを作成するには、Alibaba Cloud アカウントが良好な状態であり、ECS インスタンスを購入できる必要があります。
解決策:
ECS コンソールにログインし、[カスタム起動] に移動して、必要な ECS インスタンスタイプの在庫を表示します。これにより、指定されたインスタンスタイプの在庫不足によるマウントポイント作成の失敗を防ぐことができます。
POSIX クライアントマウントポイントの作成時に「vSwitch の IP アドレス数が不足しています」というエラーが返された場合はどうすればよいですか。
問題:
CPFS コンソールでファイルシステムの POSIX クライアントマウントポイントを作成すると、「指定された vSwitch の IP アドレス数が不足しています」というエラーメッセージが返されます。
原因:
CPFS ファイルシステムのストレージノードは、POSIX クライアントマウントポイントで指定された vSwitch から割り当てられた IP アドレスを使用します。各ストレージノードには 1 つの IP アドレスが必要です。CPFS ファイルシステムのストレージノードは、最大 160 個の IP アドレスを必要とする場合があります。
解決策:
VPC コンソールにログインして、宛先 VPC の vSwitch で利用可能な IP アドレスの数をクエリします。vSwitch に十分な数の利用可能な IP アドレスがあることを確認してください。
POSIX クライアントマウントポイントを作成できないのはなぜですか。
CPFS コンソールで作成したばかりのマウントポイントが見つからない場合は、Alibaba Cloud アカウントに支払い遅延があるかどうかを確認してください。Alibaba Cloud アカウントに支払い遅延がある場合、CPFS ファイルシステムのマウントポイントを作成できません。マウントポイントを作成する前に、アカウントに資金を追加する必要があります。
ECS インスタンスにマウントできる CPFS ファイルシステムの数はいくつですか。
ECS インスタンスには最大 1 つの CPFS ファイルシステムをマウントできます。
CPFS ファイルシステムのマウント時に「'X86_64' アーキテクチャでサポートされていない OS です」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、計算ノードのオペレーティングシステムはサポートされていません。計算ノードのオペレーティングシステムを変更する必要があります。CPFS クライアントでサポートされているオペレーティングシステムの詳細については、「制限」をご参照ください。
[ FATAL ] You cannot add cpfs-client-001 node because it has an unsupported OS for 'X86_64' architecture.CPFS ファイルシステムのマウント時に「kernel-devel のバージョンが kernel と一致していることを確認してください」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、マウントしようとしている ECS インスタンスに kernel-devel および kernel-headers パッケージがインストールされていないか、インストールされているパッケージのバージョンに互換性がありません。
No package kernel-devel-3.10.0-957.21.3.el7.x86_64 available.
Error: Nothing to do
please make sure kernel-devel version is consistent with kernel次のコマンドを実行して、パッケージが ECS インスタンスにインストールされているかどうかを確認します。
rpm -qa | grep kernel-devel-`uname -r`空の結果が返された場合、パッケージは ECS インスタンスに正しくインストールされていません。ECS インスタンスにパッケージを再インストールする必要があります。詳細については、「ステップ 1: 環境を準備する」をご参照ください。
CPFS ファイルシステムのマウント時に「ssh: connect to host A port 22: Connection timed out」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、マウントしようとしている ECS インスタンスとファイルシステム間のネットワーク接続が切断されています。
====> start check ssh
try ssh root@a.b.c.d by /root/.ssh/id_rsa.pub
ssh: connect to host a.b.c.d port 22: Connection timed out次の情報に基づいて原因を特定し、問題を解決してください。
考えられる原因 | 解決策 |
ECS インスタンス (a.b.c.d) と POSIX クライアントマスターノード (qr-001) 間のネットワーク接続が切断されています。 | ネットワーク接続を確認し、マウントコマンドを再度実行します。 |
ECS インスタンス (a.b.c.d) が qr-sg セキュリティグループに追加されていません。 | セキュリティグループの構成を確認し、ファイルシステムを再度マウントしてみてください。詳細については、「セキュリティグループを設定する」をご参照ください。 |
ECS インスタンス (a.b.c.d) と CPFS マウントポイントが同じ VPC にありません。 | マウントポイントと同じ VPC にある ECS インスタンスを選択します。 |
ECS インスタンス (a.b.c.d) の IP アドレスが存在しません。 | ECS インスタンスのインスタンスステータスを確認します。 |
CPFS ファイルシステムのマウント時に「not active on:<hostname>」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、マウントしようとしている ECS インスタンスで CPFS ファイルシステムを起動できません。
[ WARN ] GPFS is not active on: hostname. Consult the install toolkit logs for possible errors
during install. The GPFS service can also be started manually by running GPFS command
'mmstartup -N Node[,Node...]'
[ FATAL ] GPFS NOT ACTIVE次の情報に基づいて原因を特定し、問題を解決してください。
マウントしようとしている ECS インスタンスのセキュリティグループが正しく構成されていないか、ECS インスタンスが qr-sg セキュリティグループに追加されていません。詳細については、「セキュリティグループを設定する」をご参照ください。
CPFS ファイルシステムでは、ECS インスタンスに 4 GB 以上の利用可能なメモリが必要です。ECS インスタンスのメモリが不足している場合、エラーが報告されます。ECS インスタンスの利用可能なメモリを確認してください。
CPFS ファイルシステムのマウント時に「Command failed」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、ECS インスタンスの利用可能なメモリが 4 GB 未満です。ECS インスタンスのメモリをスペックアップし、cpfs add ip コマンドを再度実行してファイルシステムをマウントする必要があります。
[ WARN ] GPFS is not active on: hostname. Consult the install toolkit logs for possible errors
during install. The GPFS service can also be started manually by running GPFS command
'mmstartup -N Node[,Node...]'
[ FATAL ] GPFS NOT ACTIVECPFS ファイルシステムのマウント時に「cpfs.sh is running already」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、マウントまたはアンマウントタスクがすでに進行中です。しばらく待ってから、ファイルシステムを再度マウントしてみてください。
cpfs.sh is running already, pid: xyzCPFS ファイルシステムのマウント時に「connect to host B port 22: Connection timed out」というエラーが返された場合はどうすればよいですか。
ECS インスタンス A に CPFS ファイルシステムをマウントする際にこのエラーメッセージが返された場合、現在の CPFS ファイルシステムクラスター内に異常な ECS インスタンス B が存在します。
# cpfs add A
connect to host B port 22: Connection timed out
B hostname is invalid
Failed to add node.以下の手順に従って、異常な ECS インスタンス B をトラブルシューティングし、修正してください。その後、再度マウント操作を試してください。
マスターノード qr-001 で、mmgetstate -a を実行して ECS インスタンス B のステータスが正常かどうかを確認します。`active` 状態は正常なステータスを示します。
インスタンス B のステータスが正常な場合は、チケットを送信して、CPFS チームにさらなるトラブルシューティングを依頼してください。
インスタンス B のステータスが異常な場合は、インスタンスを引き続き使用するかどうかを判断します。
インスタンスを引き続き使用したい場合は、チケットを送信して、CPFS チームにインスタンスのステータスを解決してもらいます。
インスタンスをこれ以上使用したくない場合は、
mmdelnode -N <id> --forceコマンドを実行してノード情報をパージします。mmdelnode -N iZuf61mhwoc9flkufs0**** --force Do you want to continue? (yes/no) yes mmdelnode: [W] Could not cleanup the following unreached nodes: iZuf61mhwoc9flkufs0**** mmdelnode: Command successfully completed mmdelnode: Propagating the cluster configuration data to all affected nodes. This is an asynchronous process.情報がパージされた後、/etc/hosts ファイルからインスタンス B のホスト情報を削除します。この例では、
iZuf61mhwoc9flkufs0****は宛先 ECS インスタンスの ID です。
CPFS ファイルシステムのマウント時に「[FATAL] B: Could not connect to B via ssh」というエラーが返された場合はどうすればよいですか。
ECS インスタンス A に CPFS ファイルシステムをマウントする際にこのエラーメッセージが返された場合、現在の CPFS ファイルシステムクラスターに、インストールが中断され、残留構成が残っている ECS インスタンス B が存在します。
[ FATAL ] ssh: connect to host B port 22: Connection timed out
[ FATAL ] B: Could not connect to B via ssh.バージョン 2.2.0 以前
/usr/lpp/mmfs/5.0.5.0/installer/configuration/clusterdefinition.txt ファイルから ECS インスタンス B の残留構成情報を削除します。
[node4] fqdn = B os = rhel7 arch = x86_64 ip_address = 192.168.6.37 is_admin_node = False is_object_store = False is_nfs = False is_smb = False is_hdfs = False is_protocol_node = False is_nsd_server = False access_ips = is_quorum_node = False is_manager_node = False is_gui_server = False is_ems_node = False is_callhome_node = False is_broker_node = False is_node_offline = False is_node_reachable = True is_node_excluded = False is_mestor_node = Falseバージョン 2.2.0 以降
/usr/lpp/mmfs/5.1.2.0/ansible-toolkit/ansible/ibm-spectrum-scale-install-infra/vars/scale_clusterdefinition.json ファイルから ECS インスタンス B の残留構成情報を削除します。
{ "fqdn": "iZuf6hn0blj1g377w4xxxxZ", "os": "rhel7", "arch": "x86_64", "ip_address": "172.19.0.100", "is_admin_node": false, "is_object_store": false, "is_nfs": false, "is_smb": false, "is_hdfs": false, "is_protocol_node": false, "is_nsd_server": false, "is_quorum_node": false, "is_manager_node": false, "is_gui_server": false, "is_ems_node": false, "is_callhome_node": false, "is_broker_node": false, "is_node_offline": false, "is_node_reachable": true, "is_node_excluded": false, "is_mestor_node": false, "scale_daemon_nodename": "iZuf6hn0blj1g377w4xxxxZ" }
CPFS ファイルシステムのマウント時に [ FATAL ] No GPFS admin node specified. specify an admin node using 'spectrumscale node add <node name or IP> -a'. というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、間違ったノードでコマンドを実行しています。
[ FATAL ] No GPFS admin node specified. specify an admin node using 'spectrumscale node add <node name or IP> -a'.qr-001 ノードで CPFS コマンドを実行していることを確認してください。
CPFS ファイルシステムのマウント時に Failed to resolve domain: file-system-id.region.cpfs.aliyuncs.com というエラーが返された場合はどうすればよいですか。
原因
マウントコマンドの
file-system-id.region.cpfs.aliyuncs.comパラメーターがエクスポートディレクトリのマウントアドレスに置き換えられていませんでした。解決策
NAS コンソールにログインします。宛先 CPFS ファイルシステムの [アクション] 列で、[管理] をクリックします。表示されたページで、[プロトコルサービス] タブをクリックします。[アクション] 列で、[エクスポートディレクトリ] をクリックします。[エクスポートディレクトリ] パネルで、マウントアドレスを取得します。次に、マウントコマンドの
file-system-id.region.cpfs.aliyuncs.comパラメーターを取得したマウントアドレスに置き換えます。マウントコマンドを再度実行してファイルシステムをマウントします。
クラウドコンピューターに CPFS ファイルシステムをマウントする際にエラーが発生した場合はどうすればよいですか。
cpfs add コマンドを実行して CPFS ファイルシステムをマウントする際に YUM リポジトリエラーが発生した場合はどうすればよいですか。
CPFS ファイルシステムのマウント時にこのエラーメッセージが返された場合、CentOS 8 の YUM リポジトリ構成が無効です。
Errors during downloading metadata for repository 'appstream':
Status code: 404 for http://mirrors.cloud.aliyuncs.com/centos/8/AppStream/x86_64/os/repodata/repomd.xml (IP: 100.100.XX.XX)
Error: Failed to download metadata for repo 'appstream': Cannot download repomd.xml: Cannot download repodata/repomd.xml: All mirrors were triedCentOS 8 オペレーティングシステムはサポート終了 (EOL) に達しており、Linux コミュニティはこのオペレーティングシステムバージョンを維持していません。YUM リポジトリを切り替える必要があります。
CPFS クライアントの起動に失敗した場合はどうすればよいですか。
問題:
マスターノード qr-001 で
mmgetstate -aを実行して ECS インスタンスのステータスを確認すると、インスタンスのステータスは `down` になります。/usr/lpp/mmfs/bin/mmstartupコマンドを実行すると、次の情報が返されます。… mmfslinux.ko kernel extension does not exist. Use mmbuildgpl command to create the needed kernel extension for your kernel …
原因:
現在の ECS インスタンスのカーネルがスペックアップされました。
解決策:
/usr/lpp/mmfs/bin/mmbuildgplコマンドを実行して、カーネル拡張を再ビルドします。応答の例:
mmbuildgpl: Building GPL (5.1.X.X) module begins at Fri Dec 3 16:05:33 CST 2021. -------------------------------------------------------- Verifying Kernel Header... kernel version = 41800305 (418000305012001, 4.18.0-305.12.1.el8_4.x86_64, 4.18.0-305.12.1) module include dir = /lib/modules/4.18.0-305.12.1.el8_4.x86_64/build/include module build dir = /lib/modules/4.18.0-305.12.1.el8_4.x86_64/build kernel source dir = /usr/src/linux-4.18.0-305.12.1.el8_4.x86_64/include Found valid kernel header file under /usr/src/kernels/4.18.0-305.12.1.el8_4.x86_64/include Getting Kernel Cipher mode... Will use skcipher routines Verifying Compiler... make is present at /bin/make cpp is present at /bin/cpp gcc is present at /bin/gcc g++ is present at /bin/g++ ld is present at /bin/ld Verifying libelf devel package... Verifying elfutils-libelf-devel is installed ... Command: /bin/rpm -q elfutils-libelf-devel The required package elfutils-libelf-devel is installed Verifying Additional System Headers... Verifying kernel-headers is installed ... Command: /bin/rpm -q kernel-headers The required package kernel-headers is installed make World ... make InstallImages ... -------------------------------------------------------- mmbuildgpl: Building GPL module completed successfully at Fri Dec 3 16:05:54 CST 2021. --------------------------------------------------------/usr/lpp/mmfs/bin/mmstartupコマンドを実行して ECS インスタンスを再起動します。/usr/lpp/mmfs/bin/mmmount allコマンドを実行してファイルシステムを再度マウントします。
マウント解除された ECS インスタンスの残留構成情報をパージするにはどうすればよいですか。
まず、CPFS ファイルシステムが ECS インスタンスからアンマウントされていることを確認します。詳細については、「ファイルシステムをアンマウントする」をご参照ください。次に、mmdelnode -N <id> --force コマンドを実行して、アンマウントされた ECS インスタンスの残留構成情報をパージします。例:
mmdelnode -N iZuf61mhwoc9flkufs0**** --force
Do you want to continue? (yes/no) yes
mmdelnode: [W] Could not cleanup the following unreached nodes:
iZuf61mhwoc9flkufs0****
mmdelnode: Command successfully completed
mmdelnode: Propagating the cluster configuration data to all affected nodes. This is an
asynchronous process.この例では、iZuf61mhwoc9flkufs0**** は宛先 ECS インスタンスの ID です。
スケールアウト操作中に「在庫が不足しています」というエラーが返された場合はどうすればよいですか。
CPFS ファイルシステムのスケールアウト操作は、CPFS ストレージノードの在庫とマウントポイントの vSwitch で利用可能な IP アドレスの数に依存します。VPC コンソールに移動して、現在利用可能な IP アドレスの数を表示します。CPFS ファイルシステムには最大 164 個の利用可能な IP アドレスが必要です。vSwitch に十分な数の利用可能な IP アドレスがあることを確認してください。
CPFS ファイルシステムがスケールアウトされた後、既存データは自動的に分散されますか。
CPFS ファイルシステムがスケールアウトされた後、デフォルトではデータ分散は実行されません。つまり、既存データは元のストレージノードに保存されたままであり、新しいストレージノードに自動的に移行されることはありません。
データ分散プロセスはストレージノードのネットワークとディスク帯域幅を消費するため、フロントエンドの I/O パフォーマンスが低下します。さらに、ファイルシステム内の既存データのボリュームが大きいほど、データ分散プロセスにかかる時間が長くなります。ほとんどのサービスではスケールアウト操作後の自動データ分散は必要ないため、CPFS ファイルシステムはスケールアウト後にデータを自動的に分散しません。
CPFS ファイルシステムのマウントとアクセスには POSIX クライアントしか使用できませんか。
CPFS は、CPFS-POSIX クライアントまたは CPFS-NFS クライアントを使用したファイルシステムのマウントとアクセスをサポートしています。CPFS-POSIX クライアントと CPFS-NFS クライアント間の相互アクセスもサポートされています。たとえば、CPFS-POSIX クライアントを使用してファイルを作成し、その内容を変更した場合、変更された内容は CPFS-NFS クライアントから表示でき、その逆も同様です。詳細については、「クライアントの説明」をご参照ください。