サーキュレーターの掃除

ワイヤーラックごと移動大作戦の前にサーキュレーターが糞汚かったのでサーキュレーターをまず掃除しました。
サーキュレーター無しだとシン・マイニンゲリオンは暴走モードに入るので当然リグ停止状態で掃除したので今日は5-6時間停止していたと思います。

無水エタノールと綿棒で各隙間を2回ずつ拭き取って、アルコールウェットシートで拭いて綺麗になりました。
サーキュレーターも綺麗になると気持ちいいですね!
ワイヤーラック大移動

ワイヤーラック自体をかなり前に出したので、換気扇部分もメンテしやすくなって銀色の遮熱シートもきれいに巻き直しました。
以前の3号機を見ると換気扇部分のちょい下くらい?にRTX3060がいたので、全体もかなり下に移動したのが分かります。
ワイヤーの網目的に4マス以上下がってそうですね!
ワイヤーラック一押しポイント

好きな位置からワイヤーの裏面に回せるので、配線し易いのが最高です!
グラボ背面合わせの部分はサーキュレーターが熱い排熱を上に送るので、背面部分の道はケーブルが風を遮らないように考えて裏面を通しています。
創聖合体マイニンゲリオン3・4号機

緑色に囲った部分は4号機用のベンタス君とGTX1660Tiを装着しました。
2軍ギャラクロ君は3号機に戻って3060TiがG5へ戻りました。
この構成変更理由については後ほど説明します。

過去の記事で書いたか?書いてないか?覚えてないですが、PS5の転倒防止用に買っていたダイソーの大型のワイヤーネットにマザーボードだけ付けて、反対側のグラボと繋げています。
(今は手前にG5がいるので邪魔ですが・・・)
以前の写真を見るとワイヤーネット右側にプラ板を付けているのが分かりますが、要は風でマントを巻き込まない空間を作る為に付けていたのを、今回は向かい側にあるワイヤーネットで空間を作っています。
ダイソーのワイヤーネット用脚は売り切れていたのでセリアの脚を付けましたがサイズはピッタリ同じでしたw
マント効果はどうでしょうか?
今日は病院から呼び出されて注射を射ちに行ったのもあって、作業に時間がかかりました。
アチチな日中にならないとまだまだ分かりませんが、夜間の温度を見る感じだと冷えてそう?
サーキュレーターを昨日は最大風力の8にしていたのを今は6でこれですから。

2軍ギャラクロ君は温度だけは超一流なんですよねw
ギャラクロ君3体は全て同じ設定なので、熱が入らないからパワーが出ない個体なんでしょうね。

4号機側はサーキュレーターの風は当たらないので床にベタ置きしていた時と変わらないですね。
背面排熱がマントの中で熱いのは自然に上にいく感じになっていると思います。
フィンの方向が唯一横のベンタス君は上に排熱してマザーボードにアチチな息を吹きかけるようになっていますw
マントの中は結構暑そうな雰囲気が漂っていますが、今日の夜と明日の昼に落ちずに動くか?楽しみですね!!
大改造に踏み切った理由とは?
ちょうど昨日の動画の最後の方でおっさんが言ってる現象と同じ事が3号機でも起こっていました。
QuickMinerのエラー調査方法は以前書いたので、ログ有効にすれば良いです。
ワイはWarning以上の設定にしてるのでこれしか落ちてないんですがexcavator側のログです。
これが出ている時=たまたまモニター繋いでexcavator見てると黄色(がwarningなんでしょうね多分)の下記メッセージが流れて、OCTune側で見ると同様の状態になっていました。
これは最新のログを貼っつけただけで、ネットワークエラーが解消された後でリグ再起動がかかってる時に落ちてるのは全部このエラーでした。
[[2021-07-21 08:54:05.422544] [thread=0x000015dc] [warning]]
core | Device #3-3 could not obtain power consumption!
[[2021-07-21 08:54:35.442213] [thread=0x00001c68] [warning]]
core | Device #3-3 could not obtain power consumption!
[[2021-07-21 08:55:05.453925] [thread=0x000015dc] [warning]]
core | Device #3-3 could not obtain power consumption!
APIを叩いて定期的にグラボ情報を取得しているみたいなので、quickminerのログ側だと
Starting up logging on 2021-07-21 08:22:00:598
File SeverityLevel is: WARNING (3)
[2021-07-21 08:55:35:067] [WARNING] [watchdog] Excavator shutdown timeout, rebooting rig
[2021-07-21 08:55:39:743] [WARNING] [watchdog] Quick start/stop err: Failed to start/stop (HTTP API call failed)
[2021-07-21 08:55:42:784] [WARNING] [watchdog] Quick start/stop err: Failed to start/stop (HTTP API call failed)
[2021-07-21 08:55:47:830] [WARNING] [watchdog] Quick start/stop err: Failed to start/stop (HTTP API call failed)
[2021-07-21 08:55:54:474] [ERROR] [watchdog] Failed to establish communication channel with Excavator!
[2021-07-21 08:55:59:586] [ERROR] [watchdog] Failed to establish communication channel with Excavator!
[2021-07-21 08:56:15:457] [ERROR] [watchdog] Failed to establish communication channel with Excavator!
こんな感じでAPIのエラーで再起動がかかってます。
一番最初の行が8:22のように一度再起動がかかって30分くらいでまた再起動してる感じで、これは流石に対応が必要だと判断しました。
・Device #3-3はRTX3060Tiでコイツしかエラーは発生しない。
・かなり設定を緩めにしても改善しない。
・4分岐に挿す位置を変えても改善しない。
という感じなので、こりゃRTX3060Ti→アウトRTX3070→インという采配をせざるを得ませんでしたw
①watchdogで定期的にAPIを叩いてデバイスのpower情報を取得してる。
②なんか知らんけどデバイスのpower情報取得に失敗する。
③その後excavatorも通信失敗エラー吐く。
④リグ再起動
とりあえず②の情報が取得できないのでOCTuneでは、おっさんの動画の画面のように表示されるのは分かりますよね?
今まで快調に動いていたRTX3060Tiが法則性の無いタイミングで死ぬようになったので、多分マント内の熱でどこかに影響が出ていたんだとは思います。
というか昨日3070床置きで3号機の熱が上がってると書いた通りなのが原因なんじゃないのかな?と思います。
とりあえず今はG5の中で55℃くらいで動いているので、これで落ちないようだったらグラボ側の問題じゃないと思うので安心して兄の元へ丁稚に出すことが出来そうですw
面白かった動画
マジで憧れるッス、パねーッス!!
ワイ仕事がらサーバールームやデータセンターにも入った事はあるけど、この規模はねーッス。
マジで某所のちっこいデータセンターより広いぞこれw

1Maq8meqKPiRqHQuSq1p12ZhvLJjXhaywE
不要なビットコインを寄付して頂ける方は上記アドレスまでご送金下さい。
コメント