« EPSON DIRECT Endeavor ST170Eの中古を購入 | トップページ | Dell Inspiron15 3567の液晶パネルの交換 »

2020年8月 6日 (木)

ADATA SU650の熱対策を行う

外れ個体なのか異常に熱蓄積してファイルエラーが多発するADATAのSSD SU650の熱対策を行った。

ThinkCentre M93p Tiny で運用していたSU650だが、Windows から度々ディスクエラー警告が発生し都度再起動で修復されていたのだが、TEXTファイルを開いたらOSを巻き込んで吹っ飛んだ。
一応自動リカバリで起動するもOSが異常動作をするようになり結局修復インストールで復旧した。
しかし多数のファイルで読み込みするとそのまま無応答となる現象が発生し、結局別SSDを用意してOS再インストールと環境再構築をする羽目になった。

一応CrystalDiskInfo で取り外したSU650のS.M.A.R.T情報を確認したがハード的なエラーはカウントされておらず、恐らくは熱の影響で書き込みエラーが発生していたのではないかと推測した。
Adata-su650_smart
というのもこのSSDは運用時にOpen Hardware Monitorで温度監視をしていたら、CPU温度が50℃辺りを表示しているときに何故か60℃を超える温度を表示しており、負荷がかかると70℃を超える温度となっていた。
SSDの温度が70℃を超えている場合、CrystalDiskInfoでは温度表示が赤くなり異常状態だと評される。
一応PCから外してUSB接続状態だと41℃位の表示となるので他のSSDの温度表示と大きな差が無い事から、計測温度が狂っている訳でも無いみたいだ。
SSD交換後に色々調べてみたが、USB接続の単体状態で無負荷時の温度が42℃、負荷をかけると61℃まで上昇することを確認した。
・無負荷時
Adata-su650_1
・負荷時
Adata-su650_2


比較対象としてメインのデスクトップに内蔵して使用しているINTELのSSDも確認した。
・無負荷時
Intel-ssdsckw512gb8_1
・負荷時
Intel-ssdsckw512gb8_2
こちらは注意温度である50度まで上昇しているが、今まで使用して異常が発生したことは一度もない。

 

と言う訳でSU650をこのまま転用するには危険すぎるので取り合えずダメもとで分解して熱対策可能なのか調べてみた。
・ケース分解
Su560_001
・SSD基板
Su560_002

 

基板状態で負荷をかけて調べてみると、NANDチップの上にあるRealtek製制御チップが発熱していることを確認できた。
・Realtekの制御チップ
Su560_003
20210906追記:
SU650は発売時期で型番が変わっておりそれぞれ
ASU650SS-xxxGT
ASU650SS-xxxGT-C
ASU650SS-xxxGT-R
となる。(xxxにはそれぞれのSSDの容量が入る)
それぞれで使用しているコントローラチップが違うらしく私の場合は末尾GTでコントローラチップはRTS5732DLQとなっていた。
追記終わり

幸いチップが実装されている基板面が接するケース下部は金属製なので、チップと金属面を熱伝導シートで密着させれば放熱板代わりでチップ自体を冷却出来るのではないかと考えた。

 

と言う訳で熱伝導シートを調達。
Su560_004
どの厚みが適当か判断できなかったので、0.5/1.0/1.5mmの三種類セットを購入し現物合わせした結果1.5mmを使用した。
・ケース下部に熱伝送シートを張り付け
Su560_005
・基板をケース下部に実装した状態
Su560_006

 

この状態で無負荷時と負荷時での温度確認を行った。
・無負荷時
Adata-su650_11
・負荷時
Adata-su650_12
結果負荷時の温度が10℃近く低下していることを確認できた。
これならデスクトップで使用するなら問題なさそうな温度である。
多分ノートパソコンとかでも大丈夫ではないかと思われる。

 

このSSDはテスト用ミニPCで運用してみて異常が出ないか確認してみる予定。

 

2021/07/03追記
サブPCで運用していたが起動時に時々SSDが認識されなくなったりするのでDISMコマンドとSFCコマンドでチェックを掛けたらエラーで完了できなかった。
どうやっても修復できなかったのでWindowsのイメージから上書きインストールをして復旧させて別SSDへクローンを作成しようとしたがパーティションのクローンがどうやっても失敗する。
3日間頑張ったがどうしてもだめだったので必要ファイルだけ救出する方針に変えたが、ファイルコピーでもエラーが発生する。
最終的にCHKDSKコマンドを3回かけてエラーがでなくなった状態で必要ファイルを救出した。
CHKDSKは3回目までは
--------------------------------------
ステージ 4: ユーザー ファイル データの不良クラスターを検査しています ...
名前 \Users\xxx\DOCUME~1\PC-98x1\NEKOPR~1\bin\newdisk.nhd のファイル 1620 の不良
クラスターを置き換えました。
747760 個のファイルが処理されました。
ファイル データの検査を完了しました。
フェーズの継続時間 (ユーザー ファイルの回復): 26.02 分。
不明なエラーが発生しました (75736e6a726e6c2e 500)。
--------------------------------------
の様な感じのエラーで完了できなかった。

 

CrystalDiskInfoでは以下の通り。
Su6501001
05 代替処理済のセクタ数が47B08(hex)
A6 総不良ブロック数が579(hex)
AF ECC 失敗回数が11EC(hex)
BB 訂正不可能エラー数が11EC(hex)
C3 Cumulative corrected eccが4A3D(hex)
C4 リアロケーション発生回数が11EC(hex)
C7 Ultra DMA CRC エラー回数が11EC(hex)
とメモリチップ回りに盛大な数のエラー数が記録されている。

2021/9/3追記:
A6~AA、C7、E8、E9に関してはベンダー固有っぽいので上記説明内容とは違う可能性あり。
SU650のカタログではADATAの専用SSDツール対応を謳っているのにHPの対応表では対応していない(実際に専用ツールは対応していなかった)ので本当の所は不明。
Adatasu650_120gb
SU650 120GBのS.M.A.R.T値と比べてみるとA6に関しては総不良ブロック数とは別の値と思われる。
そのほかの値については説明は間違っていないのではないかと推測される。
ちなみにこいつも温度が高すぎるので熱対策した。
SU650シリーズは使っているコントローラーチップが悪いのか設計が悪いのか、いずれにしろ廃熱処理能力が低いPCには向かないSSDに思われる。
追記終わり。


使用時間と総書き込み量などから考えるとメモリセルの寿命ではないと思われる。

一つ考えつく理由はコントローラチップに張り付けた熱伝導シートがメモリーチップまで掛かっていたのでコントローラチップからの発熱が熱伝導シートを通してメモリーチップの温度を上昇させてエラーを引き起こしたかもしれない事。

安全を考えるならコントローラチップと同じ大きさに熱伝導シートをカットしたほうが良いと思われる。
一応再度SSDケースを分解して熱伝導シートの位置をメモリーチップに掛からないように修正したのでこれでどうなるか様子を見る予定。

 

|

« EPSON DIRECT Endeavor ST170Eの中古を購入 | トップページ | Dell Inspiron15 3567の液晶パネルの交換 »

パソコン・インターネット」カテゴリの記事

雑記」カテゴリの記事

パソコン周辺機器」カテゴリの記事

ハードウェア」カテゴリの記事

SSD」カテゴリの記事

コメント

コメント失礼します!
購入した製品が後継のSU750だったんですが、SATASSDに対して熱問題を受けるとは夢にも思っていなく
全く同じ状況になり困り果てていたところ、こちらのブログにたどり着きました!
全く同じ対応をしてみたところこちらも温度が50前後にとどまるようになって対応は成功でした!
やたら安いし何?って感じでしたが蓋を開けてみれば熱問題と納得の結果でした。
先人の知恵を借りることができブログ主さんには感謝です!

投稿: にゃんこ | 2021年5月11日 (火) 15:51

コメントどうもです。
SSDも動作保証の温度範囲があり、大体上限が70~80℃超えてくると動作が怪しくなる様です。
M.2SSDとか高速タイプだとカードにヒートシンクつけてますから発熱がすごいのでしょうね。

投稿: rikuzen | 2021年5月11日 (火) 20:00

コメントを書く



(ウェブ上には掲載しません)




« EPSON DIRECT Endeavor ST170Eの中古を購入 | トップページ | Dell Inspiron15 3567の液晶パネルの交換 »