ハクソク

世界を動かす技術を、日本語で。

Backblazeがデータのバックアップを停止しました

概要

  • Backblazeは、ユーザーに通知せずにOneDriveやDropboxのフォルダのバックアップを停止
  • 長年利用してきたが、信頼性に疑念が生じた体験談
  • クラウド同期とバックアップの違いについての注意喚起
  • 仕様変更が告知されず、重要なデータがバックアップ対象外となる危険性
  • サービスの根本的な約束違反として警鐘を鳴らす内容

Backblazeのバックアップ方針変更に対する不信感

  • 2015年からBackblazeを利用し、以前は外付けHDDでバックアップ運用
  • 無制限ストレージやシンプルなアプリ設計、評判の良さが導入理由
  • ハードディスク故障時の復元サービス体験で高い信頼を得ていた実績
  • アプリの操作性やWebサイトの使い勝手に小さな不満があったものの、全データが守られる安心感が優先
  • ファイル名流出事故などの過去の問題も、全体的な信頼感で受容

バックアップソフトの本質と理想

  • バックアップソフトの役割は全ての必要なファイルを守ること
  • ユーザーごとに重要なファイルやワークフローが異なるため、包括的なバックアップが理想
  • バックアップ事業者は未来のニーズを予測できないため、原則として全データを保護すべき

仕様変更の発覚と失望

  • 2025年、.gitフォルダがバックアップ対象外になっていることに気付き、復元できず失望
  • 除外リストに記載がなく、ユーザーが気づきにくい仕様
  • RedditでDropboxフォルダが対象外になったことを知り、自身のOneDriveもバックアップされていないと判明
  • 事前通知や警告が一切なく、リリースノートの一文のみで説明
  • クラウドストレージのフォルダやキャッシュを除外」という“改善”として扱われているが、実質的なサービスダウン

クラウド同期とバックアップの違い

  • OneDriveやDropboxは同期サービスであり、バックアップとは異なる
  • 多くのクラウドサービスは削除ファイルやバージョン履歴の保持期間が短い
  • アカウント凍結やサービス障害時にデータ消失リスクが高い
  • Backblazeの長期保存や無制限保存のメリットが失われた現状

サービスの信頼性と今後の懸念

  • 重要な仕様変更がユーザーに通知されない運用体制
  • 除外対象が今後さらに増えるリスク
  • 業務や趣味で使う独自ファイル形式が突然バックアップ対象外となる可能性
  • 公式サイトやアプリ上で除外リストが十分に明示されていない問題
  • 全てのデータを守る」という根本的な約束が破られたと感じるユーザー視点

まとめと警鐘

  • **2015年当時の「全データ無制限バックアップ」**という約束が事実上反故
  • バックアップは信頼関係で成り立つサービスであることの再認識
  • Backblazeは一部のデータしか守らないサービスへ変質
  • 今後も仕様変更や除外対象追加のリスクがあるため、利用者は注意が必要
  • **「シンプルにした結果、バックアップ自体をやめてしまった」**という皮肉な結末

Hackerたちの意見

これに気づいたんだけど(幸いにも重大になる前に)、BBから移行することにしたよ。10年以上の顧客なのに、完全におかしい。バックアップが止まっただけじゃなくて、古い履歴も全部消えちゃった。彼らがやるべきことは、すべてをバックアップすることなのに、コンソールでそれが確認できると安心できるはずなのに。デスクトップクライアントを放置してるし、意味のある例外を追加するのも難しい。今はみんなB2を使わせたいのが明らかだね。
今は何を使ってるの?友達のために聞いてるんだけど。
除外設定は一つの問題だけど、バックブレイズがファイルの復元に失敗したことがあるんだ。無制限の履歴にお金を払ってるのに。サポートに「何が起こったの?」って問い合わせたら、「ああ、そのファイルはどこかで削除されちゃった、ごめんね」って言われて、3ヶ月分のクレジットを提案された。もうバックブレイズのバックアップは信じられないよ。
何それ
もっと詳しい情報ある?これは結構大事なことだと思う。BackblazeとHetznerの違いは、こういうことができないっていうのが主なポイントだから。
私もBackblazeで同じような経験をしたことがある。3年前にデスクトップクライアントを使ってファイルを復元しようとしたんだけど、最初に気づいたのは、ネットワークや他の問題でファイルがダウンロードできないと、そのままスキップされちゃうこと。だけど、ジョブファイルをいじることで再試行させることができるんだ。それはSQLiteのDBみたいなものだし。ファイルは小さなチャンクに分けて保存・ダウンロードされるんだけど、これらのチャンクのチェックサムは保存されてるけど、ファイル全体のチェックサムは保存されてないから、クライアントの出来が悪いせいで、復元したファイルが壊れてないかどうか確信が持てないんだ。それに、何度も再試行してもダウンロードできないファイルがあって、どうやらBackblaze側で壊れてるみたい。でも、一番イラッとしたのは、非ASCIIのファイル名が全部ぐちゃぐちゃになっちゃったこと。DBではUTF-8で保存されてるけど、クライアントはWindows-1252とかで保存しちゃうから、最終的にфикацみたいな名前のファイルが何百ギガもできちゃった。名前を元に戻すために再エンコードすることもできないし、プロセス中にいくつかの文字が消えちゃったからね。Backblazeクライアントにファイルを再ダウンロードさせて、復元できないファイルをログに記録して、壊れた名前を修正して、復元したファイルをまたチャンクに分けてチェックサムをSQLite DBと照合するスクリプトを書こうと思ったけど、あまりにも大変すぎて3年間先延ばしにしちゃった。データを手放すのは悲しいから、毎月Backblazeの料金を払い続けてたよ。あれからクライアントは改善されたのかな。
ある企業は信頼をビジネスにしている。こういう企業は、信頼を得るのは難しいけど、失うのは簡単で、取り戻すのはほぼ不可能だってことを理解する必要がある。この記事を読んで、バックブレイズを使ったり勧めたりすることはほぼないだろうな。(今は使ってないけど、彼らは歴史が長いから勧めるリストに入ってたんだ。)
理論的には、.gitフォルダーをそのままバックアップしたくない理由は理解できる。コミット履歴が多いリポジトリだと、Gitはオブジェクト数の膨張問題が深刻で、ファイルをスキャンするだけでも余計なオーバーヘッドがかかるからね。まだこうなってる理由はよくわからないけど、これが原因でGitが多くのファイルシステムツール(バックアップだけじゃなくて)とうまく連携できない理由の一つだと思う。もしSQLiteデータベースみたいなものだったら(本当に例えだけど)、そんなに不要なinodeの膨張は起こらなかっただろうね。それに、バックブレイズはバックアップソリューションなんだから、すべてをバックアップする必要があるのは当然だよ。彼らは三層戦略の三つ目のバックアップソリューションになるって約束してるけど、その三つ目が一番重要だと思う。理想的なシナリオでは一番触れないものだからね。ファイルを除外するなんてありえないよ。クラウドサービスの除外も同様にひどい。例えば、クリプトワームにやられたらどうなるか想像してみて。クラウドストレージツールは、すべてを暗号化して同期するから、デバイス間でストレージがぐちゃぐちゃになっちゃう。古いバージョンの復元も難しいし、実際のバックアップソリューションが必要になる。バックブレイズがこれらのフォルダーのファイルを除外するのは、彼らの目的を完全に誤解しているように感じる。
> もしSQLiteデータベースみたいなものであったなら(本当にただの例だけど)Fossilを見てみてね(https://fossil-scm.org/) P.S. ここにも(https://www.sourcegear.com/vault/) > SourceGear Vault Proはプロの開発チーム向けのバージョン管理とバグ追跡ソリューションだよ。Vault Standardはバージョン管理だけを求める人向け。VaultはMicrosoft SQL ServerやIIS Web Servicesなどの技術を使ったクライアント/サーバーアーキテクチャに基づいていて、パフォーマンス、スケーラビリティ、セキュリティを向上させているんだ。
gitオブジェクトを個別にバックアップする必要はないと思うよ。gitがバージョン情報を管理してるからね。 .gitフォルダ自体を圧縮して、1つのユニットとしてバックアップすればいいんじゃないかな。
Backblazeやほとんどのユーザーにとって理解できることだと思うけど、解決策としてはデフォルトの除外リストに`.git`を追加して、ユーザーが管理できるようにするのがいいんじゃないかな。
多分、Linusがカーネルやファイルシステムのオタクで、データベースのオタクじゃないからだと思う。だから、彼はパフォーマンス特性をよく理解しているファイルシステムを使う方が好きだったんじゃないかな(少なくともLinuxでは)。
Gitは定期的にオブジェクトをパックファイルにまとめるよ。もしそうしてないなら、設定を確認するか、手動で「git repack」を使ってみて。
これを見るのはちょっと違うと思う。ファイルバックアップソリューションがGitに合わせて動く必要があるの? それとも他のアプリに? Gitオブジェクトが何かを理解しようとする必要はないよ。サーバーにファイルをコピーするためにお金を払ってるんだから、ただそれをやってほしい。ファイルが何であれ関係ないよ。アプリケーションレベルじゃなくて、ファイルシステムレベルでやってほしい。
ZFSやBTRFSのブロックベースのスナップショットレプリケーションが、Gitや他のデータセットで詰まることはないよ。ツールには適切な仕事をさせるべきだよね。
作者へ:もう少し暗いフォントを使ってください。できれば黒がいいです。私はまだ40代で、眼鏡は必要ないけど(まだね)、モバイルであなたのサイトを読むのに目を細める必要があるんです。Safari、iPhoneで。WCAGの許可されたコントラストレベルを下回っていると思いますよ。
このコメントに完全に同意。vimに切り貼りして、終わったらq!で出たけど、頭が痛くなったよ。
白い背景のページでは本能的にダークリーダーを使ってるから、最初はあなたのコメントに本当に驚いたよ。
Safariのリーダーモードはこれにぴったりだよ。アドレスバーの左端にあるアイコンを長押しするだけでOK。
驚いたことに、見出し(2.05)とリンク(3.72)だけがFirefoxのアクセシビリティチェックに引っかかって、本文は5.74だった。でも主観的にはもっと悪い気がするし、コントラストが低すぎるっていうのには完全に同意するよ。
14ポイントのフォントは今の時点ではちょっと古いと思うな。16ポイントが現行の画面には最低限必要だと思う。大きい文字が収まらないわけじゃないしね。
macOS/iOSのSafariやBraveブラウザには「リーダーモード」があるけど、Chromeには「リーディングモード」があって、サイドメニューに埋もれてるから使いにくいんだよね。デスクトップブラウザでは、ブックマークバーに以下のJavascriptを使ったブックマークレットを置いてるよ:javascript: document.querySelectorAll('p, td, tr, ul, ol').forEach(elem => {elem.style.color = '#000'}) これで全てのウェブページのテキストが暗くなるわけじゃないけど、このスレッドの記事には効くよ。もっとHTMLのヒューリスティックを使えば、他のウェブページでも使えるようにできるかもね。
>「まだ眼鏡は必要ない」 いつか眼鏡をかけてみて、驚くと思うよ。小さくて細いフォントが原因で、テキストのコントラストじゃないんだ。これと暗い場所での視認性が最初に影響を受けるからね。
これ、ウェブデザインでよく見かけるテーマだと思ったことがあって、HNを読むための新聞やPocketみたいなインターフェースを開発する実験にもつながったんだ。完璧ではないけど、目には優しいよ… https://times.hntrends.net/story/47762864
問題は色よりも重さだよ。300じゃなくて500だったら、全然問題なかったと思う。
リーダーモード?
ある時点で、Backblazeが僕の暗号化された(VeraCrypt)ドライブのバックアップを静かに止めちゃったんだ。お知らせも警告もなしに、ただ動かなくなった。いろいろトラブルシューティングしてググった結果、ランダムなredditのスレッドでこれが意図的だったことがわかった。それ以来、彼らのバックアップサービスは使わなくなったよ。
Backblaze Personalに関するBackblazeのビジネスモデルの問題は、「無制限」ってことだと思う。彼らは特にLinuxユーザーを除外してるけど、まあ、僕たちはオタクだし、r/datahoardersもあるし、「無制限」が何を意味するかについて考え方が違うんだよね。[1] これはバックアップの文脈で「無制限」が何を意味するかについて2人が意見が食い違っている別の例だよ、たとえ彼らが「ファイルタイプやサイズに制限はない」と主張してもね。[2] [1] https://www.reddit.com/r/backblaze/comments/jsrqoz/personal_... [2] https://www.backblaze.com/cloud-backup/personal
「無制限*」みたいなことをやってる会社は、どんな選考プロセスでも自動的に除外するよ。マーケティングや財務チームがビジネスを支配してるっていう明確なサインだし、チャンスがあればすぐにプラットフォームから追い出されることになるし、何の救済措置もないからね。ユーザーに対して持続可能な形で何を提供できるかを正直に upfrontに話しているビジネスを選ぶのが一番だよ。
無制限ってことは、制限や限界がないってことだよね。もし企業がサービスを「無制限」と表現しておいて、利用規約でそれを逃れようとするなら、それは「無制限」の意味についての意見の相違じゃなくて、単にその企業が嘘をついてるってことだよ。
Linuxサポートを求めてる同じ人が、B2が「家庭用ユーザー向けじゃない」って文句を言うのが面白いよね。自分のバックアップをB2に同期させてるけど、Linuxをインストールするよりもそっちを選ぶよ!めっちゃ簡単だから。
なんでギガバイト単位で課金しないんだろう。
Backblazeのアプリをチェックしたら、.isoが除外リストに入ってるのを見つけたよ。ここにいる誰かが私みたいにバカじゃなければいいけど…。
ここでの怒りの対象は、少なくとも部分的にはOneDriveだと思う。私の理解では、現代のデフォルトのOneDrive設定では、OneDriveフォルダの内容がすべてクラウドにプッシュされるけど、その逆はない。つまり、クラウドのOneDriveにファイルがあって、OneDriveフォルダには表示されてるけど、ローカルには存在しないことがあるんだ。そういうファイルにアクセスしたい場合、通常はOneDriveからダウンロードされることになる。そうなると、Backblazeや他のプロバイダーはどうすればいいの?常にOneDriveのファイルをダウンロードして(他のデバイスで変更されているかもしれない)、Backblazeにアップロードするの?それとも、実際にローカルに存在するファイルだけを同期するの?後者の選択肢は、見えているファイルが自動的にバックアップされることを期待している消費者には不満だろうね。これは難しい状況で、Backblazeがうまく対処したとは言えないけど、透明なクラウドストレージの状況は多くの人にとってちょっと混乱してる。もしDropboxも同じように動くなら(見えているものに対してローカルファイルが保証されない)、それも同じく厄介な状況だね。
ほとんどの人がOneDriveの除外がその複雑さから理解できると言ってるけど、ここで誰もドキュメント化されていない.gitの除外を擁護している人がいないのが気になる。これはかなりひどいよね。もしそのディレクトリをバックアップしているなら、それは常に100%意図的なことだし、安定性やパフォーマンスのために製品機能が犠牲になっているように感じる。ドキュメント化されていないのは、まさに痛いところを突いてくる。
クライアントアプリがDropboxやOneDriveフォルダをバックアップする際の問題は、ファイルオンデマンド機能だね。1TBのOneDriveを250GBのノートパソコンに同期できるけど、スマート/選択的同期、つまりファイルオンデマンドのおかげでそれが可能なんだ。でも、Backblazeのバックアップがそのフォルダをバックアップしようとすると、すべてのファイルをダウンロードしようとするから、空き容量がゼロになっちゃって、バックアップはできないし、ノートパソコンも調子悪くなる。BackblazeアプリをOAuthでOneDriveに直接アクセスさせることもできるけど、OneDriveをバックアップしたいなら、別の製品が必要だと思う。