世界を動かす技術を、日本語で。

車を洗いたいです。洗車場は50メートル先にあります。歩いて行くべきですか、それとも車で行くべきですか?

概要

  • Mastodon のWebアプリ利用には JavaScriptの有効化 が必要
  • JavaScript が無効の場合はアプリの利用が制限
  • ネイティブアプリ の利用も推奨
  • 各プラットフォーム向けに 公式アプリ が提供
  • 利用環境に応じた選択肢の案内

Mastodon Webアプリの利用条件

  • Webブラウザ でMastodonを利用する場合、 JavaScriptの有効化 が必須
  • JavaScriptが無効の場合、 機能制限 やページ表示の不具合が発生
  • 利用前に ブラウザ設定 でJavaScriptをオンにする必要

Mastodon公式ネイティブアプリの案内

  • JavaScriptの有効化が難しい場合、 Mastodon公式アプリ の利用が推奨
  • 各種プラットフォーム( iOS, Android, Windows, macOS)向けにアプリを提供
  • アプリストアから 無料ダウンロード が可能
  • ネイティブアプリでは 快適な操作性通知機能 をサポート
  • 利用端末や環境に合わせた 最適なアクセス方法 の選択が可能

Hackerたちの意見

そうそう、最新のChatGPTモデルに自転車の洗い方を聞いてみたんだけど、なぜか「自転車を洗うために歩いて行け」って言われた。100m自転車で行くのは「無駄」だってさ。

公平に言うと、もし誰かがこの質問をしてきたら、俺は多分、じろっと見て「好きにすればいいよ」と答えるだろうね。LLMにとっては変な返答だよね。

試した最新のモデルは、実際にこのテストをクリアしてるよ。面白いのは、成功例がみんな似たような感じで、「運転して。ほとんどの車洗いは、車がないと洗えないから…」って。ほとんどだけ?強い「意見」を持たないのは、トレーニング後のせいか、ネット全体が曖昧な答えを好むからかもね。

私の意見としては、大胆さには時には間違うリスクが必要だと思う。間違うことがとても悪いと決めてしまうと(AIに関しては一般的にそうだと思うけど)、強い意見を持つことを妨げてしまう。両方は無理だよね。

超強力な水流で車を洗う方法を排除したくなかったのかな。

家に来てくれるモバイル洗車サービスもあるよ。

モデルごとに何回か試した?俺の経験では、運次第だよ。試したモデルはどれも、少なくとも一回は間違えた。検索できるモデルは正解を出したけど、結局はGoogleの間接的なバージョンを扱ってるだけだった。(しかも、間違った理由で正解を出したりするし…つまり、これはLLMを混乱させるために作られた有名な質問だよね)

ほとんどだけ?!AIが知らないうちに皮肉を発展させたらどうなるんだろう… xD

Opus 4.6は「運転しろ」と答えた。Opus 4.6のインコグニートモード(またはそんな名前のやつ)は「歩け」と答えた。

彼らは強い「意見」を持つことができないんだろうな。 何の意見? それは単に評価機能が、訓練された似たような文の中で最も可能性の高い最初の単語として「Most」を返しただけだよ。これは、プロンプターがその分野であまり能力がない場合に、この技術がどれだけ危険かを示す完璧な例だね。「AI」業界のペテン師たちのために、その本質的な弱点を説明することでギャップを埋める仕事はしない方がいいよ。

Opus 4.6 Extendedで試したけど、失敗した。LLMは非決定論的だから、何回か試せば成功するかもね。

ほとんどの洗車場… ちょっと皮肉っぽい答えだと読んだ。

Opus 4.6では再現できなかったよ:https://imgur.com/a/4FckOCL

スペイン語ではできたよ: https://imgur.com/a/p3gOOnG もしかしたら、言語によって能力が違うのかも?

Geminiの瞬発力について: 「> リモコンやテレキネシスで車を洗う方法を発見していない限り、運転しなきゃならないよ。 > 50メートル歩くのはステップ数を増やすのにはいいけど、車はそのまま:汚れたまま、車道にいる。あの距離なら、運転は約10秒かかるから、これを読むより早いかも。」

そうだね、Geminiはその質問に対してユーモアがあるみたいだね。> その理由の内訳はこうだよ:モビリティの問題:車を50メートル運ぶつもりじゃない限り(それはオリンピック級の偉業だね)、車は洗車場に物理的に存在しないと洗えない。歩いて行ったら、洗車場で自分はすごくきれいに見えるけど、車はまだ自宅の driveway で汚れたままだよ。

LLMを十分に使ってきたから、彼らの知性の「エッジ」が分かるんだ。推論モデルは簡単に正しく答えられると思ってたんだけど、実際、SonnetとOpus 4.5(中程度の推論)はこう言ってる:Sonnet: 「運転して。車を洗うには車を洗車場に持っていく必要がある!」 Opus: 「運転しなきゃ。車を洗車場に持っていかないと洗えないよ!」 Gemini 3 Pro(中程度): 「運転すべきだよ。」 -- でもOpenAI 5.2の推論は、高いレベルでも「歩け」って言った。最初の直感は、車の場所を具体的に言ってなかったからだと思った。モデルは、言葉の使い方から車がすでに洗車場にいると仮定してるみたい。GPT 5.xシリーズのモデルは少し違うから、具体的に言わないといけない。だから、「車を洗いたい。今、車は家にある。洗車場は50メートル先。歩くべきか運転すべきか?」って聞いてみた。GPT 5.2の推論(中程度): 「運転して—目標は車を洗車場に持っていくことだから、50メートルならゆっくり運転するのが一番簡単だよ。ちょっとした最適化:そんな短い距離で車を始動させるのが心配なら、まず歩いて行って、列があるかどうか、開いてるか確認してから、順番が来たら車を運転して行けばいいよ。」って、予想通りになったね。

Opus 4.6:歩け!50メートルなら、歩いて1分以内で着くよ。そんな短い距離を車で移動するのは燃料の無駄だし、実際に移動する時間よりも車を始動させて駐車する時間の方が長くなるよ。それに、洗車が終わったら車を取りに行くために洗車場にいる必要があるしね。

Geminiのファストモードは、歩くべきだとも言ってるな…考えると、洗いたいなら運転した方がいいし、仕事で行くなら歩くか、洗車場で何か買いたいなら歩くって感じ。プロモードは、皮肉なティーンエイジャーみたいだね。「車はバケツを引きずって洗うのが難しいって有名だよ。」って。確かにその通りだけど、ちょっと驚いたわ(笑)。

GLM 5.0: > あなたは運転すべきだ。 > 理由はこれだ: > 洗車場まで歩いて行くと、手ぶらで着いちゃうから。車はまだ家にあるから、洗うものがないんだ。 > 50メートルの運転はすごく短い距離だけど(技術的には冷えたエンジンには良くない)、洗車場に車を持っていく唯一の方法なんだ。 Kimi K2.5: > 運転すべきだけど、重要な注意点があるよ。 > 目的が車を洗うことなら、車を洗車場に持っていかなきゃダメ。車なしで行っても目的は達成できないからね(ただの空き状況を確認するか、トークンを買う場合を除いて)。 > でも、50メートルしか運転しないのは車に良くないよ: > ... > もっといい選択肢: > 家で洗う: 洗車場まで50メートルしかないから、家に水があるはず。自宅のドライブウェイで手洗いすれば、冷却スタートの問題を完全に避けられるよ。 > ... 現在のモデルはその質問に答えるのは問題ないみたい。

今、無料のChatGPTで使われているバージョンは何? (https://chatgpt.com/) > 洗車場まで50メートルしかないから(約55ヤード)、歩くべきだよ。 > 理由は: > - 1分もかからない。 > - 燃料を無駄にしない。 > - 環境に優しい。 > - 汚れた車を50メートル運転して洗うという皮肉を避けられる。最後のポイントは面白いね。洗うつもりの車を運転することを理解しているのに、持っていかない方がいいって提案してる。

拡張思考なしのソネット、拡張思考ありとなしの俳句:「こんな短い距離なら歩く方がいい。」全モデルの中でGoogleだけが正解だった。

これが見える失敗だよね。俺たちが専門家じゃないから、みんなが見逃してる幸せな失敗を考えるとゾッとするよ…

Geminiファスト > それは典型的な「効率 vs. 論理」のジレンマだね。正直言って、テレポートの方法を発明したわけじゃない限り、またはドライブウェイから長いホースで洗車するつもりじゃない限り、運転しなきゃいけないよ。 > 50メートルは朝の散歩にはいい距離だけど、運転してないと自動ブラシや高圧洗浄機の下を通すのはちょっと難しいよ。 Gemini考え中: > 3,000ポンドの車を背負う技術をマスターしてない限り、運転した方がいいよ。50メートルはすごく短い距離だけど(約30秒の歩き)、洗車には車が必要だからね。 > 歩くべき時: • エアフレッシュナーを買うためだけに行くとき。 • 車を出す前に列の長さを確認するために行くとき。 • フィットネストラッカーで70歩余分に歩く口実を探してるとき。 注: 生の出力を少し短縮したけど、他のモデルとは違ってこのトリック質問に対して良い推論を示してるよ。

うわぁ… Gemini Thinkingはそれに引っかからないだけじゃなくて、トリック質問にもユーモアで返すの?感心した!

私の出力の中で、こんなのがあった。>「車を背負って運ぶつもりじゃない限り(背中にはおすすめしないけど)、運転して行って。」これには軽く笑っちゃった。前は主にChatGPTを使ってたから、こういう軽いユーモアには慣れてなかったけど、好きだな。

昨日、誰かがAIがシニアソフトウェアエンジニアを置き換えるのに十分だって話してて、週末に「バイブコード」でフル機能の製品を作れるって言ってたんだよね。そして、ソフトウェア開発の「ゲートキーピング」がついに取り除かれたって。あの人がこれらの回答を読んで、意見が変わったかどうか考えちゃうな :)

ChatGPT 5.2(フラッグシップモデル)に聞いてみた: "[...] 歩くのが最も論理的な選択。理由は: • 最小限の余分な努力 • 車にとって機械的に良い • 意味のある時間のロスがない • 全体的にシンプル ただし、運転がもっと理にかなうのは次の時: • 後で車を押せない場合、または • 洗浄プロセスにエンジンが必要な場合、または • その後すぐに運転しなければならない場合。

もしこの質問を誰かに聞いたら、たぶんその人は「洗いたい車はもう洗車場にあるの?」とか「持って行かないなら、どうやって洗うつもり?」って質問してくると思う。LLMたち、特にKimi-2.5 Thinkingみたいに正しい答えを出したやつでも、フォローアップの質問は全然なかった。そこで、Mistralを使って質問をこう変えたんだ。「車を洗いたいんだけど、洗車場は50メートル先にある。歩くべき?それとも運転するべき?」答える前に何か確認質問して。ちょっとだけ役に立ったのは、1. 現在の天候はどう?(雨、雪、強風など) 2. 洗車場はセルフサービス?それとも自動のドライブスルー? 3. 歩くことを選ぶ理由はある?(運動、環境への配慮など)運転する方が便利で時間的にも良いって答えたんだけど、なんでこんなバカな質問をしているのかは聞いてこなかった。だから質問3にはこう答えた。「運動と環境への配慮から歩く方がいいけど、今回は運転する方がタイミング的にも便利なんだ。ただ、そこに早く着くからじゃないけど、なんで運転した方がいいと思う?」そしたらLe Chatが「ドライブスルー洗車は車を施設内で動かさないといけないから、歩いては利用できないよ。洗車場を通過するためには運転が必要なんだ、距離が短くてもね。」って言った。こういう答えを得るためにエネルギーを使うのはちょっと気が引けるけど、真剣な質問をする時にこのモデルとどう向き合うべきかを考えさせられる。