最近GLM-4.5をコーディングモデルとして使ってみてるけど、ほんとにすごいよ。自分が作ってるコーディングエージェント、Octofriendでは、時々それを使ってClaude 4と混同しちゃうこともある。主観的には、1. Claudeは全体のコードベースのタスクにおいて、いろんなコンテキストを考慮する必要があるときにちょっと優れてる。2. GLM-4.5は「正直」であることが得意で、バグを直さずにテストを変えて壊れたテストを通すようなことはほとんどない。どちらもかなり良いけど、GLM-4.5はClaude 4 Sonnetや4.1 Opusが見逃したバグを見つけてる。一般的に、デバッグタスクではClaudeがGLM-4.5よりも少し勝つことが多いけど、接戦だね。GPT-5と比べると、ClaudeとGLMはもっと一貫性がある感じ。ただ、GPT-5は時々すごく良いパフォーマンスを発揮して、後者よりも主観的に高いコード品質を持つことがある。でも、GPT-5が調子を崩すと、元に戻すのが難しくて、ちょっとイライラすることもある。1: https://github.com/synthetic-lab/octofriend