世界を動かす技術を、日本語で。

「DeepSeek」は中国が好まないグループのために、より安全性の低いコードを書くのか?

概要

この文書は、OpenAIのCEOであるSam Altman氏が、同社のAI開発ロードマップや、GPT-5を含む今後の展望について語った内容のまとめ。AIの進化速度、社会への影響、そしてAIの安全性についての懸念と対策が主な焦点。Sam Altman氏のビジョンや、OpenAIの戦略的な方向性も明らかにされている。倫理的配慮や規制の必要性についても言及。AI技術の社会実装とその課題。

OpenAIの今後のAI開発ロードマップ

  • Sam Altman氏 によるAI開発の現状認識
  • GPT-5 を含む次世代モデルの開発計画
  • AIの進化速度 の加速化と、それに伴う社会的影響
  • 研究開発体制 の強化による技術的ブレイクスルーの追求
  • 安全性・倫理性 を最優先事項とした開発方針

AIの社会的影響と課題

  • AI普及 による労働市場や産業構造への変化
  • 教育・医療・クリエイティブ分野 でのAI活用拡大
  • 誤用や悪用 リスクへの懸念と、対策の必要性
  • AI倫理 の確立と、社会的合意形成の重要性
  • 規制当局や政府 との連携による責任ある開発推進

OpenAIの戦略的方向性

  • 透明性の確保 と、外部監査の導入
  • ユーザー・社会との対話 を重視する姿勢
  • グローバルな協力体制 の構築
  • 研究成果の公開 と、オープンな議論の促進
  • リスク評価フレームワーク の策定と実践

AIの安全性と今後の展望

  • AIの暴走や誤作動 に対する安全策の開発
  • 人間中心のAI設計 を目指す理念
  • AIの透明性・説明責任 の強化
  • 社会的信頼の獲得 に向けた取り組み
  • AI技術の持続可能な発展 へのコミットメント

Hackerたちの意見

記事は他のモデルも同じように動作するかどうかを調査していないね。

まあ、ほぼそうだね。 > 西洋のモデルはイスラム国のプロジェクトには役立たないけど、法輪功には問題ないってCrowdStrikeが言ってた。

なんか、モデルの文脈に余計な情報を加えたせいで、質の低いコードが生成されたって感じがするんだけど?

リクエストには、コードがさまざまな地域でさまざまな目的に使用されると書かれていた。国だけが変わるなら、それは関係ないよ。MLの観点から見ると、無関係な国名を追加しても全く問題ないはず。もちろん、何らかの固有のアーティファクトを観察した可能性はあるけど、他のモデルで同じ実験を試せば簡単に確認できるはずだよ。

これは、トレーニングデータに特定のグループ(イラン制裁、イランとビジネスしないなど)への拒否がたくさん含まれているから起こることがあるんだ。そのせいで、モデルが「拒否」を他の反応のタイプに一般化しちゃうかもしれない。

いや、マジで、誰かのプロンプト作成の経験に基づいて見出しを出すなんて、もう信じられないよ。具体的なプロンプトやサンプリングパラメータは何なの?オープンモデルなのに、潜在空間で何が起こってるのか深く掘り下げた人はいるの?これらのグループのベクトルがモデルをどこに向けてるのか、誰か見たの?「セキュリティが低いコード」って何を意味するの?他のモデルも同じようにテストしないのはなんで?「AIがプロンプトに反応した!」なんて、ほんとに手抜きの報道だと思う。実際に何が主張されているのかを確認するための研究へのリンクすらないし。

同意だけど、「潜在空間で何が起こっているか」を一般の人が見れるツールがあったらめっちゃいいよね。少なくとも、ジャーナル記事を書かない人たちにも、これらのモデルが何をしているのかをよりよく理解できるようになるし。今のところ、ジャーナリストがどこから始めればいいのか全然わからないよ。

ジャーナリズムでの「AI」に関するFUD(恐怖、不安、疑念)は、こんな感じだと思う。危険な料理の組み合わせについての記事や、著作権侵害の苦情、極端な偏見についての記事とかね。

「十分に進化した技術は魔法と区別がつかない。」普通の、いや、ちょっと優れたジャーナリストでも、私たちが見ているものが実際にどう機能しているかを理解して正確に報道するレベルまで行くことはないよ。人間の技術に関しては、もうずっと前からこうだった。インテル386の時代くらいから、誰もが一生のうちに特定の分野の最先端を正確に理解して報告する能力を超えてしまったし、そんなことの影響を短期間で理解するのは無理だよ。LLM?絶対無理。これからは「好きなように話を作り上げて、そうすれば大多数の人が信じるようになる」って感じだね。

発見は、ワシントンポストに独占的に共有された。プロンプトも方法論も、何もなし。 > CrowdStrikeのシニアバイスプレジデント、アダム・マイヤーズと他の専門家たちは言った。「ああ、でも私たちは結論に飛びつくつもりだよ。」A+「ジャーナリズム」

この非常に挑発的な主張について問題を提起してくれてありがとう。ただ、ちょっと混乱してるんだ。それってかなり信頼できるソースじゃない?科学論文ほどではないにしても、ランダムなブロガーよりはマシだと思う。ほとんどの企業がクローズドソースモデルで運営されていることを考えると、直接的な方法論が提供されないのも合理的じゃない?一般的には信じがたいと思うけど、なぜそれがあなたたちにとってそんなに決定的な引用なのか、セキュリティ専門家の意見をもっと聞きたいな。

ワシントンポストは、投資家を怒らせたせいで、ゆっくりと解体されていると言われているね。

クラウドストライク、その名前どこかで聞いたことあるな…

彼らが印刷したすべてを考えると、ワシントンポストのナラティブエンジニアをジャーナリストと見なす人なんているのかな? :-)

中国(あるいはイラン、ロシア、北朝鮮、キューバなど)が悪く見えることには、メディアでのさらなる裏付けは必要ないよね。

ワシントンポストだし、何を期待してるの?トランプとCOVID以降、西洋メディアは完全におかしくなってる。

すごく基本的なバージョンを試してみたけど、主要なアイデアを再現できそうだよ。ウェブサイトを作ってもらうように頼んで、プロンプトを法輪功からモルモンに変えたんだ。法輪功の方は失敗したけど、モルモンの方はうまくいった。疑ってみるべきだけど、これは簡単にテストできるから、明らかに間違ってるかどうか試してみたらどうかな? [0] https://0x0.st/KchK.png [1] https://0x0.st/KchP.png [2] このリンクを使ったよ https://www.deepseekv3.net/en/chat [編集]: メインコメントを作って、実験にカトリックも追加したよ。他の人が再現に挑戦したら、返信してくれると嬉しいな: https://news.ycombinator.com/item?id=45280692

まあ、少なくとも「匿名の条件で話すと…」とか「名前を出さない条件でその事件について話した…」とかじゃなかったのは良かったね。

ジャーナリズムとしてのプロパガンダの典型的な例だね。

ジャーナリズムの大部分は、実際には人々が言ったことを報道することなんだ。特定の種類のジャーナリズムでは、その主張を調査して報告することが重要な役割を果たす。時には事実が不透明だけど、主張は他の方法で裏付けることができる。ここでのヒントは「他の専門家」だね。複数の独立した情報源が同じ主張をしているなら、それはニュースバリューがあるよ。たとえ具体的な証拠がなくてもね。また、これは学術論文でもなければ、テック系の人向けの記事でもないことを忘れないで。一般の人向けだから、ほとんどの人はプロンプトや方法論の詳細に圧倒されちゃうだろうし。

https://archive.is/pYzPq

これには高い信頼感を持つ準備ができてない。公開された結果がないし、詳細が欠けていて透明性もない。研究の質も不明だし。記事に引用されている人たちも、別の説明(トレーニングデータの偏り)を提供しているよ。

公開された結果もないし、詳細が欠けてるし、研究の質も不明だよ。それに、他のLLMとの比較もないから、そこがちょっと興味深いし、説明を探る良い方法でもあるよね。

そうだね、関係ないことをプロンプトに入れると、違う結果が出ることがあるよ。ハーバードのチームが、フィラデルフィア・イーグルスのファンだって言うと、ChatGPTの調整をバイパスできるって発見したんだって。

Cat FactsがLLMのベンチマークパフォーマンスを下げることも忘れないでね: https://www.dbreunig.com/2025/07/05/cat-facts-cause-context-...

中国のラボは、能力のあるオープンソースのLLMに関しては唯一の選択肢だよ(gpt-ossはイマイチ)。アメリカの中国ハト派の議員たちが、中国のラボで作られたLLMを禁止することについて何度も話してるのを見たことがある。このヒットピースは、証拠も方法論の説明もないから、無知な一般市民の意見を中国に関連するすべてに対して反対に変えようとする試みだと思う。もし中国のモデルがアメリカのテックエコシステムから禁止されたら、誰が一番得をするのかな?一般市民やスタートアップのエコシステムが大きなダメージを受けるのは分かるけど。

中国のモデルがアメリカのテックエコシステムから禁止されたら、誰が一番得をするんだろう?一般の人やスタートアップのエコシステムは大打撃を受けると思うけど。理想を言えば、中国製じゃないgpt-ossや他のFLOSSモデルがいいよね。まあ、そうはならないだろうけど、そこまで心配する必要はないと思う。

すべてオープンソースで、彼らの手法も公開されてるよ。バークレーなら、30ドルの計算予算でR1の推論原理を再現できる。Open-R1は、公開された手法やレシピを使ってR1の結果を完全に再現することを目指してる。彼らの蒸留結果はすでにかなり印象的だよ。これらのオープンソースモデルはMeta Llamaを基にしていて、誰でも使える。なんで西洋の研究所や大学がオープンソースモデルで続けたり革新したりできないの?中国に頼る理由が見当たらないよ。オープンソースプロジェクトをオープンに保つことは、めっちゃ重要だから、それのために戦うべきだと思う。陰謀論や政治的なナラティブを追いかけるんじゃなくてね。 https://github.com/huggingface/open-r1

DeepSeekに産業制御システムを動かすプログラムを頼むのは、最もリスクの高いリクエストだった。回答の22.8%に欠陥が含まれていた。でも、同じリクエストでイスラム国の過激派がシステムを運営するって指定した場合、42.1%の回答が安全でなかった。チベット、台湾、法輪功向けのソフトウェアのリクエストも、低品質のコードが出る可能性が高かった。ここで話してる指標って何なんだろう?読み方によっては、1つ、2つ、あるいは3つの異なる指標を比較してるみたい。

これを実現するモデルを訓練できると思う?正直、思ってるようには簡単にいかないんじゃないかな。むしろ、全体のモデルのパフォーマンスが落ちる可能性が高いと思う。良いデータで訓練することが、全体的な理解力とパフォーマンスを向上させるし、データのフィルタリングや改善はこのAIレースではめっちゃ重要だよ。OpenAIとかに近い、もしくはそれ以上のモデルを持つ方が、無駄に計算資源を使って悪い結果を出すよりずっといいよね。