世界を動かす技術を、日本語で。

シーダンス 1.0

概要

Seedance 1.0Aは、テキスト・画像両方からマルチショット動画生成を実現するモデル。 セマンティック理解とプロンプト追従性で新たな進歩を達成。 1080pの高解像度、滑らかな動き、豊かなディテール、映画的美学を実現。 SeedVideoBench-1.0で主要指標において高評価を獲得。 T2V・I2V両タスクで業界モデルと比較し、優れた性能を示す。

Seedance 1.0Aの特徴

  • テキスト画像 からのマルチショット動画生成対応
  • セマンティック理解プロンプト追従性 の大幅向上
  • 1080p解像度、滑らかな動き、豊かなディテール、映画的美学
  • SeedVideoBench-1.0 による多次元評価で高スコア
  • T2V・I2V 両タスクで一貫した高性能

SeedVideoBench-1.0:多次元評価

  • プロンプト適合性動きの品質美的評価 など主要次元で高評価
  • 業界他モデル との比較で優位性を確認
  • Eloスコア はKling 2.1の公開データ未取得のためKling 2.0を参照

T2V(Text-to-Video)評価

  • T2Vタスク でプロンプト適合性、動きの品質、美的評価で高スコア
  • T2Vリーダーボード :Artificial Analysis公式サイトにて公開
    • 2025-06-09 11:00 (GMT+8) 時点の順位

I2V(Image-to-Video)評価

  • I2Vタスク でも高スコアを記録
  • 元画像との整合性 を高水準で維持
  • I2Vリーダーボード :Artificial Analysis公式サイトにて公開
    • 2025-06-09 11:00 (GMT+8) 時点の順位

総括

  • Seedance 1.0A は動画生成分野で新たな基準を提示
  • マルチショット生成高解像度多次元での高評価 が特徴
  • 業界内での競争力 と今後の発展性

Hackerたちの意見

どこかで使えるの?

これ、絶対にTikTokに直行するよね。大きな問題は、彼らのプラットフォームで洪水のようにコンテンツが溢れ出すこと。みんながコンテンツクリエイターになりたいなら、その特権にお金を取ってもいいんじゃない?コンテンツクリエイターは、永遠にAI生成の何かが必要になるからね。だから、今は「無料でコンテンツを投稿できる」から「コンテンツを投稿するためにこのAIゲートウェイを通じてお金を払う」時代に移行してる。

Seedance 1.0は2025年6月にDoubaoやJimengなど複数のプラットフォームに統合される予定です。 > https://www.doubao.com/chat/create-video > https://jimeng.jianying.com/ai-tool/video/generate https://arxiv.org/pdf/2506.09113

未来は、TikTokのアルゴリズムみたいな感じだけど、リアルタイムで生成されるものになると思う。スクロールするたびに、あなたの好みを学んで、もっと動画を生成する。

残念ながら、あなたの好みに影響を与えて、エンゲージメントを最大化しようとするかもしれないね…。

後には「ライブモード」があって、リアルタイムで生成されたコンテンツが、あなたの声に導かれる感じになるかも。Netflixもこれを機能として持つかもしれないね。

それが近い未来だね。もっと先を見ると、Netflixがある。スクロールを続けると、あなたの好みに基づいて、映画やショー全体を生成するようになる。おそらくその前に、スクロール中にリアルタイムで生成されるのではなく、事前に生成されたAI映画を見ることになると思う。

これは人々がソーシャルメディアを好んで使う理由を誤解してると思う。ChatGPTはもう無限に「コメント」を生成できるのに、なんでここにいるの?

あなたが反応することに関する十分なコンテキストがモデルに与えられれば、そのコンテンツはめちゃくちゃ魅力的になって、目が離せなくなるよ。これはゾッとするし、長期的には避けられない気がする。

広告が嫌いだって学んでくれるかな?

いくつかのショットは印象的だけど…厳選された例の中でも、不自然な動きがたくさんあるね。それに、どうやら最もハイパーアクティブなTikTokのサブセットでトレーニングされたみたいで、5秒以上シーンを持続できないみたい。

バイトダンスは数週間にわたってモデルアリーナで自社のモデルをテストしてきたんだって。数日前までは「ユニコーン」ってこっそり呼んでたらしいよ。もうすでにGoogle Veo 3よりもランキングが上なんだってさ。

かなり難しいことをやってる一方で、他の一見簡単なことに苦労してるみたい。最初のピアノや、写真家が使ってるカメラには「AIテキスト」って書いてあるし、カフェのベレー帽をかぶった老人は手でベレーを触ってる。海辺で振り返る女の子は、まるでフクロウみたいに頭を振りすぎてる。自転車でヨーロッパの街を走る少年のシーンは、木の下でユニコーンに乗った形のない存在で終わる...

こういう能力が普通になって、誰にとっても退屈になる日を楽しみにしてる。俺のスマホが、気まぐれでグループチャットのために声優付きの24話のアニメシリーズを生成できるようになるなんて。今できることは驚くべきだけど、気づいたら完全に無視されるようになるのも同じくらいすごい。

1ヶ月で作られるコンテンツの量は、これまでの人類の歴史のすべてを上回るだろう。ディズニー化も、マーベルやスターウォーズの「マスメディアのごちゃ混ぜ」ももう終わり。人々のニッチな興味に応じたメディアが登場するよ。エジプト学やアトランティスに情熱があるなら、エジプト人がアトランティス人と戦うスチームパンクアドベンチャーを観れるようになるかも。でも、「ザ・ワイヤー」のような真剣なトーンでね。以前は絶対に実現しなかったけど、もうすぐ可能になるだろう。良いクリエイターが、良いインディーズ音楽やインディー漫画、インディーゲームのクリエイターのように現れるはず。クリエイターにとっての課題は発見になるだろう。才能が豊富にあって、自分のビジョンを作れるようになる。ネポティズムで500の限られた年次役割に入るのではなく、小さなクリエイターがVivziePopやPsychicPebblesのように成長していくのが未来のコンテンツのモデルになる。彼らはYouTubeで小さく始めて、大きく成長し、最終的には自分の大規模な流通やフランチャイズを持つようになる。クリエイティブな世界は、桁違いに良くなる。2倍でも10倍でもなく、簡単に1000倍だ。俺はほとんどの映画やテレビ番組が嫌いだけど、メディア自体は大好き。問題は、制作されるコンテンツがほとんど俺の好みじゃないこと。超アートなものが好きだけど、特定の趣味もある。それが劇的に変わるだろう。俺の興味グラフに合ったものが出てくるはず。めっちゃ楽しみ!

コンテンツがこんなに簡単に作れるなら、誰がそのエピソードを見ようとするの?みんな自分の作ったコンテンツを見るのに忙しいよね。

誰も数秒でプロンプトを書いただけで存在する24話のシリーズなんて気にしないよ。AIはコンテンツの価値を上げるんじゃなくて、希少性を壊して無意味にしてるだけ。紅茶、アールグレイ、ホット。

5年後にはすべてのコンテンツがその場で生成されるようになるんじゃないかと思う。何かを言うと、5秒の動画が返ってくる。ライブモードは、コンテンツが固定資産ではなく、一時的な反応になることを意味する。動画はアップロードではなく、出力ストリームに変わる。音声プロンプトが新しいスワイプになる。彼らがやってるのはフォーマットのシフトを推進してるわけじゃなくて、バックエンドでランタイムコンテンツシステムをテストしてるんだ。コメットでモデルインフラを圧縮して、安くて速く動くLLMを傾けてる。その組み合わせで、バッチ処理やキャッシュなしで生成コンテンツをスケールで提供できるようになる。もしそれが実現すれば、フィードはスクロールではなくレンダーループになる。このことはもはやメディアに関することじゃなくて、アプリを低遅延のモデルホストに変えてるんだ。

すごくクールだけど、音はどこにあるの?動画がSOTAみたいになるなら、音声モデルも組み込まれてると思ってたんだけど。VEO3は動画には素晴らしいけど、音声がそれを超える要素なんだよね。

大手動画ストリーミング会社でAIソリューションに取り組んでるんだけど、VEO3の問題はプロンプト間の一貫性がないことなんだ。例えば、キャラクターの参考画像をアップロードできないし、ある動画で「老僧がかがむ」と言って、次の動画で「老僧がコインを拾う」と言ったら、ショットごとに僧侶の見た目が全然違うんだよね。Veo3は画像から動画を作ることには対応してるから、シーンの始まりとなる画像を作って、それを使って実際のシーンを生成することはできるんだけど、残念ながらVeo3はこれが本当に苦手なんだ。時間が経てば改善されると思うけど、個人的にはこのSeedanceモデルにはあまりワクワクしてないけど、ショット間の一貫性に焦点を当ててるのは好きだな。これがVeo3のパフォーマンス向上にプレッシャーをかけてくれることを願ってる。

動きの多い動画を見ると、なんだか気持ち悪くなるんだよね。前にこの感覚を感じたのは最初のSoraのリリースの時だった。Soraほどひどくはないけど、やっぱりある。Veo3ではそんな感覚はなかったか、もしくは動きの多いサンプルを見てないだけかも。Seedanceの動きの多いサンプルを見て、同じように感じる人いる?

なんで全ての例に大きな円が入ってるの?

中国人として、ByteDanceを誇りに思ってる。中国のAI産業を世界のトップに押し上げてるからね。アメリカに禁止されてるけど。

お前らがみんなを悪く見せてる気がする。AIに関しては、すぐに中国に注目が集まるね。

無限のAI生成動画が待ちきれない!