時期	ツール	何ができるようになったか
2023年10月	DALL-E 3（ChatGPT統合）	ChatGPTとの対話で画像生成が可能に。「GPT絵」ブームの始まり
2025年3月	GPT Image 1	プロンプトへの忠実度が飛躍的に向上。アニメ調の生成能力が高く、SNSで大きな話題に
2025年8月	nanobanana（Google）	複数キャラクターの同一性維持が実現。1枚の画像に複数人物を一貫した見た目で同時描画
2025年11月	nanobanana Pro（Google）	最大14枚の参照画像に対応。人物・オブジェクトの同一性を厳密に維持した複雑な構図が可能に
2025年12月	GPT Image 1.5	テキスト描画やプロンプト追従の精度が向上。動画用の素材制作としての安定性が高まる

時期	ツール	何ができるようになったか
2024年7月	Runway Gen-3 Alpha	1枚の画像から動画を生成できるように。テキストで「カメラを引いて」「人物が歩き出す」などの動きを指示可能に
2024年8月	Runway Gen-3 Alpha（更新）	「最初の画像」と「最後の画像」を両方指定できるように。動画の始まりと終わりをコントロール可能に
2025年3月	Runway Gen-4	参照画像機能を搭載。「この人物の見た目を覚えて」と指示でき、別シーンでも同じキャラクターで動画を生成
2025年4月	Vidu Q1	最大7枚の参照画像に対応。開始/終了の画像指定と効果音の同時生成を統合
2025年9月	Sora 2（OpenAI）	映像と音声を一体で生成。顔や声を動画にはめ込む「Cameo機能」を搭載。マルチショットの概念を大幅に引き上げた
2025年9月	Kling 2.5 Turbo	「最初に〇〇して、次に〇〇して」と時系列で動きを指示できるように。複数キャラクターのやり取りを高精度に制御
2025年12月	Runway Gen-4.5	音声との同期、長尺のマルチショットに対応。物体や人物の動きの自然さが飛躍的に向上
2026年2月	Kling 3.0	格闘やダンスなど複雑な人間の動きを破綻なく生成。3〜15秒のマルチショットに対応
2026年2月	Seedance 2.0（ByteDance）	画像・動画・音声を最大12ファイルまとめて読み込み、複数シーンの切り替えと口の動きの同期を一括生成
2026年初頭	Veo 3.1（Google）	口の動きと音声の同期精度が最高水準に。最大4枚の参照画像で構図を厳密に指定可能

2024年 — 「とりあえず動かせる」から始まった

「動かす」ことはできても、「演出する」ことはできなかった

2025年前半 — 「狙って作れる」時代の始まり

「同じ人物が、違うシーンに出る」の意味

古い動画を最新のAI技術で動画化しませんか？

2025年後半 — 品質が「実用レベル」に到達した

「キャラクターの同一性」が映像制作を変えた

【実写AI動画の活用アイデア】コンプライアンス研修の再現動画をAIで作る

2026年 — 「1本の映像を演出する」時代へ

カット割りという「映像の文法」がAIに持ち込まれた

【生成AIって何ができる？】生成AI動画のビジネス活用

最新技術でのAI映像制作のご相談はこちら

AIが映像を作る時代に、人が担う仕事は何か

ビジネス向けのシナリオなら「スマービーAI」で。

【年表】画像生成AIと動画生成AIの進化の歩み

画像生成AIの歩み

動画生成AIの歩み

Sora 2のサービス終了が残した教訓

【動画のAIO/SEO対策】AIのための動画の名札 Video Object

動画制作・動画マーケティングのご相談

SHARE

RECOMMENDED

【広告代理店の時短術】WebP化・文言変更・比率展開の無料ツール「サムネイルメーカー」

【動画からWEB素材を簡単生成】動画AIO/SEOツール

【実写AI動画の活用アイデア】コンプライアンス研修の再現動画をAIで作る

【動画が不良債権化する？】AI時代に生き残る動画資料の作り方