Genmo AIは、オープンソースのAI動画生成モデルとして注目を集めるMochi 1を開発し、AI動画生成分野で存在感を高めています。オープンソースモデルを活用したい開発者はもちろん、Runwayの代替ツールを探しているクリエイターにとっても注目度の高いサービスです。本記事では、Genmo AIの特徴や機能、実際の使い勝手をレビューしながら、Filmoraと組み合わせた動画編集ワークフローについても紹介します。

Part 1. Genmo AIとは?
Genmo AIは、Ajay Jain氏とParas Jain氏によって2022年に設立された、研究主導型のAI動画生成プラットフォームです。同社が掲げるミッションは、「汎用人工知能の右脳を解き放つ」ことです。つまり、動画コンテンツという形であらゆるものをクリエイティブにシミュレーションできるAIを構築していると言えます。
他の上位クラスのAI動画生成ツールと同様に、Genmo AIはテキストから動画生成と画像から動画生成を得意としています。Mochi 1モデルを利用することで、ユーザーは説明的なテキストプロンプトを、数秒で高品質なシネマティックAI動画に変換できます。このプラットフォームは独自のフラッグシップモデルであるMochi 1を採用しており、AI動画生成分野に新たな有力候補を加えています。

Mochi 1:Genmoのフラッグシップモデル
Mochi 1は、Asymmetric Diffusion Transformer(AsymmDiT)と呼ばれる独自設計を用いた 100億パラメータの拡散アーキテクチャを基盤にしています。「asymmetric(非対称)」とは、テキスト処理よりも動画データ処理におよそ4倍のパラメータを割り当てていることを意味し、そのため多くのツールよりも動きの表現に強い傾向があります。
Part 2. Genmo AIの主な機能:Mochi 1の独自性とは?
Genmo AIは完全にWebベースです。現在の機能セットは、多くのクリエイターがAI動画生成を始めるために必要とする範囲を広くカバーしています。
1. テキストから動画生成
まず、文章プロンプトからクリップを生成できます。Genmo AIのテキストから動画生成機能は、他のツールと同じくシンプルでわかりやすい設計です。作りたい内容を入力し、AIモデルを選択して生成を開始します。Mochiのほかに、Genmoは代替モデルとしてReplayも提供しています。必要なクレジットは少ないものの、出力品質はMochiには及びません。

2. 画像から動画生成
Replayモデルで動画を作成する場合、画像をアップロードして動きのあるクリップへアニメーション化できます。そのため、Genmo AIの画像から動画生成機能には専用タブがあるわけではなく、メインの作成画面内に組み込まれています。また、すばやく始めるためのAIエフェクトやテンプレートもありません。基本的には白紙の状態から作業する形です。

3. カメラモーションとFXコントロール
多くのツールでは、カメラモーションをプロンプトで指定する必要があります。一見簡単そうですが、空のテキストボックスを前に何を書けばよいかわからず、初心者はそのまま省略してしまいがちです。GenmoはReplayモデルで、パン、ズーム、チルト、ロールを含む専用のカメラモーションとFXコントロールを用意することで、この問題を解決しています。FXプリセットライブラリには以下が含まれます。
- Flower
- Ninja
- Star Spin
- Spiral など

4. コミュニティハブ
Genmo AIでは動画を生成できるだけではありません。コミュニティハブ内で、他のユーザーが何を作っているのか、どのようなプロンプトを使ったのかも確認できます。作品をリミックスしたり、後で見返したいものを保存したり、インスピレーションが必要なときにトレンドを眺めたりできます。

オープンソースのAI動画生成モデル
Mochi 1はApache 2.0ライセンスで公開されており、誰でもウェイトをダウンロードし、モデルをファインチューニングし、ロイヤリティを支払うことなく商用利用することもできます。同社は、米国のベンチャーキャピタルNEAが主導した2,840万ドルのシリーズAによる支援を受けており、モデル開発を続けるための「runway(資金的余力)」を確保しています。
Part 3. ステップ別:プロジェクトでGenmo AIを使う方法
Genmo AIは無料で使えるのでしょうか。Genmo AI PlaygroundでAI動画を作成するには、アカウントと生成ごとのクレジットが必要です。料金プランは以下で確認できます。
|
Free |
Lite |
Standard |
|
|
価格 |
$0 |
$10/月 または $96/年 |
$30/月 または $300/年 |
|
月間クレジット |
50 |
1,200 |
5,000 |
|
透かし |
|||
|
商用利用 |
|||
|
速度 |
Standard |
Fast |
Priority |
|
もっと見る
閉じる
|
|||
参考までに、MochiのAI動画生成モデルを使う場合は1回の生成につき100クレジットが必要です。Genmo AIを無料で利用している場合、Replayモデルは1回10クレジットで動作するため、利用できるのはReplayモデルのみです。
Genmo AI動画生成ツールの使い方


注: Genmo AIの画像から動画生成ツールを使い、参照画像を追加するには、モデルをReplayに設定し、アップロードボタンをクリックして参照画像を追加します。

より良い結果を得るためのプロンプトのコツ
動画が思った通りにならない場合は、プロンプトを確認して調整しましょう。出力品質は、どれだけ具体的に指示できるかに大きく左右されます。実際に差が出やすいコツは以下の通りです。
- 照明を描写する。 「ゴールデンアワーの光」「曇天の拡散光」「ネオンに照らされた路地」などの表現を使うと、モデルに有用な文脈を与えられます。
- 被写体の動作を明確に書く。 単に「歩く女性」と書くのではなく、「赤いコートを着た女性が霧の立ち込める通りをゆっくり歩き、下を見ている」のように書きます。
- プロンプトは150トークン未満に抑える。 これを超えるプロンプトは生成失敗率が高くなります。負荷の高いプロンプトを使ったストレステストでは、失敗率は約12%でした。
Part 4. Genmo AIレビュー:メリット・デメリット
では、Genmo AI動画生成ツールは実際にどの程度使えるのでしょうか。プラットフォーム上の説明と実際の出力は異なることもあり、その逆もあります。実際に試してみた結果、以下のようなことがわかりました。
モーション品質は良いが、完璧ではない
Mochi 1は、特にフォトリアルな表現において、コストに対してかなり良い結果を出します。動きは滑らかで、カメラワークも一定の品質があります。多くの用途では、クリップ全体のまとまりも十分です。一方でReplayは、簡単なテスト以外の用途ではおすすめしにくいモデルです。

Mochi 1の注意すべき限界として、物理表現や現実世界のシミュレーションがまだ不自然に見える場合があります。風に逆らう布の動き、硬い身体の動き、手の曲がり方が微妙におかしい、といった例です。音声がない点も見逃しにくく、ポストプロダクションで別途サウンドを追加する必要があります。
ビジュアルスタイルは、やや磨き込まれすぎた印象になりやすく、それがAI生成だとわかる最初の手がかりになることもあります。一方で、スタイライズされたコンテンツやアニメ調のコンテンツも不自然に見える傾向があります。そうした用途で使うなら、このモデルは適していないかもしれません。

プロンプト追従性と出力品質
Mochi 1は、カメラの動き、照明、被写体の動作を明確に指定すれば、多くのオープンソース代替モデルよりも詳細なプロンプトに安定して従います。ただし、480pという解像度の上限や、時折発生するモーフィングの問題があり、そのままでは本格的な制作向けとは言い切れません。YouTubeなどのプラットフォームに投稿する前に、まず動画をアップスケールする必要がある場合があります。
Genmo AIのメリットとデメリット
まとめると、Genmo AI動画が得意な点と、まだ弱い点は次の通りです。
- 多くのオープンソースモデルと比べて、動きの品質と時間的一貫性が高い
- 専用のカメラモーションコントロールがある
- Mochi 1はApache 2.0のもと完全にオープンソースで、商用利用権もある
- 無料の月間クレジット付き無料プランが利用できる
- コミュニティハブで他のユーザーのプロンプトから直接学べる
- 動画解像度は480pまで
- 音声なし。生成されるクリップは完全に無音
- 無料プランではGenmo Playground上でReplayモデルに限定され、Mochi 1にはより多くのクレジットが必要
- 特定のシナリオでは物理表現の精度が崩れることがある
- 主要な編集ソフトとのネイティブ連携はない
- 動画内のテキスト描画はまだ弱い
- クリップは短く、現時点では1回の生成で最大約6秒
- スタイライズされた作品向けには設計されていない
Part 5. Genmo AIと競合ツール比較:どの程度通用する?
Genmo AI以前から、Runway、Kling、Soraのようなツールはすでによく知られています。Mochi 1はこうしたプレミアムAI生成モデルと競合できると言われていますが、その主張が実際にどの程度成り立つのか見ていきましょう。
|
Genmo AI |
Runway |
Kling |
Sora |
|
|
解像度 |
480p |
1080p |
1080p |
720p〜1080p |
|
最大クリップ長 |
6秒 |
16秒 |
15秒 |
25秒(Proユーザー) |
|
無料枠 |
||||
|
料金 |
$10〜$30/月 |
$15〜$95/月 |
100ユニットあたり$9.79から |
ChatGPT Plus($20/月)またはPro($200/月)経由 |
|
ネイティブ音声 |
||||
|
最適な用途 |
開発者、実験用途 |
プロ制作、ブランドコンテンツ |
キャラクターの一貫性を保つ複数ショットのストーリーテリング |
シネマティック動画 |
|
もっと見る
閉じる
|
||||
ELOスコアに基づくと、Mochi 1はこうした既存ツールと競える水準にあり、ベンチマーク上位に入るスコアを示しています。評価対象となったすべてのモデルの中で、動きの滑らかさと空間的リアリズムにおいて最高位にランクインしました。

ただし、実際にテストして観察した内容からは、次のように結論づけられます。
- Genmo AI は、商用利用も視野に入れた高性能なオープンソースモデルを求める開発者に向いています。動きの品質は十分良いものの、短いクリップ長と低解像度のため、それ単体ではまだ制作現場向けとは言い切れません。
- Runway Gen-4.5は、よりシャープなディテール、強い時間的一貫性、優れたプロンプト追従性を提供します。その代わりコストが高く、クレジットの消費も速く、完全なプロプライエタリです。
- Kling 3.0の動画出力は、コンシューマー向けAI動画カテゴリの中でも依然としてトップクラスで、リアルな物理表現とキャラクターの一貫性があり、複数ショットのプロジェクトに特に適しています。
- Sora はフォトリアリズムとシネマティックAI動画の基準であり続けていますが、問題はアクセス性です。Sora 2はまだ一部の国に限定されており、世界中の多くのクリエイターにとっては手が届きにくい状態です。
他の高度なAIモデルと比較すると、Genmo AIのMochi 1にはまだ改善すべき点があります。ただし、モデルとしてはまだ初期段階であることを考えると、今後の開発には十分期待できます。
Part 6. まとめて活用:Genmo AI + Filmoraワークフロー
Genmo AIで生成した6秒のクリップだけでは、実際のプロジェクトにはほとんど足りません。クリップは無音で、解像度はアップスケールが必要で、カラーグレーディングもフラットです。完成度の高い動画に仕上げるには、ポストプロダクション作業が必要です。
Genmoにはネイティブエディターがないため、最適なワークフローは、クリップをWondershare Filmoraに読み込むことです。プロ仕様のAI動画編集ソフトとして、FilmoraはGenmo動画のアップスケール、AI生成音楽の追加、そしてプロレベルのカラーグレーディングを行い、AIクリップを制作に使える状態へ仕上げられます。
Filmoraは、AI動画の生成とマルチトラックタイムラインでの編集の両方に対応したAI動画編集ソフトです。そのため、1つのプロジェクトを完成させるために、さらに5つものツールを行き来する必要はありません。
タイムラインでクリップを生成・結合する
Filmoraには、Sora 2やVeo 3.1のようなモデルを活用した、内蔵のテキストから動画生成と画像から動画生成ツールもあります。さらに素材が必要な場合は、Filmora内で追加クリップを直接生成し、マルチトラックタイムラインでまとめられます。
AIクリップを延長する
Genmo AIの動画が唐突に終わってしまう場合は、FilmoraのAI動画延長機能でクリップを分析し、前後のシーンを生成して自然につなげることができます。音声については、AIオーディオストレッチを使って、音声の長さを動画に合わせられます。
音声とナレーションを追加する
Genmo AIは無音のクリップを出力するため、Filmoraのテキスト読み上げ機能を使えば、Filmora内で直接音声を追加できます。ナレーション用に、自然に聞こえる多くの音声から選択できます。BGMについては、内蔵のオーディオライブラリを参照するか、AI音楽ジェネレーターでカスタムトラックを生成できます。
エフェクト、フィルター、カラーグレーディングでクリップを強化する
平坦に見えるAI映像は、Filmoraで簡単に整えられます。フィルターを適用したり、カラーグレーディングを手動で調整したりして、狙い通りのルックに近づけられます。クリップに視覚効果を重ねたい場合も、外部プラットフォームに頼らず、Filmoraのエフェクトライブラリから閲覧、ダウンロード、使用できます。
まとめ
Genmo AIは、オープンソース動画生成の限界を押し広げる研究主導型プラットフォームとして打ち出されています。大部分において、その約束は果たしています。ただし、このモデルはまだ比較的新しいため、使う前に知っておくべき制限もあります。
現時点では、Genmo AI動画生成ツールは大きなワークフローの一部として使うのが最適です。アップスケール、音声、カラーグレーディング、タイムライン編集をFilmoraのような多機能エディターで補えば、Genmo AIで生成したクリップを実際に公開できる動画へ仕上げられます。
よくある質問
-
Genmo AIはどのファイル形式で書き出せますか?
Genmo AIは生成した動画をMP4形式で書き出します。MP4は、ほとんどの編集ソフトやSNSプラットフォームと互換性があります。
-
Genmo AIで動画を生成するにはどのくらい時間がかかりますか?
状況によって異なります。インターネット接続が不安定でない限り、Genmo AI動画1本の生成待ち時間は通常それほど長くありません。
-
Genmo AIはモバイルで使えますか?
Genmo AIは完全にWebベースなので、アプリをダウンロードしなくてもモバイルブラウザからアクセスできます。
