【完全保存版】FaceFusion 3.5.2 徹底攻略ガイド:基本操作からプロ級のチューニング設定まで

AIによる顔交換(フェイススワップ)ツールの中でも、現在最も高機能かつ活発に開発されているのが**「FaceFusion」**です。

特にバージョン3.5系からは、画質の向上や処理速度の改善が目覚ましいですが、同時に設定項目が非常に多く、どこを触ればいいのか分からないという方も多いのではないでしょうか?

この記事では、FaceFusion 3.5.2の全機能を解剖し、**「基本の使い方は?」「画質を上げるには?」「手や髪が被った時の対処法は?」**といった疑問を解決するプロ向けのノウハウを解説します。


1. 画面構成と基本のワークフロー

FaceFusionのUIは大きく3つのカラム(列)に分かれています。まずはそれぞれの役割を理解しましょう。

左カラム:システム設定(What & How)

「どんな処理をするか」と「何を使って計算するか」を決めます。

  • PROCESSORS: face_swapper(顔交換)が基本です。画質を上げたい場合は face_enhancer(顔の高画質化)を併用しますが、使い分けが重要です(後述)。
  • EXECUTION PROVIDERS: ここが最重要。NVIDIAのGPUを積んでいる場合は必ず**cuda**を選択してください。cpuのままだと処理速度が絶望的に遅くなります。

中央カラム:素材と実行(Action)

  • SOURCE: 「移植したい顔」の画像をドラッグ&ドロップ。
  • TARGET: 「はめ込み先の動画/画像」をドラッグ&ドロップ。
  • START: 全ての設定が終わったらここを押して書き出し開始。

右カラム:詳細設定(Fine-tuning)

ここが腕の見せ所です。顔の検出精度、マスクの範囲、対象者の指定など、「AIの挙動」を微調整するエリアです。デフォルト設定で上手くいかない場合は、ここを触ります。


2. クオリティを左右する重要パラメータ解説

初心者がつまづきやすい、または効果が高いパラメータを厳選して解説します。

画質に関する設定

  • FACE SWAPPER MODEL:
    • 現在は**hyperswap_1a_256**が標準かつ最強です。高速で表情の追従性が高いモデルです。
  • FACE SWAPPER PIXEL BOOST:
    • AIが処理する際の「内部解像度」です。
    • 256×256(標準)から512×512以上に上げると、目の輝きや肌の質感が劇的に向上します。ただしVRAM消費と処理時間は跳ね上がります。

顔の認識・検出設定

  • FACE DETECTOR MODEL:
    • yolo_face: 標準。速いが、小さな顔や横顔に弱い。
    • retinaface: 推奨。処理は重いが、群衆の中の顔や、激しい動きでも食いつきます。
  • FACE MASK TYPES:
    • box: 単純な四角い範囲で合成。障害物に弱い。
    • occlusion: 必須級。顔の前に手やマイクが来た時、それを避けて合成してくれます。

3. 【シーン別】最適な設定レシピ

「こういう動画を作りたい時はどう設定すればいい?」という具体的なケーススタディです。

ケースA:映画のワンシーンのように「超高画質」で作りたい

デフォルトだと肌がのっぺりして「AI感」が出てしまう場合の対処法です。

  1. Face EnhancerをOFFにする: 意外かもしれませんが、face_enhancerは肌のディテールを潰してツルツルにしてしまうことがあります。あえてOFFにします。
  2. Pixel Boostを上げる: FACE SWAPPER PIXEL BOOST512x512 または 1024x1024 に設定。
  3. Detectorを強化: FACE DETECTOR MODELretinaface に変更。
  4. 境界をシャープに: FACE MASK BLUR0.1 程度まで下げる。

ケースB:手やマイクが顔の前を横切る(オクルージョン)

歌っているシーンや食事シーンで、マイクやコップが顔に合成されてしまうホラー現象を防ぎます。

  1. Mask Type変更: FACE MASK TYPESocclusion に変更。
  2. Occluderモデル確認: FACE OCCLUDER MODELxseg 系になっていることを確認。
  3. Blur調整: FACE MASK BLUR0.5 程度に上げて、境界を馴染ませる。

ケースC:激しいダンスや横顔で「顔が外れる」

動画の途中で一瞬だけ元の顔に戻ってしまう(フリッカー現象)場合の対策です。

  1. 検出器を変更: FACE DETECTOR MODELretinaface に。
  2. 判定基準を下げる: FACE DETECTOR SCORE0.50.2〜0.3 に下げる。「自信がなくても顔として処理しろ」という命令です。
  3. 類似度判定を緩める: REFERENCE FACE DISTANCE0.60.8 に上げる。横顔で人相が変わっても追従させます。

ケースD:おでこの生え際に「線」が出る

素材とターゲットの顔の形が合わず、おでこや顎に不自然な境界線が出る場合。

  1. Paddingで拡張: FACE MASK PADDING TOP(またはBOTTOM)の数値を 0.05 ずつ上げてみる。合成範囲を強制的に広げます。
  2. Enhancerで馴染ませる: このケースでは face_enhancer をONにした方が、拡張した部分の肌色が馴染みやすいです。

4. 失敗しないための推奨ワークフロー

最後に、エラー落ちを防ぎ、効率よく作業するための手順を紹介します。

  1. プレビューで攻める: まずは instant_runner モードで、プレビューを見ながら FACE DETECTOR SCOREMASK PADDING を調整します。
  2. オクルージョン確認: 動画内で手が顔に被るシーンまでシークバーを動かし、破綻していないか確認します。ダメなら occlusion モードへ。
  3. 本番はStrictモードで: 長時間の書き出しを行う際、VRAM不足で落ちるのは最大の時間の無駄です。左カラムの VIDEO MEMORY STRATEGY は必ず strict に設定してから START を押しましょう。

FaceFusionは設定次第で「いかにもAI」な画質から「実写と見分けがつかない」レベルまでクオリティを引き上げることができます。ぜひこのパラメータ解説を参考に、最高の一本を作ってみてください。

【付録】FaceFusion 3.5.2 全パラメータ・機能完全リファレンス

ここでは、UIに表示されている全ての項目について、その役割と技術的な意味を解説します。設定に迷った時の辞書としてご活用ください。

1. 左カラム:システム・プロセッサー設定

処理の「内容」と「基盤」を設定するエリアです。

PROCESSORS (処理モジュール)

チェックを入れた順序(内部処理順)で適用されます。

  • face_swapper: 顔交換のメイン機能。ソースの顔をターゲットに移植します。
  • background_remover: 背景を削除(透過)します。
  • expression_restorer: 顔交換で失われがちな微細な表情(シワや筋肉の動き)を復元します。
  • face_debugger: 顔の検出枠やランドマーク、マスク範囲を可視化して表示します(テスト用)。
  • face_editor: 顔の特定部位を手動調整するための機能。
  • face_enhancer: 顔領域専用の高画質化(アップスケーラー)。ぼやけた顔を修復します。
  • frame_colorizer: 白黒映像をカラー化します。
  • frame_enhancer: 背景含む画面全体を高画質化します(処理は非常に重いです)。
  • lip_syncer: 音声ファイルに合わせて口の動きを生成します(リップシンク)。
  • age_modifier: 年齢を操作(若返り・老化)する実験的機能。

FACE SWAPPER MODEL

  • hyperswap_1a_256: 最新標準。高速・高解像度・高安定性。
  • inswapper_128_fp16: 旧標準。創造性は高いが解像度が低い。
  • simswap_*: 特定の角度に強いが汎用性に欠ける場合がある。
  • blendswap: 合成の馴染み重視。ID(本人らしさ)は薄れる。

FACE SWAPPER PIXEL BOOST

AIが顔を生成する際の仮想解像度。

  • 256×256: 標準。
  • 512×512: 高画質。アップの映像には必須。
  • 1024×1024: 超高画質(要VRAM)。

FACE SWAPPER WEIGHT

  • 0.0 〜 1.0: 適用強度。下げると元の顔が透けて見えます。

EXECUTION PROVIDERS

処理に使用するハードウェア。

  • cuda: NVIDIA GPU(推奨・最速)。
  • cpu: CPU処理(非常に低速)。
  • coreml: Mac (Apple Silicon) 用。

VIDEO MEMORY STRATEGY

  • strict: VRAM管理を厳格に行い、エラー落ちを防ぐ(推奨)。
  • moderate / tolerant: 速度優先でメモリを限界まで使う設定。

2. 中央カラム:実行・ワークフロー

素材の入力と書き出し制御です。

  • SOURCE: 「顔を提供する」画像。
  • TARGET: 「顔を入れ替える先」の画像または動画。
  • OUTPUT PATH / OUTPUT: 保存先とプレビュー画面。
  • UI WORKFLOW:
    • instant_runner: 操作するたびに即時プレビュー更新。
    • job_runner: タスクを積んで一括処理するバッチモード。
  • LOG LEVEL: info(通常), debug(詳細・エラー解析用)。

3. 右カラム:詳細設定(検出・マスク・選別)

AIの挙動を微調整するプロ向けエリアです。

PREVIEW 設定

  • preview resolution: プレビュー画像の画質。PCが重い場合は下げてもOK(本番出力には影響しません)。

FACE SELECTOR MODE(ターゲット指定)

  • reference: 「REFERENCE FACE」で指定した顔に似ている人物を変える。
  • one: 最初に検出された1人のみ。
  • many / all: 画面内の全員を変える。

REFERENCE FACE

  • ターゲット動画から検出された顔のサムネイル。ここをクリックして交換対象をロックオンします。

FACE SELECTOR ORDER

  • large-small: 顔が大きい順(カメラに近い順)に処理。
  • left-right: 左から右へ処理。

REFERENCE FACE DISTANCE

  • 0.0 〜 1.5: 同一人物判定の「緩さ」。
    • 下げる(0.4等): 厳密になる。他人が巻き込まれにくくなる。
    • 上げる(0.8等): 緩くなる。メイクや照明で顔が変わっても追従する。

FACE OCCLUDER MODEL

  • xseg_*: 顔の前にある障害物(手、髪など)を検出する高性能モデル。

FACE MASK TYPES

  • box: 四角い範囲で合成。
  • occlusion: 障害物を避けて合成(推奨)。
  • region: 目や口などパーツ単位での合成。

FACE MASK BLUR

  • 0.0 〜 1.0: 合成境界線のぼかし量。標準は0.3。

FACE MASK PADDING (Top/Bottom/Right/Left)

  • 顔の切り取り範囲(Crop枠)を上下左右に拡張します。おでこや顎のラインが合わない時に使用。

FACE DETECTOR MODEL(顔検出)

  • yolo_face: 標準・高速。
  • retinaface: 高精度・低速。横顔や極小の顔に強い。

FACE DETECTOR SCORE

  • 0.0 〜 1.0: 「顔だと判定する」自信の閾値。
    • 見逃す場合は下げる。誤検出する場合は上げる。

FACE LANDMARKER MODEL

  • 2dfan4: 目鼻口の座標を取得するモデル。通常は変更不要。