FaceFusion3.3.2 細かな設定 セッティング(中級編)

FaceFusionは、3.3.2のアップデートで大きく進化しました。
以前のバージョンに増して、細かな設定が可能となり、
高度な要望を満たす動画の生成が出来ます。

基本的には、デフォルトのままでもハイクオリティな顔合成動画の生成ができます。

ここでは、より高度な動画生成を目指す方向けに、詳細の設定を説明します。
尚、設定によっては、リソースが沢山必要となり処理時間が大幅に増える可能性があることに、
留意する必要があります。

PROCESSORS(プロセッサ)セクション

  • face_swapper(フェイススワイパー)
    デフォルトで有効にして、顔のスワップを許可します。
    コアとなる顔変更機能は、inswapper_128などのモデルに基づいて顔の置き換えを実現します。
  • deep_swapper(ディープスワイパー)
    代替ディープフェイク モデル (デフォルトでは有効になっていません)
    デフォルト:iperov/elon_musk_224
    選択:druuzil, edel, iperov, jen, mats, rumateus
    例: --deep-swapper-model iperov/jackie_chan_224
  • face_debugger(フェイスデバッガー)
    マスクアプリケーション中のデバッグに便利です。通常の操作では必須ではありません。デバッグ用に顔のキーポイント検出結果を表示します。
  • face_enhancer(フェイスエンハンサー)
    スワイプされた顔の明瞭さを高めるために使用します。
    顔の部分の詳細(目、肌など)が強化されました。
    モデルgfpgan_1.4 GFPGAN v1.4 モデルを使用して、顔の詳細 (目、肌の質感など) を強調します。
    ブレンド80 元の画像とのブレンド度合い(0〜100)。値が高いほど、強化が顕著になります。
  • frame_enhancer(フレームエンハンサー)
    画質が向上します。 パフォーマンスへの影
    ビデオフレームの全体的な鮮明度が向上します (超解像度)。
    モデルspan_kendata_x4 超解像モデル (kendata や Real-ESRGAN など) は画像の鮮明度を向上させます。
    ブレンド80 また、混合の強度も向上します。
  • age_modeifier(年齢補正)
    キャラクターの年齢を変更します
  • expression_restorer(表情補正)
    表情復元モジュールは、顔の交換後に表情が鈍くなる問題を修正します。
    表情回復剤 強度係数(0〜100)。値が高いほど表現力が豊かになりますが、歪みが生じやすくなります
  • face_editor(フェイスエディター)
    目の大きさ、口の形などの顔の特徴を編集します (サポートされている場合)。
  • frame_colorizer(フレーム色調整)
    白黒のビデオや画像をカラー化します。
  • lip_syncer(リップシンカー)
    リップシンク、音声駆動型ビデオの顔のスワッピング (トーキングヘッドなど)。

FACE SWAPPER MODELセクション

  • FACE SWAPPER MODEL
    モデル:新しいスワッパーHyperSwap 256モデル、解像度2倍でInswapperに匹敵すると思われる新しいモデルがリリースされました。
  • FACE SWAPPER PIXEL BOOST
    ピクセルブースト:256x256
    入力画像を処理用にこのサイズに拡大します。値を大きくすると画像はより鮮明になりますが、ビデオメモリの消費量も増加します。

EXECUTIONセクション

  • EXECUTION PROVIDERS
    実行プロバイダーcuda、、tensorrtcpu
    使用する優先計算バックエンドは次の順序で指定しますtensorrt > cuda > cpu(サポートされている場合)。
  • EXECUTION THREAD COUNT
    スレッド数:16 マルチスレッド並列処理の数は、一般的にCPUコアの数に合わせて設定されます。
  • EXECUTION QUEUE COUNT
    キュー数:1 タスク キューの数は、通常は 1 にしておきます。
  • DOWNLOAD PROVIDERS
    ダウンロードプロバイダーgithubhuggingface
    モデルをダウンロードするときに使用されるデフォルトのソース アドレス。
  • VIDEO MEMORY STRATEGY
    高速フレーム処理と低VRAM使用のバランス。
    ビデオメモリ戦略:strict(厳密、デフォルト)
    フォールト トレランス ポリシーtolerantは、グラフィックス メモリがいっぱいになると、グラフィックス メモリが自動的にダウングレードされることを意味します。
  • SYSTEM MEMORY LIMIT
    システムメモリ制限:0
    メモリ使用量の上限(MB)。0 は制限なしを意味します

OUTPUT AUDIO ENCORDERセクション

生成される動画の音声形式を指定。デフォルトは”flac”。(このセクションはTARGET動画UP後に表示)
多くのメディアプレーヤーでは”aac”が多いので切替を推奨

FACE SELECTOR MODEセクション

TARGET動画内の顔の数に応じて設定

  • reference(参照)
    動画内に複数の顔がある場合に、入替える顔を直ぐ下欄(REFERENCE FACE)参照画像の顔から選択して実行
  • many
    動画内に複数の顔がある場合に、全ての顔を1つの顔(SOURCE)に入替える。
  • one
    動画内に顔が1つの場合。

FACE MASK TYPESセクション

  • FACE MASK TYPES
    さまざまなフェイスマスクタイプを混ぜて一致させます。
    デフォルト:box
  • FACE MASK BLUR
    ボックスマスクに適用されるぼかしの程度を指定します。デフォルト:0.3

FACE SELECTORセクション

  • FACE SELECTOR ORDER
    検出された顔の順序を指定します。
  • FACE SELECTOR GENDER
    性別に基づいて検出された顔をフィルタリングします。
  • FACE SELECTOR RACE
    人種に基づいて検出された顔をフィルタリングします。

FACE MASKER セクション

  • FACE OCCLUDER MODEL
  • FACE PARSER MODEL
    リージョンマスクを担当するモデルを選択します。
  • FACE MASK PADDING TOP
    ボックスマスクに上部、右、下、左のパディングを適用します。

FACE DETECTOR ANGLES(顔検知角度)セクション

  • FACE DETECTOR ANGLES
    TARGET動画の顔の角度が90度、180度、270度の場合があれば指定(複数指定可)
  • FACE DETECTOR SCORE
    ANGLES検出された顔のベースを信頼性スコアにフィルタリングします。