潜在拡散モデルにおける生成対象の個別配置と生成による画質改善の試み

Abstract

潜在拡散モデル(LDM)は、プロンプトから高品質な画像を生成するが、複数物体を含むプロンプトについては物体の欠落や属性の混同が課題となる。本研究では、逆拡散過程で物体の存在が確定するステップに着目した新たな枠組TAUE(Training-free trAnsplant cUltivation diffusion modEl) を提案する。TAUEでは各物体と背景を個別に生成し、苗を畑に植えるように、物体の存在が確定したノイズで背景上の対象領域を上書きすることで物体の欠落を防ぎ、配置に忠実な画像の生成を実現する。TAUEは様々なLDMの関連技術への応用が期待され、直感的な生成プロセスを提供する。

Publication
情報処理学第 87 回全国大会,2025.
北田 俊輔
北田 俊輔
Research Scientist working on Vision & Language with Deep Learning

My research interests include deep learning-based natural language processing, computer vision, medical image processing, and computational advertising.