
画像生成AI技術の開発を行うFotographer AI株式会社(本社:東京都品川区、代表取締役:鈴木麟太郎)が、ファインチューニング不要で1枚の入力画像から多視点・多様なシーンを高解像度で生成できるツールキット「ZenCtrl」をオープンソースとして公開したことを発表しました。このツールは生成内容の制御性と一貫性を大幅に向上させる革新的な技術を搭載しているとのことです。
ZenCtrlの特徴と機能
ZenCtrlは、従来の画像生成AIが抱えていた「ファインチューニングの手間」や「生成内容の制御の難しさ」といった課題を解決するために開発されたツールキットです。入力画像を1枚用意するだけで、対象物やキャラクターを多視点・多様なシーンで高精度に生成することが可能になるとのことです。
このツールはCannyなどの画像処理技術と独自に開発された制御アルゴリズムを組み合わせることで、生成画像の一貫性と柔軟性を大幅に向上させているそうです。広告制作やeコマース、インテリアデザイン、イラストレーションなど、幅広い分野での活用が期待されています。
メジャーアップデートの実施
以前からプレビュー版が公開されていたZenCtrlですが、今回のメジャーアップデートでは、被写体を中心とした多視点画像生成における一貫性が大幅に向上したとのことです。さらに、ポーズやアングルの変化に対する再現性および制御性能も強化されているそうです。
このアップデートは、AI画像生成における大きな課題である制御性能と一貫性の改善に向けた解決策として位置づけられており、画像生成AIの実用化に向けた重要なステップとなっています。
ZenCtrlモデルの学習済みウェイトはHugging Faceで公開されており、同プラットフォーム上のデモスペースにて一部モデルを実際に試すことができます。またソースコードはGitHubで公開されており、今後も実用性の高い画像生成AI機能が順次アップデートされる予定だそうです。


オープンソース公開の意義
Fotographer AI社はZenCtrlをオープンソースで公開することで、世界中の研究者・開発者・クリエイターが自由に検証・改良し、新たなユースケースを開拓できる環境を提供しているとのことです。同社はコミュニティと共に生成AI分野のさらなる発展に寄与していく姿勢を示しています。
今後の展開について
ZenCtrlは今後、画像生成のさらなる制御性能の強化に加え、動画生成への拡張にも注力していく予定だそうです。また、シーン生成・背景生成・デブラーリングなど複数の小規模モデルを統合したツールキットへと進化し、AIエージェント中心の効率的なワークフローの実現を目指しているとのことです。
さらに、ZenCtrlの性能向上を図りながら、ファッションやイラストレーション、インテリアデザインなど、多分野への応用拡大も進めていくと発表されています。
Fotographer AI社について
Fotographer AI株式会社は、世界水準の研究開発チームを擁し、生成AI技術の開発および実用化をグローバルに推進している企業です。卓越した技術力を強みに、クリエイティブ産業を中心とした幅広い業界の課題を解決し、新たな価値の創出に取り組んでいるとのことです。
同社は、AWSが主催する世界的なスタートアップ支援プログラム「AWS Generative AI Accelerator」において、世界各国から応募した4,700社以上のスタートアップの中から選出された80社のうちの1社として採択されたそうです。さらに、ベイエリアの著名なアクセラレータープログラム「Inception Studio」にも採択されるなど、生成AI分野で国際的な評価と実績を得ているとのことです。
【会社情報】
会社名: Fotographer AI株式会社
所在地: 東京都品川区
代表者: 代表取締役 鈴木麟太郎
出典元:Fotographer AI株式会社 プレスリリース