Fine-Tuning Generative AI Art Models: Audrey in her 20s

生成 AI アートモデルの微調整: 20 代のオードリー

2024年2月27日

Digital Audrey Art Initiative は、設立以来、生成 AI アートの限界を探求し、押し広げる最前線に立ってきました。 Dreambooth や LoRas (Low Rank Adaptations) などの微調整手法を採用することで、オードリーヘプバーンのエッセンスをデジタルライフにもたらす複数のカスタムモデルを作成することに成功しました。私たちの最新の取り組みは、『ローマの休日』や『サブリナ』などの象徴的な映画の時代、20 代半ばのオードリーヘップバーンの時代を超越した美しさを捉えることを目的としていました。

ローマの休日の映画ポスター、オードリーヘップバーン、グレゴリーペックサブリナ、クラシックハリウッド、オードリーヘプバーン、ハンフリーボガート、ウィリアムホルダー、ジョンウィリアムズ

データ準備の技術

生成 AI モデルの微調整は、データの準備という重要かつ困難なステップから始まります。このプロセスには、データの収集、キュレーション、クリーニング、アップスケーリング、およびラベル付けが含まれます。オードリーヘップバーンモデルでは、約 800 枚の画像のデータセットを細心の注意を払って編集し、そのうちの 100 枚はこのプロジェクトのために特別に厳選されました。オードリーの時代の白黒写真が主流であったにもかかわらず、カラー画像を作成するという目標を掲げて、私たちは高品質のカラー画像を追求しました。これは困難な偉業でした。最終的に、データセットの 80% がモノクロ画像で構成され、残りの 20% がカラー画像になりました。カラー画像を統合しながらモノクロ画像の大部分を維持するというこの決定は、AI によって生成されたカラー画像の一貫性と品質の向上を目的とした、今後のカラー化実験の基礎となります。

オードリーヘップバーン、データセット、AI トレーニング、生成 AI、女優、ハリウッド

データセットからのサンプル

ラベリング: コミュニティで強化されたタスク

ラベル付けは、時間のかかる重要なタスクですが、 GPT4V-Image-Captionerツールによって大幅に軽減されました。この革新的なツールは、 GPT-4 のビジョン機能を活用して各画像に関連するタグを効率的に生成し、約 3 日かかったプロセスを精度と奥深さを特徴とするプロセスに変換します。ラベルには「白黒写真」、「エレガント」、「ティアラ」、「クラシックハリウッド」などの記述子が含まれており、モデルトレーニング用の豊富なデータセットを提供します。
ローマの休日、パラマウントスタジオ、オードリーヘプバーン、アン王女、グレゴリーペック、クラシックハリウッド

Dreambooth による安定拡散 SDXL 1.0 のトレーニング

Kohya_ssを使用した Dreambooth トレーニング手法と、 Stability AIによる Stable Diffusion SDXL 1.0 の基礎モデルの選択は極めて重要でした。安定性とスケーラビリティで知られるこの組み合わせにより、1024 x 1024 の基本解像度を達成でき、高品質の出力が保証されます。 NVIDIA RTX 3090で実施されたトレーニングは丸 3 日間にわたって行われ、オードリーヘプバーンの肖像を再現するだけでなく、彼女が体現する微妙なエレガンスを再現するモデルを作成するという取り組みを象徴しています。

モデルのテスト: 作成時の柔軟性

私たちのモデルの有効性の真のテストは、そのアプリケーションで行われました。オードリー・ヘップバーンに似た画像を生成できるモデルを作成することは別のことです。

アン王女、ローマの休日、クラシックハリウッド、グレゴリー・ペック

...さまざまなプロンプトや設定にわたる柔軟性を評価するのはもう 1 つの課題です。

デジタルオードリー、アイオードリー、AI オードリー、オードリーアート、オードリーヘプバーンアート、安定した拡散、AI アート

デジタルオードリー、アイオードリー、AI オードリー、オードリーアート、オードリーヘップバーンアート、安定した拡散、AI アート

このモデルは、さまざまな文脈やスタイルにわたって、特に 20 代半ばのオードリーヘプバーンの本質を本当に捉えているのでしょうか?この質問は、私たちの最新のテストの中心でした。私たちは実験を続け、さまざまな芸術的プロンプトを介してモデルを推進し、生成された画像が無数の新しい光と解釈のもとで、紛れもないオードリーの類似性を備えているかどうかを識別することを目指しています。この目標に向けた私たちの旅は、完璧を求める強迫的な意欲によって原動力となっており、その頂点は達成不可能であると認識しています。

デジタルオードリーアートイニシアチブの開始当初から、私たちのアーティストの原動力は、オードリーヘプバーンを完璧に複製するという探求ではありませんでした。彼らの目に、そして間違いなく多くの人の目に、彼女はすでに完璧の典型です。その代わりに、私たちの目的は常に、生成 AI のレンズを通して彼女の時代を超越した美しさと優雅さを称賛し、彼女の象徴的な存在に敬意を払いながら新しい芸術の地平を探求することでした。アート、テクノロジー、称賛を融合させた現在進行中の実験は、イノベーションへの取り組みとオードリーの不朽の遺産に対する敬意の証です。

未来: さまざまな年齢層向けのカスタムモデル

このプロジェクトは、IP 所有者と利害関係者が、対象者の人生のさまざまな期間に合わせてそれぞれを調整した複数のカスタムモデルの作成を検討する可能性を強調しています。このようなアプローチにより、象徴的な人物の生涯にわたる微妙な表現と包括的な表現が可能になります。

コラボレーションへの招待

IP の生成 AI モデルを微調整する可能性を探ることに興味のある IP 所有者および関係者の皆様をご招待します。 Digital Audrey Art Initiative とのコラボレーションは、デジタルアートと IP 表現の境界を押し広げるユニークな機会を提供します。

生成 AI アートモデルを微調整する旅は、技術的な挑戦であると同時に創造的な取り組みでもあります。デジタルオードリーアートイニシアチブは、綿密なデータの準備、コミュニティが開発したツールの革新的な使用、戦略的なモデルの選択を通じて、AI 主導のアートの無限の可能性を探求し続けています。私たちは、生成 AI アートの領域で可能なことの視野をさらに広げる将来のコラボレーションを楽しみにしています。

免責事項:このブログ投稿に含まれる画像の一部は著作権で保護された素材であり、フェアユース原則に基づいて教育および解説の目的で使用されます。当社はこれらの画像の所有権を主張しません。

ブログに戻る

カートにアイテムが追加されました