前書き

Midjourneyは、現在世界で最も急速に成長している生成アートツールであり、最近のトレンドとなっています。アート制作にAI人工知能が取り込まれたと考える人もいれば、生成型AI制作が将来のアートの発展方向になると考える人もいます。また、AIに指令を入力する「呪文」は、相当な技量が必要な管理学の一分野と見なされることもあります。Midjourneyでは、最新の機能である「説明」機能がリリースされ、Midjourneyに画像を入力するだけで、AIがMidjourneyの指示を自動的に作成したり、Stable Diffusionで生成された画像がどのような素材から派生しているかを確認できます。

本文では、Midjourneyの最新機能を紹介します。

図/Midjourney

Midjourneyの紹介

Midjourneyは、人工知能を活用して芸術作品を生成するツールです。ユーザーは高度な絵画技術やコンピュータ技術を学ぶ必要はありません。好きな美術スタイルや画面要素を考え、公式インターフェイスにキーワードを入力するだけで、短時間で画像を生成できます。高い効率性と精巧な画面が特徴です。

工学的な観点から見ると、Midjourneyは、自然言語処理(NLP)と生成対抗ネットワーク(GAN)を組み合わせた深層学習アルゴリズムによって実現されたフロントエンドツールです。キーワードを入力するたびに、システムは関連する画像をデータベースから検索し、再構成して特定のスタイルと要素の作品を生成します。全体的に、前世代のツールであるDisco Diffusionや現在の他のツールと比較して、Midjourneyはより操作性、生成速度、画面品質に優れています。

キーワードを入力するだけで画像を生成できますが、特定のスタイルや構図の画像を生成したい場合は、ユーザーはキーワードの説明に多くの労力を費やす必要があります。まるで魔法をかける前に「呪文」を唱えるように、AIの描画を得意とする人たちを「呪文使い」と揶揄するネットユーザーもいます。

図/Midjourney

Midjourney最新機能、画像からの推測を『詠唱』により簡単に

Midjourneyは最近、新しい「

説明

」機能をリリースし、画像をテキストに変換することができます。Midjourneyチームはこのツールがあなたの言語視覚プロセスを創造性と発見の面で変えると考えています。説明機能の最も素晴らしい点は、画像をアップロードするだけで、テキストに変換でき、これらの単語を入力してMidjourneyによって全く新しい、関連のある画像を生成できることです。つまり、Midjourneyは画像から『詠唱』を推測することができるようになりました。

この機能は、画像の説明にもより重要な意味をもたらします:

  1. アクセシビリティの向上:
  2. 画像の説明により、視覚障害や読みにくさのある人が数字コンテンツにアクセスしやすくなります。これは、Web表示に使用されるALTテキスト要素を使用して達成されます。
  1. 検索性の向上:
  2. 説明は、検索エンジンによるより優れた検索機能と索引を可能にします。
  1. 字幕に使用:
  2. 字幕に説明を含めることで、画像がより明確になります。
  1. 詳細なヒント:
  2. 説明は、新しい変種を作成するためのより詳細なヒントを作成するために使用できます。彼らは、クイックプロジェクトのインスピレーションを提供することができます。

Midjourneyは、アップロードされた画像に基づいて4つの異なる説明を生成し、新しい画像を簡単に生成できます。


Midjourneyの新機能の使い方

この記事では、Paul DelSignore氏の共有を通じて、最新の機能の使い方を紹介します:

ステップ1:テキストエリアに/describeを入力すると、ドラッグアンドドロップ領域が表示され、ユーザーは画像をアップロードできます。


step2、上傳圖片後,點擊進入

ステップ2、画像をアップロードした後、enterを押してください。


ステップ3、Midjourneyは画像を元に4パターンの説明文を作成し、ユーザーに最も近いパターンを選んでもらう


ボトムにある4つの数字はアクティブなミックスボタンです。それぞれの数字はそれに対応する説明と一致しています。数字をクリックすると、新しい説明に基づいて画像が再度混合されます。また、ミキシングを通じて生成された画像の説明を変更することもできます。

元の画像の説明を生成します:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors

こちらはMidjourneyが作成した説明の一種、ミックス機能を使用して新たに説明を作る:

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts マーク・ヘンセンのスタイルを採用した発光するカラーの抽象的な脳のツリーのイメージ。暗号化された象徴主義、詳細な解剖学的構造、大胆なラインワーク、鮮やかな色彩、心理現象の挿絵、明暗の対比を備えたイメージです。

ミックスされた変更を加えた説明をもとに、Midjourneyを使用して新しい画像を生成しました:

図/ Paul DelSignore 在 Midjourney 製作


Midjourneyのプロンプトは非常にシンプルであるか、自然言語であることができます。しかし、使用者の意図に最も合った画像を生成するためには、固有の文法を使用する必要があります。Midjourneyのボットは人間と同様に文法や文の構造、単語を理解するわけではないためです。そのため、AIによる画像生成の初心者にとって、/describeは非常に役立つツールです。

海外ユーザーの実証結果

現在、Twitter上でのユーザーのテスト結果によれば、最新の機能によって生成された画像の類似度は少なくとも70%以上です。また、一部のユーザーは/describeの説明文を変更して、満足できない画像を調整しました。結果は完全にユーザーの希望通りのものでないかもしれませんが、画像をテキストで説明すること自体がAIの大きな進歩です。


Paul DelSignoreさんがNASAの宇宙飛行士の写真をアップロードし、Midjourneyに説明させ、新しいバージョンのAI宇宙飛行士を生成しました。

元画像 Josh Valcarcel/NASA

Midjourneyを使って新しく説明を加えて生成した画像/Paul DelSignore


まだ誰も思いついていないかもしれませんが、ブランドのロゴをアップグレードするために/describeを使用することができます。これにより、以前のブランド認知度を継続しながら、新しいイメージをもたらすことができます。

まとめ

本記事では、Midjourneyの最新機能「Description」について紹介しました。この機能により、ユーザーは入力された画像に基づいて関連するヒントワードを自動生成し、新しい画像を生成することができます。Midjourneyチームは、この機能により、ユーザーの言語視覚プロセスにおいて創造性と発見の観点で変化が生じると述べています。また、本記事では、Midjourneyツールの使用方法も紹介しており、最新機能を素早く理解し、体験することができます。AIの描画も新たな段階に入ることとなりました。