OpenAI は、有名な画像生成ツールの最新バージョンである DALL·E 3 の初期の概要を提供しました。この新バージョンでは、ユーザーのクエリにより一致した画像を提供することが約束されており、プロンプトを理解して解釈する機能の強化が強調されています。新モデルの発表は、それに関する情報が最近ネット上に流出したことを受けて行われた。

DALL-E は、共同開発された画像生成 AI です。 OpenAIとマイクロソフトによる。レドモンドは、AI を作成するために Azure を搭載したスーパーコンピューターを提供しました。これは、GPT AI エンジンを構築したのと同じコンピューティング システムであり、現在は GPT-4 に達し、Bing Chat や Microsoft 365 Copilot などのサービスを支えています。 DALL-E は、Microsoft の画像検索/作成 AI、Bing Image Creator の一部でもあります。

主な機能と改善

DALL・E 3 は、プロンプト、特に長いプロンプトのニュアンスの理解における大幅な進歩で際立っています。 2022 年 4 月に導入された前世代の DALL·E 2 と比較して、顕著な改善が見られました。

当社の新しいテキストから画像へのモデルである DALL·E 3 は、微妙なリクエストを非常に詳細で正確な画像に変換できます。

近日提供予定間もなく ChatGPT Plus & Enterprise に移行します。これは、アイデアを実現するための素晴らしいプロンプトを作成するのに役立ちます:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL

— OpenAI (@OpenAI) 2023 年 9 月 20 日

主要なアップデートの 1 つは、ChatGPT との統合であり、ユーザーはチャットボットとのインタラクティブな会話を通じて画像をリクエストします。これは、ユーザーが生成された画像をチャット アプリケーション内で直接受信できることを意味します。 OpenAI は、10 月に ChatGPT Plus および企業顧客向けに DALL·E 3 のリリースを予定しており、一般向けおよび API 顧客向けのより広範なリリースは今秋後半に予定されています。

このツールの高品質なデータを生成する機能ユーザーのクエリによく一致する画像は注目に値します。たとえば、DALL・E 3 は、複雑な説明に細心の注意を払って画像を生成し、以前のモデルでは課題であった、ラベルや標識などの画像内テキストの生成を管理できます。 OpenAI の宣伝資料では、DALL·E 3 が提供されたプロンプトに忠実に従って、最小限の変形でオブジェクトをレンダリングできることが示唆されています。

安全性と倫理的配慮

OpenAI は、安全性と倫理的配慮への取り組みも強調した。同社は、DALL・E 3 の安全性を強化し、アルゴリズムのバイアスを最小限に抑えるための措置を導入しました。画像ジェネレーターについてアーティストが提起した懸念に応えて、DALL・E 3 は、生きているアーティストのスタイルの画像を求めるリクエストを拒否するようにプログラムされています。さらに、アーティストは、将来の OpenAI 画像生成モデルのトレーニングで使用される画像の一部またはすべてを除外するオプションを利用できるようになりました。

これらの措置に加えて、OpenAI は、「レッド

競争環境

一方、DALL·E 3 は新たな基準を設定する準備ができています。画像生成の分野では、OpenAI は市場の他のツールとの競争に直面しています。Stable Diffusion などのオープンソース ツールやさまざまなテクノロジー企業の製品も市場シェアを争っています。しかし、その高度な機能とサポートにより、 OpenAI の評判により、DALL·E 3 は AI 主導の画像生成において先導する立場にあります。

AI 画像ジェネレーターの最近の例

OpenAI も導入しました。画像作成における AI の新たな可能性を開く、テキストから 3D モデルを作成できる生成モデル ShapE。生成 AI に焦点を当てたスタートアップである Stability AI は、安定拡散モデルを使用してテキスト プロンプトから画像を生成するオープンソース ウェブ アプリである StableStudio をリリースしました。ユーザーは、DreamStudio の機能を使用して、異なるスタイルや属性を持つ画像の複数のバリエーションを作成することもできます。以前は Facebook として知られていた会社である Meta は、生成トランスフォーマー モデルに基づいた独自の AI 画像ジェネレーターである I-JEPA を発表しました。 I-JEPA は、単語と画像の関連性を学習し、テキストの説明からリアルな画像を生成できます。中国の電子商取引大手 Alibaba は、中国語と英語の両方を処理できる生成 AI 画像ジェネレーターである Tongyi Wanxiang を発売しました。ユーザーは、Alibaba Cloud によって開発された大規模モデルである Composer を使用して画像出力パラメータをカスタマイズできます。チップ大手の Nvidia は、Perfusion AI アート作成ツールを 8 月にデビューさせました。

Categories: IT Info