シリコンバレーのすべてを自動化しようとする情熱はとどまるところを知らず、その最新の傾向が説明されるのは、最新の人工知能モデルを活用して、ソフトウェアやオンラインサービスに干渉するAuto-GPTです。
本質的には、Auto-GPTは、OpenAIの最新のAIモデルの柔軟性を活用して、XやYなどのタスクを「自律的に」実行できるようにする、オンライン上のソフトウェアやサービスとやり取りする仕組みを持っています。しかし、多大な言語モデルの学習により、この能力は海よりも広く、水たまりよりも深いように見えます。
Auto-GPTは、オープンソースアプリで、ゲーム開発者Toran Bruce Richardsが作成し、主にGPT-3.5およびGPT-4など、OpenAIのテキスト生成モデルを使用して「自律的に」動作する仕組みを持っています。
その自立性には魔法はありません。Auto-GPTは、OpenAIのモデルの最初のプロンプトのフォローアップを単に処理し、それらに問い合わせ、回答することで、タスクが完了するまで処理します。
Auto-GPTは、基本的には、使用者が目標を伝え、その目標を達成するために必要な手順をすべて実行するために、GPT-3.5およびGPT-4を伴うコンパニオンボットと一緒に動作します。
GPT-3.5およびGPT-4は、指示された動作を処理するために使用されます。Auto-GPTは、ウェブブラウザーやワードプロセッサーのようなオンラインやローカルのアプリ、ソフトウェア、サービスとやり取りできるため、例えば「私の花ビジネスを育てるために助けてくれ」というプロンプトが与えられた場合、Auto-GPTは、比較的妥当な広告戦略を開発し、基本的なウェブサイトを構築することができます。
Auto-GPTを試したソフトウェア開発者のJoe Koen氏は、TechCrunchに電子メールで説明し、「Auto-GPTはchatbot向けのAIモデルであるChatGPTなどを使っての質問・回答のやりとりによって必要な、複数のステップを自動化するように設計されています。」と述べています。
使用者は、ターミナル上でAuto-GPTのエージェント名、役割、目的を定義し、その目的を達成するための最大5つの方法を指定します。例えば:
- Name: Smartphone-GPT
- Role: An AI designed to find the best smartphone
- Objective: Find the best smartphones on the market
- Goal 1: Do market research for different smartphones on the market today
- Goal 2: Get the top five smartphones and list their pros and cons
裏側で、Auto-GPTは、タスクを実行するためにメモリ管理などの機能に頼り、テキスト生成、ファイルストレージ、サマリーゼーションにはGPT-4とGPT-3.5が必要となります。
また、Auto-GPTは、例えば電話を「かける」ことができるElevenLabsなどの音声合成器に接続することもできます。
Auto-GPTはGitHubで公開されていますが、起動するにはいくつかのセットアップとノウハウが必要です。使用するには、Auto-GPTをDockerなどの開発環境にインストールし、OpenAIのAPIキーで登録する必要があります。APIキーには有料のOpenAIアカウントが必要です。
それでも、Auto-GPTは、一部の単調なタスクをボットに委任するのに適した早期採用者によ
元記事はこちら