Cortanaの衰退を示すように、昔のAIアシスタントは期待に応えられないことが明らかです。そして、それらは再構築されています。
Amazonは、Alexa音声アシスタントにpowerを与えるため、OpenAIのGPT-4に似た新しい大きな言語モデルを構築しています。一方、Googleは、Bardと呼ばれるアルゴリズム駆動のチャットボットのようなAIでGoogle Assistantを「supercharge」することを計画していると報じられています。
このパラダイムシフトはビッグテックの領域に限定されていません。スタートアップもますます便利で有用なAIアシスタントの独自バージョンを実現し始めています。
私が見つけた中で最も興味深いものの1つは、あらゆるmacOS、Windows、Linuxマシンで動作するMoemateです。アニメスタイルのアバターという形をとるMoemateは、GPT-4やAnthropicのClaudeなどのモデルの組み合わせによって、ユーザーの質問に最適な回答を提供し、音声化することを目指しています。(「モエ」は、アニメにおけるかわいさを表す日本語の言葉です。)
これは特に斬新なものではありません。ChatGPT、Bard、Bing Chatなど、無数の他のチャットボットもすでに同じように行っています。しかし、Moemateの特徴であるのは、テキストのプロンプトに加えて、PCの画面で実際に何が起こっているかを直接見る能力を持っていることです。
プライバシーのリスクのように聞こえますか?確かにその通りです。Moemateの背後にあるWebaverseは、アシスタントのチャットログと設定をローカルに保存すると主張しています。ただし、プライバシーポリシーには、PCの仕様や一意の識別子など、収集するデータを法的な要求や疑わしい違法行為の調査に使用する権利があることも明記されています。基本的には、あなたが見たり行ったりするすべてのことにこのようなソフトウェアのアクセスを与えることは、最善の場合でもかなりのリスクです。
それにもかかわらず、私は好奇心に駆られて、現在のオープンベータ版であるMoemateを、仕事で提供されたMacノートブックにインストールしました。
無料(現時点では)の早期アクセスプロダクトであるにもかかわらず、Moemateは驚くほど堅牢です。アバターやそのアニメーションからMoemateの合成音声や応答まで、ほとんどすべての体験の側面をカスタマイズすることができます。さらに、カスタムキャラクターモデルを作成してインポートし、他のMoemateユーザーがインポートして使用できる形式でアバターをエクスポートする方法もあります。
Moemateの「パーソナリティ」という言葉によって駆動されるのは、いくつかのテキスト生成モデルのうちの1つです。ユーザーはそれを選択します(たとえば、GPT-4対Claude)。合成音声については、MoemateはElevenLabs、Microsoft Azure、Moemate独自のテキスト読み上げエンジンのいずれかを選択できます。
元記事はこちら