>Deasieは、企業がテキスト生成AIモデルに対してより多くの制御を与えるためのツールを開発するスタートアップであり、Y Combinator、General Catalyst、RTP Global、Rebel Fund、J12 Venturesの参加により、シードラウンドで290万ドルの資金調達を発表しました。
Deasieの創設者であるリース・グリフィス、ミッコ・ペイポネン、レオ・プラッツァーは以前、McKinseyでデータガバナンスツールを共同で開発しました。彼らは、McKinseyで企業データガバナンスに関する「重大な問題」とチャンスを観察したと述べており、これらの問題が会社の生成AIの採用能力にどのように影響を与えるかを具体的に示しました。
彼らだけではありません。最近のIDCの調査では、大企業の900人以上の幹部に対して行われ、86%がより多くのガバナンスが必要であるとし、生成AIインサイトの「品質と信頼性」を保証するために必要な方法について明確な問題があることがわかりました。調査の回答者のうち30%は、現在の生成AIを活用するために「非常に準備ができている」と感じていると述べています。
大規模言語モデル(LLM)(例:OpenAIのGPT-4)をより信頼性の高いものにするために、Deasieチームは、ドキュメント、レポート、メールなどの非構造化企業データに接続し、その内容と機密性に基づいて自動的に分類する製品を開発しました。
例えば、Deasieはレポートに自動的に「個人を特定できる情報」または「所有権情報」というタグを付け、それがレポートの3番目のバージョンであることを示すかもしれません。また、仕様書に「所有権情報」というタグを付け、そのシートのアクセス権が制限されていることを強調するかもしれません。Deasieの顧客は、データの分類と整理のアプローチを反映するためにタグとラベルを定義し、これによりDeasieのアルゴリズムが将来のデータをどのように分類するかを「学ばせる」ことができます。
Deasieがドキュメントに自動的にタグを付けた後、プラットフォームはタグのライブラリを処理し、その関連データを全体的な関連性と重要性の観点で評価します。その評価に基づいて、テキスト生成モデルに「供給」するデータを決定します。
「企業は、データガバナンスの観点からほとんど注意を払われていない非構造化データの膨大な量を持っています」とグリフィスは述べています。「言語モデルが意味のない回答を返したり、機密情報にアクセスしたりする可能性は、データの量と共にスケールする。Deasieは、エンタープライズ全体の数千のドキュメントをフィルタリングし、生成AIアプリケーションに供給されるデータが関連性が高く、高品質で安全に使用できるように確保するインテリジェントなプラットフォームです。」
Deasieは興味深いプラットフォームです。検証済みのデータにLLMを制限するという考えは悪くないものです-特に古くなった情報や相反する情報にLLMを自由にさせることの結果として考えればそのように思えます。ただし、Deasieのアルゴリズムがデータを一貫して分類するかどうか、プラットフォームが文書の重要性を正しく評価するかどうかについては疑問です。
Deasieのデモを見せている企業は、少なくともいくつかの満足度に対してこれらの質問に答える必要があります。グリフィスは、3人の従業員しかいないDeasieがアメリカの「数十億ドル」の企業と最初の試験導入の契約を結んだと述べ、「フォーチュン500社を含む30以上の企業顧客のパイプラインを持っている」と付け加えました。
「他の製品は、厳密には『データの安全性』の側面または『構造化データのデータガバナンス』の側面に焦点を当てたものでした。Deasieは非構造化データのデータ品質と関連性を計測するための良いアプローチが存在しなかった…全ての生成AIのユースケースに対して可能な限り最適なデータセットをマッチングする問題を直接解決する製品は存在しませんでした。Deasieは、この領域で新しいアプローチを開発しました。」
次の数か月で、Deasieはエンジニアリングチームを拡大し、「複数の人員を採用する」予定であり、Unstructured.io、Scale AI、Collibra、Alationなどの競合他社との差別化機能の構築に焦点を当てる予定です。
元記事はこちら