高品質なデータは高品質なAIの鍵になるかもしれない。データセットのキュレーションがAIモデルのパフォーマンスに本当に影響を与えることが研究からわかっており、データセットの管理プラクティスへの注目が高まっています。一部の調査によると、現在のAI研究者はデータの準備や整理の作業に多くの時間を費やしています。
Vahan PetrosyanとTigran Petrosyan兄弟は、大学でアルゴリズムのトレーニング中に多くのデータを管理しなければならない苦労を感じました。Vahanは、画像セグメンテーションのPh.D.研究中にデータ管理ツールを作成するほどまで行きました。
数年後、Vahanは、開発者や企業が喜んで同様のツールを購入するだろうと気づきました。そこで、兄弟はSuperAnnotateという会社を設立しました。
Vahanは、声明で「2023年の革新の爆発に伴い、モデルや多モダルAIに関する必要性が一層高まり、各組織が専門化されたデータを必要とする複数のユースケースを抱えるようになりました。現代のAIトレーニングデータ向けの、スイスアーミーナイフのような使いやすい低コードプラットフォームを構築する機会があると考えました」と述べました。
SuperAnnotateのプラットフォームでは、ユーザーはローカルソースやクラウドからデータを接続し、チームメイトと共同でデータプロジェクトを作成できます。ダッシュボードから、ユーザーはトレーニングに使用されたデータによってモデルのパフォーマンスを比較し、準備ができたらそれらのモデルをさまざまな環境に展開できます。
SuperAnnotateはまた、企業にデータアノテーションタスクのためのクラウドソーシングワーカーへのアクセスを提供します。アノテーションは通常、モデルがトレーニングするデータの意味や部分をラベリングするテキストの断片であり、モデルが物事、場所、アイデアを区別するためのガイドポストとして機能します。
正直に言って、ここには、SuperAnnotateが使用するデータアノテーターに関する複数のRedditスレッドがあり、それらは批判的ではありません。アノテーターはコミュニケーションの問題、不明確な期待、低い給与などについて不満を述べています。
SuperAnnotateは自社が適正な市場価格を支払っており、アノテーターに対する要求が業界の慣習から外れているわけではないと主張しています。当社は、実践に関するより詳細な情報を提供するよう依頼し、回答があればこの記事を更新します。
AIデータ管理の領域には、Scale AI、Weka、Dataloopなどのスタートアップなど、いくつかの競合他社が存在しています。サンフランシスコを拠点とするSuperAnnotateは、最近、Socium Ventures主導のシリーズBラウンドでNvidia、Databricks Ventures、Play Time Ventures、Defy.vcから出資を受けた3,600万ドルを調達し、それなりに立ち回っています。
この新たな資金は、SuperAnnotateの合計調達額を約5300万ドルに引き上げ、現在の約100人のチームの拡充、製品R&D、およびおよそ100社の顧客基盤の拡大に使用されます。
Vahanは「企業の変化するニーズに完全に適合し、データ微調整の幅広いカスタマイズを提供するプラットフォームを構築することを目指しています」と述べました。
元記事はこちら