AIスタートアップHugging FaceとServiceNow Research、ServiceNowのR&D部門は、GitHubのCopilotなどのコード生成AIシステムの無料代替であるStarCoderをリリースしました。
DeepMindのAlphaCode、AmazonのCodeWhisperer、OpenAIのCodexなどのコード生成システムは、計算機プログラミングの領域におけるAIの可能性を示唆するものです。倫理的、技術的、法的な問題がいつか解決され(AIによるコーディングツールが解決するよりもバグやセキュリティの脆弱性を引き起こすことはない)、これらのツールは開発コストを大幅に削減し、コーダーがより創造的なタスクに集中できるようにする可能性があります。
ケンブリッジ大学の調査によると、少なくとも半数の開発者の努力がデバッグに費やされており、これはソフトウェア業界に年間3120億ドルの費用をもたらしています。しかし、現在までに、コード生成AIシステムのほとんどは、それらを構築している組織の商業的なインセンティブを反映して、一握りのものしか公開されていません(Replitを参照)。
一方、StarCoderは、企業を含む誰でもロイヤリティ無料で使用することを許可するライセンスが付与されており、80以上のプログラミング言語やドキュメント、プログラミングノートブックなど、GitHubリポジトリからのテキストをトレーニングしています。StarCoderは、MicrosoftのVisual Studio Codeコードエディタと統合されており、OpenAIのChatGPTのように基本的な指示(例:「アプリUIを作成する」)に従ってコードを作成し、コードに関する質問に回答できます。
Hugging Faceの機械学習エンジニアであり、StarCoderの共同リードであるLeandro von Werraは、StarCoderがCopilotの最初のバージョンを駆動するために使用されたOpenAIのAIモデルに匹敵または優れていると主張しています。
「昨年のStable Diffusionなどのリリースから学んだことの1つは、オープンソースコミュニティの創造性と能力です」とvon WerraはTechCrunchとの電子メールインタビューで語っています。「リリースされた強力なコード生成モデルにより、誰でも自分のユースケースに適合するように微調整し、カスタムアプリケーションを統合することができ、無数のダウンストリームアプリケーションを実現します。」
モデル構築
StarCoderは、昨年末に立ち上げられたHugging FaceとServiceNowの600人以上の人員によるBigCodeプロジェクトの一部であり、コードのための「最先端」のAIシステムを「オープンかつ責任ある」方法で開発することを目的としています。ServiceNowは、512個のNVIDIA V100 GPUからなる一連のコンピューティングクラスタを提供して、StarCoderモデルをトレーニングしました。
BigCode
元記事はこちら