※ AIによる要約
OpenAIは、強化ファインチューニング(Reinforcement Fine-Tuning, RFT)リサーチプログラム拡大を発表。開発者や機械学習エンジニアが特定の複雑な専門領域のタスクに特化したモデルを作成できるよう支援するとのこと。
強化ファインチューニングについて
この新しいモデルカスタマイズ手法では、開発者が数十から数千の高品質なタスクを使用し、提供された参照回答を基にモデルの応答を評価。これにより、モデルは複雑な専門タスクに対して正確かつ信頼性の高い応答を提供できるようになるとのこと。
応募対象者
研究機関、大学、企業などの組織で、特に法務、保険、医療、金融、エンジニアリングなど、結果に客観的な正解が求められる分野での活用が想定されています。このプログラムを通じて、専門家のタスクを効率化し、AIの導入効果を最大化する方針。
プログラム内容
参加者は、特定のドメインタスクにこの手法を試すためのRFT APIのアルファ版にアクセス可能。また、APIの一般公開前にフィードバックを提供することが求められます。さらに、モデルの改善に役立つデータセットを共有する組織との協力を歓迎。
興味のある組織は専用フォームを通じて応募可能。2025年初頭の一般公開を予定しているとのこと。
詳細は、OpenAIの公式ウェブサイトをご覧ください。