ニュース OpenAI、新AIベンチマーク「SWE-Lancer」公開! OpenAIがAIの実務力を測定する新ベンチマーク「SWE-Lancer」を公開!1,400以上のタスクに挑戦し、AIは約4500万〜6000万円分を遂行。エンジニア業務の全面代替にはまだ難。GitHubでソースコードをオープン公開中。 2025.02.27 ニュース技術
ニュース ジャック・ドーシー氏、「Goose」発表!AI開発を加速 ジャック・ドーシー氏、新AIエージェント「Goose」発表エンジニア向け効率化機能、多様な拡張性が特徴オープンソース化でAI活用促進、創造性向上に寄与※ AIによる要約決済サービス「Block」を率いるTwitter創業者ジャック・ドーシー... 2025.02.03 ニュース技術
言語・LLM 【SWE-Gym】ソフトウェア開発のシミュレーション学習環境! ソフトウェアエンジニアリングタスクをシミュレーションする学習環境「SWE-Gym」を提案。Transformerを使用し高精度のコード修正を実現。オープンソースで公開され、研究者や開発者が利用可能に! 2025.01.06 言語・LLM論文解説