OpenAIが数学コンペ「First Proof」の全10問にAIモデルで挑戦し、専門家評価で少なくとも5問が正解の可能性ありと判定。研究レベルの定理証明における形式的推論能力の到達点と今後の展望を解説します。
フリーランスになったとたん年収は上がる。しかし「作業者」のままでは5年後にAIと内製化に仕事を奪われる。AI時代を生き抜くフリーランスが実践する「探索(シナプス)戦略」とは何か。
llama.cppの作者Georgi Gerganov氏とGGMLチームがHugging Faceに参加。プロジェクトの独立性・オープンソース方針を維持しつつ、transformersとの統合によりローカルAI推論のワンクリック実行を目指します。
清華大学が提案したSpargeAttention2は、Top-kとTop-pのマスキング限界を理論分析し、ハイブリッド統合と蒸留微調整でアテンション計算を95%削減・16.2倍高速化しながら、既存手法を全指標で上回る生成品質を実現します。
Alibaba X-PLUGのGUIエージェント「GUI-Owl-1.5」がOSWorld 56.5%など20以上のベンチマークでオープンソース最高性能を達成。新強化学習アルゴリズムMRPOとマルチプラットフォーム対応の仕組みを解説します。
2026年2月20日、Hugging FaceとUnslothが連携を発表。Hugging Face Jobs上の無料GPU枠でLLMのファインチューニングが利用可能になり、個人開発者でもゼロコストからモデル訓練を開始できる環境が整った。
UC BerkeleyとTsinghua大学の共同研究「SLA2」が、学習可能なルーターとQATによりビデオ拡散モデルのアテンション計算を97%スパース化しながら18.6倍の高速化と品質向上を同時に実現しました。ICML 2025採択。
GoogleがARC-AGI-2で77.1%を達成した「Gemini 3.1 Pro」を発表。前世代比2倍超の推論性能向上が確認され、API料金は据え置きでGemini APIとVertex AI経由での即日利用が可能となった。
LangGraph・CrewAI・AutoGen・OpenAI Agents SDK・Google ADKを徹底比較。2026年のユースケース別選び方と、MCP対応など最新トレンドをわかりやすく解説します。
2^128サイズのバイナリコードブックを持つ視覚トークナイザー「UniWeTok」が提案されました。従来手法REPA比8分の1以下の33Bトークンで訓練しながらFID 1.38を達成し、画像生成DPGスコア86.63でFLUX.1を上回る性能を示しています。
GoogleがDeepMindの最新AI音楽生成モデル「Lyria 3」をGeminiアプリに統合。テキストや写真から30秒のオリジナル楽曲を生成する機能の詳細と、著作権保護の仕組みを解説します。
拡散トランスフォーマーベースの命令駆動型画像編集システム「FireRed-Image-Edit 1.0」が登場。16億サンプルの大規模データと強化学習を組み合わせ、独自ベンチマークREDEdit-Benchの全15カテゴリで商用システムと同等以上の性能を達成します。
ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線
NVIDIAが日本語特化LLM「Nemotron 2 Nano 9B」を公開 — ソブリンAI実現に向けた性能を解説
Step 3.5 Flashとは?110億パラメータでGPT-5.2級の性能を達成したオープンモデル
Composition-RL: 簡単な問題を組み合わせてLLMの推論力を伸ばす強化学習フレームワーク
India AI Impact Summit — OpenAI・Anthropic・Googleら集結、インドAI投資が加速する全発表まとめ