強化学習 強化学習で新次元に達したDeepSeek-R1の性能がGPT-4超え 事前学習済みモデルに強化学習を適用したDeepSeek-R1-Zeroが、自律的な思考時間調整を実現。さらに、SFTを補完しつつOpenAI GPT-4-1217を超える性能を示し、省資源な推論の可能性を示唆。 2025.03.31 強化学習論文解説
ニュース 中国DeepSeek、画期的AIモデルをオープンソース化! 中国のAI企業DeepSeekが革命的な推論モデル「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスでオープンソース化!低コストで高性能なこれらのモデルの登場により、AI産業に新たな競争の波が押し寄せています。NVIDIA株価暴落も影響大。 2025.02.03 ニュース
ニュース 2024年のAI動向を振り返る!GPT-4超え70モデル登場 2024年、AI市場が劇的に進化!GPT-4を超える70のAIモデル登場し、コンテキストウィンドウが大幅に拡張。特にGoogleのGemini 1.5 Proが注目。価格低下で多くの分野での革新が期待されます。 2025.01.07 ニュースビジネス