AI-Papers
最新のAI論文・Newsを追うメディア
  • ホーム
  • 論文解説
    • 言語・LLM
    • 画像
    • 動画
    • 音声
    • 音楽
    • マルチモーダル
    • データセット
    • 強化学習
  • ニュース
    • 技術
    • ビジネス
  • お問い合わせ

強化学習

強化学習

強化学習で新次元に達したDeepSeek-R1の性能がGPT-4超え

事前学習済みモデルに強化学習を適用したDeepSeek-R1-Zeroが、自律的な思考時間調整を実現。さらに、SFTを補完しつつOpenAI GPT-4-1217を超える性能を示し、省資源な推論の可能性を示唆。
2025.03.31
強化学習論文解説
ニュース

アリババ、「Qwen2.5-Max」でAI性能の新時代を切り開く!

Alibabaが新AIモデル「Qwen2.5-Max」をリリース!高度な知能と柔軟な応用能力を備えたこのモデルは、GPT-4oを超える性能を示し、「Qwen Chat」にも統合。AI業界の新たな可能性を切り開きます。
2025.02.06
ニュースビジネス
強化学習

グラフGPTで分子構造の生成や物性予測などの科学技術の問題解決へ

新手法「Graph Generative Pre-trained Transformer(GPT)」が登場!Transformerを使いグラフをシーケンス化し、自己教師付きで事前学習。実験で既存手法を超える性能、強化学習で最適化。科学と工学に革新をもたらす予感!
2025.02.01
強化学習論文解説
AI-Papers
  • ホーム
  • お問い合わせはこちら
© 2025 AI-Papers All Rights Reserved.
    • ホーム
    • 論文解説
      • 言語・LLM
      • 画像
      • 動画
      • 音声
      • 音楽
      • マルチモーダル
      • データセット
      • 強化学習
    • ニュース
      • 技術
      • ビジネス
    • お問い合わせ
  • ホーム
  • トップ