ニュース Inceptionが「Mercury Coder」発表!従来比10倍高速なAIモデル Inceptionが新AIモデル「Mercury Coder」を発表!従来のモデルより最大10倍高速でテキスト生成。画像や動画で使われる拡散型手法を応用し、6秒で出力可能。デモサイトやHugging Faceで試用可能。 2025.03.03 ニュース技術
ニュース Sakana AI、小規模高性能日本語モデル発表! Sakana AIが小規模日本語言語モデル「TinySwallow-1.5B」を発表!最新の知識蒸留技術「TAID」を活用し、同規模モデル中で最高性能を達成。スマホやPCでも使用可能で、オフライン対応版も提供中! 2025.02.11 ニュース
強化学習 エージェント支援の科学実験フレームワーク「Boxing Gym」 科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。 2025.02.01 強化学習論文解説
言語・LLM 生成回答を改善する自己修正手法「ProgCo」の効果やいかに 言語モデルの能力向上手法としてProgCoを提案。プログラムで生成された回答を検証・改善するプロセスを導入し、実験でGPT-3.5やGPT-4の性能を向上。自己修正で言語モデルの有用性を強化。 2025.01.15 言語・LLM論文解説
言語・LLM 埋め込み技術で強化されたロシア語LLMの新成果 ロシア語特化大規模言語モデルの改良法「学習型埋め込み伝播」を提案。埋め込み空間の整合性向上で未学習領域でも高性能を実現。複数ロシア語ベンチマークで優れた結果を確認。 2025.01.06 言語・LLM論文解説