言語モデル

Inceptionが「Mercury Coder」発表！従来比10倍高速なAIモデル

Inceptionが新AIモデル「Mercury Coder」を発表！従来のモデルより最大10倍高速でテキスト生成。画像や動画で使われる拡散型手法を応用し、6秒で出力可能。デモサイトやHugging Faceで試用可能。

2025.03.03

ニュース技術

Sakana AIが小規模日本語言語モデル「TinySwallow-1.5B」を発表！最新の知識蒸留技術「TAID」を活用し、同規模モデル中で最高性能を達成。スマホやPCでも使用可能で、オフライン対応版も提供中！

2025.02.11

ニュース

科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。

2025.02.01

強化学習論文解説

言語モデルの能力向上手法としてProgCoを提案。プログラムで生成された回答を検証・改善するプロセスを導入し、実験でGPT-3.5やGPT-4の性能を向上。自己修正で言語モデルの有用性を強化。

2025.01.15

言語・LLM論文解説

ロシア語特化大規模言語モデルの改良法「学習型埋め込み伝播」を提案。埋め込み空間の整合性向上で未学習領域でも高性能を実現。複数ロシア語ベンチマークで優れた結果を確認。

2025.01.06

言語・LLM論文解説