言語モデル

ニュース

Inceptionが「Mercury Coder」発表!従来比10倍高速なAIモデル

Inceptionが新AIモデル「Mercury Coder」を発表!従来のモデルより最大10倍高速でテキスト生成。画像や動画で使われる拡散型手法を応用し、6秒で出力可能。デモサイトやHugging Faceで試用可能。
ニュース

Sakana AI、小規模高性能日本語モデル発表!

Sakana AIが小規模日本語言語モデル「TinySwallow-1.5B」を発表!最新の知識蒸留技術「TAID」を活用し、同規模モデル中で最高性能を達成。スマホやPCでも使用可能で、オフライン対応版も提供中!
強化学習

エージェント支援の科学実験フレームワーク「Boxing Gym」

科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。
言語・LLM

生成回答を改善する自己修正手法「ProgCo」の効果やいかに

言語モデルの能力向上手法としてProgCoを提案。プログラムで生成された回答を検証・改善するプロセスを導入し、実験でGPT-3.5やGPT-4の性能を向上。自己修正で言語モデルの有用性を強化。
言語・LLM

埋め込み技術で強化されたロシア語LLMの新成果

ロシア語特化大規模言語モデルの改良法「学習型埋め込み伝播」を提案。埋め込み空間の整合性向上で未学習領域でも高性能を実現。複数ロシア語ベンチマークで優れた結果を確認。