大規模言語モデル

ニュース

AIの未来を拓く「マルチモデル」時代の幕開け

AI進化の未来は「マルチモデル」、ザック・カス氏が予測。各特化型モデルが共存することで効率と革新を最大化し、AIがより安全で制御しやすい環境に。断片化した市場が新たな可能性を示す。
ニュース

AIによるコード生成の性能向上と課題を探る

データサイエンティストのマックス・ウルフ氏が、AIに「もっといいコードを書いて」と繰り返し要求し、コードの性能を測定。最終的に100倍の高速化を達成も、バグ増加。人間の介入が必要と指摘。
データセット

YouTubeの教育動画データセットで視覚質問の応答性能を向上

この研究では、YouTubeの教育動画を元にしたマルチモーダルデータセットを構築し、音声認識や字幕同期を用いて説明文を生成するパイプラインを開発。提案データセットは視覚質問応答タスクの性能を向上させることに成功。
言語・LLM

自己呼び出し関数の生成能力を測るベンチマークでLLMのコーディング性能向上へ!

自己呼び出し関数生成の新しいベンチマーク「HumanEval Pro」「MBPP Pro」を提案。最新のLLMはこの課題で苦戦中。特に非指示調整型モデルで低精度を示すが、新ベンチマークはエラー削減と評価ツールとして有用。
言語・LLM

LLMの考えすぎを抑え効率性20%向上する手法

LLMの考えすぎ問題がモデルの効率と精度に与える影響を分析し、Reasoning Preference Optimizationで緩和。提案手法により数学テストの精度と効率が約10%-20%向上。o1やQwQ-32Bなどを用い、数学的問題や一般知識に基づくテストを実施。
言語・LLM

埋め込み技術で強化されたロシア語LLMの新成果

ロシア語特化大規模言語モデルの改良法「学習型埋め込み伝播」を提案。埋め込み空間の整合性向上で未学習領域でも高性能を実現。複数ロシア語ベンチマークで優れた結果を確認。
マルチモーダル

医療画像解析マルチモーダルLLMとデータセットMed-MAT

医療画像解析に役立つマルチモーダルLLMの活用が進展中。大規模ラベル付きデータセット「Med-MAT」を構築し、プロンプトエンジニアリングとTransformerモデルで精度向上を実現。医療現場でのAI活用がさらに広がる可能性。
ニュース

Anthropicの新機能「Computer Use」が業界に革命!

AnthropicがAIモデル「Claude 3.5 Sonnet」のアップグレードを発表し、「Computer Use」機能のベータ版を公開。AIがPC操作を自動化可能に!GitLabやCanvaも導入、特にReplitではテスト自動化に活用。業務効率化に期待が高まる新たな技術革新です。
マルチモーダル

視覚タスクのゼロショット学習を刷新する「Explanatory Instructions」

視覚タスクにゼロショット能力を持たせる「Explanatory Instructions」アプローチを提案。指示付き説明で複数タスクに対応、視覚データの汎用性を向上。これにより効率的な機械学習モデルの開発が期待される。
ニュース

Meta、最新AIモデル「Llama 3.3 70B Instruct」

Meta社が700億パラメータの言語モデル「Llama 3.3 70B Instruct」を発表。公開データセットと1,000万件の人間注釈で訓練し、多様なタスクで高性能を実現。英語を中心に30以上の言語をサポートし、コード生成やテキスト生成にも対応。