大規模言語モデル

ニュース

OpenAI、新AI「GPT-4.5」発表!対話力と創造性が飛躍

OpenAIが「GPT-4.5」を公開!最大の会話モデルで、直感的な対話と創造的ライティングに期待大。ChatGPT Proユーザー向けに提供開始、教師なし学習がAI発展の基盤に。計算リソースに注意が必要です。
ニュース

Perplexity、新AI「Sonar」発表!GPT-4o超えの実力

Perplexity AIが最新AIモデル「Sonar」発表!Llama 3.3 70Bを基に開発され、速度と正確性で他モデルを凌駕。Perplexity Pro向けに使用でき、AI検索の競争を加速させる注目の技術です。
ニュース

ジャック・ドーシー氏、「Goose」発表!AI開発を加速

ジャック・ドーシー氏、新AIエージェント「Goose」発表エンジニア向け効率化機能、多様な拡張性が特徴オープンソース化でAI活用促進、創造性向上に寄与※ AIによる要約決済サービス「Block」を率いるTwitter創業者ジャック・ドーシー...
ニュース

AIの未来を拓く「マルチモデル」時代の幕開け

AI進化の未来は「マルチモデル」、ザック・カス氏が予測。各特化型モデルが共存することで効率と革新を最大化し、AIがより安全で制御しやすい環境に。断片化した市場が新たな可能性を示す。
ニュース

AIによるコード生成の性能向上と課題を探る

データサイエンティストのマックス・ウルフ氏が、AIに「もっといいコードを書いて」と繰り返し要求し、コードの性能を測定。最終的に100倍の高速化を達成も、バグ増加。人間の介入が必要と指摘。
データセット

YouTubeの教育動画データセットで視覚質問の応答性能を向上

この研究では、YouTubeの教育動画を元にしたマルチモーダルデータセットを構築し、音声認識や字幕同期を用いて説明文を生成するパイプラインを開発。提案データセットは視覚質問応答タスクの性能を向上させることに成功。
言語・LLM

自己呼び出し関数の生成能力を測るベンチマークでLLMのコーディング性能向上へ!

自己呼び出し関数生成の新しいベンチマーク「HumanEval Pro」「MBPP Pro」を提案。最新のLLMはこの課題で苦戦中。特に非指示調整型モデルで低精度を示すが、新ベンチマークはエラー削減と評価ツールとして有用。
言語・LLM

LLMの考えすぎを抑え効率性20%向上する手法

LLMの考えすぎ問題がモデルの効率と精度に与える影響を分析し、Reasoning Preference Optimizationで緩和。提案手法により数学テストの精度と効率が約10%-20%向上。o1やQwQ-32Bなどを用い、数学的問題や一般知識に基づくテストを実施。
言語・LLM

埋め込み技術で強化されたロシア語LLMの新成果

ロシア語特化大規模言語モデルの改良法「学習型埋め込み伝播」を提案。埋め込み空間の整合性向上で未学習領域でも高性能を実現。複数ロシア語ベンチマークで優れた結果を確認。
マルチモーダル

医療画像解析マルチモーダルLLMとデータセットMed-MAT

医療画像解析に役立つマルチモーダルLLMの活用が進展中。大規模ラベル付きデータセット「Med-MAT」を構築し、プロンプトエンジニアリングとTransformerモデルで精度向上を実現。医療現場でのAI活用がさらに広がる可能性。