OpenAIは2025年1月28日、政府機関向けにカスタマイズされた「ChatGPT Gov」を発表。 この新サービスは、政府機関の高度なセキュリティ要件を満たすよう設計されており、アメリカ政府専用のAzure環境でセル […]
2025年1月20日、中国のAI企業DeepSeekは、推論モデル「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開。 DeepSeekが注目を集める理由の一 […]
決済サービス「Block」を率いるTwitter創業者ジャック・ドーシー氏が、独自のオープンソースAIエージェント「Goose」を発表。「Goose」は、エンジニア向けのタスクを自律的にこなすアシスタントとして設計されて […]
画像生成AI「Flux Pro 1.1」を活用したAIロゴジェネレーター「Logo-creator.io」が、新たに公開され話題を呼んでいます。 このサービスは、オープンソースの生成AIモデル構築プラットフォームであるT […]
Transformerの注意機構を再設計する新手法「Tensor Product Attention(TPA)」を解説。テンソル分解によりKVキャッシュのメモリ使用量を大幅削減し、モデルの軽量化を実現する仕組みを紹介します。
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 Baichuan-Omni-1.5は、画像と音声、そしてテキストを処理するために統合的なアーキテクチャを用いたモデ […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文は、LLMの応答を安全かつ説得力ある形で制御する新手法としてGuardReasonerを提案している。この手 […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 論文「METAGENE-1: Metagenomic Foundation Model for Pandemic […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、LLM(大規模言語モデル)のパーソナライゼーション性能を向上させるための手法「Personalize […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文では、新しいフレームワーク「Dispider」を提案し、動画とLLMを統合してリアルタイムでの対話を可能にす […]
AIモデルの推論を「System-1(直感的回答生成)」と「System-2(論理的チェック)」に分けて統合するフレームワークを解説。柔軟な推論制御で回答の精度と効率を両立する仕組みを紹介します。
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文では、LLM(大規模言語モデル)の数学的推論能力を向上させる新しいアプローチ「BoostStep」が提案され […]
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル