生成AI

論文解説

高速な音声生成TangoFlox!Flox変換とCLAPランク付け最適化

この論文では、高速・効率的な音声生成技術「TangoFlox」を開発。オープンデータセットを活用して柔軟性と音質を向上。流れ変換技術とCLAPランク付け最適化を採用し、高品質な音声生成を実現。
ニュース

生成AI 2024年トレンド発表、ChatGPT圧倒的首位!

生成AIツールの最新ランキングがSHIFT AIから発表。首位は汎用性に優れたChatGPTで、GeminiやClaudeも注目。画像生成ではDALL-E3が人気。各ツールの特長を理解し、目的に合った選択が重要です。
ニュース

インドのAI産業の成長!NVIDIAとスタートアップ10万社

インドがAI超大国に急成長中!NVIDIAのサポートで、インドではAI企業が2,000社以上、開発者は10万人を超えています。2016年の500社未満から、今や10万社のAIスタートアップが活躍中。ベンガルールのCoRover.aiも注目を集めています。
ニュース

急成長する生成AI支出、2024年に138億ドル突破!

Menlo Venturesの調査によれば、米国企業でのAI活用が加速し、生成AIへの支出は2023年23億ドルから2024年には138億ドルへと6倍以上に。企業の競争力向上の鍵としてAIの迅速な導入が重要視されています。
動画

3Dオブジェクトからリアルタイム4Dシーンの生成

3Dオブジェクトを動きのある4Dオブジェクトに変換する新手法を提案しました。この手法は動きを抽出し、4Dシーンをリアルタイムで生成する最適なプロセスを活用。視覚的な品質と動的な表現のバランスが優れており、その優位性を実証しました。
ニュース

Anthropicの新機能「Computer Use」が業界に革命!

AnthropicがAIモデル「Claude 3.5 Sonnet」のアップグレードを発表し、「Computer Use」機能のベータ版を公開。AIがPC操作を自動化可能に!GitLabやCanvaも導入、特にReplitではテスト自動化に活用。業務効率化に期待が高まる新たな技術革新です。
マルチモーダル

視覚タスクのゼロショット学習を刷新する「Explanatory Instructions」

視覚タスクにゼロショット能力を持たせる「Explanatory Instructions」アプローチを提案。指示付き説明で複数タスクに対応、視覚データの汎用性を向上。これにより効率的な機械学習モデルの開発が期待される。
ニュース

OpenAI、「o3」を公開!o1を大きく上回る推論性能

OpenAIが新AIモデル「o3」と「o3ミニ」を発表。o3はプログラミングや数学で従来モデルを大幅に上回る性能を示す。これらのモデルは現在研究者向けに限定提供されている。
ニュース

ChatGPT、Mac用デスクトップアプリとの連携機能を大幅強化

ChatGPTがMac用デスクトップアプリと連携し作業効率化。アプリ内容を直接読み取り質問対応可能。高度な音声モードでリアルタイム支援。
ニュース

ChatGPT、電話とWhatsAppでの利用開始—AIとの対話がさらに身近に

ChatGPTが電話とWhatsAppで利用可能に。電話番号1-800-CHAT-GPTで音声対話。WhatsAppでテキスト対話が可能に。