言語・LLM GPT-4oの異なる音声入力に対する性能を多様な国のデータを用いて評価 GPT-4oというモデルの能力と安全性について評価。異なる音声入力に対するモデルの一貫性や、多様な国のデータを用いた評価が行われています。テキストと音声による説得力も比べられ、特定の条件でモデルが人間と同等かそれ以上の影響力を持つことが示されました。 2024.10.31 言語・LLM論文解説
言語・LLM 【AgentStore】特定タスクに対する最適なエージェントの組み合わせを自動選択 この論文では、多様なエージェントを動的に統合する柔軟なプラットフォーム「AgentStore」について説明しています。これにより、複雑なタスクをより効率的に遂行できるようになりました。この技術は、システム全体の協力能力を高め、特定の問題に対してより適切なアプローチを可能にします。 2024.10.30 言語・LLM論文解説
言語・LLM ポーランド語専用のLLM「Bielik 7B v0.1」が公開! この論文は、ポーランド語専用の大規模言語モデル「Bielik 7B v0.1」の開発と評価について述べています。このモデルは13億のパラメータを持ち、ポーランド語の理解と生成に最適化されています。主なポイントは、高品質なポーランド語テキストの生成を可能にし、教育や自動翻訳、対話システムなど多様なアプリケーションでの利用が期待されています。 2024.10.29 言語・LLM論文解説
論文解説 【Moshi】重複発話や割り込み対応が可能な音声対話モデル!遅延の少ない全二重の対話が実現 この論文では、Moshiというリアルタイム音声対話モデルを提案しています。Moshiは、音声から直接音声を生成する技術を用いることで、自然な会話体験を提供します。従来のモデルでは難しかった重複発話や割り込みへの対応が可能になり、遅延の少ない全二重の対話が実現。 2024.09.24 論文解説音声
言語・LLM 【jina-embeddings-v3】LoRAアダプターを導入し最大8192トークン処理可能に! 多言語対応のテキスト埋め込みモデル「jina-embeddings-v3」を提案。特定のタスクに最適化されたLoRAアダプターを導入し、効率的に高品質な埋め込みを生成できるようになり、多言語データや長文検索タスクでのパフォーマンスが向上し、実用的な利用が可能となっています。 2024.09.23 言語・LLM論文解説
言語・LLM TransformerにCoTを導入することで全ての推論問題を解決できる! この論文では、Transformerに「Chain of Thought(CoT)」を導入することで、従来の並列処理が得意なTransformerに複雑な計算能力を持たせる方法を提案しています。この手法によって、複雑な問題の解決が可能となり... 2024.09.22 言語・LLM論文解説
画像 【BEINGS】ロボットが入力画像から目標地点まで移動するナビゲーション方法 この論文では、ロボットが目標の画像が撮影された場所へ自律的に到達するための新しい手法「BEINGS」を提案しています。BEINGSは3Dガウススプラッティングを用いて未来の視点を予測し、ベイズ更新を組み合わせることで、データに依存せず複雑な環境でも効率的なナビゲーションを可能にしました。 2024.09.21 画像論文解説
言語・LLM 小規模データから十分な知識獲得が可能な継続事前学習がスタンフォード大より提案される この論文は、小規模データから効果的に知識を学ぶための新しい手法「合成継続事前学習」を提案しています。限られたデータでも多様な知識をモデルに学習させ、高精度な質問応答や命令追従が可能になりました。論文:Synthetic continued ... 2024.09.21 言語・LLM論文解説
画像 【OmniGen】画像生成や編集などの多様なタスクを1つのモデルで処理! この論文では、OmniGenという新しい画像生成モデルを提案しています。OmniGenは、従来のモデルが個別に対応していたテキスト生成や画像編集などの多様なタスクを、一つのフレームワークで統一的に処理することを可能にし、追加のモジュールを必要とせず、多様な条件下で効率的かつ柔軟な画像生成が実現。 2024.09.21 画像論文解説
論文解説 【EzAudio】1次元の波形データとDiTで効率かつ高品質な音声を生成! この論文では、テキストから音声を生成する「EzAudio」という新しいモデルを提案。従来のモデルが抱えていた品質や計算コストの課題を克服するため、1次元の波形データを利用した効率的なTransformerモデルを開発し、計算コストを削減して高品質な音声生成が可能となりました。 2024.09.20 論文解説音声