※ AIによる要約
中国のIT大手Alibabaが開発した新たなAIモデル「Qwen2.5-Max」が、2025年1月28日にリリース。
このモデルは、クラウドサービスを提供するAlibaba CloudのAI研究チーム「Qwen」によって開発され、最新のベンチマークテストでGPT-4oやDeepSeek-V3を上回る性能を示しました。
Qwen2.5-Maxは、20兆トークンを超える膨大なデータをもとに事前学習を行った上で、SFTやRLHFを適用してトレーニング。モデルの規模を示すパラメーター数は約1000億に達しており、これにより高精度なタスク処理を実現。例えば、「マインスイーパーのウェブアプリを作成してほしい」という具体的な依頼に対し、実際にプレイ可能なコードを出力するなど、実用的なソリューションを迅速に提供できる能力を誇っています。
ベンチマークテストでは、Qwen2.5-Maxが「DeepSeek-V3」や「Llama 3.1-405B」などのライバルモデルを大きく引き離し、最も高いスコアを記録しました。詳細なグラフによる比較結果も報告されており、「Qwen2.5-Max」は複数のカテゴリで圧倒的な性能を発揮。このモデルは現在、Alibaba CloudのAPIを介して利用可能であり、「Qwen Chat」というチャットAIにも統合されています。
Alibabaによるこの発表は、AI業界における競争の激化を背景に、さらなる発展の兆しを示しています。
Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model
QWEN CHAT API DEMO DISCORDIt is widely recognized that continuously scaling both data size and model size can lead to si...