アリババ、「Qwen2.5-Max」でAI性能の新時代を切り開く！

Alibabaの新AIモデル「Qwen2.5-Max」登場
GPT-4oを超える性能と実用的能力
AI業界に技術革新の新機軸

※ AIによる要約

中国のIT大手Alibabaが開発した新たなAIモデル「Qwen2.5-Max」が、2025年1月28日にリリース。

このモデルは、クラウドサービスを提供するAlibaba CloudのAI研究チーム「Qwen」によって開発され、最新のベンチマークテストでGPT-4oやDeepSeek-V3を上回る性能を示しました。

The burst of DeepSeek V3 has attracted attention from the whole AI community to large-scale MoE models. Concurrently, we have been building Qwen2.5-Max, a large MoE LLM pretrained on massive data and post-trained with curated SFT and RLHF recipes. It achieves competitive… pic.twitter.com/oHVl16vfje
— Qwen (@Alibaba_Qwen) January 28, 2025

Qwen2.5-Maxは、20兆トークンを超える膨大なデータをもとに事前学習を行った上で、SFTやRLHFを適用してトレーニング。モデルの規模を示すパラメーター数は約1000億に達しており、これにより高精度なタスク処理を実現。例えば、「マインスイーパーのウェブアプリを作成してほしい」という具体的な依頼に対し、実際にプレイ可能なコードを出力するなど、実用的なソリューションを迅速に提供できる能力を誇っています。

ベンチマークテストでは、Qwen2.5-Maxが「DeepSeek-V3」や「Llama 3.1-405B」などのライバルモデルを大きく引き離し、最も高いスコアを記録しました。詳細なグラフによる比較結果も報告されており、「Qwen2.5-Max」は複数のカテゴリで圧倒的な性能を発揮。このモデルは現在、Alibaba CloudのAPIを介して利用可能であり、「Qwen Chat」というチャットAIにも統合されています。

Alibabaによるこの発表は、AI業界における競争の激化を背景に、さらなる発展の兆しを示しています。