AI分野のダークホース、Z.aiが再び波紋を広げています!新たに発表されたGLM-4.5およびGLM-4.5-Airモデルは、そのパラメータ規模で注目を集めるだけでなく、革新的な「ハイブリッド推論モード」と、いくつかの権威あるベンチマークテストでの驚異的なパフォーマンスにより、複雑なエージェントAIアプリケーション分野における強力な野心を宣言しています。
人工知能の競争は決して止まることはなく、誰もが大手企業のモデルについて議論している最中、Z.aiの研究開発チームが爆弾を投下しました。彼らはGLMシリーズの2つの新しいメンバー、GLM-4.5とGLM-4.5-Airを正式に発表しました。これは単なる定期的なアップデートではなく、技術的な飛躍の宣言のようなものです。
これらの2つのモデルは、設計当初から目標が非常に明確でした。トップクラスの推論、コード生成、AIエージェント能力を単一のモデルに統合し、ますます複雑化するアプリケーションシナリオに対応することです。AIエージェントアプリケーションが急速に台頭しているこの時代において、この一手は特に重要です。
二人の英雄の登場:単なるパラメータの積み重ねではない
新しいモデルについて語るとき、パラメータの規模は常に避けられない話題です。しかし、GLM-4.5ファミリーは、賢いアーキテクチャが単なる数字よりも重要であることを教えてくれます。
- GLM-4.5: ファミリーのトップフラッグシップとして、合計3550億のパラメータと320億のアクティブパラメータを誇ります。これは、非常に深い知識ベースと複雑な問題を処理する能力を持っていることを意味します。
- GLM-4.5-Air: これはより軽量で効率的なバージョンで、合計1060億のパラメータと120億のアクティブパラメータを持っています。その存在は、パフォーマンスと効率の完璧なバランスを見つけ、より多様なアプリケーションシナリオに適応するためです。
「アクティブパラメータ」とは何か、と尋ねるかもしれません。それは人の脳のようなものです。膨大な情報を保存していますが、特定の問題について考えるときは、最も関連性の高い部分のみを動員します。このMixture-of-Experts(MoE)アーキテクチャにより、モデルは強力な能力を維持しながら、計算効率が高く、応答も速くなります。
思考と思考の間:ハイブリッド推論モードの革新
これはおそらく、GLM-4.5シリーズの最もエキサイティングな革新点です。これまで、私たちはモデルの「思考の深さ」と「反応速度」の間でトレードオフを迫られることがよくありました。しかし、GLM-4.5はハイブリッド推論モードを導入し、モデルが問題の難易度に応じて、人のように自動的に動作モードを切り替えることを可能にしました。
- 思考モード(Thinking mode): 複数ステップの推論、計画、または外部ツール(データの検索、コードの実行など)の使用を必要とする複雑なタスクに遭遇すると、モデルはこのモードに入ります。それは「立ち止まって考え」、戦略を立て、高品質で深みのある答えを提供することを保証します。
- 非思考モード(Non-thinking mode): 簡単で直接的な質問と回答に対して、モデルはこのモードに切り替わり、遅延なくリアルタイムで迅速な応答を提供します。
この設計の利点は明らかです。深さと速度の両方を考慮し、ユーザーがどのシナリオでも最高のエクスペリエンスを得られるようにします。
実力は本物:主要なベンチマークテストを席巻
これだけ話して、実際のパフォーマンスはどうなのでしょうか?データは常に最も強力な証拠です。公式に発表されたベンチマークテストのチャートから判断すると、GLM-4.5デュオのパフォーマンスは「驚異的」としか言いようがありません。
一つずつ分析してみましょう:
- TAU-Bench(小売シナリオ): 実際の小売会話をシミュレートするこのテストでは、GLM-4.5(79.7ポイント)とGLM-4.5-Air(77.9ポイント)のパフォーマンスは非常に印象的で、業界トップのモデルに匹敵し、他の有名なモデルを大きく引き離しています。
- TAU-Bench(航空シナリオ): このシナリオもモデルの専門分野の会話能力をテストします。興味深いことに、より軽量な**GLM-4.5-Air(60.8ポイント)**は、このプロジェクトで「兄貴分」のGLM-4.5(60.4ポイント)をわずかに上回り、両方ともリストのトップを占め、その優れた効率とパフォーマンスを示しました。
- BFCL-v3(マルチターン対話): このテストは真のハイライトです。これは、AIエージェントの中核である、長く、複数ターンの会話における文脈理解と論理的一貫性を維持するモデルの能力を特に評価します。このプロジェクトでは、GLM-4.5(64.3ポイント)とGLM-4.5-Air(61.9ポイント)が圧勝し、他のすべての競合他社を大きく引き離しました。これは、複雑なエージェントタスクを実行する上での彼らの巨大な可能性を強く証明しています。
即時体験とオープンソース:コミュニティの力を受け入れる
Z.aiチームは、偉大なモデルには活発なコミュニティが必要であることを知っています。したがって、彼らは誰もがGLM-4.5シリーズを体験し、使用するためのさまざまな方法を提供しています:
- オンライン体験: Z.aiの公式サイトまたはBigModel.cnプラットフォームに直接アクセスして、新しいモデルの力を自分で体験できます。
- オープンソースの重み: 開発者や研究者にとって、最大のニュースはこれです。GLM-4.5とGLM-4.5-Airのモデルの重みは、Hugging FaceとModelScopeで公開されており、誰でもダウンロードして自分のプロジェクトにデプロイできます。
このオープンな姿勢は、間違いなくGLM-4.5エコシステムの発展を大幅に加速させ、より創造的なアプリケーションを生み出すでしょう。
よくある質問(FAQ)
Q1:GLM-4.5とGLM-4.5-Airのどちらを選ぶべきですか?
A: それはあなたのニーズによります。最も強力なパフォーマンスを追求し、非常に複雑な推論タスクを処理する必要がある場合は、より多くのパラメータを持つGLM-4.5が最初の選択肢です。効率と応答速度をより重視する場合、またはリソースが限られた環境でデプロイする必要がある場合は、GLM-4.5-Airが比類のない価格性能比を提供します。
Q2:「ハイブリッド推論モード」は一般ユーザーにとって何を意味しますか?
A: 簡単に言えば、AIに質問するときに「考えすぎる」または「考えが浅すぎる」と心配する必要はもうありません。モデルは自動的に質問の難易度を判断します。簡単な質問をすれば、数秒で答えます。複雑な質問をすれば、専門家のように深く考えてから信頼できる答えをくれます。体験は非常にスムーズです。
Q3:私は開発者ですが、これらのモデルはどこで入手できますか?
A: モデルは複数のチャネルから入手できます。最も直接的な方法は、Hugging FaceのZ.aiページにアクセスすることです。そこには、GLM-4.5とGLM-4.5-Airの完全なモデルの重みがダウンロード可能です。同時に、Z.aiおよびBigModel.cnプラットフォームでAPIを介して呼び出すこともできます。


