📝 本日のニュース概要
2026年4月、Qwenチームから最新モデル「Qwen3.6-35B-A3B」が突如リリースされました。総パラメータ35Bに対し、アクティブパラメータをわずか3Bに抑えたMoE(Mixture of Experts)構成により、RTX 4090単体で驚異的なフルコンテキスト動作を実現。RedditやHacker Newsでは、そのエージェント性能が「Claude 4.7 Opus」を凌駕するとの報告も飛び出し、ローカルLLM界隈に激震が走っています。量子化KVキャッシュを用いたメモリ最適化の極意から、最新CUDA 13.2での不具合報告、そしてMac vs RTX 4090の「統一メモリ論争」まで、現場のリアルな熱量を主任リサーチャーが深掘りします。
2026年4月13日にお伝えした「Qwen3.5-27B」の熱狂からわずか数日、Qwenチームはさらなる爆弾を投下しました。最新のMoE(Mixture of Experts)モデル『Qwen3.6-35B-A3B』のリリースです。このモデルは、総パラメータ数350億(35B)でありながら、推論時に動くアクティブパラメータを30億(3B)に絞り込むことで、驚異的な推論速度と省メモリ性能を両立させています。
【技術的衝撃:RTX 4090で「25万トークン」の壁を突破】
今回のリリースの最大の焦点は、コンシューマー向けハイエンドGPUである「RTX 4090(24GB VRAM)」での動作性能です。Hacker Newsの報告によれば、llama.cppを使用し、量子化KVキャッシュ(-ctk q8_0 -ctv q8_0)を適用することで、15万トークンから最大25万トークンのコンテキストを、メインメモリへのオフロードなしにVRAM内だけで処理できることが確認されました。これまでこのクラスのコンテキスト処理にはMac Studio等の高価な統一メモリ環境が必須とされてきましたが、Qwen3.6-35B-A3Bはその常識を覆しました。
【実用性の評価:Claude 4.7 Opus超えの衝撃】
著名な開発者Simon Willison氏は、SVG生成テストにおいて、このモデルが「Claude 4.7 Opusよりも正確に、自転車に乗るペリカンを描画した」と報告し、大きな話題となっています。また、エージェントとしてのコーディング能力も極めて高く、SWE-bench Verifiedで73.4を記録。これは商用モデルの「Haiku 4.5」を上回るスコアです。Redditのユーザーからは「Qwen3.5 27B(Denseモデル)よりもエージェントとしての思考が柔軟で、複雑なツール呼び出しのループに耐えられる」との評価が相次いでいます。
【Reddit等での激しい議論と現場の課題】
一方で、コミュニティではいくつかの深刻な課題も議論されています。
1. **CUDA 13.2の呪い**: 最新のCUDA 13.2環境下で、IQ4_XS量子化などの特定のGGUFモデルを実行すると、出力が文字化け(gibberish)する致命的なバグが報告されています。これはNVIDIAのコンパイラ側の問題と見られていますが、多くのユーザーがダウングレードを余儀なくされています。
2. **Unslothの「バグと修正」のループ**: ローカル学習・量子化の旗手であるUnslothチームが、リリース当日に何度も量子化ファイルを再アップロードする事態が発生しました。これに対し、「QAが不十分」との批判が出る一方で、Unsloth側は「llama.cpp側の20以上のバグ修正に対応するためで、我々のせいではない」と応戦。ローカルAI開発のスピード感が、安定性を置き去りにしている現状が浮き彫りになっています。
3. **統一メモリ(Mac)vs 専用VRAM(NVIDIA)**: 「統一メモリはマーケティングギミックだ」と主張するNVIDIA派と、「128GB以上のメモリを手軽に扱えるMacこそが正義」とするApple派の対立が再燃しています。しかし、今回のQwen3.6が16GB〜24GBのGPUで「まともに動く」ことで、GPU派が勢いを取り戻している印象です。
【今後の展望】
Qwen3.6-35B-A3Bは、ローカルエージェントの「標準OS」的な地位を確立する可能性があります。特に、APIコストを気にせず数百万ドキュメントをバッチ処理する用途や、プライバシーが重視される医療・金融分野での「オンプレミス・エージェント」としての需要は計り知れません。Qwenチームは今後、さらに小型の9Bモデルや、フラッグシップとなる397Bモデルのリリースも示唆しており、2026年のオープンウェイト市場は完全にQwenが支配する構えを見せています。
🔗 情報ソース・引用元
※この記事は、Geek Terminalの自律型AIパイプラインによって自動生成・配信されています。
📺 映像と音声でサクッとチェックしたい方は
Geek Terminal 公式YouTubeチャンネルへ!

コメント