【衝撃】Qwen3.6-35B-A3Bがリリース！RTX 4090で「25万トークン」を飲み込むローカルエージェントの怪物を徹底解剖

📝 本日のニュース概要
1. 🔗 情報ソース・引用元

📝 本日のニュース概要

2026年4月、Qwenチームから最新モデル「Qwen3.6-35B-A3B」が突如リリースされました。総パラメータ35Bに対し、アクティブパラメータをわずか3Bに抑えたMoE（Mixture of Experts）構成により、RTX 4090単体で驚異的なフルコンテキスト動作を実現。RedditやHacker Newsでは、そのエージェント性能が「Claude 4.7 Opus」を凌駕するとの報告も飛び出し、ローカルLLM界隈に激震が走っています。量子化KVキャッシュを用いたメモリ最適化の極意から、最新CUDA 13.2での不具合報告、そしてMac vs RTX 4090の「統一メモリ論争」まで、現場のリアルな熱量を主任リサーチャーが深掘りします。

2026年4月13日にお伝えした「Qwen3.5-27B」の熱狂からわずか数日、Qwenチームはさらなる爆弾を投下しました。最新のMoE（Mixture of Experts）モデル『Qwen3.6-35B-A3B』のリリースです。このモデルは、総パラメータ数350億（35B）でありながら、推論時に動くアクティブパラメータを30億（3B）に絞り込むことで、驚異的な推論速度と省メモリ性能を両立させています。

【技術的衝撃：RTX 4090で「25万トークン」の壁を突破】
今回のリリースの最大の焦点は、コンシューマー向けハイエンドGPUである「RTX 4090（24GB VRAM）」での動作性能です。Hacker Newsの報告によれば、llama.cppを使用し、量子化KVキャッシュ（-ctk q8_0 -ctv q8_0）を適用することで、15万トークンから最大25万トークンのコンテキストを、メインメモリへのオフロードなしにVRAM内だけで処理できることが確認されました。これまでこのクラスのコンテキスト処理にはMac Studio等の高価な統一メモリ環境が必須とされてきましたが、Qwen3.6-35B-A3Bはその常識を覆しました。

【実用性の評価：Claude 4.7 Opus超えの衝撃】
著名な開発者Simon Willison氏は、SVG生成テストにおいて、このモデルが「Claude 4.7 Opusよりも正確に、自転車に乗るペリカンを描画した」と報告し、大きな話題となっています。また、エージェントとしてのコーディング能力も極めて高く、SWE-bench Verifiedで73.4を記録。これは商用モデルの「Haiku 4.5」を上回るスコアです。Redditのユーザーからは「Qwen3.5 27B（Denseモデル）よりもエージェントとしての思考が柔軟で、複雑なツール呼び出しのループに耐えられる」との評価が相次いでいます。

【Reddit等での激しい議論と現場の課題】
一方で、コミュニティではいくつかの深刻な課題も議論されています。
1. **CUDA 13.2の呪い**: 最新のCUDA 13.2環境下で、IQ4_XS量子化などの特定のGGUFモデルを実行すると、出力が文字化け（gibberish）する致命的なバグが報告されています。これはNVIDIAのコンパイラ側の問題と見られていますが、多くのユーザーがダウングレードを余儀なくされています。
2. **Unslothの「バグと修正」のループ**: ローカル学習・量子化の旗手であるUnslothチームが、リリース当日に何度も量子化ファイルを再アップロードする事態が発生しました。これに対し、「QAが不十分」との批判が出る一方で、Unsloth側は「llama.cpp側の20以上のバグ修正に対応するためで、我々のせいではない」と応戦。ローカルAI開発のスピード感が、安定性を置き去りにしている現状が浮き彫りになっています。
3. **統一メモリ（Mac）vs 専用VRAM（NVIDIA）**: 「統一メモリはマーケティングギミックだ」と主張するNVIDIA派と、「128GB以上のメモリを手軽に扱えるMacこそが正義」とするApple派の対立が再燃しています。しかし、今回のQwen3.6が16GB〜24GBのGPUで「まともに動く」ことで、GPU派が勢いを取り戻している印象です。

【今後の展望】
Qwen3.6-35B-A3Bは、ローカルエージェントの「標準OS」的な地位を確立する可能性があります。特に、APIコストを気にせず数百万ドキュメントをバッチ処理する用途や、プライバシーが重視される医療・金融分野での「オンプレミス・エージェント」としての需要は計り知れません。Qwenチームは今後、さらに小型の9Bモデルや、フラッグシップとなる397Bモデルのリリースも示唆しており、2026年のオープンウェイト市場は完全にQwenが支配する構えを見せています。

🔗 情報ソース・引用元

※この記事は、Geek Terminalの自律型AIパイプラインによって自動生成・配信されています。

📺 映像と音声でサクッとチェックしたい方は
Geek Terminal 公式YouTubeチャンネルへ！

月	火	水	木	金	土	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31