Ollama v0.19

MLX搭載でApple Siliconでの動作が劇的に進化したOllama：次世代のローカルLLM実行環境

導入:

AppleのMLXフレームワークを採用し、Apple Silicon搭載Macでのパフォーマンスを極限まで引き出した最新のOllamaをご紹介します。M5チップのGPU Neural Acceleratorへの最適化やNVFP4フォーマットのサポートにより、Qwen3.5などの最新モデルがかつてない速度で動作。キャッシュ機能の改善でコーディングエージェントの効率も向上した、開発者必携のツールです。

追加日:

2026-04-03

月間訪問者数:

--K

コードとIT

Ollama v0.19 - AI Tool Screenshot and Interface Preview

Ollama v0.19 製品情報

Ollama：Apple SiliconとMLXの融合が実現するローカルLLMの最高速体験

2026年3月30日、OllamaはApple Silicon搭載Macにおいて、Apple独自の機械学習フレームワークであるMLXを活用したプレビュー版を公開しました。これにより、Appleデバイス上でのOllamaの実行速度は劇的に向上し、最も要求の厳しいAIワークフローをローカル環境で快適に処理することが可能になりました。

Ollamaとは？（What's Ollama）

Ollamaは、ローカル環境で大規模言語モデル（LLM）を簡単に実行・管理するための強力なプラットフォームです。今回のアップデートにより、OllamaはApple Siliconのユニファイドメモリ・アーキテクチャを最大限に活用できるよう設計が刷新されました。

特に、最新のApple M5、M5 Pro、M5 Maxチップに搭載された新しいGPU Neural Accelerator（GPUニューラルアクセラレータ）をフル活用することで、Ollamaは推論の初期応答時間（TTFT）と生成速度（トークン/秒）の両方で圧倒的なパフォーマンスを実現しています。

Ollamaの主要機能（Features）

1. MLXによるApple Siliconへの最適化

Ollama 0.19では、バックエンドにAppleのMLXフレームワークを採用しました。これにより、旧バージョンと比較して以下のような大幅な高速化を達成しています（Qwen3.5-35B-A3Bモデルによる計測）：

プリフィル性能（Prefill Performance）:
- Ollama 0.18: 1154 tokens/s
- Ollama 0.19: 1810 tokens/s（int4量子化では最大1851 tokens/s）
デコード性能（Decode Performance）:
- Ollama 0.18: 58 tokens/s
- Ollama 0.19: 112 tokens/s（int4量子化では最大134 tokens/s）

2. NVIDIA NVFP4フォーマットのサポート

Ollamaは、モデルの精度を維持しながらメモリ帯域幅とストレージ要件を削減するNVFP4フォーマットに対応しました。これにより、プロダクション環境と同等の高品質なレスポンスをローカルのOllama環境で再現できるようになります。また、NVIDIAのモデルオプティマイザーで最適化されたモデルの実行も可能になりました。

3. 進化したキャッシングシステム

コーディングやエージェント業務の効率化のため、Ollamaのキャッシュ機能が大幅に強化されました。

メモリ利用率の低減: 会話間でキャッシュを再利用し、共有システムプロンプト利用時のメモリ消費を抑制します。
インテリジェント・チェックポイント: プロンプトの適切な位置にキャッシュのスナップショットを保存し、再処理時間を短縮します。
スマートな破棄アルゴリズム: 古いブランチが削除されても、共有プレフィックスをより長く保持します。

Ollamaの活用シーン（Use Case）

Ollamaの圧倒的なスピードは、特に以下のような対話型・自律型エージェントの利用で威力を発揮します。

コーディングエージェントの高速化: Claude Code、OpenCode、Codex、PiといったツールとOllamaを連携させることで、コード生成やリファクタリングの待ち時間が大幅に短縮されます。
パーソナルアシスタント: OpenClawのようなアシスタントが、MLXの力を借りてより人間味のある、リアルタイムに近い速度で応答します。
プロダクション環境のシミュレーション: NVFP4のサポートにより、クラウドでの本番運用に近い環境をOllamaを使ってローカルで構築・テストできます。

Ollamaの使い方（How to Use）

今回のプレビューリリースでは、コーディングタスクに最適化された最新モデル「Qwen3.5-35B-A3B」を高速に実行できます。なお、本機能の利用には32GB以上のユニファイドメモリを搭載したMacを推奨します。

モデルの起動と実行

Claude Codeで使用する場合

ollama launch claude --model qwen3.5:35b-a3b-coding-nvfp4

OpenClawで使用する場合

ollama launch openclaw --model qwen3.5:35b-a3b-coding-nvfp4

モデルと直接チャットする場合

ollama run qwen3.5:35b-a3b-coding-nvfp4

よくある質問（FAQ）

Q: Ollama 0.19での主な変更点は何ですか？ A: AppleのMLXフレームワークへの対応による劇的な高速化、NVFP4フォーマットのサポート、そしてキャッシュ機能の強化が主な変更点です。

Q: 自分のファインチューニングしたモデルをOllamaで使えますか？ A: 現在、サポートされているアーキテクチャについては順次拡大中です。将来的には、カスタムモデルをより簡単にOllamaへインポートできる仕組みを導入する予定です。

Q: なぜ32GB以上のメモリが必要なのですか？ A: Qwen3.5-35B-A3Bのような大規模なモデルを高品質な精度（NVFP4等）でスムーズに動作させるためには、Apple Siliconの広帯域なユニファイドメモリの容量が重要になるためです。

Q: MLX以外へのサポートはどうなっていますか？ A: Ollamaは、MLXチーム、NVIDIA、GGML、llama.cpp、そしてAlibaba Qwenチームといった多くのパートナーとの協力により、幅広いハードウェアとアーキテクチャの最適化を継続しています。

Alternatives Tools

Open Vibe

Open Vibe: AIエージェントを究極のSaaS構築アシスタントに変える完全無料ツール

Open Vibeは、Claude CodeなどのAIエージェントを強力なSaaS構築アシスタントへと変貌させる、100%無料かつオープンソースのツールです。単にコードを生成するだけでなく、Webアプリの背後にあるシステム設計を深く理解しながら、プロダクションレベルのアプリを開発できます。MITライセンスで提供され、Open SaaSテンプレートを活用することで、認証や決済機能を備えた本格的なSaaSを迅速にリリース可能です。

コードとIT

display.dev

display.dev: AIエージェントのHTML成果物をSSO保護下で安全に公開・共有するエンジン

display.devは、ClaudeやCursor等のAIエージェントが生成したHTML、ダッシュボード、ドキュメントを企業の認証（SSO）付きで即座に公開できる「Gated Publishing Engine」です。スクリーンショットやセキュリティリスクのある公開URLを使わず、1つのコマンドでチーム専用の永続URLを発行。インラインコメント機能により、エージェントとの双方向なフィードバックループを実現します。

コードとIT

Graphbit PRFlow

PRFlow：コードベース全体を深く理解し、出荷レベルのバグを見逃さないAIコードレビューツール

PRFlowは、GitHubのプルリクエスト（PR）を自動でレビューする最先端のAIレビューツールです。コードベース全体をインデックス化し、ファイル間の依存関係をトレースすることで、従来のツールでは見落とされがちなXSS、SSRF、認証バイパスなどの複雑なセキュリティ脆弱性をわずか3分以内に特定します。チームのフィードバックを学習し、使えば使うほど精度が向上。開発効率とコード品質を劇的に改善します。

コードとIT

Atomic Mail

Atomic Mail：プライバシーとセキュリティを極めた次世代型暗号化メールサービス

Atomic Mailは、エンドツーエンド暗号化（E2EE）とブロックチェーン級のセキュリティを誇る最新のメールサービスです。プライバシー保護を最優先し、大手テック企業のメールとは一線を画す安全な通信環境を提供します。AIアシスタント、エイリアス機能、ゼロアクセス暗号化など、ビジネスや個人利用に最適な機能を多数搭載。この記事では、Atomic Mailの特徴や利便性、よくある質問について詳しく解説します。

コードとIT

Superset 2.0

Superset - 100以上のAIエージェントを並列実行・管理できる次世代AIコードエディタ

Supersetは、AIエージェントのオーケストレーションに特化した画期的なコードエディタです。Claude CodeやGemini、Cursorなど、あらゆるCLIベースのAIエージェントをサポートし、数十のタスクを並列で実行可能。Git worktreeによる環境分離で競合を防ぎ、既存のIDEともシームレスに連携します。AI時代の開発フローを劇的に進化させ、生産性を最大化するエンジニア必携のツールです。

コードとIT

Waydev Agent

Waydev：AIエンジニアリング・インテリジェンスで開発組織の生産性とROIを最大化

Waydevは、G2でマーケットリーダーに選出されたAIソフトウェアエンジニアリング・インテリジェンス（SEI）プラットフォームです。DORAメトリクス、SPACEフレームワーク、AI導入インパクトの測定を通じて、エンジニアリング組織のパフォーマンスを可視化します。GitやCI/CDと連携し、開発サイクルの短縮やリソース配分の最適化をリアルタイムで実現。SOC 3準拠の高度なセキュリティを備え、Fortune 500企業に信頼されています。

コードとIT

Kilo Code v7 for VS Code

Kilo Code - 並列実行とマルチエージェントを統合した次世代AIコーディング環境

Kilo Codeは、OpenCodeを基盤とした強力なAIエージェント拡張機能です。並列ツール実行やサブエージェントへの委譲により、開発速度を劇的に向上させます。Git Worktreesによる作業の分離、500以上のAIモデル比較、CLIやSlackとのシームレスな連携をサポート。SOC 2準拠のセキュリティを備え、300万ダウンロードを誇るオープンソースの新しい開発標準です。

コードとIT

Claude Code & Codex Usage Trading Cards by Rudel

Claude Code Wrapped: Jon Doeの開発統計と1.9Mトークンの活動分析

Claude Code Wrappedは、開発者Jon Doe氏の58日間にわたる活動を詳細に記録したパフォーマンスレポートです。総セッション数219回、1.9Mトークンの使用、12のリポジトリへの関与など、開発効率を測る重要な指標を網羅。リファクタリングを好む開発スタイルや、コミット1回あたりのコスト3.3ドルといった具体的な経済性も可視化し、AIを活用した現代的な開発プロセスを浮き彫りにします。

コードとIT

Loading related products...