Ollama v0.19

Ollama 0.19: Potenciado por MLX para máximo rendimiento en Apple Silicon

Introducción:

Ollama 0.19 introduce una integración revolucionaria con MLX, el framework de aprendizaje automático de Apple, permitiendo una ejecución de modelos de IA sin precedentes en dispositivos macOS. Con soporte para el formato NVFP4 de NVIDIA y mejoras drásticas en la gestión de caché, Ollama ofrece velocidades de prefill de hasta 1810 tokens/s y decode de 112 tokens/s en chips M5. Esta actualización optimiza asistentes personales y agentes de codificación como Claude Code y OpenClaw, aprovechando la arquitectura de memoria unificada y los nuevos aceleradores neuronales de GPU.

Añadido:

2026-04-03

Visitantes mensuales:

--K

Código e IT

Ollama v0.19 - AI Tool Screenshot and Interface Preview

Ollama v0.19 Información del producto

Ollama: La Revolución de la Inteligencia Artificial en Apple Silicon con MLX

El ecosistema de la inteligencia artificial local ha alcanzado un nuevo hito con el lanzamiento de la versión preview de Ollama, ahora potenciada por MLX, el avanzado framework de aprendizaje automático de Apple. Esta actualización transforma a Ollama en la herramienta definitiva para ejecutar modelos de lenguaje de gran tamaño (LLM) en hardware macOS, aprovechando al máximo la arquitectura de silicio de Apple.

¿Qué es Ollama?

Ollama es una plataforma líder diseñada para ejecutar modelos de inteligencia artificial de código abierto de forma local y eficiente. Con su última actualización, Ollama se integra profundamente con el framework MLX en dispositivos Apple Silicon, lo que permite una comunicación directa con la arquitectura de memoria unificada de los chips de la serie M.

Esta integración convierte a Ollama en la vía más rápida y optimizada para que desarrolladores y entusiastas de la IA ejecuten asistentes personales y agentes de codificación exigentes directamente en sus equipos Mac, sin depender de la nube y garantizando una privacidad total.

Características Principales de Ollama 0.19

La nueva arquitectura de Ollama introduce mejoras críticas que redefinen el rendimiento en entornos locales:

Máximo Rendimiento con MLX y Apple Silicon

Ollama ha sido reconstruido sobre MLX para tomar ventaja de la memoria unificada. En los nuevos chips M5, M5 Pro y M5 Max, Ollama utiliza los nuevos Aceleradores Neuronales de GPU, optimizando tanto el tiempo hasta el primer token (TTFT) como la velocidad de generación.

Rendimiento de Prefill: Alcanza hasta 1810 tokens/s (en comparación con los 1154 tokens/s de versiones anteriores).
Rendimiento de Decode: Logra hasta 112 tokens/s, superando significativamente los 58 tokens/s de la versión 0.18.

Soporte para el Formato NVFP4 de NVIDIA

Para mantener la precisión del modelo mientras se reduce el uso de memoria y almacenamiento, Ollama ahora implementa el formato NVFP4. Esto permite:

Paridad de producción: Obtener los mismos resultados en local que en entornos de producción a gran escala.
Optimización de NVIDIA: Capacidad para ejecutar modelos optimizados mediante el optimizador de modelos de NVIDIA.

Sistema de Caché Inteligente y Optimizado

El manejo de la memoria ha sido refinado en Ollama para tareas agénticas y de codificación:

Menor utilización de memoria: Reutilización de caché entre conversaciones.
Checkpoints inteligentes: Almacenamiento de instantáneas de caché en ubicaciones estratégicas del prompt.
Evicción inteligente: Los prefijos compartidos permanecen más tiempo en memoria, mejorando la respuesta en tareas con herramientas como Claude Code.

Casos de Uso de Ollama

Gracias a su aceleración de hardware, Ollama es ideal para flujos de trabajo intensivos:

Agentes de Codificación: Herramientas como Claude Code, OpenCode, Codex y Pi funcionan con una fluidez sin precedentes.
Asistentes Personales: Aplicaciones como OpenClaw responden de manera casi instantánea, mejorando la interactividad.
Entornos de Producción Local: Los desarrolladores pueden testear modelos con cuantización NVFP4 asegurando que la calidad de respuesta sea idéntica a la de los servicios en la nube.

Cómo usar Ollama 0.19

Para comenzar a utilizar esta versión preview de Ollama, es necesario contar con un Mac con más de 32GB de memoria unificada. Aquí te mostramos cómo ejecutar los modelos más recientes:

Lanzamiento para Claude Code

Usa el siguiente comando para iniciar Ollama optimizado para codificación: ollama launch claude --model qwen3.5:35b-a3b-coding-nvfp4

Lanzamiento para OpenClaw

Para una experiencia rápida con asistentes personales: ollama launch openclaw --model qwen3.5:35b-a3b-coding-nvfp4

Chat Directo con el Modelo

Si prefieres interactuar directamente con el modelo Qwen3.5 optimizado: ollama run qwen3.5:35b-a3b-coding-nvfp4

Preguntas Frecuentes (FAQ)

¿Qué requisitos de hardware tiene esta versión de Ollama? Se requiere un Mac con Apple Silicon y un mínimo de 32GB de memoria unificada para garantizar un rendimiento óptimo con modelos como Qwen3.5-35B.

¿Cómo mejora MLX la experiencia en Ollama? MLX permite que Ollama acceda directamente a los aceleradores neuronales de la GPU y gestione la memoria de forma más eficiente, resultando en velocidades de generación casi el doble de rápidas.

¿Qué es el formato NVFP4 soportado por Ollama? Es un formato de cuantización de NVIDIA que reduce los requisitos de ancho de banda de memoria sin sacrificar la precisión del modelo, permitiendo ejecutar modelos de alta calidad en hardware local.

¿Soportará Ollama modelos personalizados en el futuro? Sí, se está trabajando para facilitar la importación de modelos personalizados ajustados (fine-tuned) en arquitecturas soportadas por Ollama.

Con esta actualización, Ollama se posiciona como el estándar de oro para la ejecución de inteligencia artificial en macOS, ofreciendo una combinación inigualable de velocidad, eficiencia y calidad de respuesta.

Alternatives Tools

Graphbit PRFlow

PRFlow: El Revisor de Código con IA para Seguridad y Dependencias Cruzadas

PRFlow es un avanzado revisor de código basado en inteligencia artificial diseñado para identificar errores críticos y vulnerabilidades de seguridad que otros omiten. Al indexar todo el repositorio y rastrear dependencias entre archivos, PRFlow genera revisiones estructuradas en menos de 3 minutos. Con un puntaje de 4.3/5 en benchmarks reales frente al 2.5/5 de la competencia, esta herramienta ofrece aprendizaje persistente y análisis profundo de XSS, SSRF y fallos de autenticación.

Código e IT

Atomic Mail

Atomic Mail: Correo electrónico cifrado con privacidad blockchain y herramientas avanzadas de IA para máxima seguridad.

Descubre Atomic Mail, la plataforma de correo electrónico cifrado que revoluciona la privacidad digital. Con encriptación de extremo a extremo, tecnología blockchain y potentes funciones de IA, Atomic Mail protege tus datos personales, contratos y secretos comerciales frente a las grandes tecnológicas. Ofrece una experiencia sin anuncios, almacenamiento gratuito y herramientas de productividad como redacción asistida por IA, traducción instantánea y resúmenes automáticos. Disponible en Windows, macOS, iOS, Android y Web, Atomic Mail garantiza que solo tú tengas el control de tus claves privadas y tu información.

Código e IT

Superset 2.0

Superset: El Editor de Código Revolucionario para Orquestar Agentes de IA en Paralelo

Superset es el editor de código pionero diseñado para la era de la inteligencia artificial, permitiendo orquestar más de 100 agentes de codificación en paralelo. Gracias a su integración con git worktrees, Superset garantiza un aislamiento total de los cambios, eliminando conflictos y permitiendo trabajar simultáneamente con agentes como Claude Code, Cursor y Gemini. Compatible con cualquier IDE y optimizado para flujos de trabajo de alto rendimiento, Superset es la herramienta definitiva para desarrolladores que buscan escalar su productividad mediante el uso intensivo de agentes de IA.

Código e IT

Waydev Agent

Waydev: Plataforma de Software Engineering Intelligence para optimizar el rendimiento de ingeniería con IA y métricas DORA

Waydev es la plataforma líder en Software Engineering Intelligence (SEI), reconocida por G2 y respaldada por Y Combinator. Ayuda a los líderes de ingeniería a medir el impacto de la IA, optimizar el ROI y acelerar el ciclo de vida de desarrollo de software (SDLC). Mediante la integración de herramientas de Git, ticketing y CI/CD, Waydev ofrece visibilidad en tiempo real a través de métricas DORA, el marco SPACE y análisis de productividad del desarrollador (DX). Con Waydev, las empresas pueden alinear sus objetivos técnicos con las prioridades de negocio, reduciendo el trabajo no planificado y aumentando la velocidad de despliegue de código.

Código e IT

Kilo Code v7 for VS Code

Kilo Code: Potente Extensión de VS Code para Ejecución de Agentes en Paralelo y Desarrollo Eficiente

Kilo Code es la evolución del desarrollo asistido por IA en VS Code. Reconstruido sobre un núcleo portátil compartido con Kilo CLI y la base de código abierto OpenCode, permite la ejecución de agentes en paralelo, delegación de subagentes y sesiones multiplataforma. Con más de 3 millones de descargas, Kilo Code destaca por su capacidad de gestionar worktrees de git de forma nativa, realizar revisiones de código detalladas y comparar más de 500 modelos de IA (Claude, GPT, Gemini) en tiempo real. Su cumplimiento con SOC 2 garantiza seguridad de nivel empresarial, mientras que su integración fluida con Slack y terminales SSH asegura una continuidad total del flujo de trabajo.

Código e IT

Claude Code & Codex Usage Trading Cards by Rudel

Tu Claude Code Wrapped: Análisis Completo del Rendimiento y Métricas de Programación de Jon Doe

Descubre el informe detallado de Tu Claude Code Wrapped para Jon Doe. Un resumen exhaustivo con 219 sesiones, 1.9 millones de tokens y métricas de éxito en 12 repositorios.

Código e IT

Codex Pets

Codex App: Guía Completa de Configuración y Optimización para Desarrolladores de IA

Optimiza tu flujo de trabajo con Codex App. Aprende a configurar temas, integrar MCP, gestionar Git y usar funciones avanzadas como Computer Use y Codex Pets para potenciar tu productividad.

Código e IT

Radar

Radar por Skyhook: La interfaz de usuario definitiva y de código abierto para la gestión de Kubernetes

Descubre Radar por Skyhook, la potente interfaz de usuario (UI) de código abierto diseñada para simplificar la gestión de clústeres Kubernetes. Con funciones avanzadas de topología, GitOps, gestión de Helm y auditorías en tiempo real, Radar elimina la complejidad de kubectl y centraliza la visibilidad de tu infraestructura en una solución ligera de alto rendimiento.

Código e IT

Loading related products...