Desplegando Agentes Autónomos con Ollama
•
#IA#Ollama#Python#LocalHost
Correr modelos de lenguaje en local se ha vuelto una necesidad para mantener la privacidad y reducir costos en el desarrollo de agentes autónomos.
La Arquitectura
Para este setup, utilizo un contenedor LXC en Proxmox dedicado exclusivamente a inferencia. Esto me permite aislar los recursos de GPU y CPU.
Pasos de instalación
- Levantar el servicio de Ollama.
- Configurar
LiteLLMcomo proxy para estandarizar las llamadas. - Conectar nuestro framework de agentes (como OpenClaw o Hermes).
# Instalación rápida de Ollama
curl -fsSL [https://ollama.com/install.sh](https://ollama.com/install.sh) | sh
# Descargar el modelo base
ollama run llama3
En próximos artículos detallaré cómo estructurar los prompts del sistema para optimizar el razonamiento del agente.