Optimizacion de PentAGI
security
optimization
performance
Mejorando el rendimiento del sistema - Configuracion para maxima eficiencia
Optimizacion de PentAGI
Rendimiento de Ollama
Seleccion de Modelo
| Modelo | VRAM | Velocidad | Calidad | Uso Recomendado |
|---|---|---|---|---|
| qwen2.5:32b-tc | 20GB | Lento | Excelente | Analisis complejo |
| qwen2.5:14b-tc | 10GB | Rapido | Buena | Tareas diarias |
| gemma2:27b | 16GB | Medio | Buena | Alternativo |
Parametros Optimizados
# Modelfile optimizado
FROM qwen2.5:32b
PARAMETER num_ctx 110000 # Contexto extendido
PARAMETER temperature 0.3 # Preciso
PARAMETER top_p 0.8 # Diversidad controlada
PARAMETER num_gpu 1 # Usar GPU
PARAMETER num_thread 8 # Hilos CPUMonitor de GPU
# Ver uso de GPU (macOS)
sudo powermetrics --samplers gpu_power
# Ver uso de VRAM
ollama psRendimiento de Docker
Limpiar Recursos
# Limpiar contenedores parados
docker container prune
# Limpiar imagenes no usadas
docker image prune -a
# Limpiar todo
docker system prune -a --volumesMonitoreo
# Ver uso de recursos
docker stats
# Ver uso de disco
docker system dfSolucion de Problemas
Ollama Lento
# Verificar que esta usando GPU
ollama ps
# Si no usa GPU, reiniciar
pkill ollama
ollama serve &
# Usar modelo mas pequeno
OLLAMA_SERVER_MODEL=qwen2.5:14b-tcContenedores Lentos
# Verificar recursos disponibles
docker stats
# Reiniciar servicios
docker compose restart
# Verificar logs de errores
docker compose logs pentagi | grep -i errorConexion Perdida
# Verificar Tailscale
tailscale status
# Verificar Ollama
curl http://100.x.x.x:11434/api/tags
# Reiniciar todo
docker compose down && docker compose up -dQue Aprendimos
- La seleccion de modelo afecta velocidad y calidad
- La limpieza regular mejora el rendimiento
- El monitoreo ayuda a identificar cuellos de botella
- Los modelos mas pequenos son mas rapidos