Áreas de conocimiento
Trabajo en la intersección entre desarrollo, infraestructura e inteligencia artificial.
Desarrollo software a medida
SaaS, ERP, APIs, microservicios y paneles de gestión.
Inteligencia artificial aplicada
Modelos locales, RAG privado, chatbots empresariales sin fuga de datos.
Agentes IA y MCP
Agentes para atención al cliente, CRM, automatización y reservas.
Modelos locales y LLMs
vLLM, Ollama, cuantización, GGUF, inferencia optimizada.
Automatización de procesos
Flujos IA, OCR, clasificación documental, generación de informes.
Infraestructura técnica
GPUs, servidores IA, despliegues on-premise y cloud.
APIs e integraciones
Conectores REST, webhooks, sistemas legacy y plataformas modernas.
Bases de datos y almacenamiento
MySQL, MariaDB, MongoDB, PostgreSQL. Modelado, optimización, migraciones y replicación.
Frontend y aplicaciones web
Next.js, React Native, PHP MVC, interfaces responsivas, Tailwind, SPA y PWA.
Proyectos
Trabajo personal e investigación en desarrollo software e inteligencia artificial.
Artículos técnicos
Notas sobre desarrollo, IA e infraestructura.
Laboratorio IA local
Infraestructura privada para desarrollo, prueba y despliegue de modelos de inteligencia artificial. On-premise, sin dependencias externas.
Hardware
GPU
2× NVIDIA RTX A5000
48 GB VRAM total (24GB × 2)
Driver 595.71.05
CPU
32 cores AMD
RAM
96 GB DDR4
Software Stack
Runtime
Frameworks
Técnicas de inferencia
Ollama
11 modelos
Embeddings
GGUF / vLLM
8 modelos
Infraestructura
ollama
Servicio local con 14 modelos + 3 embeddings
vllm
Qwen3.6-35B-A3B en FP8 con cuantización avanzada
llama_cpp
Inferencia directa con MTP + draft tokens
almacenamiento
205 GB de modelos GGUF en disco
Contacto
Para consultas técnicas, colaboración o simplemente intercambiar ideas.