Portfolio técnico

Desarrollo software, inteligencia artificial y automatización.

Este web recoge mi trabajo, investigación práctica y experiencia en desarrollo software, inteligencia artificial aplicada e infraestructura técnica.

Áreas de conocimiento

Trabajo en la intersección entre desarrollo, infraestructura e inteligencia artificial.

Desarrollo software a medida

SaaS, ERP, APIs, microservicios y paneles de gestión.

Inteligencia artificial aplicada

Modelos locales, RAG privado, chatbots empresariales sin fuga de datos.

Agentes IA y MCP

Agentes para atención al cliente, CRM, automatización y reservas.

Modelos locales y LLMs

vLLM, Ollama, cuantización, GGUF, inferencia optimizada.

Automatización de procesos

Flujos IA, OCR, clasificación documental, generación de informes.

Infraestructura técnica

GPUs, servidores IA, despliegues on-premise y cloud.

APIs e integraciones

Conectores REST, webhooks, sistemas legacy y plataformas modernas.

Bases de datos y almacenamiento

MySQL, MariaDB, MongoDB, PostgreSQL. Modelado, optimización, migraciones y replicación.

Frontend y aplicaciones web

Next.js, React Native, PHP MVC, interfaces responsivas, Tailwind, SPA y PWA.

Proyectos

Trabajo personal e investigación en desarrollo software e inteligencia artificial.

Artículos técnicos

Notas sobre desarrollo, IA e infraestructura.

Laboratorio IA local

Infraestructura privada para desarrollo, prueba y despliegue de modelos de inteligencia artificial. On-premise, sin dependencias externas.

Hardware

GPU

2× NVIDIA RTX A5000

48 GB VRAM total (24GB × 2)

Driver 595.71.05

CPU

32 cores AMD

RAM

96 GB DDR4

Software Stack

Runtime

OllamavLLMllama.cppllama-server

Frameworks

PythonFastAPILangChainCrewAI

Técnicas de inferencia

Q8_0FP8IQ4MTPDraft tokens

Ollama

11 modelos

Nemotron-3:33B-Q8
ollama
Qwen3.6:35B-A3B-Q8
ollama
Gemma4:26B-A4B-IT-Q8
ollama
GLM-5 (cloud)
cloud
Kimi-K2.6 (cloud)
cloud
GPT-OSS:120B
ollama
Qwen3:8B
ollama
LLaMA 3.1:8B
ollama
DeepSeek-OCR
ollama
Ministral-3:14B
ollama
Qwen3-Reranker-8B-Q8
ollama

Embeddings

Qwen3-Embedding:8BEmbedding grande
Qwen3-Embedding:4BEmbedding medio
Mxbai-Embed-Large:335MEmbedding ligero

GGUF / vLLM

8 modelos

Qwen3.6-35B-A3B-Q8_0
gguf
Qwen3.6-35B-A3B-BF16
vllm
Qwen3.6-35B-A3B-Custom-Q8
gguf
Gemma-4-31B-Q8_K_XL
gguf
GLM-4.7-Flash-UD-Q8_K_XL
gguf
Qwen3-4B Reasoning-Slerp
gguf
Qwen3.5-4B-IQ4_XS
gguf
Multimodal projectors (mmproj)
gguf

Infraestructura

ollama

Servicio local con 14 modelos + 3 embeddings

vllm

Qwen3.6-35B-A3B en FP8 con cuantización avanzada

llama_cpp

Inferencia directa con MTP + draft tokens

almacenamiento

205 GB de modelos GGUF en disco

Contacto

Para consultas técnicas, colaboración o simplemente intercambiar ideas.