Portfolio técnico

Desarrollo software, inteligencia artificial y automatización.

Este web recoge mi trabajo, investigación práctica y experiencia en desarrollo software, inteligencia artificial aplicada e infraestructura técnica.

Áreas de conocimiento

Trabajo en la intersección entre desarrollo, infraestructura e inteligencia artificial.

Cargando áreas...

Proyectos

Trabajo personal e investigación en desarrollo software e inteligencia artificial.

Cargando proyectos...

Artículos técnicos

Notas sobre desarrollo, IA e infraestructura.

Cargando artículos...

Laboratorio IA local

Infraestructura privada para desarrollo, prueba y despliegue de modelos de inteligencia artificial. On-premise, sin dependencias externas.

Hardware

GPU

2× NVIDIA RTX A5000

48 GB VRAM total (24GB × 2)

Driver 595.71.05

CPU

32 cores AMD

RAM

96 GB DDR4

Software Stack

Runtime

OllamavLLMllama.cppllama-server

Frameworks

PythonFastAPILangChainCrewAI

Técnicas de inferencia

Q8_0FP8IQ4MTPDraft tokens

Ollama

11 modelos

Nemotron-3:33B-Q8
ollama
Qwen3.6:35B-A3B-Q8
ollama
Gemma4:26B-A4B-IT-Q8
ollama
GLM-5 (cloud)
cloud
Kimi-K2.6 (cloud)
cloud
GPT-OSS:120B
ollama
Qwen3:8B
ollama
LLaMA 3.1:8B
ollama
DeepSeek-OCR
ollama
Ministral-3:14B
ollama
Qwen3-Reranker-8B-Q8
ollama

Embeddings

Qwen3-Embedding:8BEmbedding grande
Qwen3-Embedding:4BEmbedding medio
Mxbai-Embed-Large:335MEmbedding ligero

GGUF / vLLM

8 modelos

Qwen3.6-35B-A3B-Q8_0
gguf
Qwen3.6-35B-A3B-BF16
vllm
Qwen3.6-35B-A3B-Custom-Q8
gguf
Gemma-4-31B-Q8_K_XL
gguf
GLM-4.7-Flash-UD-Q8_K_XL
gguf
Qwen3-4B Reasoning-Slerp
gguf
Qwen3.5-4B-IQ4_XS
gguf
Multimodal projectors (mmproj)
gguf

Infraestructura

ollama

Servicio local con 14 modelos + 3 embeddings

vllm

Qwen3.6-35B-A3B en FP8 con cuantización avanzada

llama_cpp

Inferencia directa con MTP + draft tokens

almacenamiento

205 GB de modelos GGUF en disco

Desarrollo software, IA aplicada y automatización de procesos desde una perspectiva técnica, práctica y actualizada.

Infraestructura propia con GPUs dedicadas para inferencia local de modelos de lenguaje. Sin dependencia de proveedores externos para datos sensibles.

Respuesta habitual en menos de 24h laborables.

Contacto

Para consultas técnicas, colaboración o simplemente intercambiar ideas.