Investigación y datos abiertos
Análisis rigurosos con datos públicos, metodología transparente y código abierto. Contribuciones al conocimiento que cualquiera puede verificar.
Dashboard interactivo: 15 presidentes de México bajo el mismo algoritmo
Análisis cuantitativo interactivo de las 15 administraciones presidenciales (1934-2024). 9 variables estructurales (PIB, pobreza, empleo, violencia, Gini, recaudación, inversión, inflación, deuda), Z-score regional LatAm-5, Índice de Dificultad Contextual y bootstrap con 1,000 simulaciones.
Cómo reducir fraude 73% con Machine Learning: caso de estudio
Caso práctico de implementación de un sistema de detección de fraude financiero con ML para una fintech en LATAM. Arquitectura, features, modelo y resultados en producción.
De monolito a microservicios: guía práctica para empresas en crecimiento
Guía técnica para migrar de una arquitectura monolítica a microservicios. Patrones, antipatrones, decisiones de dominio y lecciones aprendidas en producción.
Estado de la IA empresarial en Latinoamérica 2026
Análisis del estado actual de adopción de inteligencia artificial en empresas de Latinoamérica. Tendencias, barreras, casos de éxito y oportunidades por sector.
AI Act: guía de cumplimiento para exportadores LATAM→UE antes del 2 de agosto 2026
Deadline regulatorio fijo: 2 de agosto 2026. Multas hasta €35M o 7% del ingreso global. Checklist de 20 puntos, stack self-hosted para data residency y calendario de remediación para SaaS y fintech latinoamericanas que procesan datos europeos.
Stack de IA self-hosted en un droplet de Digital Ocean de $40: Qdrant + Langfuse + LiteLLM + Redis
Docker Compose productivo con Qdrant, Langfuse, LiteLLM Proxy, Redis 8 y Ollama en un droplet de $40. Nginx + Certbot, backups a Spaces, monitoreo con Grafana y Prometheus. Todo el stack corriendo en un solo servidor.
Construir un recepcionista IA en español: Pipecat + Deepgram + Cartesia + Qdrant
Agente de voz en español mexicano para clínicas dentales y despachos jurídicos. Stack OSS: Pipecat para orquestación, Deepgram/Whisper.cpp para STT, Cartesia/Coqui TTS para voz, Qdrant para RAG del negocio, Langfuse para trazas y Redis para contexto.
MCP templates: el estándar que faltaba para chatbots empresariales
Diez servidores MCP listos para producción: CRM, WhatsApp Business, facturación CFDI, calendario, Postgres con RLS y RAG con Qdrant. Repo abierto numoru/mcp-templates-es con tests, OAuth, Docker y despliegue en Cloudflare Workers.
GEO vs SEO en 2026: por qué el 50% de tus clicks orgánicos desaparece y cómo medirlo
Generative Engine Optimization explicado con benchmark propio: 20 marcas mexicanas medidas en ChatGPT, Perplexity, Gemini y Claude. Pipeline de medición con Firecrawl, LiteLLM y Qdrant. Por qué el SEO tradicional ya no alcanza.
Auditar si ChatGPT cita tu marca: herramienta open source en Go con LiteLLM y Qdrant
Script en Go que prueba 100 queries contra 5 LLMs vía LiteLLM proxy, vectoriza respuestas en Qdrant y detecta citaciones semánticas. Dashboard en React. Publicado como numoru/geo-audit.
MCP desde cero: servidor en Go con Postgres, Gmail y Calendar en 30 minutos
Guía práctica para implementar un servidor Model Context Protocol en Go usando mcp-go, con integración a Postgres (row-level security), Gmail API y Google Calendar. Incluye OAuth, tests y despliegue a Cloudflare Workers.
Langfuse + Redis + Mem0 como memoria de agentes en producción: patrón tiered memory
Patrón de memoria por capas para agentes LLM: Redis para working memory (TTL 1h), Langfuse sessions para historia auditable, Mem0 para memoria semántica de largo plazo. Código Go, cuándo expirar, cuándo resumir, cuándo vectorizar.
Encuesta Numoru: estado de los agentes de IA en empresas LATAM 2026
Resultados de encuesta propia a 87 empresas latinoamericanas: frameworks usados (LangGraph, CrewAI, Mastra), vector DBs (Qdrant, pgvector, Weaviate), observabilidad (Langfuse, Phoenix) y barreras reales. Solo 23% reporta ROI claro.
Context engineering: por qué tu RAG se rompe a los 50k tokens y cómo arreglarlo
De RAG naive a RAG de producción: Chonkie para chunking semántico, Qdrant con búsqueda híbrida (dense + BM25), BGE-reranker self-hosted, Contextual Retrieval de Anthropic, RAPTOR, cache semántico con RedisVL y evaluación con Ragas + Langfuse.
Orquestar tres agentes para una clínica dental con LangGraph, Qdrant, Mem0 y Temporal
Caso completo: agente de citas + agente de recordatorios + agente de reseñas, orquestados con LangGraph y Postgres como checkpointer. Memoria semántica de pacientes con Mem0, flujos largos con Temporal, guardrails sanitarios y trazas en Langfuse.
Evals de agentes en CI/CD: Promptfoo + DeepEval + Langfuse + GitHub Actions
Pipeline que corre la suite completa de evals en cada PR: dataset dorado versionado en Qdrant, detección automática de regresiones, métricas RAG con DeepEval, trazas en Langfuse y bloqueo de merge si el score baja.
Matriz de adopción de IA por vertical en México: dónde pagan más y dónde menos
Cruce de datos Fed, Deloitte y observación local: cuál vertical paga más por IA, cuál está subdigitalizado, qué stack aplica en cada uno (salud → Ollama on-prem, legal → BAML, retail → Mem0 + Redis). Matriz 2x2 de entrada y ticket.
Vibe coding seguro: pipeline de QA para código generado con Cursor, Aider y Cline
Cómo auditar código IA antes de producción: Semgrep + Bearer + Trivy en pre-commit, SonarQube Community con reglas específicas para IA, DSPy para generar tests automáticos y Promptfoo para validar prompts en CI.
Fine-tuning de Llama 3.3 para ICD-CIE en español: dataset, costos y benchmarks contra Claude
Ajuste fino de Llama 3.3 8B sobre catálogo ICD-CIE-11 en español: Unsloth para training eficiente, vLLM para serving, Qdrant para RAG complementario, benchmark con lm-eval-harness. Modelo publicado en Hugging Face.
n8n blueprint para inmobiliaria: WhatsApp + CRM + listings IA con Qdrant y Ollama
Flujo n8n self-hosted exportable: búsqueda semántica de propiedades con Qdrant, generación de descripciones con Ollama (sin costo por listing), WhatsApp Business Cloud API, trazas Langfuse. Repo numoru/n8n-blueprints.
Más investigaciones próximamente...