Agentic AI

Sistemas basados en LLM que razonan, usan herramientas externas y ejecutan acciones en el mundo real — frente al chatbot tradicional que solo responde texto. La frontera de las startups YC del batch reciente: dejaron de construir wrappers de GPT y empezaron a construir agentes que sustituyen flujos completos.

Definición operativa

Un agente típico cumple tres requisitos:

Razona sobre el estado de la tarea (no responde reactivamente).
Usa herramientas externas (APIs, búsquedas, llamadas telefónicas, ejecución de código).
Ejecuta acciones que cambian el mundo (procesa un pago, envía un mensaje, modifica código).

Chatbot ≠ agente. Wrapper de GPT ≠ agente. La diferencia operacional es ¿puede equivocarse con consecuencias? Si sí, es agente.

Casos canónicos (YC batch reciente)

Fuente: yc-root-access-ai-y-agentes Q6.

Atención al cliente

Giga (DoorDash): agente habla con cliente y simultáneamente llama al repartidor para coordinar.
Parahelp: lee políticas de empresa, decide elegibilidad de reembolso, se conecta a Stripe y devuelve el dinero sin humano.

Ventas y operaciones

Simple AI: telefónica para Omaha Steaks. 30% mejor upsell que humanos entrenados.
HappyRobot: agentes llaman a camioneros para negociar fletes, ajustándose a pausas/interrupciones.
Juicebox: reclutamiento autónomo — evaluar perfiles → calificar → contactar.

Programación

Greptile: entiende toda la base de código, revisa PRs. 20.000 bugs en una semana.
Momentic: QA — el agente navega la web como usuario, no escribes test code.
Conductor: orquesta múltiples agentes en paralelo (lo que el usuario está usando ahora en este workspace).
Emergent: app builder multi-agente (diseño, seguridad, deploy).
Diode: diseño automatizado de PCBs.

Por qué funcionan ahora y no en 2022

Modelos buenos en tool use: Claude/GPT-4+ pueden invocar funciones con suficiente fiabilidad.
context-engineering: las técnicas de curación de contexto hacen que el agente no se ahogue en loops largos.
Inference barata: corre cientos de iteraciones del agente sin quebrar la economía.

Limitaciones reales

Acumulación de errores en loops largos — sin checkpoints/compactación, drift garantizado.
No-determinismo de salida — pruebas exhaustivas difíciles; QA requiere otros agentes (Momentic).
Costo en tareas largas — un agente “pensando” 10 minutos puede costar $5-20 en API.
Riesgo de acciones irreversibles — pagos, emails, código en producción. Necesita guardrails humanos en el loop.

Conexiones

context-engineering — disciplina necesaria para que los agentes funcionen en escala.
vibe-coding — vibe-coding con LLMs en IDE es agentic AI a escala uno. Los agentes amplían el patrón a flujos completos.
ia-y-desarrollo — agentes son la siguiente capa del topic: ya no es “código como output”, es “trabajo completo como output”.
bc-6-estado-ai-2025 — el draft del usuario sobre MCPs y agentes ya anticipaba esto; ahora con ejemplos concretos para citar.
ai-course-vibecoding-bootcamp — gap pedagógico: el bootcamp debería tener módulo sobre construir agentes simples, no solo escribir prompts.

Preguntas abiertas

¿Qué framework usar para construir agentes? Q6 menciona varias startups pero no compara stacks (LangGraph vs CrewAI vs custom). Brecha sin cubrir en este notebook.
¿Los agentes obsoletan a los Product Engineers? Pregunta abierta: si Greptile revisa PRs y Momentic hace QA, ¿qué queda al humano? Probablemente: definir el problema, diseñar el sistema, decidir riesgo aceptable. Pero la lista shrinks.
Negocio agencia/SaaS agéntico: el usuario tiene draft ai-agency-100k-framework-4-pasos. ¿Hace sentido pivotar a “agency que construye agentes para PYME LATAM”? Diferenciación frente a competencia US: idioma + zona horaria + nichos hispanos.

Fuentes

yc-root-access-ai-y-agentes — 11 ejemplos concretos (Q6).

Wiki de James

Explorar

Agentic AI

Agentic AI

Definición operativa

Casos canónicos (YC batch reciente)

Atención al cliente

Ventas y operaciones

Programación

Por qué funcionan ahora y no en 2022

Limitaciones reales

Conexiones

Preguntas abiertas

Fuentes

Vista Gráfica

Tabla de Contenidos

Retroenlaces