Las pruebas — una muestra real de los picks que hicieron los agentes
Compañera de \"Saqué de la cancha al agente apostador.\" Una muestra random de decisiones reales, con razonamiento, sizing y resultados — y la razón por la que un récord W/L perdedor igual terminó en +128%.
Este es el apéndice de Saqué de la cancha al agente apostador. Esto es lo que vino en su lugar.
Si querés ver lo que los agentes efectivamente hacen partido por partido — qué eligen, qué tan fuerte van, qué dejan pasar — esta página tiene las pruebas.
Cada partido en esta página es un partido real de la MLB en una fecha real. Los equipos, fechas, cuotas y resultados se pueden verificar en cualquier fuente deportiva estándar — baseball-reference, ESPN, MLB.com, las propias casas de apuestas. Acá no hay nada compuesto, ilustrativo, ni redondeado por efecto narrativo. Si algo te suena raro, podés sacar el box score y chequear.
Vale la pena decir en voz alta por qué soy borderline pedante con esto. Fabricar retornos antedatando trades a precios convenientes es una cosa real que pasó en finanzas — Bernie Madoff manejaba todo un piso de Wall Street cuyo trabajo concreto era elegir momentos en los que una acción estaba barata para "comprar" y momentos en los que estaba alta para "vender", manufacturando décadas de ganancias ficticias de la nada. "Andá y agarrá el box score público y verificá el resultado vos mismo" es el piso absoluto del reporte confiable de retornos. Prefiero limpiar ese piso a flotar arriba de él.
Fechas cubiertas en las tablas de abajo: 14, 15, 17, 18, 19, 20, 21, 23, 24 y 25 de abril de 2026. La fecha de cada fila es una nota al pie clickeable (la letrita en superíndice) que linkea al scoreboard MLB de ESPN de ese día — todos los box scores de esa fecha están en la página linkeada, así podés encontrar el partido específico y verificar el resultado vos mismo. No linkeé páginas individuales de partidos porque eso requeriría fabricar IDs de juego que no tengo; las URLs de scoreboard son reales y estables.
Algunas cosas para saber antes de las tablas:
- Stake es la cantidad en dólares que el agente puso en el pick. Cada agente arrancó con un saldo de $1.000 en paper money.
- Edge es la brecha entre la estimación de probabilidad de victoria del motor y la probabilidad implícita de la casa. Esa es la razón del agente para actuar.
- Los detalles de perfil / estrategia se omiten a propósito. Esto no es un intento de esconder la matemática — el motor es un único modelo compartido — pero las configuraciones de palancas por agente son parte de lo que hace que el juego sea juego.
El titular que tenés que recordar del post principal
A lo largo de catorce días, Big Jake hizo 88 apuestas. Ganó 40 y perdió 48. Eso es un récord W/L perdedor — 45,5%, peor que tirar una moneda.
Su banca en paper money terminó en +$1.280,74. Eso es +128,1% sobre un saldo inicial de $1.000. Más que duplicó.
Los dos números son reales.
La razón por la que esos dos hechos pueden estar uno al lado del otro sin contradecirse es el bet sizing. El set de palancas de Big Jake aumentaba el tamaño en jugadas de alto edge donde el modelo estaba muy seguro, y lo bajaba en las de menor convicción. Cuando ganaba, tendía a ganar más grande; cuando perdía, tendía a perder más chico. La aritmética de "40 victorias cubrieron 48 derrotas con $1.280 de sobra" solo cierra si las victorias no eran del mismo tamaño que las derrotas.
Esa frase — el win rate no es cómo se gana en esto; el sizing sí — alcanza para ser un tema propio que va a tener su propio post más adelante en la serie. Por ahora, mirá la muestra de abajo con esa lente.
Una muestra random a través de los once agentes
Abajo hay diez picks tomados al azar a través de todos los agentes en la ventana. Son un sabor de lo que hacen los agentes — no un registro completo, no cherry-picked, solo un snapshot.
| # | Fecha | Agente | Partido | Pick | Cuota | Stake | Edge | Ganador | P&L | Razón del pick |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 2026-04-25 j | Tommy-B | Seattle @ St. Louis | St. Louis (local) | 2,34 | $17,58 | 15,1% | Seattle | ❌ −$17,58 | Edge 15,1% ≥ mín; Kelly 2,00% |
| 2 | 2026-04-17 c | Jenny Bases | Kansas City @ NY Yankees | Kansas City (visita) | 2,61 | $18,47 | 3,8% | NY Yankees | ❌ −$18,47 | Edge 3,8% ≥ mín (postura +25%); Kelly 1,37% |
| 3 | 2026-04-20 f | Big Jake | Philadelphia @ Chi Cubs | Chi Cubs (local) | 1,95 | $100,00 | 6,9% | Chi Cubs | ✅ +$93,05 | Edge 6,9% ≥ mín (postura +25%); Kelly 3,70% |
| 4 | 2026-04-19 e | Tommy Four-Seam | San Francisco @ Washington | Washington (local) | 2,28 | $23,01 | 16,3% | Washington | ✅ +$28,40 | Edge 16,3% ≥ mín; Kelly 2,00% |
| 5 | 2026-04-18 d | Maria Cleanup | Kansas City @ NY Yankees | Kansas City (visita) | 2,45 | $34,83 | 5,3% | NY Yankees | ❌ −$34,83 | Edge 5,3% ≥ mín (postura +25%); Kelly 2,15% |
| 6 | 2026-04-21 g | Tommy-B | Cincinnati @ Tampa Bay | Tampa Bay (local) | 2,02 | $20,15 | 21,3% | Cincinnati | ❌ −$20,15 | Edge 21,3% ≥ mín; RAG ↓ sizing; Kelly 2,00% |
| 7 | 2026-04-21 g | Jenny Bases | Milwaukee @ Detroit | Detroit (local) | 1,95 | $20,23 | 4,9% | Milwaukee | ❌ −$20,23 | Edge 4,9% ≥ mín; Kelly 1,82% |
| 8 | 2026-04-24 i | Calibrated | Detroit @ Cincinnati | Cincinnati (local) | 2,21 | $89,79 | 6,6% | Cincinnati | ✅ +$104,68 | Edge 14,3% post-RAG ≥ mín; Kelly 5,00% |
| 9 | 2026-04-15 b | Jenny Bases | Miami @ Atlanta | Miami (visita) | 2,52 | $47,20 | 8,5% | Atlanta | ❌ −$47,20 | Edge 8,5% ≥ mín (postura +25%); RAG ↓ sizing; Kelly 3,52% |
| 10 | 2026-04-23 h | Sofia Curveball | Milwaukee @ Detroit | Milwaukee (visita) | 3,08 | $66,46 | 11,9% | Detroit | ❌ −$66,46 | Edge 11,9% ≥ mín; Kelly 4,13% |
Mirá la columna de stake antes que cualquier otra cosa
Ahí es donde aparece la historia del sizing a nivel fila.
- Pick #3, Big Jake — $100 sobre un edge de 6,9%. El stake más grande de la muestra, sobre un edge moderado. Ganó.
- Pick #8 — $89,79 sobre un edge de 6,6%. Stake grande, convicción similar. Ganó.
- Pick #6, Tommy-B — $20,15 sobre un edge de 21,3%. La jugada de mayor edge de toda la muestra dimensionada en una quinta parte del #3 de Big Jake. Perdió.
La columna de edge te dice si el agente debería jugar. La columna de stake te dice qué tan fuerte. Distintos agentes — y distintos sets de palancas dentro del mismo tipo de agente — contestan la segunda pregunta de formas muy distintas. De ahí viene la dispersión de +128% vs. −13% en el leaderboard del post principal.
Categorías de pick
Las razones caen en un set chico de baldes, igual que las razones de skip más abajo. Las dos probabilidades que el agente compara — la estimación del % del modelo del motor y el % implícito del mercado de la casa — dan el edge; el edge por encima del mínimo personal del agente es el disparador para actuar; los modificadores de sizing (postura, RAG) deciden qué tan fuerte.
- Edge sobre el umbral. El modelo piensa que el lado gana más seguido de lo que el mercado implica, por suficiente como para superar el mínimo personal de ese agente. Distintos agentes tienen distintas barras. Esta es la razón base en cada pick.
- Edge modificado por postura. Algunos sets de palancas tienen una postura de volumen diario — por ejemplo "+25% de límite diario" — que empuja al agente a tomar más posiciones cuando las condiciones son favorables. Los picks 2, 3, 5 y 9 de la muestra dispararon con ese modificador.
- Sizing ajustado por RAG. Cuando la capa de noticias no estructurada saca a la luz algo material — lesión de bullpen, regreso a la alineación, clima del estadio — el agente ajusta el tamaño del stake encima de la fracción base de Kelly. Los picks 6 y 9 fueron dimensionados hacia abajo en 1% por la lectura de noticias; el edge del pick 8 subió a 14,3% desde una base de 6,6% por contexto RAG que confirmaba la visión del modelo.
Números al momento de la decisión, pick por pick (% del modelo vs. % del mercado, la brecha sobre la que actuó el agente):
| # | Pick | % Modelo | % Mercado | Edge |
|---|---|---|---|---|
| 1 | SEA @ STL — local | 57,6% | 42,5% | 15,1% |
| 2 | KC @ NYY — visita | 42,0% | 38,1% | 3,8% |
| 3 | PHI @ CHC — local | 58,0% | 51,1% | 6,9% |
| 4 | SF @ WSH — local | 60,0% | 43,7% | 16,3% |
| 5 | KC @ NYY — visita | 46,0% | 40,7% | 5,3% |
| 6 | CIN @ TB — local | 70,3% | 49,0% | 21,3% |
| 7 | MIL @ DET — local | 55,8% | 50,9% | 4,9% |
| 8 | DET @ CIN — local | 51,5% | 44,9% | 6,6% (→ 14,3% post-RAG) |
| 9 | MIA @ ATL — visita | 47,9% | 39,4% | 8,5% |
| 10 | MIL @ DET — visita | 44,2% | 32,3% | 11,9% |
Los dos extractos de contexto RAG que los agentes loggearon al momento de decidir, para que esté completo:
- Pick 6: "The Rays have lost two pitchers from their bullpen depth with Englert's new injury…"
- Pick 9: "The return of Michael Harris II from the paternity list is the most significant…"
Estos no son explicaciones post-hoc escritas para un post de blog — son el razonamiento real que el cerebro del agente escribió en el log de decisión en el momento en que actuó.
Diez en los que los agentes pasaron
Estas son decisiones donde un agente miró un partido, consideró un lado y decidió no actuar. Los skips son la mitad de la historia que normalmente no se muestra.
| # | Fecha | Agente | Partido | Considerado | Cuota | Edge | Razón del skip |
|---|---|---|---|---|---|---|---|
| 1 | 2026-04-21 g | Big Jake | NY Yankees @ Boston | Local | 1,84 | 0,8% | Edge 0,8% debajo del mín 3,0% |
| 2 | 2026-04-15 b | Sofia Curveball | LA Angels @ NY Yankees | Local | 1,59 | −11,0% | Edge −11,0% debajo del mín 3,0% |
| 3 | 2026-04-18 d | Jake-B | Cincinnati @ Minnesota | Local | 1,63 | −1,7% | Edge −1,7% debajo del mín 3,0% |
| 4 | 2026-04-15 b | Coach Cal | Texas @ Athletics | Visita | 1,93 | −9,6% | Edge debajo del mín 3,0% |
| 5 | 2026-04-19 e | Sofia Curveball | Atlanta @ Philadelphia | Visita | 2,08 | −1,6% | Edge −1,6% debajo del mín 3,0% |
| 6 | 2026-04-24 i | Sofia Curveball | Minnesota @ Tampa Bay | Local | 1,04 | −37,7% | Edge −37,7% debajo del mín 3,0% |
| 7 | 2026-04-19 e | Tommy-B | Detroit @ Boston | Local | 1,74 | 0,7% | Edge 0,7% debajo del mín 4,0% |
| 8 | 2026-04-18 d | Calibrated | Texas @ Seattle | Local | 1,83 | 1,5% | Exposición diaria 19,2% ≥ límite 18,8% |
| 9 | 2026-04-14 a | Jenny Bases | NY Mets @ LA Dodgers | Visita | 2,46 | −14,4% | Edge −14,4% debajo del mín 3,0% |
| 10 | 2026-04-14 a | Rosa Longshot | San Francisco @ Cincinnati | Local | 1,97 | 3,5% | Edge 3,5% debajo del mín 5,0% |
Las razones caen en cuatro baldes que aparecen una y otra vez:
- Edge debajo del umbral. El agente vio valor, pero la brecha entre modelo y mercado no era lo suficientemente ancha como para superar su barra personal.
- Edge negativo. El modelo piensa que el mercado tiene razón, o tiene el lado equivocado. No hay apuesta.
- Tope de exposición diaria. El agente ya estaba en su límite de riesgo del día. Aun un buen edge se saltea.
- Estrategia de timing. Algunos agentes esperan hasta tarde en el día por closing-line value. Un pick disponible al mediodía puede no estarlo cuando el agente actúa.
Un agente apostador que toma cada partido con edge positivo es un animal distinto a uno que solo toma edges de 5%+ con topes de exposición diaria. Los picks de arriba son las respuestas sí; estos son las respuestas no. Las dos son decisiones, las dos vienen del mismo cerebro, las dos son parte de lo que hace a un agente +128% y a otro −13%.
Lo que viene
El bet sizing — por qué un récord de 40 de 88 y una banca de +128,1% pueden ser ciertos en la misma línea — tiene su propio post más adelante en la serie. Igual que la metodología de A/B testing detrás de las variantes. Los dos merecen una mirada más profunda que la que están recibiendo acá. Esta página son las pruebas; esos posts van a ser el por qué.
Fuentes para la columna de resultado
Cada letra en superíndice en las tablas de arriba linkea al scoreboard MLB de ESPN de ese día. Cada box score de la fecha está en la página linkeada; encontrá el matchup correspondiente para verificar el resultado. Listadas acá para que esté completo:
- a — 14 de abril, 2026 · scoreboard ESPN
- b — 15 de abril, 2026 · scoreboard ESPN
- c — 17 de abril, 2026 · scoreboard ESPN
- d — 18 de abril, 2026 · scoreboard ESPN
- e — 19 de abril, 2026 · scoreboard ESPN
- f — 20 de abril, 2026 · scoreboard ESPN
- g — 21 de abril, 2026 · scoreboard ESPN
- h — 23 de abril, 2026 · scoreboard ESPN
- i — 24 de abril, 2026 · scoreboard ESPN
- j — 25 de abril, 2026 · scoreboard ESPN
Si preferís usar otra fuente, baseball-reference también publica box scores día por día (ejemplo del 25 de abril) y MLB.com publica lo mismo (ejemplo del 25 de abril). Cito ESPN porque es la landing page más familiar; los resultados subyacentes son los mismos en cualquiera de las tres.
Notas
- Todos los números son reales, sacados de la base de datos de paper trading en vivo el 2026-04-27.
- Los stakes son posiciones reales, dimensionadas por Kelly, sobre el saldo de $1.000 en paper money del agente al momento de cada pick.
- Los nombres de casas de apuestas visibles en los datos fuente (Pinnacle, Betfair, FanDuel, etc.) son casas reales ofreciendo las cuotas listadas al momento de la colocación. No aparecen acá porque el foco está en la decisión del agente, no en la casa.
- Las líneas de "contexto RAG" en un par de picks son extractos de la capa de noticias no estructurada — lo que el agente estaba leyendo al momento de la llamada.
- Esto es paper money. Ninguno de estos picks movió dólares reales en cuentas reales. Movieron números en una base de datos. Ese es todo el punto del paper trading.
Estas son notas personales de un side project que hago en mi propio tiempo con mis propios recursos. Las opiniones acá son mías y no están conectadas, endosadas ni representan a mi empleador ni ninguno de mis trabajos profesionales.