¿Qué es un token, y por qué la IA cuenta tokens en vez de palabras?

Question

Accepted Answer

Un token es un trozo de texto, a menudo un fragmento de palabra y no una palabra entera. Antes de leer tu texto, el modelo lo parte en tokens y asigna un número a cada uno. Los modelos cobran y presupuestan en tokens, no en palabras, porque los tokens son la unidad real que procesan. La misma idea puede costar más o menos según cómo se parta: las palabras comunes en inglés son un token, mientras que el código, las palabras raras y muchos idiomas no ingleses se rompen en más tokens por palabra.

Tokens y tokenización, explicados

Lo que la gente entiende mal

Dónde lo ves en productos reales

Explicadores relacionados