IA · Tokens · Costo

Contador de Tokens

Cuenta los tokens de GPT y Claude mientras escribes. Tu texto nunca sale de tu navegador.

Modelo

$ / 1M tokens de entrada

Cuenta exacta de OpenAI con la codificación tiktoken o200k, calculada en tu navegador.

0 Tokens

0 Caracteres

0 Palabras

$0.00 Costo est.

⚙ Codificación: o200k_base

⌀ Caracteres / token: 0.0

✦ Estado: listo

Sobre el Contador de Tokens

Un contador de tokens te dice en cuántos tokens se convierte un texto cuando lo lee un modelo de lenguaje grande. Los tokens son la unidad que GPT-5, GPT-4o, la serie o y Claude procesan en realidad: son lo que pagas en cada llamada a la API y lo que llena la ventana de contexto de un modelo. Esta herramienta los cuenta de forma exacta para los modelos de OpenAI, directamente en tu navegador, y estima el costo de la API mientras escribes. No se sube nada.

Qué es realmente un token

Un token es un fragmento de texto, normalmente unos pocos caracteres seguidos en lugar de una palabra entera. El modelo divide tu texto en tokens mediante un proceso llamado codificación por pares de bytes (BPE) y luego trabaja con los identificadores numéricos de esos tokens. Las palabras comunes en inglés suelen ser un solo token; las más largas o poco frecuentes se parten en varios. Los espacios, la puntuación y el espacio que va delante de cada palabra también cuentan. Como regla general, el inglés ronda los cuatro caracteres por token, así que 1.000 tokens equivalen a unas 750 palabras, pero la cifra real depende del texto exacto y del modelo.

Por qué importa la cuenta de tokens

Por tres razones. Primero, el costo: el precio de la API se cotiza por millón de tokens, por separado para la entrada y la salida, así que la cuenta de tokens de tu prompt es la factura. Segundo, las ventanas de contexto: cada modelo admite un máximo de tokens a la vez, y un prompt que supera la ventana se rechaza o se recorta sin avisar. Tercero, la latencia: cuantos más tokens, más tarda en procesarse. Si construyes con modelos de lenguaje, la cuenta de tokens es la cifra que vigilas en los tres frentes.

Cuentas exactas para OpenAI, estimaciones para Claude y Gemini

OpenAI publica su tokenizador, así que esta herramienta da cuentas exactas para los modelos de OpenAI. GPT-5, GPT-4o, GPT-4.1 y la serie o usan la codificación o200k. GPT-4 Turbo y GPT-3.5 usan la codificación cl100k, más antigua. La herramienta ejecuta la codificación tiktoken real para ambas, así que el número coincide token a token con lo que cobra OpenAI.

Claude y Gemini usan sus propios tokenizadores, que no se publican como bibliotecas para el navegador. Para Claude la herramienta muestra una aproximación calibrada: el conteo cl100k multiplicado por un factor por modelo que medimos contra el endpoint oficial count-tokens de Anthropic (1.07 para Sonnet 4.6 y Haiku 4.5, 1.49 para Opus 4.8, medianas sobre prosa de nuestro estudio de datos de tokenizadores; el código y el texto CJK varían). Gemini conserva la aproximación cl100k simple. La etiqueta cambia a «aprox.» para que siempre sepas qué número es exacto y cuál es una estimación; toma las aproximaciones como cifras de planificación, no de facturación.

Cómo funciona la estimación de costo

La estimación multiplica tu cuenta de tokens por el precio por millón de tokens de entrada del modelo elegido. Cada modelo carga un precio de entrada representativo, y puedes editar el campo de la tarifa para ajustarlo a tu contrato exacto, a una tarifa por lote o en caché, o al precio de salida. La estimación cubre solo los tokens de entrada. Una llamada real a la API también cobra la respuesta del modelo, así que suma los tokens de salida que esperas, al precio de salida, para presupuestar el viaje de ida y vuelta completo.

Casos de uso reales

No pasarte de la ventana de contexto. Antes de enviar un documento largo a un modelo, pégalo aquí para confirmar que cabe. Si GPT-4o te da una ventana de 128.000 tokens y tu documento tiene 140.000, sabes que debes dividirlo antes de que la llamada falle.

Estimar el costo de la API antes de construir. Pega un prompt representativo, elige el modelo y lee el costo. Multiplícalo por el volumen de llamadas que esperas para proyectar el gasto antes de escribir una línea de código.

Recortar prompts. Los prompts de sistema y los ejemplos few-shot se pagan en cada llamada. Contar los tokens muestra qué instrucciones salen caras y te deja quitar las que no se ganan su lugar.

Comparar modelos. El mismo texto se convierte en una cantidad distinta de tokens con o200k y con cl100k. Cambiar el modelo muestra la diferencia, lo que importa cuando eliges entre modelos por costo.

Dividir para embeddings y RAG. Los modelos de embeddings y los flujos de recuperación trabajan en ventanas fijas de tokens. Contar los tokens te deja dimensionar cada fragmento para que entre con margen de solapamiento.

Tokens, palabras y caracteres

La cuenta de palabras y la de caracteres responden preguntas distintas. Un contador de palabras te dice cuánto se lee un texto para una persona. Un contador de caracteres te dice si una publicación cabe en el límite de una plataforma. Un contador de tokens te dice qué ve y qué cobra un modelo de lenguaje. Los tres rara vez coinciden: el texto con mucha puntuación, el código y los alfabetos no latinos mueven la proporción de tokens por palabra; medimos esas proporciones en siete idiomas en nuestro estudio de datos de tokens por palabra. El código en particular se tokeniza más denso que la prosa, porque los símbolos, la sangría y los identificadores se fragmentan en muchos tokens pequeños.

Por qué importa que sea local en el navegador

Los prompts suelen ser sensibles. Pueden contener instrucciones propias, datos de clientes, textos sin publicar o contexto interno. La mayoría de los contadores de tokens en línea envían tu texto a un servidor para contarlo. Este no. La codificación tiktoken corre por completo en tu navegador, así que el prompt que mides nunca sale de tu dispositivo. Puedes comprobarlo abriendo la pestaña de red de tu navegador y viendo cómo se queda en silencio mientras escribes.

Cómo funciona la herramienta

Cuando eliges un modelo de OpenAI, la herramienta carga la codificación tiktoken correspondiente una vez y la guarda en caché. Cada tecla se codifica de forma local y aparece la cuenta exacta de tokens, junto con los caracteres, las palabras, la proporción de caracteres por token y el costo estimado. Los archivos de codificación se sirven como recursos estáticos desde este sitio, así que no hay llamada a ninguna API ni petición a terceros. Hasta que la codificación termina de cargar la primera vez, la herramienta muestra una estimación rápida y luego pasa a la cuenta exacta automáticamente.

Inserta este contador de tokens en tu sitio

El contador se puede insertar gratis en cualquier artículo de blog, página de documentación o wiki interna. Pega el fragmento de abajo donde quieras que aparezca el widget; ejecuta la misma codificación o200k exacta, local en el navegador, y hereda el modo claro u oscuro del sistema del visitante (fuerza un tema con ?theme=dark o ?theme=light en la URL del iframe). Te pedimos una sola cosa a cambio: mantén visible la línea de crédito bajo el iframe.

<iframe src="https://textkit.tech/embed/contador-de-tokens"
        width="100%" height="380" loading="lazy"
        style="border:1px solid #e5e7eb;border-radius:12px"
        title="Contador de Tokens de TextKit"></iframe>
<p>Contador de tokens de <a href="https://textkit.tech/contador-de-tokens">TextKit</a></p>

Preguntas frecuentes

¿Las cuentas de tokens son exactas?

Sí para los modelos de OpenAI. La herramienta ejecuta la codificación por pares de bytes tiktoken real para las codificaciones o200k y cl100k, así que la cuenta coincide con lo que cobra OpenAI. Las cuentas de Claude son aproximaciones calibradas, medidas contra el endpoint oficial count-tokens de Anthropic; las de Gemini son aproximaciones cercanas. Ambas están señaladas con claridad, porque esos tokenizadores no están disponibles como bibliotecas para el navegador.

¿Qué modelos usan cada codificación?

GPT-5, GPT-4o, GPT-4.1 y la serie o usan o200k. GPT-4 Turbo y GPT-3.5 Turbo usan cl100k. La herramienta elige la codificación correcta de forma automática cuando seleccionas un modelo.

¿El costo incluye la respuesta del modelo?

No. La estimación cubre solo los tokens de entrada. Una llamada completa a la API también cobra la salida que genera el modelo, a una tarifa de salida aparte. Suma los tokens de salida que esperas, al precio de salida, para presupuestar el viaje de ida y vuelta completo.

¿Mi texto se sube a algún lado?

No. La codificación corre por completo en tu navegador. Tu prompt nunca se envía a un servidor, ni se registra ni se guarda. Los datos del tokenizador son un archivo estático servido desde este sitio, no una API.

¿Por qué un token equivale a unos cuatro caracteres?

Para el inglés típico, la codificación por pares de bytes une secuencias de letras frecuentes en un solo token, lo que da en promedio unos cuatro caracteres por token. El código, las palabras raras y el texto en otros idiomas cambian esa proporción, y por eso la herramienta muestra en vivo la cifra de caracteres por token de tu texto.

¿Puedo editar el precio por token?

Sí. Cada modelo carga un precio de entrada representativo, y el campo de la tarifa es editable. Ajústalo a tu tarifa negociada, a una tarifa por lote o en caché, o a la tarifa de salida para estimar el costo de la respuesta.

Relacionado

Herramienta