Логотип компании
Технологии
30Просмотры

Что такое токены в нейросети и почему они заканчиваются быстрее, чем кажется

Токены в нейросети — это базовые единицы текста, на которые модель разбивает слова, части слов, отдельные символы и знаки препинания перед обработкой, присваивая каждому элементу числовой идентификатор. Это помогает быстрее анализировать запросы, находить языковые закономерности, учитывать контекст и генерировать ответы.

В материале разбираем, как работает токенизация и почему на русском языке нейросетям «думать» сложнее.

Говоря о том, что такое токены в нейросети простыми словами, представьте, что вы разрезаете текст на кусочки пазла. Источник: Summit Art Creations / Shutterstock / FOTODOM

Что такое токены и зачем они нейросетям

Представьте, что вы объясняете задачу человеку, который не знает вашего языка. Чтобы он хоть что-то понял, вы разбиваете каждое слово на слоги и показываете карточку с цифрой для каждого слога.

Примерно так же устроена и языковая модель: текст для нее — это не привычные слова, а последовательность чисел. Проще говоря, нейросеть не умеет читать слова.

Токены это базовые единицы текста, которые нейросеть выделяет перед началом анализа. В качестве единицы измерения может выступать целое слово, его часть, отдельный символ или знак препинания. Каждому элементу присваивается специальный числовой идентификатор. Их и обрабатывает в дальнейшем нейросеть.

Библиотекарь вместо книг работает с карточками каталога. Так ему проще искать нужную информацию.

С нейросетями происходит примерно то же. Разбивая текст на части, модель может:

  • быстрее анализировать запрос;
  • находить закономерности в языке;
  • учитывать контекст разговора;
  • генерировать новые ответы.
Перейти по баннеру

Откуда берутся токены

Их не назначают вручную, а определяют с помощью специального алгоритма токенизации, анализирующего гигантские массивы текста и отбирающего наиболее частотные сочетания символов.

Самый распространенный метод — Byte Pair Encoding (BPE). Алгоритм начинает с букв и шаг за шагом «склеивает» те пары символов, которые чисто статистически чаще всего стоят рядом. Сначала получается «ст», потом «сто», потом «стол» — и так далее. В итоге формируется словарь из 30 000–100 000 символов, покрывающий большинство слов и их словоформ.

Слово «обучение» можно разбить на «обуч» + «ение» — два токена.

«Нейросеть» — на «нейро» + «сеть».

Редкие и незнакомые слова модель тоже «читает», собирая их из знакомых частей — как «электроскутер» складывается из «электро» и «скутер».

Разные компании используют собственные токенизаторы: 

  • OpenAI применяет BPE,
  • Anthropic (создатели Claude) — свой субсловный токенизатор,
  • DeepSeek — адаптированную версию BPE с упором на многоязычные данные.

Сколько слов помещается в один токен

Универсального соотношения нет.

По данным OpenAI, для английского языка в среднем один токен соответствует примерно четырем символам или 0,75 слова.

Чтобы понять масштаб:

  • короткая фраза может занимать 5–10 токенов;
  • страница текста — несколько сотен;
  • книга среднего объема — десятки или даже сотни тысяч.

Поэтому даже ограничение в 100 000 на практике означает возможность обработать довольно внушительный объем информации.

Нейросети считают токены, а мы — деньги. И если за использованием ИИ удобно следить через счетчики токенов, то за личными финансами — с помощью карты «Халва». Она позволяет получать кешбэк до 10%, оплачивать покупки частями и контролировать расходы в мобильном приложении. Так проще понимать, куда уходят средства, и планировать бюджет на будущее.

Халва всегда рядом

Рассрочка* без переплат в 260 000+ магазинов, кешбэк до 10%, доход до 15,5% на остаток в онлайн-копилке.

Оценивайте свои финансовые возможности и риски. Изучите все условия в разделе «Карты»/«Карта Халва» на сайте банка sovcombank.ru 

Заказать карту

Заявка на оформление карты

Почему русский «съедает» токены быстрее

Факт, важный для каждого, кто работает с нейросетями на русском языке: один токен в русском тексте покрывает значительно меньше информации, чем в английском.

Если для английского языка работает правило: 100 токенов ≈ 75 слов, то для русского соотношение другое. Те же 75 слов потребуют около 120–150. Русскоязычный текст расходует лимит в 1,5–2 раза быстрее.

Причина техническая: большинство современных моделей обучали преимущественно на англоязычных данных. Токенизатор «натренирован» на латинский алфавит и его частотные сочетания. Кириллица встречалась в обучающих данных реже, поэтому русские слова дробятся на большее число фрагментов. «Привет» — это 2 символа, а «Hello» — 1.

К тому же русский в принципе «длиннее» английского примерно на 9%.

Так что, если вы работаете с длинными русскими текстами через API и платите за единицы измерения, это обходится дороже, чем аналогичная работа с английским контентом. При одинаковом бюджете на русском вы получите в полтора раза меньше эффективной работы.

Почему токены так важны

У каждой нейросети есть так называемое контекстное окно — максимальное количество единиц измерения, которое модель может учитывать одновременно.

В этот лимит входят:

  • системные инструкции;
  • история переписки;
  • текущий запрос пользователя;
  • ответ самой модели.

Когда лимит исчерпывается, нейросеть начинает забывать старые сообщения или просит начать новый чат.

Именно поэтому длинные диалоги иногда становятся менее точными: часть раннего контекста просто перестает помещаться в доступное окно.

Чем больше контекстное окно — тем комфортнее работать с объемными задачами. Источник: VideoFlow / Shutterstock / FOTODOM

Сколько токенов в разных сервисах

Конкуренция между платформами идет в десятках и сотнях тысяч — и разрыв стремительно растет.

Токены в ChatGPT: как работают ограничения

Токены в ChatGPT ограничены контекстным окном в 400 000 токенов для флагманской серии GPT-5. Это примерно 400 страниц текста на английском или около 200–250 страниц на русском. Сервис ограничивает не количество сообщений, а общий объем текста, который модель может удерживать в памяти.

Каждый новый вопрос расходует символы. Причем учитывается не только сам запрос, но и предыдущая переписка.

Например, если вы ведете длинный рабочий проект в одном чате, через некоторое время часть ранних обсуждений перестанет учитываться. Поэтому для крупных задач часто рекомендуют создавать новые диалоги и периодически делать краткие выжимки из того, что уже обработали.

Сколько токенов в Claude Pro

По данным Anthropic, большинство современных моделей Claude в платных тарифах поддерживают контекстное окно до 500 000 токенов. Для отдельных сценариев в Claude Code доступны окна до 1 миллиона.

Для сравнения: 200 000 символов — это примерно несколько сотен страниц текста. Поэтому Claude считается одним из лидеров по работе с объемными документами.

Сколько токенов в «Дипсик»

Если в 2025 году модели DeepSeek-V3 и DeepSeek-R1 работали с окном в 128 000 токенов, то с выходом DeepSeek-V4-Pro и DeepSeek-V4-Flash в апреле 2026 года контекстное окно выросло до 1 миллиона.

В таком объеме помещается примерно 800 страниц текста на английском. Это рекордный показатель среди коммерчески доступных моделей на сегодняшний день.

Как экономить токены

Если вы часто работаете с ИИ, несколько приемов помогут использовать контекст эффективнее:

  • формулируйте запросы кратко и конкретно;
  • удаляйте лишние фрагменты текста из промптов;
  • разбивайте большие документы на части;
  • начинайте новый чат для новой задачи;
  • периодически просите нейросеть сделать краткое резюме обсуждения.

Так вы сможете получить более точные ответы и избежать ситуации, когда важный контекст неожиданно исчезает.

Чем лучше вы представляете, как расходуются токены, тем проще создавать длинные диалоги, анализировать большие документы и получать качественные ответы от нейросети.

Список источников

  1. OpenAI Help Center: What are tokens and how to count them? (дата обращения: 01.06.2026).
  2. Claude API Docs: Token counting (дата обращения: 01.06.2026).
  3. DeepSeek API Docs: Models & Pricing (дата обращения: 01.06.2026).

Подпишитесь на email-рассылку

Раз в неделю мы будем присылать вам лайфхаки о том, как обращаться с деньгами и повышать финансовую грамотность

Выражаю согласие на обработку персональных данных и принимаю правила пользования платформой, а также даю согласие на получение рекламной информации от Банка.

Начать обсуждение

Комментарии проходят модерацию по правилам блога

Статьи по теме

Читать полную статью
Новости
12.04.2025

Минцифры хотят ввести новый платеж — «Налог на трафик»

Минцифры хотят ввести новый платеж — «Налог на трафик»
349Просмотры
Читать полную статью
25.06.2025
Новости

Правительство утвердило обязательные программы для предустановки на смартфоны

349Просмотры
Читать полную статью

Что такое СКУД и как выбрать систему контроля доступа для дома и офиса

175Просмотры