Некоторые компании начали намеренно упрощать ответы своих ИИ-моделей, превращая их почти в «каменный век общения». Вместо длинных объяснений и вежливых формулировок нейронки выдают короткие фразы в духе «Халк крушить».

Все из-за стремительно растущих расходов на работу с языковыми моделями. Чем длиннее ответ, тем больше токенов он потребляет, а значит — тем дороже обходится каждый запрос.
По данным 404 Media, так называемые «caveman-режимы» уже используют разработчики, работающие с Claude Code, Codex и Gemini. Идея в том, чтобы выжимать максимум смысла при минимуме слов.

Интересно, что среди пользователей инструмента, по словам его создателя, есть сотрудники крупных компаний вроде OpenAI, Nvidia и GitHub. Более того, один из инженеров OpenAI даже участвовал в доработке поддержки такого плагина для Codex. Это экономит до 65-75% токенов.
Пещерный человек беречь твой токен, беречь твои деньги.
