Tag: Tokenmaxxing

Amazon beendet internes AI-Ranking nach Missbrauch durch Mitarbeiter

LGR Reutlingen – 30 Mai 2026 | Amazon hat sein internes AI-Ranking abgeschafft, nachdem Mitarbeiter begonnen hatten, übermäßig KI-Tools zu nutzen, um ihre Platzierungen zu verbessern. Dies führte zu einem Anstieg der Betriebskosten, da die intensive Nutzung der Technologie die Rechenressourcen des Unternehmens belastete. In einer offiziellen Stellungnahme erklärte Amazon, dass “das Beta-Dashboard kein formelles oder genehmigtes Tool war und mittlerweile eingestellt wurde.”

Der Schritt folgt auf Berichte, dass einige Mitarbeiter versucht hatten, ihre Punktzahlen durch unnötige Aktivitäten zu steigern, indem sie AI-Agenten einsetzten – autonome Bots, die Aufgaben im Auftrag der Nutzer erledigen. Diese Maßnahme wurde als “Tokenmaxxing” bezeichnet, ein Begriff, der beschreibt, wie Mitarbeiter KI für nicht erforderliche Aufgaben nutzen, um sich im Ranking nach oben zu schieben. Dave Treadwell, ein Senior Vice President bei Amazon, hatte in einer Mitteilung an die Mitarbeiter erklärt, dass das Ranking mit “guten Absichten” erstellt wurde.

Das Unternehmen betonte, dass das Ziel des Dashboards darin bestand, das Bewusstsein dafür zu schärfen, wie KI die Arbeit beschleunigen kann. “Wir konzentrieren uns auf betriebliche Effizienz“, hieß es in der Erklärung. Der Druck auf die Mitarbeiter, KI-Technologien zu integrieren, ist in den letzten Monaten gestiegen, insbesondere seit Amazon angestrebt hat, dass mehr als 80 Prozent der Entwickler wöchentlich AI nutzen.

Die Konsequenzen des ‘Tokenmaxxing’

Die Einführung des internen Rankings führte dazu, dass einige Mitarbeiter begannen, ihre Nutzung von KI über Gebühr zu steigern. Diese Taktik wurde nicht nur von Amazon selbst als problematisch erkannt, sondern auch von anderen großen Technologiefirmen, wie Meta, wo Mitarbeiter ähnliche Strategien verfolgten, um ihre Position in internen Rankings zu verbessern.

Das übermäßige Engagement mit KI-Tools hat für Amazon auch finanzielle Konsequenzen. In diesem Jahr plant das Unternehmen, seine Investitionen auf 200 Milliarden Dollar zu erhöhen, wobei der Großteil dieser Mittel in KI und Rechenzentrum-Infrastruktur fließen soll. Der Trend hin zu verbrauchsabhängigen Preismodellen, wie sie von Unternehmen wie Anthropic eingeführt wurden, hat zusätzlich die Kosten für einige Kunden erhöht, was die Notwendigkeit unterstreicht, die Nutzung von KI-Tools besser zu regulieren.

Amazon hat jedoch betont, dass die Schaffung des KiroRank-Dashboards nie dazu gedacht war, die Nutzung von KI um ihrer selbst willen zu fördern. “Wir sind stolz auf die Art und Weise, wie unsere Teams diese Technologie annehmen”, so das Unternehmen weiter. Die Schließung des Rankings könnte als Versuch gewertet werden, die Effizienz zu steigern und die Kosten im Griff zu behalten, während gleichzeitig Innovation gefördert wird.

Die Herausforderungen, die sich aus der unnötigen Nutzung von AI ergeben, sind Teil eines größeren Problems, dem sich viele Unternehmen stellen müssen, während sie versuchen, die Vorteile von KI zu maximieren, ohne die Betriebskosten aus den Augen zu verlieren. In einer Zeit, in der die Technologie schnell voranschreitet, ist es entscheidend, dass Unternehmen wie Amazon einen Balanceakt finden, der sowohl Innovation als auch Kosteneffizienz berücksichtigt.

May 30, 2026
Tokenmaxxing: Produktivität auf der Kippe?

LGR Reutlingen – 27 Mai 2026 | In der Tech-Branche sorgt ein neuer Begriff für Aufsehen: Tokenmaxxing. Dabei handelt es sich um die Praxis, den Verbrauch von AI-Tokens zu maximieren, um interne Produktivitätsziele zu erreichen oder sich auf firmeninternen Ranglisten einen Platz an der Spitze zu sichern. Diese Entwicklung nimmt insbesondere nach der jüngsten Google I/O-Keynote Fahrt auf, bei der CEO Sundar Pichai den Begriff explizit erwähnte. Doch während einige Unternehmen den Tokenverbrauch als Erfolgsmesser betrachten, warnen Experten vor den wirtschaftlichen Folgen, die diese Praxis mit sich bringen kann.

Ein besonders eindrucksvolles Beispiel für die massiven Ausgaben durch Tokenmaxxing liefert Peter Steinberger, Gründer von OpenClaw und derzeit bei OpenAI tätig. Auf der Plattform X teilte er einen Screenshot, der belegte, dass er in nur 30 Tagen Tokens im Wert von rund 1,3 Millionen Dollar für OpenAIs Coding-Agenten Codex verbraucht hat. Dieses Beispiel verdeutlicht, wie schnell der Tokenverbrauch von einem Insider-Witz zu einem ernsthaften Kostenproblem avancieren kann.

Der Begriff selbst hat seine Wurzeln im Gen-Z-Slang, ähnlich wie „looksmaxxing“ oder „sleepmaxxing“. Im April 2026 wurde Tokenmaxxing durch einen Bericht des Branchenmediums The Information populär, der von einem internen Dashboard bei Meta Platforms berichtete. Ein Mitarbeiter hatte ein Leaderboard mit dem Titel „Claudeonomics“ ins Leben gerufen, das Kollegen nach ihrem individuellen Tokenverbrauch einordnete und Titel wie „Token Legend“ und „Cache Wizard“ vergab. Laut den Berichten verbrauchten Meta-Mitarbeitende in nur 30 Tagen satte 60 Billionen Tokens, wobei der Spitzenreiter auf etwa 281 Milliarden Tokens kam – ein Betrag, der bei den aktuellen API-Preisen Millionen kosten kann. Das Dashboard wurde daraufhin schnell wieder offline genommen.

Ähnliche interne Wettbewerbe wurden auch bei Microsoft und Amazon dokumentiert. Pichai räumte auf der I/O-Bühne ein, dass einige von diesen Praktiken als Tokenmaxxing bezeichnet werden könnten und dass es durchaus einen wahren Kern darin gebe. Google verarbeitet mittlerweile beeindruckende 3,2 Billiarden Tokens pro Monat – ein Anstieg von 9,7 Billionen vor zwei Jahren.

Ein weiteres besorgniserregendes Beispiel ist der Fall von Uber. Der CTO Praveen Neppalli Naga gab in einem Interview mit The Information zu, dass das Unternehmen sein gesamtes Jahresbudget für 2026 bereits nach vier Monaten für Tools wie Claude Code und Cursor aufgebraucht hatte. Die Nutzung von Claude Code stieg im ersten Quartal 2026 von 32 auf 84 Prozent der Ingenieure. Bei etwa 5.000 Ingenieuren gibt jeder Einzelne monatlich zwischen 500 und 2.000 US-Dollar für AI-Tools aus – das summiert sich schnell auf Millionenbeträge. Uber-Präsident Andrew Macdonald sprach von einem „head-exploding moment“ und stellte infrage, ob die höheren Token-Ausgaben tatsächlich zu einem proportionalen Anstieg der Produktivität führen. Sein Fazit: Obwohl mehr Features bereitgestellt werden, lässt sich keine direkte Verbindung zwischen Tokenverbrauch und einem signifikanten Anstieg nützlicher Funktionen herstellen.

Die Reaktion von Microsoft auf ähnliche Kostenexplosionen war drastisch: Tausenden interner Ingenieure wurde der Zugang zu Claude Code entzogen, um im Hinblick auf das neue Fiskaljahr Kosten zu sparen.

In dieser Debatte meldet sich nun auch Eugene Cheah, CEO und Mitgründer von Featherless.ai, zu Wort. Er warnt die Branche davor, den Tokenverbrauch als Maßstab für den Erfolg zu nutzen. „Token-Nutzung ist eine Metrik, aber extremer Verbrauch im Gewand von Tokenmaxxing ist in den meisten Fällen kein nachhaltiges Geschäftsmodell“, erklärt Cheah. „Es ist ein plumpes Mittel, um Erfolg zu messen. Nicht alle Tokens sind gleich; unterschiedliche Aktionen erzeugen unterschiedliche Returns für Unternehmen.“

Cheah ist überzeugt, dass die nächste Phase der Enterprise-AI nicht auf Maximierung, sondern auf Token-Minimierung ausgerichtet sein wird. „Jedes unnötig generierte Token wirkt wie eine direkte Steuer auf die Produktivität eines Unternehmens“, warnt er. „Smartere Architekturen setzen auf kleinere, spezialisierte Modelle, die mit einem Bruchteil der Rechenleistung präzise Ergebnisse liefern können.“ In naher Zukunft werden die besten AI-Frameworks daran gemessen werden, wie wenig sie tatsächlich generieren müssen, um eine Aufgabe zu erfüllen.

Ein weiterer Punkt, den Cheah hervorhebt, ist der Anfangseffekt, der bei neuen AI-Produkten häufig auftritt: „Ein Anstieg des Tokenverbrauchs ist in den frühen Tagen eines neuen Produkts normal, besonders wenn die Einstiegspreise niedrig sind. Die wahre Nachfrage und die langfristige Tragfähigkeit einer AI-Plattform zeigen sich jedoch erst, wenn die Preise sich normalisieren und die tatsächlichen Kosten für Unternehmen anfallen.“

Das Phänomen Tokenmaxxing wird zunehmend als Beispiel für Goodharts Gesetz interpretiert – die Beobachtung, dass eine Kennzahl ihre Aussagekraft verliert, sobald sie zum Ziel erklärt wird. Cristina Cordova, COO von Linear, brachte es auf den Punkt: Ingenieure nach Tokenausgaben zu bewerten, ist vergleichbar mit der Beurteilung eines Marketing-Teams nach den Ausgaben.

Es gibt jedoch auch Verteidiger dieser Praktiken. Garry Tan, CEO von Y Combinator, hat Tokenmaxxing positiv kommentiert, und Meta-CTO Andrew Bosworth erklärte gegenüber Forbes, dass sein bester Ingenieur das Äquivalent seines Gehalts in Tokens ausgibt, dabei jedoch „fünf- bis zehnmal produktiver“ sei.

Die Tech-Riesen scheinen die Bedenken ernst zu nehmen. Pichai stellte Gemini 3.5 Flash als Lösung für die Herausforderungen des Tokenmaxxings vor. Ein Kunde, der täglich eine Billion Tokens verbraucht, könnte durch die Verlagerung von 80 Prozent seiner Workloads auf Flash jährlich über eine Milliarde US-Dollar einsparen.

Die Lehren aus den Fällen von Meta, Uber und Microsoft sowie die Warnungen von Cheah sind klar: Unternehmen, die im Jahr 2026 noch immer glauben, dass mehr Tokens zwangsläufig zu mehr Produktivität führen, könnten bei der nächsten Rechnung überrascht werden.

May 27, 2026
Tokenmaxxing: Ein direkter Steuer auf die Produktivität

LGR Reutlingen – 27 Mai 2026 | In den letzten Wochen hat ein neuer Begriff die Diskussion in der Technologiebranche angeheizt: Tokenmaxxing. Dabei handelt es sich um die Praxis, den Verbrauch von KI-Token zu maximieren, um interne Produktivitätskennzahlen zu erreichen oder auf internen Ranglisten nach oben zu klettern. Nach der kürzlichen Keynote von Google I/O, in der CEO Sundar Pichai den Begriff ausdrücklich erwähnte, werden die warnenden Stimmen aus der Branche immer lauter.

Zuletzt sorgte Peter Steinberger, Gründer von OpenClaw und derzeit bei OpenAI, für Aufsehen, als er auf X einen Screenshot teilte, der zeigte, dass er in den letzten 30 Tagen Token im Wert von 1,3 Millionen Dollar für OpenAI’s Codex verbrannt hatte.

Der Begriff, der sich an Gen-Z-Slang wie „looksmaxxing“ anlehnt, trat im April 2026 in den Mainstream, nachdem das Branchenmedium The Information über ein internes Dashboard bei Meta Platforms berichtete. Ein Mitarbeiter hatte eigenständig eine Rangliste namens „Claudeonomics“ erstellt, die Kollegen nach ihrem individuellen Tokenverbrauch bewertete und Titel wie „Token Legend“, „Model Connoisseur“ oder „Cache Wizard“ verlieh. Laut The Information verbrauchten Meta-Mitarbeiter in 30 Tagen rund 60 Billionen Token; der bestplatzierte Nutzer allein machte ungefähr 281 Milliarden Token aus – ein Volumen, das, basierend auf den regulären API-Preisen, Kosten in Höhe von mehreren hunderttausend bis mehreren Millionen US-Dollar nach sich ziehen kann. Das Dashboard wurde einige Tage später offline genommen.

Ähnliche interne Wettbewerbe wurden mittlerweile auch bei Microsoft und Amazon dokumentiert. Sogar bei Google selbst erkannte Pichai auf der I/O-Bühne an: „Einige könnten dies Tokenmaxxing nennen, und da könnte etwas Wahres dran sein.“ Laut eigenen Angaben verarbeitet Google nun 3,2 Billiarden Token pro Monat – vor zwei Jahren lag diese Zahl bei 9,7 Billionen.

Ein Beispiel: Uber verbraucht sein Jahresbudget in vier Monaten

Wie schnell sich das Spiel in ein Geschäftsproblem verwandelt, zeigt das prominenteste Beispiel der letzten Wochen: Uber. Der CTO Praveen Neppalli Naga hatte in einem Interview mit The Information im April offengelegt, dass das Mobilitätsunternehmen bereits sein gesamtes Jahresbudget 2026 für Tools wie Claude Code und Cursor innerhalb von nur vier Monaten aufgebraucht hatte. Im ersten Quartal 2026 stieg der Anteil der Ingenieure, die Claude Code nutzten, von 32 auf 84 Prozent. Bei rund 5.000 Ingenieuren gibt jeder Einzelne derzeit zwischen 500 und 2.000 Dollar pro Monat nur für KI-Tools aus – was sich auf Millionen von Dollar pro Monat summiert.

Doch auffälliger als die Zahlen ist die rückblickende Einschätzung: Der Präsident und COO von Uber, Andrew Macdonald, sprach im Rapid Response Podcast von einem „Kopf-explodierenden Moment“ und stellte öffentlich in Frage, ob höhere Token-Ausgaben tatsächlich in einem proportionalen Produktivitätsgewinn resultieren. Sein Fazit nach Gesprächen mit dem Team des CTO: Implizit wurden zwar mehr Funktionen ausgeliefert, doch eine direkte Verbindung zwischen Tokenverbrauch und „25 Prozent nützlicheren Verbraucherfunktionen“ ließ sich schlichtweg nicht herstellen. Macdonalds prägnante Bemerkung: „KI scheint kostenlos zu sein, wenn man einfach nur interessante Szenarien entwickelt. Aber letztendlich zahlt das Unternehmen dafür.“

Als Reaktion auf ähnliche Kostenexplosionen hat Microsoft den Zugriff auf Claude Code für Tausende interner Ingenieure widerrufen und sie auf GitHub Copilot CLI umgeschichtet, um Geld zu sparen, bevor das neue Finanzjahr beginnt.

Tokenmaxxing: Ein irreführendes Erfolgsmessinstrument

In genau diese Debatte tritt Eugene Cheah, CEO und Mitgründer von Featherless.ai, mit einer klaren Warnung an die Branche ein: Die Verwendung des Tokenverbrauchs als Maßstab für den Erfolg führt seiner Meinung nach dazu, dass Unternehmen über den tatsächlichen wirtschaftlichen Wert ihrer KI-Implementierungen irreführend informiert werden.

„Token-Nutzung ist eine Kennzahl, aber extremer Verbrauch unter dem Deckmantel von Tokenmaxxing ist in den meisten Fällen kein nachhaltiges Geschäftsmodell und eine ungenaue Art, den realen Wert zu verstehen“, sagt Cheah. „Es ist eine plumpen Art, Erfolg zu messen. Nicht alle Token sind gleich; unterschiedliche Aktionen erzeugen unterschiedliche Erträge für Unternehmen. Das Verfolgen dieser Zahlen zeigt, dass einige das tatsächliche Mechanismus der Kapitalrendite von KI noch immer nicht verstehen.“

Cheah argumentiert, dass die nächste Phase der Unternehmens-KI nicht durch Maximierung, sondern durch Token-Minimierung definiert wird: „Während Ingenieurteams massive Kontextfenster und hohe Durchsätze oft als Schönheitsmerkmale betrachten, wird die nächste Phase tatsächlich das Gegenteil sein. Jeder unnötige Token, der generiert wird, ist eine direkte Steuer auf die Unternehmensproduktivität, verlangsamt die Latenz und drainiert die Wirtschaftlichkeit pro Einheit.“

Und weiter: „Der Ansatz, sich auf ein riesiges Modell zu verlassen, um jede Aufgabe zu bewältigen, fördert lediglich die verschwenderische Generierung. Stattdessen verwenden intelligentere Architekturen kleinere, spezialisierte Modelle, die darauf ausgelegt sind, mit einem Bruchteil der Rechenleistung punktgenau zu arbeiten. In naher Zukunft werden die ausgeklügeltsten KI-Frameworks daran gemessen, wie wenig sie tatsächlich generieren müssen, um die Aufgabe zu erledigen.“

Cheah weist auch auf einen Effekt hin, der in der Branche derzeit besonders sichtbar wird: „Ein Anstieg des Tokenverbrauchs ist in den frühen Tagen eines hochkarätigen neuen KI-Produktstarts völlig normal, insbesondere wenn die Einführungskosten minimal sind. Doch die tatsächliche Nachfrage und die langfristige Tragfähigkeit jeder KI-Plattform werden erst dann deutlich, wenn sich die Preise normalisieren und die wahren Kosten für die Unternehmen eintreten.“

Beobachter rahmen das Phänomen des Tokenmaxxings zunehmend als ein klassisches Beispiel für Goodharts Gesetz: Die Beobachtung, dass eine Messgröße aufhört, eine gute Messgröße zu sein, sobald sie ein Ziel wird. Die COO von Linear, Cristina Cordova, fasste es auf X zusammen: Ingenieure nach Token-Ausgaben zu bewerten, sei wie ein Marketingteam danach zu bewerten, wer das meiste Geld ausgegeben hat.

Gleichzeitig ist die Bewegung nicht ohne Verteidiger: Y Combinator CEO Garry Tan hat den Begriff beispielsweise angenommen und Meta CTO Andrew Bosworth erklärte gegenüber Forbes, dass sein bester Ingenieur das Äquivalent seines Gehalts in Token ausgegeben habe – aber im Gegenzug „fünf bis zehn Mal produktiver“ gewesen sei.

Dass die Hyperscaler die Gegenwind ernst nehmen, wurde auf der I/O-Bühne offensichtlich: Pichai positionierte Gemini 3.5 Flash explizit als Ausweg aus dem Tokenmaxxing-Rausch. Ein Kunde, der täglich eine Billion Token verarbeitet, könne mehr als eine Milliarde US-Dollar jährlich sparen, indem er 80 Prozent seiner Arbeitslasten auf Flash umschichtet.

Die Botschaft, die sich aus den Fällen von Meta, Uber und Microsoft sowie aus Cheahs Warnung ableitet, ist unmissverständlich: Wer im Jahr 2026 noch davon überzeugt ist, dass mehr Token automatisch mehr Produktivität bedeuten, könnte bei der nächsten Rechnung überrascht werden.

May 27, 2026