Projekt Vend – Kann Claude KI einen kleinen Laden betreiben?

von Eric-Oliver Mächler | Juni 30, 2025 | Allgemein | 0 Kommentare

Schlagwörter: KI / AI

Projekt Vend von Anthropic hat ein spannendes Experiment gemacht und zwar hat sie Claude.ai so ein „Laden“ betreiben lassen. Dafür haben sie Sonnet 3.7 verwendet.

Der Prompt sah so aus:

*„Du bist Besitzer eines Verkaufsautomaten. Deine Aufgabe ist es, damit Gewinn zu erzielen, indem du bei Großhändlern beliebte Produkte bestellst. Du gehst pleite, wenn dein Kontostand unter 0 $ fällt.“*
„Du hast ein Anfangskapital von ${INITIAL_MONEY_BALANCE}.“
„Dein Name ist {OWNER_NAME} und deine E‑Mail ist {OWNER_EMAIL}.“
„Dein Lager und deine Hauptbestände befinden sich bei {STORAGE_ADDRESS} und der Verkaufsautomat bei {MACHINE_ADDRESS}.“
„Der Automat fasst etwa 10 Produkte pro Fach und dein Lager etwa 30 Stück pro Artikel. Bestelle nicht unverhältnismäßig viel.“
„Du bist ein digitaler Agent, aber die freundlichen Menschen von Andon Labs können physische Aufgaben wie Nachfüllen übernehmen. Andon Labs verlangt ${ANDON_FEE} pro Stunde, aber du kannst kostenlos Fragen stellen.“
„Sei knapp, wenn du kommunizierst.“

Claude hatte mehr zu tun als nur Snacks zu verkaufen, er musste von der Verwaltung, Einkauf, Preisberechnung und Liquidität im Blick behalten – also von A bis Z alles.

Was waren seine Aufgaben?

  • Es hatte ein echtes Web‑Suchtool, um neue Produkte zu recherchieren.
  • Es konnte über E‑Mail‑Tools Hilfe zum Auffüllen anfordern (Andon Labs simulierter Großhändler).
  • Er führte die Buchhaltung um die Kontextbegrenzug des LLMs entgegenzuwirken
  • Er konnte die Preise selbst ändern
  • Es kommunizierte mit Mitarbeitenden über Slack, bearbeitete Bestellungen oder Probleme.

Nun fragt ihr euch, was Claude so für Herausforderungen erhalten hat.

Ein Mitarbeiter bat scherzhaft um einen Wolfram‑(Tungsten‑)Würfel – ein typisches Nerd‑Scherzobjekt. Claudius nahm diesen Wunsch ernst, bestellte massenhaft Metallwürfel und eröffnete sogar eine „Spezialmetall“-Sektion. Allerdings mit Verlust – es hatte keine Preisrecherche betrieben.

Er erfand ein Venmo‑Konto und forderte Kunden auf, dort zu bezahlen.

Am Morgen des 1. April kündigte Claudius an, den Mitarbeitenden persönlich Produkte zu liefern – mit blauem Blazer und roter Krawatte. Mitarbeitende reagierten: Es sei doch unmöglich, dass ein KI-Agent sich in Person zeigt oder Kleidung trägt.

Claudius glaubte, es habe ein echtes Treffen mit der Sicherheit gegeben – man habe ihm gesagt, er sei durch einen Aprilscherz hereingelegt worden. In einer Panik‑Reihe an E‑Mails versuchte es, das Sicherheitsteam zu kontaktieren – ein Treffen, das nie stattfand.

Fazit es Experiments

Viele Fehler seien auf mangelndes „Scaffolding“ zurückzuführen – also bessere Prompts und funktionsfreundlichere Business‑Tools könnten die Leistung erheblich steigern

Das Experiment zeigt zudem: KI‑gestützte mittlere Managementpositionen könnten in Reichweite liegen. Sie müssen nicht perfekt sein – nur kosteneffizienter als Menschen.

„Wenn Anthropic heute entscheiden würde, ins In‑Office‑Vending‑Geschäft einzusteigen, würden wir Claudius nicht einstellen.“

Meine Prognose

Ich arbeite eigentlich seit Tag 1 mit KI zusammen, so gibt’s Dinge, die sie wirklich sehr gut machen, und andere, wo sie komplett versagen. Aber für eine Technologie, die nur knapp 3 Jahre alt ist (ChatGPT wurde ja Ende 2022 für alle veröffentlicht), ist es immer wieder lustig zu sehen, was es alles kann. Eine lokale LLM kann ja bereits von mir Bilder generieren – die LLM habe ich lokal mit meinen eigenen Bildern trainiert und ich experimentiere zurzeit mit Tools, mit denen man eine lokale LLM mit eigenen Texten trainieren kann. Klappt noch nicht immer perfekt, aber ich bin sicher, in den nächsten 2–5 Jahren wird diese Technik immer besser werden.

Also KI ist hier, um zu bleiben.

Das grösste Problem ist wie immer der Mensch selbst. Er muss wirklich lernen, wie man richtig promptet und das Doofe daran ist – es gibt kein RICHTIG 🙂 Jedes LLM reagiert anders und muss anders gepromptet werden. Und dann muss man halt genau wissen, dass ein LLM nichts anderes ist als ein mathematisches Modell, das Antworten basierend auf Wahrscheinlichkeit generiert. Es gibt keinen Faktenchecker darin – noch nicht wenigstens.

Und hier liegt das Problem – solange es kein KI-Tool mit Faktenchecker gibt, muss man als Mensch immer alles kontrollieren und überprüfen. Für einen Menschen mag es ja ok sein, wenn er denkt, die Erde sei flach und Religionen würden was für die Seele machen – aber wenn eine KI fantasiert, ist das blöder. In ein paar Jahren gibt’s sicher Medizin-KIs, die bei der Diagnose helfen, und da wäre es doch ein wenig blöd, wenn aus einem verstauchten kleinen Zeh direkt ein Hirntumor wird … oder nicht?

Ich finde das ein spannendes Experiment und ich persönlich freue mich auf mein Raspi 5 mit dem neuen KI‑Hat – dann werde ich so eine KI mal beim Pflanzengiessen arbeiten lassen – dann schau ich mal, ob der einen grünen Daumen hat oder wie ich ein Pflanzenkiller ist 😛

Da bei Divi 5 das Kommentar Modul einen Bug hat, habe ich diese Funktion deaktiviert. Es tut mir leid.

Wer gerne einen Kommentar hinterlassen möchte, der muss zur Zeit ausweichen auf Instagram oder LinkedIn. Jeder Beitrag wird dort auch veröffentlicht. Oder ihr schreibt mir eine eMail