Das persönliche CEO-Interface zur Agenten-Systemlandschaft
Modul ONE control bildet als Interface für die Leitungsebene den zentralen Einstiegspunkt in die gesamte Mainufactory-Agenten-Systemlandschaft. Es ist die Grundlage für alle weiteren Module. Während alle anderen Module individuell hinzugebucht oder deaktiviert werden können, ist dieses Modul erforderlich, um mit dem gesamten System zu interagieren.
Preise:
MONATLICH
pro NUTZER: € XX,- [zu verifizieren]
LAUFZEIT: 1 Jahr, automatische Verlängerung, Kündigung spätestens ein Monat vor Laufzeitende
SETUP (einmalig)
– INITIALES SETUP (siehe hier unterhalb) € XXXX,- [zu verifizieren] (einmalig, inkl. initiales Setup des Servers)
– FOLGE SETUPS pro Modul ONE control pro weiterem Mitarbeitenden € XXX,- [zu verifizieren] (jeweils, einmalig)
Das INITIALE SETUP umfasst: Hilfe beim Buchen des Servers (aktuell bei Hetzner, Deutschland), die Einrichtung des Servers, Hilfe beim Buchen/Anmelden der Software für den Betrieb des Agenten-Netzwerks (inkl. API-Buchung der Sprachmodelle), Einrichtung des Moduls ONE control, die Konfiguration der Memory-Struktur mit Kurz- und Langzeitgedächtnis, die individuelle Anpassung von Rollen, Tonalität und Interaktionsverhalten (Promting), die technische Anbindung eines hochwertigen LLMs (z. B. Mistral) via API, die Vergabe einer persönlichen, kryptischen E-Mail-Adresse zur Kommunikation, Hilfe bei der Installation und Konfiguration der mobilen App auf dem Smartphone der nutzenden Person.
FOLGE SETUPS umfassen: Einrichtung des Moduls ONE control, die Konfiguration der Memory-Struktur mit Kurz- und Langzeitgedächtnis, die individuelle Anpassung von Rollen, Tonalität und Interaktionsverhalten (Promting), die technische Anbindung eines hochwertigen LLMs (z. B. Mistral) via API, die Vergabe einer persönlichen, kryptischen E-Mail-Adresse zur Kommunikation, Hilfe bei der Installation und Konfiguration der mobilen App auf dem Smartphone der nutzenden Person.
SERVICE LEVEL AGREEMENT
SLA: 5/48
€ 160,- / Stunde, abgerechnet pro angefangenen 15 Minuten
Definition: siehe unten
Funktionsweise:
Jede Leitungsperson in der Agenten-Systemlandschaft nutzt ihr eigenes Modul ONE control, ein individuelles, zentrales Kommunikationsmodul, das durch einen persönlichen Agenten gesteuert wird. Dieser Agent ist auf die jeweiligen Bedürfnisse, Kommunikationsgewohnheiten und Anforderungen der nutzenden Person abgestimmt und mit einem leistungsfähigen LLM ausgestattet.
Als persönliche Schaltzentrale ermöglicht der Agent im Modul ONE control nicht nur den Zugriff auf die Agenten-Systemlandschaft, sondern fungiert zugleich als delegierende und koordinierende Instanz gegenüber allen weiteren Modulen, für die Zugriffsrechte bestehen.
Agentenlogik:
- Der zentrale Agent arbeitet kontextbezogen und nutzt je nach Situation, Ziel und Anwendungsfall die geeigneten Ressourcen und Subagenten.
- Der Fokus liegt auf persönlicher, effizienter Kommunikation, die auf die individuellen Anforderungen und Kontexte der nutzenden Person abgestimmt ist.
- Die Steuerung erfolgt dialogisch: Der Agent fragt aktiv nach, bietet Vorschläge und setzt Aufgaben eigenständig oder delegierend um.
Kommunikationsschnittstellen:
- Das Modul ist schnittstellenoffen: Die Kommunikation kann prinzipiell über verschiedene Kanäle erfolgen (Text, Spracheingabe, Eingabefelder in der Web-App, E-Mail, etc.).
- Die zentrale Schnittstelle ist eine mobile App, die auf dem Smartphone der nutzenden Person läuft.
- Die App funktioniert wie ein Messenger (z. B. WhatsApp), basiert jedoch technisch auf dem SMTP-Protokoll, das aus der E-Mail-Kommunikation bekannt ist.
- Dem Nutzer wird eine individuelle kryptische E-Mail-Adresse über unseren E-Mail-Server vergeben, ebenso dem persönlichen Agenten. Diese Adressen sind nicht erratbar und sinnvollerweise geheim zu halten. Nur über diese Adressen kann die Kommunikation mit dem Agenten erfolgen.
- Auf dem Endgerät wird ein Client installiert, der die Kommunikation in Form eines Chat-Interfaces darstellt.
- Die Übertragung ist SSL/TLS-verschlüsselt. Auf Wunsch kann zusätzlich eine Ende-zu-Ende-Verschlüsselung mit PGP aktiviert werden (die Einrichtung erfolgt im Rahmen unserer Stundensätze für Service).
- Die Kommunikation erfolgt per gesprochener Sprache oder Texteingabe.
- Die Antworten des Agenten erfolgen aktuell in Textform. Eine Ausgabe in Audioform wäre theoretisch möglich, wird aber derzeit nicht angeboten, da die Entscheidung für Text oder Audio je nach Eingabe individuell getroffen werden müsste – was derzeit nicht zielführend erscheint.
Gedächtnis und Kontextspeicherung:
Das zentrale Kommunikationsmodul nutzt eine zweischichtige Memory-Struktur, um frühere Interaktionen einzuordnen, wiederaufzugreifen oder in neue Aufgaben zu überführen. Dabei wird zwischen Kurzzeitgedächtnis und Langzeitgedächtnis unterschieden:
Kurzzeitgedächtnis (interaktionsbasiert)
- Innerhalb laufender Gespräche wird eine definierte Anzahl der letzten Interaktionen im Arbeitsspeicher behalten. Aktuell liegt diese Schwelle bei 250 Interaktionen.
- Eine Interaktion besteht aus einem einzelnen Dialogschritt (Eingabe und Antwort).
- Der Agent kann so auf aktuelle Gesprächsverläufe reagieren, Aufgaben nachverfolgen oder Zusammenhänge erkennen.
- Diese Daten sind flüchtig und werden nach Erreichen der maximalen Anzahl von Interaktionen automatisch verworfen. Eine Speicherung bis zu diesem Wert ist wahrscheinlich, kann aber nicht garantiert werden.
Langzeitgedächtnis (strukturierte und kontextbasierte Speicherung)
- Alle Interaktionen werden unmittelbar nach Abschluss vektorisiert und in eine spezialisierte Vektordatenbank überführt.
- Dies ermöglicht eine kontextbasierte, semantische Durchsuchbarkeit vergangener Inhalte.
- Zusätzlich ist vorgesehen, [optional] [zu verifizieren] eine strukturierte Ablage in einer relationalen Datenbank (z. B. PostgreSQL über NoCodeDB) zur Sicherung, Nachvollziehbarkeit und möglichen Rekonstruktion von Gesprächsverläufen vorzunehmen. [Diese Option befindet sich in Prüfung.]
- Das Langzeitgedächtnis ermöglicht:
- Wiederauffindbarkeit früherer Informationen (z. B. Briefings, Absprachen, Ideen)
- Unterstützung bei wiederkehrenden Aufgaben durch Erinnerungen oder Vorlagen
- Langfristige Personalisierung und Kontextverständnis
- Möglichkeit zur Nachvollziehbarkeit und Dokumentation früherer Entscheidungen
- Die Speicherung erfolgt datenschutzkonform und ist insbesondere bei wachsendem Gesprächsvolumen oder modulübergreifenden Aufgaben von strategischer Bedeutung.
Technische Grundlagen und Sprachmodelle
Das zentrale Kommunikationsmodul verwendet hochwertige Large Language Models (LLMs), um die Anforderungen an Verständnis, Kontexttiefe und Dialogqualität zuverlässig zu erfüllen. Je nach individueller Konfiguration kann dabei auf unterschiedliche Modelle zugegriffen werden.
- Eingesetzte Modelle: Standardmäßig kommen leistungsfähige Modelle wie das Mistral Large zum Einsatz, das besonders durch seine differenzierte Textverarbeitung und hohe kontextuelle Präzision überzeugt. Die Auswahl des Modells erfolgt abhängig von der gewünschten Qualität, der erforderlichen Kontexttiefe und dem Nutzungsumfang.
- Einbindung: Die Sprachmodelle werden über gesicherte APIs in die Mainufactory-Agenten-Systemlandschaft integriert. Der Zugriff erfolgt dabei ausschließlich über Server in datenschutzkonformen Hostingumgebungen.
- Ressourcenverbrauch und Konfiguration: Hochwertige LLMs haben je nach Länge und Komplexität der Eingaben einen erhöhten Tokenverbrauch. Im zentralen Kommunikationsmodul ist dieser Ressourcenaufwand bewusst einkalkuliert, da hier oftmals besonders hohe Anforderungen an Verständlichkeit, Präzision und Verlaufskontinuität gestellt werden. Parameter wie Temperatur, Kontextlänge oder Maximale Tokenzahl werden je nach Anwendungsszenario technisch abgestimmt.
Spracheingabe (Speech-to-Text) über Whisper
- Für die Umwandlung gesprochener Sprache in Text wird zum Zeitpunkt dieser Leistungsbeschreibung das Modell Whisper von OpenAI eingesetzt. Whisper liefert aktuell die höchste Erkennungsqualität und eignet sich besonders für natürlich gesprochene Sprache.
- Die Verarbeitung erfolgt auf Servern außerhalb der EU, was datenschutzrechtlich beachtet werden muss.
- Wenn Spracheingabe genutzt werden soll, ist ein separater Auftragsverarbeitungsvertrag (AVV) zwischen dem Kunden und OpenAI erforderlich.
- Der Kunde ist dafür verantwortlich, die datenschutzrechtlichen Voraussetzungen für die Nutzung von Whisper zu prüfen und zu erfüllen – insbesondere im Hinblick auf die Verarbeitung personenbezogener oder sensibler Inhalte.
- Es gilt der Hinweis auf unsere AGB, insbesondere die Abschnitte zum Datenschutz (Kapitel 4) und zur Haftung (Kapitel 6). Eine Haftung unsererseits für datenschutzrechtliche Folgen der Nutzung von Whisper ist ausgeschlossen, sofern keine grobe Fahrlässigkeit oder Vorsatz vorliegt.
Service Level Agreement (SLA) – Reaktionszeit
Wir verpflichten uns, auf von Kunden gemeldete Störungen oder Supportanfragen wie folgt zu reagieren:
Reaktionszeit:
Die maximale Reaktionszeit beträgt 48 Stunden (Werktage, Montag bis Freitag, ausgenommen gesetzliche Feiertage in Schleswig-Holstein, Nordrhein-Westfalen und Bremen) ab Eingang der Störungsmeldung oder Supportanfrage per E-Mail an service@mainufactory.de.
Definition Reaktion:
Als Reaktion gilt die qualifizierte Rückmeldung von uns mit einer ersten Einschätzung des gemeldeten Sachverhalts sowie ggf. Angaben zum weiteren Vorgehen oder zur geplanten Fehlerbehebung.
Verfügbare Supportzeiten:
Der Support steht an fünf Werktagen pro Woche (Montag bis Donnerstag, 09:00–17:00 Uhr, Freitag 09:00 – 13:00 Uhr) zur Verfügung. Außerhalb dieser Zeiten eingehende Meldungen gelten als am nächsten Werktag 09:00 Uhr eingegangen.
Leistungsbeschreibung Modul ONE
Stand: 18.04.2025, Version 0.2