Powrót do artykułów
case-study 12 kwietnia 2026 · 8 min czytania

Case study: 4 godziny dziennie skrócone do 20 minut

Realne pomiary z pilotażu agenta AI w obsłudze maili klienta. Co dokładnie się zmieniło, jakie liczby, jaki koszt, jakie pułapki.

Marcin Ołdak
Cover artykułu: 4 godziny dziennie do 20 minut

4 godziny dziennie → 20 minut.

To nie jest marketing. To liczba zmierzona na realnych danych podczas 6-tygodniowego pilotażu agenta AI w niewielkiej firmie usługowej (5 osób, ~80 maili klienckich dziennie).

W tym artykule rozkładam to na czynniki: co dokładnie zostało zautomatyzowane, ile kosztowało wdrożenie, jaki był ROI, i — najważniejsze — co poszło nie tak w pierwszej iteracji.

Kontekst: dlaczego w ogóle to robiliśmy

Klient (nazwiska nie podaję — pilotaż nie jest jeszcze opublikowany jako referencja) prowadził pięcioosobowy zespół obsługujący korespondencję od ~150 stałych klientów B2B.

Stan zerowy:

Problem nie był “trudny” — był nudny i pochłaniał czas, który można było wykorzystać na pracę wymagającą kompetencji człowieka.

Co dokładnie zbudowałem

Architektura

Skrzynka IMAP (Gmail Workspace)

Cron worker (n8n, co 15 min)

Agent klasyfikujący (Claude Sonnet)
   → Decyzja: PILNE / RUTYNOWE / SPAM
   → Dla rutynowych: czytanie historii klienta z CRM (PipeDrive API)

Agent generujący draft (Claude Sonnet)
   → Pisze odpowiedź w tonie zespołu (8 example'ów w prompcie)
   → Format: Markdown, z placeholderami (data, kwota, link)

Dashboard webowy (FastAPI + Tailwind)
   → Lista draftów do akceptacji
   → 1 klik = wysyłka, 1 klik = edycja, 1 klik = odrzucenie

SMTP (po akceptacji) lub eskalacja do osoby

Stack:

Co dokładnie robi człowiek

Przed:

Po:

Liczby

Czas pracy

EtapPrzed (min/dzień)Po (min/dzień)Oszczędność
Przegląd skrzynki455-89%
Klasyfikacja200-100%
Pisanie odpowiedzi rutynowych908-91%
Pisanie odpowiedzi nietypowych4535-22%
Raport dzienny dla managera300-100%
Razem230 min48 min-79%

Jakość

Koszty

PozycjaKwota
Wdrożenie jednorazowe (mój czas, 3 tygodnie)12 000 zł
Claude API (Sonnet, ~80 maili × 30 dni × 2 wywołania)~120 zł / mies
n8n cloud + Postmark~80 zł / mies
Hosting dashboardu (Hetzner Cloud CX21)25 zł / mies
Miesięczny koszt utrzymania~225 zł

ROI

Człowiek-pracownik to ~7 000 zł/miesiąc kosztu pracodawcy. Oszczędność 3 godzin dziennie × 21 dni = 63h miesięcznie ≈ 2 800 zł wartości pracy uwolnionej miesięcznie.

Zwrot wdrożenia: ~5 miesięcy. Po tym koszt ~225 zł zwraca się 12-krotnie.

Co poszło nie tak (pierwsza iteracja)

To jest najważniejsza część — pomijana w 95% case studies “wdrożeń AI”. Pierwsza wersja agenta była zła. Tu są 3 błędy.

Błąd 1: Za szeroki prompt klasyfikacji

W pierwszym tygodniu kazałem Claude “ocenić czy mail jest pilny”. Wynik: model uznawał za pilne wszystko co zawierało słowa “termin”, “do dziś”, “asap”. Konserwatywny, ale 70% maili oznaczonych jako PILNE = bez sensu, człowiek i tak musiał przeglądać.

Fix: dodanie definicji “pilne = wymaga akcji w ciągu 4h I dotyczy umowy, faktury, reklamacji, urzędu”. Spadek false-positive z 70% do 12%.

Błąd 2: Drafty bez kontekstu historii klienta

Agent pisał poprawne gramatycznie, profesjonalne odpowiedzi — które jednak wyglądały jak od bota. Brakowało nawiązania do poprzednich rozmów, do otwartego deala, do specyfiki klienta.

Fix: dodanie kroku “weź ostatnie 5 maili z tym klientem + status w CRM” przed generacją draftu. Drafty od razu nabrały personalności.

Błąd 3: Brak feedback loop

Pierwsze 2 tygodnie człowiek edytował drafty, ale poprawki nigdzie nie wracały. Agent nie uczył się z korekt.

Fix: dodanie panelu “powód odrzucenia” przy każdym odrzuconym draftcie. Co 2 tygodnie analiza wzorców → aktualizacja systemowego prompta. Od 4. tygodnia jakość draftów wzrosła o 35% (mierzone procentem akceptacji bez edycji).

Czy zadziała u Ciebie

To zależy od 3 zmiennych:

  1. Wolumen. Poniżej ~30 maili dziennie nie ma sensu — koszt wdrożenia nie zwróci się szybko.
  2. Powtarzalność. Jeśli Twoje maile to głównie negocjacje 1-na-1 z każdorazowo unikalnymi warunkami, agent nie pomoże. Jeśli 60%+ to “powtarzalne pytania” — pomoże znacznie.
  3. Gotowość zespołu. Pierwsze 2 tygodnie to więcej pracy, nie mniej (uczenie się systemu, weryfikacja draftów). Trzeba przejść przez tę dolinę.

Jeśli te trzy są na ✅ — porozmawiajmy.

Co dalej

Aktualnie wdrażam tę samą architekturę u 2 kolejnych klientów (oba biura rachunkowe — przypadek użycia jeszcze lepiej dopasowany niż firma usługowa, bo maile są jeszcze bardziej powtarzalne).

Jeśli prowadzisz biuro lub MŚP z dużą skrzynką — napisz na contact@mjoldak.com i pokażę demo na Twojej (zanonimizowanej) próbce maili.

Najlepsza inwestycja w automatyzację to ta, która zwraca się w mniej niż 6 miesięcy. Wszystko powyżej to spekulacja.

Czytaj dalej: Stack pod agentów AI — Claude, n8n, Azure Document Intelligence

Tagi

Newsletter · 1× w miesiącu

Dostawaj esencję.

Najlepsze artykuły z miesiąca + 1 case study z biur rachunkowych. Bez spamu, bez sprzedaży.

Twój email idzie tylko do mnie. Wypisanie 1 klikiem.

Powiązane artykuły.