demo 8 kwietnia 2026 · 10 min czytania

Stack pod agentów AI: Claude, n8n, Azure Document Intelligence

Konkretne narzędzia którymi buduję agentów AI dla polskich firm. Dlaczego ten stack, jakie są alternatywy i ile to kosztuje miesięcznie.

Marcin Ołdak

Cover artykułu: Stack pod agentów AI — Claude, n8n, Azure

Kiedy zaczynałem budować agentów AI rok temu, każdy tutorial polecał inny stack. LangChain. AutoGPT. CrewAI. Llama. OpenAI Functions.

Po 12 miesiącach produkcyjnych wdrożeń u realnych klientów wiem już, co działa. W tym artykule rozkładam mój aktualny stack — z uzasadnieniem, kosztami, alternatywami i kiedy warto coś podmienić.

Stack w skrócie

┌─────────────────────────────────────────────┐
│              FRONTEND / TRIGGER             │
│  FastAPI + Tailwind  ·  cron  ·  webhooks   │
└─────────────────────┬───────────────────────┘
                      ↓
┌─────────────────────────────────────────────┐
│              ORKIESTRACJA                   │
│              n8n self-hosted                │
└─────────────────────┬───────────────────────┘
                      ↓
┌──────────────┬──────────────┬──────────────┐
│     LLM      │     OCR      │   STORAGE    │
│   Claude     │    Azure     │   SQLite /   │
│   Sonnet     │  Document    │   Postgres   │
│   4.5/Opus   │ Intelligence │              │
└──────────────┴──────────────┴──────────────┘
                      ↓
┌─────────────────────────────────────────────┐
│              INTEGRACJE                     │
│ Comarch Optima · wFirma · Gmail · IMAP API  │
└─────────────────────────────────────────────┘

Teraz przejdziemy przez każdy element.

LLM: dlaczego Claude (a nie GPT)

Po wszystkich produkcyjnych wdrożeniach Claude Sonnet 4.5 jest moim domyślnym wyborem dla 90% przypadków. Dlaczego:

1. Lepsze instruction following

Claude Sonnet rzadziej “halucynuje akcje”. Jeśli proszę go o wybór jednej z 3 kategorii — wybiera dokładnie jedną z trzech. GPT-4o czasem dorzuca czwartą “OTHER” mimo że nie ma jej w prompcie.

2. Lepsze rozumienie polskiego

Konkretnie dla biur rachunkowych: Claude rozumie pojęcia jak “VAT-7K kwartalny”, “JPK_VAT”, “PIT-36L” i nie myli ich z innymi. GPT-4o i Gemini częściej generalizują.

3. Tańszy przy długim kontekście

200 000 tokenów kontekstu w Claude Sonnet 4.5 = $3/M input, $15/M output (kwiecień 2026). To 2-3x taniej niż GPT-4 Turbo przy podobnej jakości dla zadań typu agent.

4. Niezawodność API

W ostatnich 6 miesiącach Claude API miał ~99.5% uptime mierzony przez moje monitoringi. OpenAI miał 3 większe outage’y (z których 1 trwał 4 godziny). To wpływa bezpośrednio na SLA wobec klienta.

Kiedy NIE Claude

Multimodalność z video/audio → GPT-4o (Claude jeszcze słabszy)
Embedding → OpenAI text-embedding-3 (Claude nie ma natywnych embeddingów)
Self-hosted (compliance) → Llama 3.1 70B na własnej infrastrukturze

Orkiestracja: n8n vs Make vs custom

Agent to nie pojedynczy LLM call. To workflow: pobierz dane → wywołaj LLM → zwaliduj wynik → wywołaj API → zapisz → powiadom.

Trzy opcje:

Opcja A: n8n (mój wybór)

Plusy:

Self-hosted (compliance + brak vendor lock-in)
400+ gotowych integracji (Gmail, Slack, Comarch, PostgreSQL…)
Wizualny edytor (klient może sam zmienić proste rzeczy)
Kod custom w nodes (Function nodes z JS)
Darmowy do self-hostingu

Minusy:

Trzeba sami hostować (mały dodatkowy koszt: ~25 zł/miesiąc na Hetzner)
Krzywa uczenia ~3-5 dni

Opcja B: Make (dawniej Integromat)

Plusy:

Zero hostingu
Bardzo polerowany UX

Minusy:

Płatne od pierwszego workflow (~70 zł/miesiąc baseline)
Vendor lock-in (trudno migrować do innej platformy)
Brak self-hostingu = problem dla compliance niektórych klientów (RODO)

Opcja C: Custom kod (FastAPI + Celery)

Plusy:

Maksymalna kontrola
Wszystko w Pythonie/TS

Minusy:

5-10x dłuższe wdrożenie
Więcej maintenance (każda zmiana = deploy)
Gorsze obserwowalne (logi, retry, monitoring trzeba budować od zera)

Werdykt: n8n self-hosted, chyba że klient ma istniejący stack DevOps i preferuje custom.

OCR: Azure Document Intelligence

Do faktur i dokumentów księgowych testowałem (i odrzuciłem):

Tesseract — open-source, ale jakość fatalna na polskich dokumentach. Pas.
Google Document AI — dobre, ale drogie ($1.50/100 stron) i compliance trudniejsze (data residency).
AWS Textract — przyzwoite, ale słabe na polskich faktura (gorsze rozumienie struktury).
Mindee — dedykowane do faktur, świetna jakość, ale $99/miesiąc minimum + 0.10€/page.

Azure Document Intelligence wygrało z 4 powodów:

Polskie znaki natywnie (ć, ż, ą — bez problemu)
Pre-built model “Invoice” wyciąga 30+ pól bez trenowania
$1.50 / 1000 stron (~5 zł / miesiąc dla biura z 1000 faktur)
EU data residency (Azure West Europe = compliance OK dla MŚP w PL)

Jakość na polskich fakturach: ~95% extracted fields correct without manual review. Dla biur rachunkowych to game-changer.

Storage: SQLite czy Postgres

Dla większości moich projektów: SQLite wystarcza.

Brzmi kontrowersyjnie? Nie powinno. Modern SQLite (z WAL mode) obsługuje 100k+ writes dziennie. Większość biur rachunkowych ma 100-1000 transakcji dziennie. Komfortowo.

Wybieram Postgres gdy:

Multi-tenant (kilku klientów na tej samej instancji)
Wymagany backup w czasie rzeczywistym
Skala 10k+ users
Klient już ma Postgres infrastructure

Inaczej SQLite. Backup = kopia pliku. Migracja = cp database.db backup.db. Hosting = dowolny serwer z dyskiem. Maintenance = zero.

Frontend: FastAPI + Tailwind (a nie React)

Moje produkty (MJ.OLDAK INVOICE, EMAIL, DEADLINE, REPORTS) używają FastAPI + Jinja2 + Tailwind CDN — bez Reacta.

Powody:

Stack jednolity — backend i UI w tym samym Pythonie
Zero build step — python main.py i już
SEO — server-side rendered HTML
Mniej zależności — łatwiej audytować i utrzymać przez 5 lat

React/Vue mają sens gdy interfejs jest aplikacją (real-time dashboardy, drag&drop, complex state). Dla CRUD typu “lista faktur, formularz upload, detail page” — FastAPI + Jinja jest szybsze do napisania i tańsze w utrzymaniu.

Koszty stack’u — realistyczny budżet

Dla biura rachunkowego z 10 klientami i ~1000 faktur/miesiąc + obsługą maili:

Pozycja	Koszt miesięczny
Claude API (Sonnet, ~80k requestów)	150-250 zł
Azure Document Intelligence (1k faktur)	5-8 zł
n8n self-hosted (Hetzner CX21)	25 zł
Postmark (transactional emails, 10k/mies)	50 zł
Domena + SSL (Cloudflare)	0 zł
Backup (Backblaze B2, 100GB)	5 zł
Razem	~235-340 zł

Plus jednorazowe koszty wdrożenia (mój czas, 2-4 tygodnie): 8 000 — 18 000 zł zależnie od pakietu.

Czego nie używam (i dlaczego)

LangChain / LangGraph

Powód: za dużo abstrakcji nad prostą rzeczą. Pisanie agenta to często 30 linii Pythona robiących client.messages.create(). LangChain dodaje 5 warstw, które trzeba debugować przy każdym błędzie. Plus częste breaking changes w API.

Wyjątek: RAG nad dużą bazą dokumentów (>1000) — wtedy LangChain ma sensowne moduły do retrieval.

CrewAI / AutoGen / AgentScope

Powód: “multi-agent collaboration” brzmi cool, ale w 95% biznesowych przypadków wystarcza pojedynczy LLM call z dobrym promptem + 1-2 tool calls. Multi-agent dodaje koszt (każda iteracja = kolejny LLM call) i nieprzewidywalność.

Wyjątek: zadania kreatywne (research, pisanie długich raportów) gdzie różne perspektywy faktycznie pomagają.

Vector DB (Pinecone, Weaviate, Qdrant)

Powód: dla biur rachunkowych nie ma znaczącej bazy “wiedzy” do RAG. Klienci, faktury, deadliny to dane strukturalne — SQL załatwia sprawę.

Wyjątek: klient ma archiwum dokumentów (umowy, regulaminy) i agent musi z nich cytować — wtedy pgvector w Postgres wystarcza, nie trzeba osobnej bazy.

Następne kroki

Jeśli chcesz zobaczyć ten stack w akcji:

Demo na żywo — pokazuję jak agent przetwarza Twoją prawdziwą fakturę w Azure DI + Claude Sonnet w czasie rzeczywistym. 30 minut, bezpłatnie. Napisz na contact@mjoldak.com.
Tutoriale — w przygotowaniu seria pod hood (architektura agenta od zera, n8n setup od podstaw, integracja z Comarch Optima). Zapisz się na newsletter, żeby nie przegapić.

Najlepszy stack to ten, który przetrwa zmianę requirements za 6 miesięcy bez przepisywania od zera. n8n + Claude + SQLite spełnia ten test od roku.

Czytaj dalej: Czym jest agent AI? Praktyczne wyjaśnienie

Tagi

#n8n-claude #tutorial #automatyzacja #demo

Newsletter · 1× w miesiącu

Dostawaj esencję.

Najlepsze artykuły z miesiąca + 1 case study z biur rachunkowych. Bez spamu, bez sprzedaży.

Twój email idzie tylko do mnie. Wypisanie 1 klikiem.

Powiązane artykuły.

Cover artykułu: Premiera 4 demo agentów AI dla biura rachunkowego

demo · 20 maj 2026

Premiera: 4 gotowe demo agentów AI dla biura rachunkowego — testuj za darmo

Cztery gotowe agenty AI dla biur rachunkowych — OCR faktur, klasyfikacja maili, kalendarz podatkowy, raporty PDF. Pokazuję co działa, ile kosztuje i dlaczego nie musisz zwalniać księgowej.

Cover artykułu: Agent AI przetwarza fakturę w 8 sekund

demo · 6 maj 2026

Jak agent AI przetwarza polską fakturę w 8 sekund — live demo pipeline

Azure Document Intelligence + Claude Sonnet + walidacja NIP. Rozkładam pipeline step-by-step: co dzieje się w każdej sekundzie, ile to kosztuje i gdzie Azure się myli na polskich fakturach.

Cover artykułu: Agent AI do obsługi skrzynki mailowej biura rachunkowego

demo · 29 kwi 2026

Agent AI, który obsługuje skrzynkę mailową biura rachunkowego — architektura, koszty, compliance

69% maili do biur rachunkowych to powtarzalne pytania. Pokazuję stack, który odpowiada na nie automatycznie — za ~130 zł miesięcznie, z DPA i ZDR.