← Powrót do auto-sys

Budujemy Agenta AI w n8n: Twój prywatny researcher, który nigdy nie śpi 🤖

Budujemy Agenta AI w n8n: Twój prywatny researcher, który nigdy nie śpi 🤖

Wszyscy potrafimy odpalić ChatGPT i wpisać "znajdź mi informacje o firmie X". Ale to wymaga Twojego czasu, Twojej uwagi i Twojego klikania. A przecież ustaliliśmy już, że automatyzacja ma pracować, kiedy Ty śpisz.

Dzisiaj zbudujemy w n8n coś więcej niż prostego bota odpowiadającego na pytania. Zbudujemy Autonomicznego Agenta, który potrafi korzystać z narzędzi.

Różnica między zwykłym wywołaniem API OpenAI a Agentem jest jak różnica między encyklopedią a bibliotekarzem. Encyklopedia ma wiedzę (statyczną). Bibliotekarz wie, gdzie szukać nowej wiedzy i jak jej użyć.

Dlaczego n8n + AI to "Power Couple"?

Zanim otworzysz edytor, musisz zrozumieć jedną rzecz. n8n w ostatnich aktualizacjach zaimplementowało natywną obsługę LangChain.

Co to oznacza dla Ciebie? Wcześniej, żeby połączyć model językowy z Google Search, musiałeś tworzyć skomplikowane pętle If, parsować JSON-y i modlić się, żeby prompt się nie "rozjechał". Teraz masz gotowe klocki: AI Agent Node, Tools i Memory.

Blueprint: Jak wygląda architektura Agenta? 🧠

Nasz cel: Agent, któremu podajesz temat (np. "Nowe regulacje AI w UE"), a on przeszukuje sieć, czyta artykuły i generuje raport z linkami źródłowymi.

Oto Twój stack w n8n:

1. Mózg operacji: AI Agent Node To tutaj dzieje się magia. Wybierasz typ agenta (polecam "Tools Agent"). To on decyduje: "Czy wiem wystarczająco dużo, żeby odpowiedzieć? Nie? To muszę użyć wyszukiwarki".

2. Model (LLM) Podpinasz węzeł OpenAI Chat Model. Moja rada: Do zadań wymagających researchu i logiki nie żałuj grosza. Użyj GPT-4o lub Claude 3.5 Sonnet. Modele typu "mini" czy GPT-3.5 często gubią wątek i wpadają w pętle bez wyjścia. Chcesz mieć analityka, a nie stażystę, prawda?

3. Narzędzia (Tools) Agent bez narzędzi tylko halucynuje. Musimy dać mu oczy i uszy. Podpinamy do węzła Agenta:

  • SerpApi / Google Search: Żeby mógł wyszukiwać w czasie rzeczywistym.
  • HTTP Request / Website Scraper: Żeby mógł wejść w link i przeczytać treść strony (bo sam nagłówek z Google to za mało).
  • Calculator: Tak, modele językowe są słabe z matematyki. Daj mu kalkulator, jeśli ma liczyć.

4. Pamięć (Window Buffer Memory) Jeśli chcesz prowadzić z agentem konwersację, a nie tylko wydawać jednorazowe komendy, musisz podpiąć pamięć. Inaczej każde Twoje zdanie będzie dla niego nowym początkiem świata.

Jak to działa w praktyce? (Logika ReAct)

Kiedy wpisujesz: "Sprawdź ceny konkurencji X i porównaj z naszymi", w konsoli n8n zobaczysz fascynujący proces myślowy (Chain of Thought):

  1. Thought: Użytkownik chce porównania cen. Nie znam cen konkurencji X.
  2. Action: Uruchamiam Google Search z zapytaniem "Cennik firmy X 2024".
  3. Observation: Wyniki wyszukiwania pokazują stronę x.com/pricing.
  4. Thought: Mam link. Teraz muszę go przeczytać.
  5. Action: Uruchamiam Web Scraper na url x.com/pricing.
  6. Observation: (Treść strony z tabelą cen).
  7. Final Answer: "Firma X oferuje pakiet Basic za 29 USD, co jest tańsze od nas o 5 USD, ale nie mają w tym supportu..."

Widzisz to? On sam zdecydował, jakich kroków użyć. Ty tylko zdefiniowałeś cel.

Pułapki, na które musisz uważać ⚠️

Budowanie agentów jest ekscytujące, ale bywa bolesne:

  • Pętle nieskończone: Czasem Agent uprze się na jedną frazę i będzie ją wpisywał w Google w nieskończoność. Ustaw limit iteracji (np. max 10 kroków).
  • Kontekst: Strony internetowe są zaśmiecone reklamami i kodem. Używaj narzędzi, które czyszczą HTML do czystego tekstu/markdowna przed podaniem go do LLM. Inaczej zapłacisz fortunę za tokeny, które są śmieciami.
  • Halucynacje: Zawsze proś Agenta o podawanie linków źródłowych (citations). Ufam, ale sprawdzam – to powinna być Twoja dewiza przy pracy z AI.

Podsumowanie

n8n pozwala Ci zbudować własną armię cyfrowych pracowników bez konieczności pisania setek linii kodu w Pythonie. To potężne narzędzie, które zmienia zasady gry.

Zamiast tracić 2 godziny na przeglądanie newsów branżowych, zbuduj workflow, który zrobi to rano za Ciebie i wyśle Ci espresso... to znaczy esencję informacji na Slacka. ☕