W 2006 roku zakładaliśmy Web Systems w Łodzi. Aplikacje mobilne? Raczkujące. AI? Zamknięta w laboratoriach. Dziś nasi klienci przychodzą z konkretem – chcą apek, które rozumieją kontekst, przewidują potrzeby użytkowników i automatyzują robotę, która do tej pory wymagała człowieka. To nie moda na AI. To odpowiedź na rynek, który się zmienił. Firmy z e-commerce i B2B potrzebują inteligentnych narzędzi mobilnych opartych na AI, bo ich klienci po prostu oczekują spersonalizowanych doświadczeń. I tyle. Dzielimy się tu perspektywą wykonawcy, który przeszedł drogę od pierwszych eksperymentów z modelami językowymi do produkcyjnych wdrożeń. Pokażemy decyzje architektoniczne, błędy (sporo ich było), koszty i lekcje z realnych projektów.
Spis treści
Skąd pomysł na połączenie aplikacji mobilnej z AI
Impuls nie przyszedł z konferencji ani z raportu Gartnera. Przyszedł z rozmów z klientami. Jeden zarządzał setkami produktów w systemie B2B i potrzebował sposobu, żeby handlowcy szybciej znajdowali odpowiedzi na pytania kontrahentów. Powiedział wprost – “moi ludzie tracą godzinę dziennie na szukanie specyfikacji w PDF-ach, zróbcie coś z tym”. No i zrobiliśmy. Taki problem rozwiązuje dobrze zaprojektowany moduł AI, a nie kolejna wyszukiwarka pełnotekstowa.
Różnica między modnym hasłem a czymś, co faktycznie działa? Ogromna. Masa firm dodaje “AI” do opisu produktu, bo brzmi nowocześnie. Ale realna wartość pojawia się dopiero wtedy, gdy model rozwiązuje konkretny problem użytkownika. W naszej praktyce to najczęściej systemy pytań i odpowiedzi oparte na firmowej bazie wiedzy, inteligentne rekomendacje produktowe albo automatyczna kategoryzacja treści. Każdy z tych scenariuszy wymaga innego podejścia technicznego. I innej architektury.
Decyzja o wdrożeniu RAG (Retrieval-Augmented Generation) przyszła naturalnie. Klasyczny LLM generuje odpowiedzi na podstawie danych treningowych – a to oznacza ryzyko halucynacji i nieaktualnych informacji. RAG eliminuje ten problem, bo model czerpie wiedzę z konkretnej, kurowanej bazy dokumentów klienta. Ale nie każdy projekt wymaga aż tak zaawansowanego rozwiązania. Prostsze przypadki? Obsłużymy dobrze skrojonym prompt engineeringiem, bez dodatkowej infrastruktury wyszukiwania semantycznego.
„The retrieval mechanism in RAG is critically important. You need the best semantic search on top of a curated knowledge base to ensure that the retrieved information is relevant to the input query or context. If your retrieved information is irrelevant, your generation could be grounded but off-topic or incorrect.”
Ten cytat trafia w sedno tego, co widzimy w projektach. Jakość odpowiedzi AI zależy przede wszystkim od jakości mechanizmu wyszukiwania i samej bazy wiedzy. Inwestycja w kurację danych zwraca się wielokrotnie. A próba nadrobienia słabych źródeł lepszym modelem językowym? Prowadzi donikąd. Sprawdzałem.
Architektura mobilna gotowa na sztuczną inteligencję
Wybór stosu technologicznego dla aplikacji mobilnej z komponentem AI – to jedna z pierwszych decyzji, która determinuje powodzenie całego projektu. W Web Systems pracujemy z rozwiązaniami natywnymi (Kotlin, Swift) i crossplatformowymi (Flutter, React Native). Przy integracjach AI preferujemy podejście, w którym logika komunikacji z modelami siedzi po stronie backendu, a aplikacja mobilna zostaje lekkim klientem prezentacyjnym. Dlaczego? Bo daje elastyczność w zmianie modelu AI bez konieczności aktualizacji apki w sklepie. A modele zmieniamy często.
Fundament skalowalnej aplikacji mobilnej to separacja warstw. Warstwa UI odpowiada wyłącznie za prezentację i interakcje. Warstwa danych zarządza komunikacją z API, cache’owaniem i synchronizacją offline. Między nimi opcjonalnie warstwa domenowa, która enkapsuluje złożoną logikę biznesową. I co daje taki podział? Dodanie modułu AI – chatbota, systemu rekomendacji, analizy obrazów – nie wymaga przebudowy istniejącej aplikacji. Po prostu wpinasz nowy element.
„App architecture is the foundation of a high-quality Android application. A well-defined architecture lets you create a scalable, maintainable app that can adapt to the ever-expanding ecosystem of Android devices. (…) The most important principle is separation of concerns: separating your app into methods, classes, files, packages, modules and layers that have clearly defined responsibilities and boundaries.”
Dwadzieścia lat tworzenia oprogramowania. Potwierdzam tę zasadę bez zastrzeżeń. Projekty, w których klient nalegał na szybkie prototypowanie kosztem architektury, generowały dług techniczny, który potem kosztował wielokrotnie więcej niż ta początkowa “oszczędność” czasu. Szczególnie przy integracji AI – gdzie wymagania zmieniają się dynamicznie z każdą nową wersją modeli – solidna architektura to nie luksus. To warunek przetrwania projektu.
Tip: Projektując architekturę mobilną pod przyszłe moduły AI, od początku wprowadź warstwę abstrakcji dla komunikacji z serwisami inferencji. Zdefiniuj interfejs, który pozwoli podmienić dostawcę modelu (OpenAI, Anthropic, lokalne modele) bez zmian w warstwie prezentacji. W praktyce oznacza to stworzenie dedykowanego repozytorium danych dla odpowiedzi AI z jednolitym kontraktem, niezależnym od konkretnego API.
Wyzwania integracji modeli AI z aplikacją mobilną
Pierwsze pytanie na początku każdego projektu z komponentem AI – gdzie uruchamiać model? Inferencja na urządzeniu (edge) eliminuje latencję sieciową i daje działanie offline, ale drastycznie ogranicza rozmiar modelu. Trzeba optymalizować pod konkretne chipy mobilne. Chmura daje dostęp do najpotężniejszych modeli, ale generuje koszty proporcjonalne do liczby zapytań i uzależnia od stabilności łącza. W większości naszych projektów wybieramy podejście hybrydowe. Proste zadania (klasyfikacja, ekstrakcja słów kluczowych) realizujemy lokalnie. Złożone generowanie tekstu leci do chmury.
Bezpieczeństwo danych – temat, który budzi największe obawy klientów korporacyjnych. I słusznie. Przesyłanie zapytań użytkowników do zewnętrznego API modelu językowego oznacza, że wrażliwe informacje opuszczają kontrolowaną infrastrukturę firmy. Stosujemy kilka strategii – anonimizację danych przed wysłaniem, dedykowane instancje modeli z gwarancją nieużywania danych do treningu, szyfrowanie end-to-end oraz lokalne przetwarzanie wstępne, które filtruje dane osobowe zanim trafią do LLM. Każde rozwiązanie dobieramy indywidualnie do wymagań regulacyjnych klienta. Nie ma tu jednego uniwersalnego podejścia.
Obsługa stanów offline to kolejna rzecz specyficzna dla platform mobilnych. Użytkownik w terenie (handlowiec, inspektor, serwisant) traci zasięg i oczekuje, że aplikacja nadal działa. No i co? Projektujemy systemy cache’owania odpowiedzi AI, kolejkowania zapytań do późniejszego przetworzenia i inteligentnego prefetchingu najczęściej potrzebnych informacji. Te mechanizmy wymagają starannego zarządzania pamięcią urządzenia, bo modele zajmują sporo miejsca, a starsze telefony mają ograniczone zasoby.
Typowe błędy, których nauczyliśmy się unikać przy pierwszych integracjach? Brak obsługi timeoutów przy zapytaniach do API modelu. Ignorowanie limitów tokenów wejściowych (co prowadzi do obcinania kontekstu). Nielogowanie kosztów per zapytanie. I mój ulubiony – testowanie wyłącznie na szybkim WiFi biurowym zamiast na realnych warunkach sieci mobilnej. Każdy z tych problemów odkryliśmy na produkcji. Bolesne lekcje, ale skuteczne.
RAG, fine-tuning i prompt engineering w praktyce projektowej
Dobór techniki AI do konkretnego przypadku biznesowego powinien wynikać z analizy danych i potrzeb. Nie z fascynacji technologią. Prompt engineering sprawdza się, gdy klient ma ustandaryzowane zapytania i potrzebuje przewidywalnych formatów odpowiedzi – generowanie opisów produktów, tłumaczenia, ekstrakcja danych z formularzy. Fine-tuning wchodzi do gry, gdy model musi rozumieć specyficzny żargon branżowy albo tonację komunikacji firmy. RAG natomiast jest niezastąpiony tam, gdzie odpowiedzi muszą opierać się na aktualnej, firmowej bazie wiedzy – dokumentacji technicznej, regulaminach, katalogach produktowych.
Podejście RAG Ops, czyli metryczne zarządzanie jakością systemu retrieval-augmented generation, zmieniło sposób, w jaki prowadzimy projekty AI. Zamiast subiektywnego “odpowiedź wygląda spoko”, mierzymy konkretne parametry każdej generowanej odpowiedzi. Pozwala to systematycznie optymalizować cały pipeline – od parsowania dokumentów źródłowych, przez strategię chunkingu, po sam prompt sterujący generowaniem. Bez metryk iteracja to strzały w ciemno. Z nimi – proces inżynierski.
Metryki oceny odpowiedzi AI, które stosujemy w projektach:
- Coherence – spójność logiczna odpowiedzi, brak wewnętrznych sprzeczności
- Groundedness – zakotwiczenie w źródłach, stopień oparcia odpowiedzi na dostarczonych dokumentach
- Fluency – płynność językowa i naturalność generowanego tekstu
- Safety – bezpieczeństwo treści, brak generowania szkodliwych lub nieodpowiednich odpowiedzi
- Instruction following – zgodność z zadanymi instrukcjami i formatem odpowiedzi
- Question answering quality – trafność odpowiedzi w odniesieniu do zadanego pytania
Kuracja bazy wiedzy to element, który klienci najczęściej lekceważą. Strategie chunkingu – czyli sposób dzielenia dokumentów na fragmenty indeksowane przez wyszukiwarkę semantyczną – mają bezpośredni wpływ na jakość odpowiedzi. Zbyt duże fragmenty rozmywają precyzję wyszukiwania. Zbyt małe tracą kontekst. W naszych projektach eksperymentujemy z chunkingiem semantycznym (dzielenie po akapitach logicznych), nakładającym się (overlapping chunks) i hierarchicznym (zachowanie struktury dokumentu). Optymalny wariant? Dobieramy empirycznie dla każdego typu dokumentacji. Nie ma tu drogi na skróty.
Koszty, harmonogram i MVP – co mówić klientowi wprost
Transparentność kosztowa w branży IT bywa traktowana wybiórczo. No wiadomo. W Web Systems przyjęliśmy zasadę, że klient powinien znać pełny obraz finansowy projektu zanim podejmie decyzję. Realistyczny budżet na aplikację mobilną z komponentem AI zaczyna się od 80-150 tysięcy złotych za MVP i rośnie proporcjonalnie do złożoności modelu, wielkości bazy wiedzy oraz wymagań dotyczących wydajności i bezpieczeństwa. Samo wdrożenie RAG z dedykowaną bazą wektorową i API do obsługi zapytań to zazwyczaj 30-50% tego budżetu.
Strategia MVP ma sens, bo pozwala zweryfikować wartość biznesową AI zanim klient zainwestuje w pełną wersję. Do pierwszej iteracji wybieramy jedną, najważniejszą funkcjonalność AI – najczęściej chatbot pytanie-odpowiedź na firmowej bazie wiedzy albo inteligentne wyszukiwanie produktów. Analiza obrazów, generowanie raportów, predykcje? Zostawiamy na kolejne iteracje, gdy już wiemy, że użytkownicy faktycznie korzystają z komponentu AI i przynosi on mierzalną wartość.
Ukryte koszty utrzymania projektu AI – temat, o którym wielu wykonawców milczy. Model językowy wymaga regularnych aktualizacji. Dostawcy API zmieniają wersje, deprecjonują endpointy, modyfikują cenniki. Baza wiedzy wymaga kuracji, bo dokumenty klienta się zmieniają i stare chunki stają się nieaktualne. Monitoring jakości odpowiedzi generuje koszty infrastrukturalne, a sam koszt tokenów przy dużej liczbie użytkowników potrafi zaskoczyć niejednego product ownera. Szacujemy, że roczny koszt utrzymania systemu AI to 15-25% początkowej inwestycji.
Dlaczego o tym piszemy otwarcie? Bo klient, który rozumie strukturę kosztów, podejmuje lepsze decyzje. I nie traci zaufania do wykonawcy, gdy po pół roku pojawiają się rachunki za API czy konieczność reindeksacji bazy wiedzy. Przejrzystość chroni obie strony przed rozczarowaniem. Buduje relację partnerską, która sprawdza się na długim dystansie. Testowałem oba podejścia – wiem, które działa.
FAQ
Ile kosztuje stworzenie aplikacji mobilnej z AI w polskim software house?
MVP aplikacji mobilnej z komponentem AI w polskim software house – od około 80-150 tysięcy złotych netto. Ostateczna kwota zależy od złożoności modelu AI, rozmiaru bazy wiedzy, wymagań bezpieczeństwa i liczby platform (iOS, Android lub obie). Do tego trzeba doliczyć koszty utrzymania – aktualizacje modeli, monitoring jakości odpowiedzi i opłaty za API dostawców modeli językowych. To orientacyjnie 15-25% inwestycji początkowej rocznie. Strategia MVP pozwala ograniczyć początkowe wydatki i skalować projekt dopiero po potwierdzeniu, że AI faktycznie daje wartość biznesową.
Czy AI w aplikacji mobilnej wymaga stałego połączenia z internetem?
Nie zawsze. Rozwiązania hybrydowe pozwalają uruchamiać prostsze modele bezpośrednio na urządzeniu – klasyfikację tekstu, ekstrakcję słów kluczowych czy rozpoznawanie obrazów można realizować offline. Złożone zadania generatywne (odpowiedzi chatbota, generowanie treści, analiza dokumentów przez RAG) wymagają komunikacji z serwerem, bo duże modele językowe potrzebują zasobów obliczeniowych niedostępnych na przeciętnym smartfonie. Projektujemy aplikacje z kolejkowaniem zapytań i cache’owaniem odpowiedzi – dzięki temu użytkownicy mogą pracować offline i synchronizować wyniki po odzyskaniu łączności.
Jak długo trwa wdrożenie MVP aplikacji mobilnej ze sztuczną inteligencją?
Realnie? 3-5 miesięcy, zależnie od złożoności. Pierwszy miesiąc to analiza wymagań, projektowanie architektury i przygotowanie bazy wiedzy. Kolejne 6-8 tygodni – implementacja aplikacji mobilnej i integracja z modelem AI. Resztę przeznaczamy na testy jakości odpowiedzi, optymalizację promptów, testy wydajnościowe i wdrożenie. Projekty z zaawansowanym fine-tuningiem modelu albo skomplikowanymi wymaganiami bezpieczeństwa mogą trwać dłużej – szczegółowy harmonogram ustalamy po warsztacie analitycznym.
Podsumowanie i kolejny krok
Budowanie aplikacji mobilnych z komponentem AI wymaga połączenia kompetencji inżynierii mobilnej, architektury systemów rozproszonych i praktycznej znajomości ekosystemu modeli językowych. Po dwudziestu latach w branży widzę, że sukces takich projektów zależy od trzech rzeczy – solidna architektura warstwowa, metryczne podejście do jakości AI i uczciwa komunikacja kosztowa z klientem. Żaden z tych elementów nie jest opcjonalny.
Partnerstwo z doświadczonym zespołem technicznym ma znaczenie nie tylko na etapie budowy. Przede wszystkim liczy się w fazie utrzymania i rozwijania systemu. Modele AI ewoluują, API się zmieniają, bazy wiedzy rosną – i wtedy sprawdza się jakość architektury i dojrzałość procesów, które wykonawca wprowadził na początku. Tanie prototypy pisane bez separacji warstw i bez strategii testowania stają się kosztownymi problemami po kilku miesiącach eksploatacji. Widziałem to wielokrotnie.
Rozważasz stworzenie aplikacji mobilnej z elementami sztucznej inteligencji? Szukasz partnera do budowy MVP albo chcesz zintegrować RAG z istniejącym systemem? Odezwij się do nas. W Web Systems łączymy doświadczenie projektowe z praktyczną znajomością AI – chętnie porozmawiamy o Twoim przypadku biznesowym, realnych kosztach i harmonogramie, który ma sens.

