Hauer of Power. Podcast o sprzedaży, automatyzacji i optymalizacji procesów B2B Mateusz Hauer
Strona głównaWiedzaKontakt
Świat AI

Bezpieczeństwo danych firmowych a AI: jak używać ChatGPT bez wycieku tajemnic

10 min 24 kwi 2026 Autor:
Mateusz Hauer
Hauer Mateusz
Bezpieczeństwo danych firmowych a AI

Kiedy pracownik wkleja do ChatGPT treść kontraktu, który dopiero ma być podpisany, dzieje się dokładnie to, czego nie chciałby szef firmy: dane opuszczają granice organizacji, trafiają na serwery amerykańskiego dostawcy, potencjalnie stają się częścią danych treningowych i w najgorszym scenariuszu mogą wypłynąć w odpowiedzi innemu użytkownikowi. Firmy w 2026 tracą tajemnice nie przez hakerów, tylko przez własnych pracowników używających AI bez świadomości konsekwencji.

W tym artykule pokazuję: jak faktycznie działa przetwarzanie danych w darmowych i firmowych wersjach AI, jakie konkretne zabezpieczenia trzeba wdrożyć, co mówią DPA dostawców, gdzie są granice RODO, jak używać DLP i kiedy warto self-hostować. Artykuł dla CIO, CISO, DPO i liderów IT w firmach, które już wdrożyły AI lub są w trakcie.

Realne zagrożenia: co się już wydarzyło

Samsung, kwiecień 2023

Inżynierowie Samsunga wkleili do ChatGPT wewnętrzny kod źródłowy i notatki ze spotkań. Dane trafiły na serwery OpenAI. Samsung odkrył incydent po kilku tygodniach, natychmiast zakazał publicznych narzędzi AI i zaczął budować własne wewnętrzne rozwiązanie. Koszt wewnętrzny incydentu: szacunkowo kilka milionów dolarów w utraconej przewadze technicznej.

Amazon, 2023

Amazon zakazał pracownikom używania ChatGPT po tym, jak wykryto, że model generuje odpowiedzi zawierające fragmenty kodu Amazona. Sugeruje to, że kod pracowników trafił do danych treningowych.

JPMorgan, Bank of America, Goldman Sachs

Największe banki zakazały pracownikom używania ChatGPT w pracy. Nie z obawy o technologię, tylko o kontrolę nad danymi klientów i compliance.

Polska kancelaria prawna, 2024

Młodszy prawnik wkleił do ChatGPT fragmenty tajemnicy adwokackiej z dużej sprawy gospodarczej, żeby przygotować podsumowanie. Sprawa wyszła na jaw przez wewnętrzny audyt. Konsekwencje: naruszenie tajemnicy zawodowej, postępowanie dyscyplinarne, utrata klienta.

Hakerzy są problemem, o którym wszyscy w firmie słyszeli. Własni pracownicy wklejający dane do AI są problemem, o którym nikt nie mówi głośno, bo trudno przyznać, że w firmie nie ma kontroli nad tym, co się dzieje.

Co się dzieje z danymi wklejonymi do AI

Po wklejeniu tekstu do narzędzia AI dane przechodzą kilka etapów:

  1. Transmisja — dane wysyłane szyfrowanym kanałem (HTTPS/TLS) do serwera dostawcy.
  2. Przetwarzanie — model AI generuje odpowiedź. Dane wejściowe są tymczasowo w pamięci serwera.
  3. Zapis — w większości wersji konsumenckich zapytanie i odpowiedź są zapisywane w historii konta.
  4. Ewentualne wykorzystanie do treningu — w darmowych wersjach OpenAI i Google domyślnie tak, chyba że wyłączyłeś.
  5. Backupy i logi — dane mogą być zachowane w backupach przez 30 dni do kilku lat.

Każdy z tych etapów to potencjalny punkt ekspozycji. Atak na dostawcę, błąd systemu, niedoświadczony administrator, błąd w izolacji kont — wszystko to może doprowadzić do wycieku danych wklejonych miesiące wcześniej.

Darmowe vs Enterprise: 5 kluczowych różnic

AspektDarmowe / Plus / ProTeam / Enterprise / API
Trening na danych użytkownikaDomyślnie TAK (ChatGPT, Gemini)NIE, umownie wykluczone
Zero data retentionBrak opcjiMożliwe na API
SOC 2 Type IIBrak lub ograniczoneTAK
DPA (Data Processing Agreement)Brak lub standardowyNegocjowalny, dostosowany do firmy
Admin controls i audit logsBrakPełna kontrola admin + logi dostępu
Cena (USD/usr/msc)0-2025-80+

Różnica 25-60 USD per użytkownik miesięcznie to w skali firmy wydatek rzędu kilkudziesięciu tysięcy złotych rocznie. Dla każdej firmy, która wykorzystuje AI do realnej pracy, jest to inwestycja nieporównywalna z ryzykiem incydentu.

Klasyfikacja danych: co wolno, a czego nie

Nie każdy fragment tekstu jest równie wrażliwy. Praktyczna klasyfikacja, którą wdrażamy u klientów:

Poziom 1: Publiczne (zielone)

Materiały marketingowe, case studies już publikowane, opisy produktów, posty blogowe. Wolno w każdym narzędziu AI, nawet darmowym.

Poziom 2: Wewnętrzne (żółte)

Wewnętrzne notatki, dokumenty operacyjne, procedury, draft'y tekstów. Tylko w narzędziach Enterprise/Team z umową DPA.

Poziom 3: Poufne (pomarańczowe)

Dane osobowe klientów i pracowników, dane finansowe, kod źródłowy, plany strategiczne. Tylko w narzędziach Enterprise z DPA + dodatkowe zabezpieczenia (DLP, szyfrowanie).

Poziom 4: Ściśle poufne (czerwone)

Tajemnice handlowe, dokumenty prawne w trakcie sporów, dane medyczne, dane biometryczne, plany fuzji i przejęć. Self-hosted AI albo w ogóle nie.

DPA i compliance: co musi się zgadzać

DPA (Data Processing Agreement) to umowa między administratorem danych (Twoja firma) a procesorem (dostawca AI). Wymagana przez RODO, gdy ten drugi przetwarza dane osobowe.

Co powinno być w DPA z dostawcą AI

Dostępność DPA u głównych dostawców

DLP i kontrola techniczna

DPA i polityka to papier. Bez kontroli technicznej pracownicy nadal będą wklejali poufne dane do ChatGPT, bo zapomną albo nie zauważą. Narzędzia DLP (Data Loss Prevention) wykrywają i blokują takie próby.

Typy rozwiązań DLP dla AI

Typowe wdrożenie DLP dla AI

  1. Blokada darmowych ChatGPT/Claude/Gemini na poziomie sieci.
  2. Dostęp wyłącznie do firmowych kont Enterprise (SSO).
  3. Browser extension skanująca prompty przed wysłaniem.
  4. Alert dla adminów przy próbach naruszenia.
  5. Audyt logów raz w tygodniu.

Self-hosting: kiedy ma sens

Self-hosting oznacza uruchomienie modeli AI na własnej infrastrukturze (on-prem lub w prywatnym środowisku cloud). Żadne dane nie opuszczają firmy.

Kiedy self-hosting ma sens

Kiedy self-hosting NIE ma sensu

Opcje self-hostingu w 2026

Typowa infrastruktura dla średniej firmy: 2-4 GPU H100 lub A100 (koszt 200-400 tys. zł + chmura Azure/AWS), zespół MLOps (pół etatu), narzędzia orchestracji (vLLM, Text Generation Inference). Więcej o praktyce w osobnym artykule o RAG dla firmy.

Checklist bezpiecznego wdrożenia AI

Konkretna lista rzeczy, które muszą być zrobione, zanim pozwolisz pracownikom używać AI do danych firmowych:

Więcej o tej tematyce w powiązanych tekstach: ryzyka wdrożenia AI w firmie i koszty wdrożenia AI. Jeśli chcesz audyt bezpieczeństwa AI w swojej firmie, zajmujemy się tym od strony technicznej i procesowej. Zobacz usługi automatyzacji AI lub porozmawiaj z nami.

FAQ

Czy dane wpisywane do ChatGPT są używane do trenowania modeli?

W darmowej i płatnej wersji Plus domyślnie tak, ale można to wyłączyć w ustawieniach (Data Controls). W wersjach Team, Enterprise i API nie, OpenAI gwarantuje umownie, że dane nie są używane do treningu. Claude domyślnie nie trenuje na danych użytkownika nawet w wersjach konsumenckich. Gemini Workspace i Microsoft Copilot trzymają dane w granicach tenantu organizacji.

Gdzie są serwery ChatGPT, Claude i Gemini?

OpenAI (ChatGPT): głównie USA, dla Enterprise dostępne również serwery w Europie. Anthropic (Claude): USA, dla Enterprise dostępne zone AWS/GCP w Europie. Google (Gemini): globalnie, Workspace trzyma dane w regionie klienta. Microsoft Copilot: w granicach geografii tenantu Microsoft 365. Dla polskich firm regulowanych często tylko wersje Enterprise z konkretną lokalizacją są akceptowalne.

Co wolno, a czego nie wolno wklejać do AI?

NIE WOLNO w darmowych narzędziach: danych osobowych klientów i pracowników, tajemnic handlowych, kodu źródłowego z własnością firmy, danych finansowych przed publikacją, informacji objętych klauzulą poufności. W wersjach Enterprise większość tych danych można wprowadzać zgodnie z DPA, ale dane szczególnie wrażliwe (medyczne, biometryczne) nadal wymagają dodatkowych zabezpieczeń lub self-hostingu.

Czy warto self-hostować modele AI?

Dla 80% firm nie. Koszty (infrastruktura GPU, MLOps, aktualizacje) są wyższe niż licencje Enterprise. Self-hosting ma sens gdy: (1) firma w mocno regulowanej branży (bank, szpital, obronność), (2) dane tak wrażliwe że nie mogą wyjść z infrastruktury firmy, (3) ogromny wolumen API, przy którym koszt własnych GPU się zwraca. Dla reszty firm ChatGPT Enterprise + DPA to najlepszy balans.

Mateusz Hauer
Mateusz Hauer
Założyciel, Hauer Power
Od kilku lat wdrażam systemy B2B w firmach, w których bezpieczeństwo danych jest ważniejsze niż szybkość działania. Na AI patrzę z tej samej perspektywy: nie jak zabronić, tylko jak umożliwić używanie bezpiecznie. Najczęściej okazuje się, że to nie technologia jest barierą, tylko luka między polityką a narzędziami do jej egzekucji.

Zobacz również