Słownik wynagrodzeń
BDL (Bank Danych Lokalnych)
Czym jest BDL?
Bank Danych Lokalnych, w skrocie BDL, to najwiekszy w Polsce uporzadkowany zbior informacji statystycznych o wymiarze terytorialnym, prowadzony i udostepniany przez Glowny Urzad Statystyczny pod adresem bdl.stat.gov.pl. BDL zawiera ponad 40 tysiecy zmiennych opisujacych sytuacje spoleczno-gospodarcza Polski - od demografii i rynku pracy, przez edukacje, zdrowie i kulture, az po finanse publiczne i ochrone srodowiska. Dla badaczy wynagrodzen BDL jest narzedziem absolutnie podstawowym, poniewaz pozwala porownywac place miedzy wojewodztwami, podregionami, a w niektorych przypadkach takze powiatami.
BDL wystartowal w obecnej formie w 2010 roku i od tego czasu jest stale rozwijany. Obecnie obejmuje szeregi czasowe siegajace w wielu przypadkach roku 1995, a niektore dane demograficzne nawet roku 1950. To czyni BDL nie tylko zrodlem danych biezacych, ale takze wartosciowym archiwum historycznym.
Struktura BDL: K -> G -> P -> V
BDL jest zorganizowany hierarchicznie wedlug nastepujacej struktury:
- K - Kategorie (najwyzszy poziom): np. Rynek pracy, Ludnosc, Wynagrodzenia i swiadczenia spoleczne, Gospodarka mieszkaniowa.
- G - Grupy: w ramach kategorii Rynek pracy znajdziemy np. Pracujacy, Bezrobocie rejestrowane, Wynagrodzenia.
- P - Podgrupy: np. Przecietne miesieczne wynagrodzenie brutto.
- V - Zmienne (variables): konkretne wskazniki, np. Przecietne miesieczne wynagrodzenie brutto w sektorze przedsiebiorstw, w sektorze publicznym, wedlug sekcji PKD.
Kazda zmienna ma unikalny identyfikator liczbowy (zmienna ID), ktory jest stabilny w czasie i pozwala na automatyczne pobieranie danych przez API.
Dane terytorialne - od Polski po gminy
BDL jest zorganizowany w nastepujacych poziomach terytorialnych:
- Polska - poziom krajowy.
- Wojewodztwo - 16 jednostek (NUTS-2).
- Region - 7 regionow makro (NUTS-1, np. region poludniowy).
- Podregion - 73 jednostki (NUTS-3).
- Powiat - 380 jednostek (LAU-1), w tym 66 miast na prawach powiatu.
- Gmina - 2477 jednostek (LAU-2).
Wazna uwaga: dane o wynagrodzeniach sa dostepne w BDL glownie na poziomie wojewodztw i podregionow. Na poziomie powiatow sa dostepne pewne wskazniki (przecietne wynagrodzenie w sektorze przedsiebiorstw dla powiatow, w ktorych jest reprezentatywna proba), ale nie wszystkie. Na poziomie gmin danych placowych praktycznie nie ma - tajemnica statystyczna i mala liczebnosc prob to uniemozliwiaja.
API REST BDL - jak korzystac
API BDL jest publiczne i darmowe, dostepne pod adresem api.stat.gov.pl/Home/BdlApi. Glowne endpointy to:
/api/v1/subjects- lista kategorii, grup i podgrup./api/v1/variables- lista zmiennych, mozna filtrowac po subject-id./api/v1/variables/{id}- szczegoly konkretnej zmiennej./api/v1/data/by-variable/{id}- dane dla zmiennej, filtr po roku i jednostce terytorialnej./api/v1/data/by-unit/{id}- dane dla jednostki terytorialnej./api/v1/units- lista jednostek terytorialnych.
Format odpowiedzi to JSON. Bez klucza API obowiazuja limity (10 zapytan na sekunde, 5000 na dzien). Po zarejestrowaniu klucza limity rosna do 100 zapytan na sekunde i 2 milionow na dzien. Klucz mozna uzyskac za darmo przez formularz na portalu API GUS.
Najwazniejsze zmienne BDL dla wynagrodzen
Z perspektywy badan placowych warto znac nastepujace zmienne i ich obszary:
- Przecietne miesieczne wynagrodzenie brutto - ogolem oraz wedlug sektorow.
- Przecietne miesieczne wynagrodzenie w sektorze przedsiebiorstw.
- Przecietne miesieczne wynagrodzenie w sektorze publicznym i prywatnym.
- Wynagrodzenie wedlug sekcji PKD (rolnictwo, przemysl, budownictwo, handel, transport, informacja i komunikacja, finanse, dzialalnosc profesjonalna, edukacja, opieka zdrowotna).
- Relacja do przecietnego wynagrodzenia w kraju (Polska = 100).
- Stopa bezrobocia rejestrowanego (kontekst dla danych placowych).
- Liczba pracujacych ogolem i w sektorze przedsiebiorstw.
Jak interpretowac dane BDL
Dane w BDL sa najczesciej podawane jako wartosci roczne lub miesieczne (w zaleznosci od zmiennej). Wartosc 7155.48 w polu Przecietne miesieczne wynagrodzenie brutto za 2023 rok dla Polski oznacza, ze tyle wynosila przecietna pensja brutto w gospodarce narodowej. Wazne, zeby zwracac uwage na dwie rzeczy: (1) zakres podmiotowy - czy mowimy o sektorze przedsiebiorstw, czy o gospodarce narodowej, (2) konstrukcje wskaznika - czy to brutto, czy netto, czy zawiera trzynastki, premie i inne dodatki.
Limity API i komercyjne uzycie
Dane BDL sa dostepne na licencji pozwalajacej na komercyjne uzycie z podaniem zrodla w formie: Zrodlo: Bank Danych Lokalnych GUS. Nie ma oplat za korzystanie. Limity API w wersji bez klucza wystarczaja do pojedynczych zapytan dziennikarskich i prac akademickich. Aplikacje produkcyjne, zwlaszcza serwisy z duzym ruchem, powinny uzyskac klucz API i implementowac cache po stronie aplikacji.
Roznica miedzy BDL a BSW
BDL i BSW (Badanie Struktury Wynagrodzen) to dwa rozne produkty GUS, czesto mylone:
- BDL - baza danych z wartosciami srednimi i agregatami w przekroju terytorialnym, dostepna online przez przegladarke i API. Aktualizowana na biezaco.
- BSW - cykliczne badanie (co 2 lata) zawierajace szczegolowy rozklad wynagrodzen (mediana, percentyle) wedlug zawodu, plci, wieku, wyksztalcenia. Wyniki publikowane w postaci raportow PDF i tablic Excel - nie sa standardowo udostepniane przez API BDL.
FAQ - najczesciej zadawane pytania o BDL
Czy dostep do BDL jest darmowy? Tak, calosc danych i API sa bezplatne, takze do uzytku komercyjnego.
Jak czesto sa aktualizowane dane? Zaleznie od zmiennej - od raz w miesiacu (rynek pracy, sektor przedsiebiorstw) po raz w roku (dane gospodarcze).
Czy moge pobrac wszystkie dane na raz? Nie ma jednego archiwum z calosc BDL, ale przez API mozna systematycznie zbudowac wlasna kopie.
Czy BDL ma dane o wynagrodzeniach na poziomie powiatu? Tylko w ograniczonym zakresie - przecietne wynagrodzenie w sektorze przedsiebiorstw dla powiatow, ktore spelniaja kryteria reprezentatywnosci.
Praktyczne scenariusze uzycia BDL
BDL nie jest tylko narzedziem akademickim - znajduje zastosowanie w wielu praktycznych kontekstach. Samorzady wykorzystuja BDL do oceny pozycji swoich gmin na tle innych: porownuja stope bezrobocia, dochody wlasne na mieszkanca, liczbe pracujacych w sekcji przemyslu czy uslugach. Inwestorzy zagraniczni szukajac lokalizacji pod fabryke czy centrum logistyczne sprawdzaja w BDL dostepnosc sily roboczej, poziom plac w regionie i strukture wieksza ludnosci. Dziennikarze danych uzywaja BDL do tworzenia map i infografik o zaroboch w roznych czesciach kraju, czesto wskazujac na luke miedzy Mazowszem a Polska Wschodnia.
Drugim wazkim zastosowaniem jest badanie efektywnosci polityk publicznych. Programy rzadowe kierowane do regionow slabszych ekonomicznie (np. Polska Wschodnia, Sciana Zachodnia) sa monitorowane wlasnie przez wskazniki BDL: czy poziom plac sie zblizyl do sredniej krajowej, czy zatrudnienie rosnie szybciej, czy pojawila sie wieksza dynamika inwestycji prywatnych. Bez BDL takie monitorowanie byloby praktycznie niemozliwe.
Format i sciezki dostepu
Z BDL mozna korzystac na kilka sposobow:
- Przegladarka WWW - bdl.stat.gov.pl, intuicyjny interfejs z drzewem kategorii. Mozna wybrac zmienna, lata, jednostki terytorialne i pobrac dane jako Excel lub CSV.
- API REST - dla aplikacji, automatyzacji i regularnego pobierania duzych ilosci danych.
- Pliki zbiorcze - GUS publikuje okresowo paczki danych obejmujace calosc zmiennych dla wybranej kategorii w plikach CSV/XLSX.
- Strona stat.gov.pl - wybrane wykresy interaktywne i dashboardy zbudowane na danych BDL, np. interaktywna mapa wynagrodzen.
Format danych zwracanych przez API to JSON, ale GUS udostepnia rowniez specyfikacje OpenAPI 3.0, ktora pozwala generowac klientow w roznych jezykach programowania (Python, JavaScript, R, Java).
Najczestsze bledy uzytkownikow BDL
Pracujac z BDL warto wystrzegac sie typowych pulapek interpretacyjnych. Po pierwsze, wskaznik Przecietne wynagrodzenie w sektorze przedsiebiorstw nie jest tym samym, co wynagrodzenie w gospodarce narodowej - sektor przedsiebiorstw obejmuje firmy 10+ pracownikow, gospodarstwo narodowe to wszystko, lacznie z administracja publiczna, edukacja, ochrona zdrowia. Liczby moga sie roznic o kilkaset zlotych. Po drugie, dane miesieczne moga byc bardzo zmienne ze wzgledu na premie, trzynastki, nagrody kwartalne - sredniorocznie te efekty sie wygladzaja, ale w pojedynczym miesiacu pensje moga skakac o 20-30%.
Po trzecie, agregaty regionalne potrafia byc zwodnicze. Na przyklad Mazowsze ma najwyzsze przecietne wynagrodzenie w Polsce, ale to glownie Warszawa - reszta Mazowsza ma place blisko sredniej krajowej. Dlatego do badan wewnatrzregionalnych warto schodzic na poziom podregionow (NUTS-3) lub powiatow.
BDL a otwarte dane publiczne
BDL jest wpisany w szeroka strategie otwartych danych publicznych panstwa polskiego. Dane sa dostepne na licencji zblizonej do Creative Commons - wystarczy podanie zrodla. BDL jest tez podlaczony do unijnego portalu danych publicznych data.europa.eu i portalu krajowego dane.gov.pl. Dzieki temu polscy badacze i deweloperzy maja te same narzedzia, co ich odpowiednicy z innych krajow czlonkowskich UE.
Przyklady kodow API w Pythonie
Dla deweloperow wkraczajacych w prace z BDL, oto przyklady typowych zapytan w Pythonie z biblioteka requests:
- Pobranie listy wojewodztw - GET /api/v1/units/units?level=2&format=json
- Pobranie zmiennej Przecietne miesieczne wynagrodzenie brutto za 2023 dla wojewodztwa mazowieckiego - GET /api/v1/data/by-variable/{varId}?unit-parent-id=011000000000&year=2023
- Wyszukanie zmiennych zawierajacych w nazwie slowo wynagrodzenie - GET /api/v1/variables/search?name=wynagrodzenie
Wynik jest zwracany w formie JSON z polami values, year, unit-id, unit-name oraz metadanymi (miara, dokladnosc, data publikacji). Wieksze zapytania mozna paginowac przez parametry page-size i page (max 100 rekordow na strone bez klucza, 1000 z kluczem). Dla aplikacji produkcyjnych zaleca sie cache po stronie aplikacji - dane BDL rzadko sie zmieniaja w trakcie miesiaca, wiec mozna trzymac kopie przez 24-48 godzin.
BDL a inne portale GUS
Czesto BDL jest mylony z innymi serwisami GUS. Dla jasnosci:
- BDL - dane terytorialne, wszystkie zmienne dla wszystkich poziomow (Polska, wojewodztwo, powiat, gmina). Glowne narzedzie analityczne.
- STRATEG - system monitorowania strategii rozwoju, dane wskaznikow celow strategicznych. Mniej szczegolowy niz BDL, ale lepiej zorganizowany pod katem konkretnych celow polityki publicznej.
- Demografia - dedykowana baza demograficzna z bardzo szczegolowymi danymi o populacji, urodzeniach, zgonach, migracjach.
- Eurostat przez GUS - polska wersja danych Eurostatu, takich jak SES (Structure of Earnings Survey), LFS (Labour Force Survey), HBS (Household Budget Survey).
- Portal Informacyjny - jednolity punkt wyszukiwania we wszystkich publikacjach GUS, dziala jak google na dane statystyczne.
Krytyka i ograniczenia BDL
BDL, mimo bogactwa danych, ma swoje ograniczenia. Po pierwsze, granularnosc danych placowych jest niewystarczajaca - na poziomie powiatu mozemy zobaczyc tylko ogolne wynagrodzenie, bez podzialu na sekcje czy zawody. Po drugie, czesto brakuje porownan z kosztami zycia w danym regionie - 7000 PLN brutto w Warszawie a 7000 PLN w Lublinie to kompletnie inna sila nabywcza, ale BDL tego nie pokazuje. Po trzecie, interfejs uzytkownika jest pomocny, ale dla osob niezaznajomionych z metodologia statystyczna moze byc zbyt techniczny - nie kazdy wie, czym jest sekcja PKD czy NUTS-3. Wreszcie, API dziala dobrze, ale dokumentacja czasem jest nieaktualna lub niepelna - w niektorych przypadkach trzeba eksperymentowac, by znalezc wlasciwy parametr.
Plany rozwoju BDL
GUS zapowiada w nadchodzacych latach kilka usprawnien BDL: pelna integracja z BDL3 (nowa wersja architektury), dodanie nowych baz tematycznych (np. innowacyjnosc, transformacja cyfrowa), wzbogacenie wizualizacji o interaktywne mapy choropletyczne, rozbudowa API o webhooki dla notyfikacji o nowych danych, oraz mozliwosc otwartych pulpitow analitycznych (dashboardy budowane przez uzytkownikow). Te zmiany maja sprawic, ze BDL bedzie nie tylko zrodlem danych, ale takze platforma analityczna porownywalna z najlepszymi rozwiazaniami w UE (Statistics Norway, Statistics Sweden).