cepikstatspl

Dane · zasięg

Co serwis obejmuje, a czego nie

Granice cepikstats.pl wyłożone na stół. Zamiast udawać, że pokrywamy wszystko, pokazujemy konkretnie, jakie dane mamy, czego brakuje i dlaczego.

Co serwis pokrywa

  • Wszystkie pojazdy aktywne w polskim rejestrze CEPiK — ok. 27 mln rekordów na dzień 17 kwietnia 2022.
  • 16 województw Polski w pełnym podziale administracyjnym (TERYT).
  • Marki: ponad 7 000 unikalnych zapisów z surowych danych CEPiK, w tym marki światowe i historyczne polskie (FSO, Polonez, Ursus, WSK, FS-Lublin).
  • Lata produkcji: pełen przedział 1950–2022 z ważnym wpisem produkcyjnym.
  • Pierwsze rejestracje: szereg czasowy 1990–2019 (z luką 2020–2022 — patrz niżej).
  • Paliwa: 10 kategorii (benzyna, diesel, LPG, CNG, hybrydy HEV/PHEV, BEV, wodór, etanol, inne).

Czego serwis nie pokrywa

  • Dane osobowe — właściciele, kierowcy, numery rejestracyjne. CEPiK publiczny ich nie udostępnia, my także nie.
  • Konkretne pojazdy — VIN, historia szkód, ważność OC. To robi historiapojazdu.gov.pl.
  • Pojazdy wyrejestrowane — kasacje, eksport, kradzieże nie wchodzą do statystyk parku aktywnego.
  • Cena pojazdu — CEPiK nie zawiera danych cenowych. Kalkulator TCO wykorzystuje wartości szacunkowe, które wpisuje użytkownik.
  • Modele samochodów — w obecnej wersji serwisu tabela modeli jest pusta. Powodem jest tekstowa, niespójna postać pola model w surowych danych CEPiK (np. „A4", „A 4", „Audi A4 Avant" jako trzy różne wpisy). Karty modeli uruchomimy po normalizacji.

Luki w danych

  • Lata 2020–2022 — pierwsze rejestracje. Snapshot CEPiK z 17.04.2022 zawiera w tych latach zaledwie kilkanaście wpisów rocznie zamiast ~250 000/rok. To znany efekt migracji systemu do CEPiK 2.0. Aktualne dane miesięczne podaje PZPM — planujemy ich integrację.
  • Pole kategoria w CEPiK ma niespójną postać (kody numeryczne zamiast oczekiwanych M1/N1/L). Nie używamy go w obecnej wersji jako wymiaru.
  • Marki tekstowe — surowe wartości zawierają literówki i wariacje. Stosujemy aliasy do mapowania na slugi kanoniczne, ale 100 % poprawność nie jest zapewniona.
  • Pojazdy bifuelowe (np. benzyna+LPG) są w CEPiK najczęściej rejestrowane jako benzyna. Liczby LPG są więc zaniżone.
  • BEV (samochody elektryczne) w CEPiK to dane z 2022 — nie uwzględniają boomu lat 2023–2025. Aktualne liczby publikuje EAFO.

Pojazdy bez przypisanego województwa

Dump CEPiK zawiera plik pojazdy_xx_2022-04-17 z ~410 tysięcy wpisów bez ważnego kodu województwa (najczęściej pojazdy historyczne i jednorazowe). W agregacjach regionalnych pomijamy je, w totalu krajowym także. Nie ma sensu „rozdzielać" ich między województwa proporcjonalnie.

Skala porównań

  • Per capita liczymy używając populacji GUS 2023 (najnowsza dostępna). Ratio „pojazdów na 1 000 mieszkańców" jest wskazówkowe — pojazdy firmowe (zarejestrowane w siedzibach leasingu, głównie Mazowieckim) zaburzają obraz regionalny.
  • Cuota nacional liczymy zawsze względem 27 mln aktywnych pojazdów z odpowiedniego snapshotu, nigdy względem populacji.

Schemat aktualizacji

Bazę otwiera schemat z tabelą snapshots — każda fuente i każda data to osobny rekord. Nowe snapshoty dołączają bez przebudowywania historii. Daty wszystkich publikowanych snapshotów rejestrujemy w Changelog.