Co serwis pokrywa
- Wszystkie pojazdy aktywne w polskim rejestrze CEPiK — ok. 27 mln rekordów na dzień 17 kwietnia 2022.
- 16 województw Polski w pełnym podziale administracyjnym (TERYT).
- Marki: ponad 7 000 unikalnych zapisów z surowych danych CEPiK, w tym marki światowe i historyczne polskie (FSO, Polonez, Ursus, WSK, FS-Lublin).
- Lata produkcji: pełen przedział 1950–2022 z ważnym wpisem produkcyjnym.
- Pierwsze rejestracje: szereg czasowy 1990–2019 (z luką 2020–2022 — patrz niżej).
- Paliwa: 10 kategorii (benzyna, diesel, LPG, CNG, hybrydy HEV/PHEV, BEV, wodór, etanol, inne).
Czego serwis nie pokrywa
- Dane osobowe — właściciele, kierowcy, numery rejestracyjne. CEPiK publiczny ich nie udostępnia, my także nie.
- Konkretne pojazdy — VIN, historia szkód, ważność OC. To robi historiapojazdu.gov.pl.
- Pojazdy wyrejestrowane — kasacje, eksport, kradzieże nie wchodzą do statystyk parku aktywnego.
- Cena pojazdu — CEPiK nie zawiera danych cenowych. Kalkulator TCO wykorzystuje wartości szacunkowe, które wpisuje użytkownik.
- Modele samochodów — w obecnej wersji serwisu tabela modeli jest
pusta. Powodem jest tekstowa, niespójna postać pola
modelw surowych danych CEPiK (np. „A4", „A 4", „Audi A4 Avant" jako trzy różne wpisy). Karty modeli uruchomimy po normalizacji.
Luki w danych
- Lata 2020–2022 — pierwsze rejestracje. Snapshot CEPiK z 17.04.2022 zawiera w tych latach zaledwie kilkanaście wpisów rocznie zamiast ~250 000/rok. To znany efekt migracji systemu do CEPiK 2.0. Aktualne dane miesięczne podaje PZPM — planujemy ich integrację.
- Pole
kategoriaw CEPiK ma niespójną postać (kody numeryczne zamiast oczekiwanych M1/N1/L). Nie używamy go w obecnej wersji jako wymiaru. - Marki tekstowe — surowe wartości zawierają literówki i wariacje. Stosujemy aliasy do mapowania na slugi kanoniczne, ale 100 % poprawność nie jest zapewniona.
- Pojazdy bifuelowe (np. benzyna+LPG) są w CEPiK najczęściej rejestrowane jako benzyna. Liczby LPG są więc zaniżone.
- BEV (samochody elektryczne) w CEPiK to dane z 2022 — nie uwzględniają boomu lat 2023–2025. Aktualne liczby publikuje EAFO.
Pojazdy bez przypisanego województwa
Dump CEPiK zawiera plik pojazdy_xx_2022-04-17 z ~410 tysięcy wpisów
bez ważnego kodu województwa (najczęściej pojazdy historyczne
i jednorazowe). W agregacjach regionalnych pomijamy je, w totalu
krajowym także. Nie ma sensu „rozdzielać" ich między województwa
proporcjonalnie.
Skala porównań
- Per capita liczymy używając populacji GUS 2023 (najnowsza dostępna). Ratio „pojazdów na 1 000 mieszkańców" jest wskazówkowe — pojazdy firmowe (zarejestrowane w siedzibach leasingu, głównie Mazowieckim) zaburzają obraz regionalny.
- Cuota nacional liczymy zawsze względem 27 mln aktywnych pojazdów z odpowiedniego snapshotu, nigdy względem populacji.
Schemat aktualizacji
Bazę otwiera schemat z tabelą snapshots — każda fuente i każda data
to osobny rekord. Nowe snapshoty dołączają bez przebudowywania
historii. Daty wszystkich publikowanych snapshotów rejestrujemy
w Changelog.