Witaj w repozytorium poświęconym warsztatom z analizy i wizualizacji danych! Cel tego projektu jest prosty: chcemy, abyś skupił się na wyciąganiu wniosków i tworzeniu pięknych wykresów, zamiast tracić czas na żmudne czyszczenie danych i debugowanie kodu.
Aby to umożliwić, przygotowaliśmy dedykowany zestaw narzędziowy (pipeline), który automatyzuje powtarzalne czynności analityczne.
Głównym celem warsztatów jest przeprowadzenie kompleksowej analizy korelacji między wskaźnikami ekonomicznymi, społecznymi a subiektywnym poczuciem szczęścia mieszkańców różnych krajów. Odpowiadamy na pytania takie jak:
- Czy PKB jest jedynym wyznacznikiem szczęścia?
- Jak koszty życia i ceny nieruchomości korelują z jakością życia?
- Czy zanieczyszczenie środowiska i korki drogowe mają mierzalny wpływ na satysfakcję obywateli?
- data/: Zbiory danych w formacie .csv (world_data, happiness_index, crime, health itp.).
- docs/: Dokumentacja warsztatowa i opis funkcji w formacie LaTeX (zestaw_narzedzi.pdf).
- notebooks/: Gotowe scenariusze analizy (demo.ipynb, correlations.ipynb).
- pipeline/: Skrypt Python
utils.pyz gotowymi funkcjami analitycznymi. - requirements.txt: Lista wymaganych bibliotek do instalacji.
git clone https://github.com/tadejow/warsztaty-wizualizacja-danych.git
cd warsztaty-wizualizacja-danychpip install -r requirements.txtW pliku utils.py znajdziesz autorskie funkcje, które ustandaryzują Twoją pracę:
- Wczytywanie i Czyszczenie:
wczytaj_dane()(automatycznie naprawia nazwy kolumn i konwertuje typy). - Łączenie:
polacz_dane()(inteligentnie łączy tabele, dbając o spójność typów). - Analiza:
tabela_korelacji()(tworzy czytelne mapy ciepła dla wybranych zmiennych). - Wizualizacja:
wykres_babelkowy(),wykres_punktowy()i inne estetyczne wykresy.
Otwórz Jupyter Notebook w folderze głównym i przejdź do folderu notebooks, aby uruchomić:
demo.ipynb: Prezentacja wszystkich dostępnych funkcji pipeline'u.correlations.ipynb: Zaawansowana analiza korelacji między wieloma zbiorami danych.
Dane są pobierane bezpośrednio z wersji RAW tego repozytorium na GitHubie. Dzięki temu, pracując w Google Colab lub lokalnie, zawsze masz dostęp do najświeższych zbiorów bez konieczności ich ręcznego pobierania na dysk.
Autorzy: tadejow Jacek Kowalski Licencja: MIT