Probleemipüstituses
Oletame, et meil on aegrea andmestik, mis sisaldab jaekaupluse aasta müüginäitajaid. Meie ülesanne on analüüsida seda andmestikku ja arvutada 7 päeva jooksev keskmine müügitulu, et tasandada võimalikke kõrvalekaldeid, tuvastada suundumusi ja suunata äriotsuseid. Andmeanalüüsiks hakkame kasutama Pythonit, tuntud ja laialdaselt kasutatavat programmeerimiskeelt.
Lahenduskäsitlus
Veereva akna probleemi lahendamiseks toimime järgmiselt.
- Importige vajalikud teegid
- Laadige andmestik
- Loo veerev aken
- Arvutage 7 päeva libisev keskmine
- Visualiseerige tulemusi
Alustame vajalike teekide importimisest ja andmestiku laadimisest.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Load dataset (Assuming the dataset is a CSV file)
data = pd.read_csv('sales_data.csv')
# Preview the dataset
print(data.head())
Pärast andmestiku laadimist jätkame jooksva akna loomist.
Veereva akna loomine
Pöördume võimsate poole Pandad teek, et luua veerev aken kasutades rolling() funktsiooni. Veereva akna suurus on 7 päeva, kuna tahame arvutada 7 päeva libiseva keskmise.
# Create a rolling window of 7 days rolling_window = data['sales'].rolling(window=7)
Nüüd, kui meil on veerev aken, saame arvutada 7 päeva libiseva keskmise.
7 päeva libiseva keskmise arvutamine
Müügi 7-päevase libiseva keskmise leidmiseks nimetame lihtsalt mean() funktsiooni meie veereva akna objektil. Seejärel lisame selle uue liikuva keskmise oma andmekogumisse uue veeruna.
# Calculate the moving average data['7_day_avg'] = rolling_window.mean() # Preview the updated dataset print(data.head(10))
Lõpuks visualiseerime oma tulemusi, et paremini mõista meie andmete suundumusi.
Tulemuste visualiseerimine
Kasutame populaarset matplotlib raamatukogu, et luua lihtne joondiagramm, mis näitab nii igapäevaseid müügiandmeid kui ka meie arvutatud 7 päeva libisevat keskmist.
# Plot the daily sales data
plt.plot(data['sales'], label='Daily Sales')
# Plot the 7-day moving average
plt.plot(data['7_day_avg'], label='7-Day Moving Average', color='red')
# Add labels and legend
plt.xlabel('Days')
plt.ylabel('Sales')
plt.title('Daily Sales and 7-Day Moving Average')
plt.legend()
# Display the plot
plt.show()
Loodud diagramm kuvab igapäevased müügiandmed koos 7 päeva libiseva keskmisega, mis muudab trendide ja kõrvalekallete tuvastamise lihtsamaks.
Kokkuvõtteks võib öelda, et veerevat akent kasutatakse laialdaselt andmeanalüüsis, eriti aegridades, kuna see suudab paljastada suurtes andmekogumites peidetud mustreid ja suundumusi. Pythoni, Pandase ja Matplotlibi kombinatsioon lihtsustab libiseva keskmise arvutamise ja tulemuste visualiseerimise protsessi, muutes selle käsitletavaks teemaks nii algajatele kui ka asjatundjatele.