
Tänapäeva maailmas on aegridade andmetega töötamine arendaja jaoks hädavajalik oskus. Üks levinumaid ülesandeid on ajatempli teisendamine konkreetseks perioodiks, näiteks nädala- või kuuandmeteks. See toiming on erinevate analüüside jaoks ülioluline, näiteks andmete suundumuste ja mustrite uurimine. Selles artiklis uurime, kuidas teisendada ajatemplit perioodiks aegridade andmekogumis, kasutades võimsat Pythoni teeki Pandas. Sukeldume ka põhjalikult koodi, uurime protsessiga seotud teeke ja funktsioone ning mõistame nende tähtsust selle probleemi lahendamisel.
Pandas on avatud lähtekoodiga andmeanalüüsi ja manipuleerimise teek, mis pakub paindlikke ja suure jõudlusega funktsioone aegridade andmetega töötamiseks. See muudab meie ülesande lihtsaks, täpseks ja tõhusaks.
Lahendus ajatempli andmete teisendamiseks konkreetseks perioodiks, näiteks nädalaks või kuuks, hõlmab Pandase teegi resampling-meetodi kasutamist. Resampling on võimas tööriist, mida saab kasutada ajatempliandmete või aegridade andmete puhul andmepunktide üles- või aladisamplimiseks. Sel juhul võtame soovitud perioodide loomiseks andmepunktidest allavalimi.
Vaatame nüüd koodi samm-sammult selgitust:
1. Importige vajalikud teegid:
import pandas as pd import numpy as np
2. Looge ajatempliindeksiga andmeraami näidis.
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D') df = pd.DataFrame(date_rng, columns=['date']) df['data'] = np.random.randint(0,100,size=(len(date_rng))) df.set_index('date', inplace=True)
3. Võtke aegrea andmetest uuesti proovid ja teisendage ajatempli andmed perioodideks:
df_period = df.resample('W').sum()
4. Printige saadud andmeraam:
print(df_period)
Lõplik andmeraamistik „df_period” sisaldab algandmete summat, mis on koondatud nädala kaupa.
**Teekide ja kasutatud funktsioonide mõistmine**
Panda raamatukogu
Pandas on laialdaselt kasutatav Pythoni teek andmete töötlemiseks ja analüüsimiseks. See pakub kõrgetasemelisi andmestruktuure, nagu Series ja DataFrame, võimaldades arendajatel teha kiirelt ja tõhusalt selliseid toiminguid nagu liitmine, ümberkujundamine ja puhastamine. Meie puhul aitab Pandas ajatempliandmeid tõhusalt käsitleda ja pakub ajatempliandmete perioodideks teisendamiseks väärtuslikke funktsioone, nagu resample().
Resample funktsioon
. resample () Funktsioon Pandas on mugav meetod aegridade andmete sageduste teisendamiseks ja uuesti valimimiseks. See pakub palju võimalusi andmete koondamiseks või allavõtmiseks, sealhulgas summa, keskmine, mediaan, režiim ja muud kasutaja määratud funktsioonid. Kasutame seda funktsiooni ajatempli andmete teisendamiseks nädalaperioodiks, määrates uuesti diskreetimissageduseks „W”. Võite kasutada ka 'M' iga kuu jaoks, 'Q' kvartali jaoks jne.
Nüüd, kui oleme uurinud Pandade funktsionaalsust ja ajatempli perioodiandmeteks teisendamist uuesti proovimise funktsiooni, saame ajatundlikke andmeid hõlpsasti sisukamalt käsitleda. Nende tööriistade abil saavad arendajad, andmeanalüütikud ja SEO spetsialistid oma andmetest ainulaadset teavet avada, aidates neil teha paremaid otsuseid ja ennustusi.