Všechny články

Ondřej Švec

10. 6. 20245 min čtení

Obsah

DataNástroje a metody

Jak na zálohu dat z Universal Analytics, abyste o ně v červenci nepřišli

Ondřej Švec

5 min čtení

10. 6. 2024

Loňským jarem hýbal přechod na nové Google Analytics 4. Původní Universal Analytics od té doby už neměřily, ale data z předchozích období v nich ještě zůstávala. To se ale od 1. 7. 2024 změní, Google účty se všemi daty smaže. Pokud si je nyní nezálohujete, přijdete o historická čísla z webu či e⁠-⁠shopu. Podívejte se, jak je můžete jednoduše zálohovat.

To nejdůležitější:

  • Universal Analytics od léta 2023 neměří. Od 1. 7. 2024 z nich zmizí i všechna data.
  • I když data pro meziroční srovnání už máte v nových Google Analytics 4, doporučujeme starší data zálohovat.
  • Zálohujte data o návštěvnosti alespoň na měsíční bázi.
  • Ostatní data vyhodnoťte a uložte si alespoň přehledy a reporty.
  • U menších webů stačí export nejdůležitějších dat, s většími projekty vám pomohou datoví odborníci.

Proč zálohovat stará data

Zatímco některé firmy s přechodem na nové Google Analytics 4 otálely, jiné je už pár let používají. Pokud mezi ně patříte, data pro meziroční srovnání máte. Přesto i vám doporučujeme data z Universal Analytics alespoň jako CSV zálohovat. I starší data se totiž mohou hodit pro vyhodnocování trendů, kvůli historickému kontextu byznysu a pro strategické rozhodování a plánování budoucího vývoje.

Těch, kteří přechod na nové Google Analytics 4 nechávali na poslední chvíli a začali je používat až od července 2023, je dost. Především pro ně je záloha předchozích dat důležitá. I ostatním firmám se ale může hodit pohled pár let zpátky. Například pro sledování vývoje nějakého trendu, pro srovnání se situací před covidem a podobně. Historická data nabízí spoustu důležitých vhledů do byznysu a byla by chyba o ně přijít.“

Zde musíme připomenout, že porovnání dat z původních a nových Google Analytics není tak snadné. Měří se podle odlišných metodik, například se jinak počítá návštěva webu. Nelze tedy starší data vzít a jen tak porovnávat. Můžete je ale mít uložená ve formátu CSV a jakmile budete srovnání potřebovat, data interpretujete a porovnáte s aktuálním stavem.

Jaká data z Universal Analytics zálohovat

Byť data vnímáme jako důležitá, všímáme si také nešvaru měřit vše. Původní analytics tak mohou být plná nepotřebných dat. Proto si při zálohování určete, která data jsou pro vás důležitá a využijete je.

Pokud tápete, která data zálohovat, doporučujeme alespoň data o návštěvnosti a hlavním cíli webu (transakce nebo lead) podle zdrojů a případně i kampaní. Další data si uložte podle toho, co měříte, využíváte a srovnáváte. U e⁠-⁠commerce webů to může být výkon jednotlivých produktů nebo transakce včetně ID. U lead⁠-⁠gen webů to může být výkon jednotlivých landing pages, ostatní cíle a události. Mohou se hodit i návštěvnosti jednotlivých stránek či zařízení, ze kterého uživatelé web navštěvují.

Data zálohujte minimálně po měsících – to je mnohdy jediná cesta. Mít data za rok je prakticky k ničemu. Naopak data po dnech budou užitečnější, jenže často také příliš velká.

Při exportu návštěvnosti po dnech, když máme průměrně 50 různých zdrojů, za 10 let jsme na 182 000 řádcích. U jednotlivých produktů to bude ještě vyšší. Data po měsících tak mohou být nejrychlejší možností. Ostatní si můžete vyhodnotit a místo dat uložit jen report, se kterým si do budoucna vystačíte.“

Pokud si ve firmě děláte roční vyhodnocení dat z webu, může vám to jako záloha stačit. Když k tomu přidáte alespoň základní minimum dat, která nemáte uložená jinde (například v CRM), bude to ještě lepší.

Jaké jsou možnosti exportu

Export dat z Universal Analytics

Přímo z rozhraní Universal Analytics si můžete data uložit ve formátu CSV, PDF, XLSX, nebo jako Google Sheets. Následně můžete data vyhodnotit, interpretovat, nebo vizualizovat například v Looker Studiu.

Tento způsob je snadný a zvládne ho každý i bez technických dovedností. Přihlásíte se ke svému účtu v Universal Analytics, zobrazíte si data, která chcete exportovat, a období, ze kterého chcete data uložit. Poté už je jen stáhnete v požadovaném formátu.

Narazíte ale na omezení – najednou lze exportovat pouze 5 000 řádků, pokud máte dat více, musíte je ukládat po částech. Celý proces se tak může výrazně protáhnout. Navíc dochází k samplingu, kdy systém vypisuje hodnoty jen na základě části dat a dochází tak ke zkreslení. Jedinou možností, jak se tomu vyhnout, je data stahovat po menších částech.

Export dat proto doporučujeme spíše malým webům s menším množstvím dat.

Záloha pomocí BigQuery

Pokud máte větší web a používáte placené Google Analytics 360, možná už máte napojení na cloudové úložiště BigQuery, kam se vám data automaticky zálohují. Jinak je tam budete muset nahrát po vlastní ose.

Mimochodem, BigQuery si nastavte i na nových Google Analytics 4, ve kterých budete mít téměř čistá data u nichž můžete dělat libovolné modelace a výpočty.

 

Záloha pomocí Google Analytics Spreadsheet Addon

O něco složitější než export dat je řešení pomocí doplňku přímo od Googlu, který propojuje Universal Analytics s Google Sheets. Pro zálohu dat zde existuje i šablona, takže si jen vytvoříte tabulku v Google Sheets a pomocí rozšíření (add⁠-⁠on) ji propojíte s aplikací Google Analytics, kterou si stáhnete. Přímo v tabulce pak vytvoříte nový report, do kterého se exportují data z Analytics.

Výhodou je, že data máte rovnou v sheetu, který si připojíte například do Looker Studia, stejně jako se napojovaly Universal Analytics. Ale opět tu narážíme na sampling, pro větší weby je proto add⁠-⁠on nevhodný – nebo musíte data stahovat po částech, abyste samplování zabránili. Druhou věcí je pak velikost samotných dat, Google Sheet má limit 10 000 000 buněk a i menší množství dat ho značně zpomaluje.

Export do CSV přes API

Pro stažení dat můžete využít také rozhraní Google Analytics API V4, ke kterému se dostanete například pomocí R scriptu (lze spustit třeba z RStudia). Funguje to podobně jako záloha přes add⁠-⁠on, jen výstupem není sheet, ale třeba CSV soubor – stačí napsat pár řádků kódu a máte hotovo.

 

Rscript
# Nainstaluje package pokud ho nemáte
if (!requireNamespace("googleAnalyticsR", quietly = TRUE)) install.packages("googleAnalyticsR")
library(googleAnalyticsR)

#Google login
ga_auth()

# ID  Google Analytics view
view_id <⁠-⁠ "25073918"

# Volba metrik a dimenzí
metrics <⁠-⁠ c("sessions", "users", "bounceRate", "goalCompletionsAll", "transactionRevenue")
dimensions <⁠-⁠ c("date","sourceMedium")

# Vytvoření requestu
ga_ua_data <⁠-⁠ google_analytics(viewId = view_id,
                            date_range = c("2022⁠-⁠01⁠-⁠01", "2023⁠-⁠01⁠-⁠31"),
                            metrics = metrics,
                            dimensions = dimensions,
                            anti_sample = TRUE)  # Rozdělení dotazů z důvodu samplingu
                            
# Vypíše ukázku výstupu
head(ga_ua_data)

# Cesta uložiště a přidání veiw ID před název souboru
filename <⁠-⁠ paste("C:/Users/ondrej.svec/Desktop/EXT/P&R/ua_backup/", view_id, "_ga_ua_backup.csv")
# Uložení do CSV
write.csv(ga_ua_data, filename, row.names = FALSE)

 

Stahování dat je v tomto případě relativně spolehlivé a probíhá bez samplingu. U větších webů s až miliony řádků záznamů stahování může chvilku trvat. Stažený export v CSV si uložíte a později data využijete, jak potřebujete.

Další variantou je stažení dat z Universal Analytics přes rozhraní Keboola, pokud jej používáte. V Keboole pohodlně naklikáte dimenze a metriky, které chcete zálohovat, nastavíte anti⁠-⁠sampling a data uložíte, kam potřebujete.

Zálohujte, ale neblázněte

Pokud máte větší web a za zády oddělení datových analytiků, se zálohováním si nelamte hlavu – nejspíš už data zálohovali pomocí BigQuery (případně do jiného Cloudu) nebo přes Rko. Stejně tak pokud spolupracujete s agenturou jako jsme my, nejspíš už vám vhodné řešení doporučili a provedli.

U menších webů si zálohujte potřebná data pomocí exportu do souboru nebo přes add⁠-⁠on. Pokud máte nové Google Analytics 4 nasazené od roku 2021, potřebujete skutečně jen základní minimum dat po měsících za posledních pár let, což pomocí exportu zvládnete.

Zároveň doporučujeme udělat si roční přehledy a data si vyhodnotit – dost možná vám při srovnání bude stačit jen tento přehled, bez dat samotných.

Data jsou důležitá a nechcete o ně přijít. Zároveň ale není nutné bláznit a zálohovat úplně všechno. Rozhodnout se každopádně musíte do konce června.

 

Pomůžeme vám uchovat data důležitá pro byznys

Pokud potřebujete se zálohou dat pomoct, ozvěte se nám.

Pište na e-mail ondrej.svec@proofreason.com
nebo se ozvětě přes LinkedIn

Ondřej Švec

Head of data

Ondřej Švec

Head of data