Съдържание
Работата с дигитални данни днес е много по-лесна – събираме, анализираме и стигаме до полезни изводи далеч по-бързо отпреди. Един от инструментите, които често помагат в този процес, е Regular Expressions, или по-познат като RegEx.
Ако сте се занимавали с Google Tag Manager или Universal Analytics, вероятно вече сте попадали на RegEx. Някои го използват с лекота, други – просто се оправят колкото да свършат работа. И това не е проблем – важното е, че върши работа, нали?
RegEx е типичен пример за това как нещо уж дребно може да ви даде големи възможности. С преминаването към Google Analytics 4 (GA4) има доста промени, но RegEx продължава да е тук – и ако знаете къде и как да го използвате, може да ви спести много време и главоболия.
Какво е RegEx и защо ни е нужен?
RegEx представлява набор от символи, които се използват за откриване на определени модели в текст – т.е. в текстови низове (strings). Всъщност, той съществува много преди Google Analytics и е широко разпространен в програмирането.
Използва се масово в различни програмни езици за обработка на текст – например за търсене, замяна или валидиране на съдържание според зададени условия.
Защо да го използвате? Защото може да ви спести време, усилия и ръчна работа. Основната му цел е да открива текстови елементи, които съвпадат с определен шаблон (или pattern). А това е особено полезно, когато работим с динамични или непълно известни стойности – не е нужно да знаете точния текст, достатъчно е да уцелите модела.
Какви са основните приложения на RegEx?
- Извличане на текст – Можете да „издърпате“ конкретна информация от по-дълъг текст или множество редове, ако те отговарят на зададен шаблон.
- Валидиране на данни – Използва се често при проверка на потребителски вход (например дали e-mail или парола отговарят на изискванията).
- Редакция на текст – Позволява ви да заменяте, изтривате или форматирате части от текста автоматично – много полезно при почистване на данни.
- Разделяне на текст (т.нар. tokenization) – Може да се използва за разбиване на текст на по-малки части според зададени правила. Това е често срещано в анализа на текст и NLP.
От всички изброени, най-честото приложение на RegEx в GA4 е извличането на текстови данни. Но както виждате – възможностите му са доста по-широки.
Видове съвпадения (Match Types) при RegEx
Когато работим с филтри в GA4, често срещаме различни типове съвпадения – дори и без изрично да използваме RegEx. Тези match types влияят пряко върху резултатите, които виждаме, затова е добре да знаем как работят.
Макар често да ги пренебрегваме, правилният избор на тип съвпадение може напълно да промени това, което ще ни покаже отчета.
Ето бърз преглед на основните типове съвпадения с RegEx:
- Matches RegEx / Does not match RegEx
Този тип проверява за точно съвпадение с RegEx шаблона (или обратно – че няма такова съвпадение, ако изберете does not match).
Пример: Да вземем за пример Google Merchandise Store – в акаунта в GA4 искаме да видим всички стойности за page path, които съдържат /Google\+Redesign.
Този RegEx няма да даде резултат, ако няма точно съвпадение със стойността.
Но ако използваме /Google\+Redesign/Apparel, тогава ще сработи, тъй като това е точна стойност, присъстваща в данните.
- Matches partial RegEx / Does not match partial RegEx
Този вариант се използва по-често, защото ни дава всички стойности, които съдържат определена дума или модел, дори да не е точно копие.
Пример: Ако зададете /Google\+Redesign за page path или screen class, ще получите всички страници, които съдържат тази стойност, независимо от останалата част на URL адреса.
Важно: Типовете съвпадения са чувствителни към малки и главни букви. Ако стойността в данните е с главна буква, а вие търсите с малка – няма да съвпаднат, освен ако изрично не отчетете разликата в RegEx шаблона.
Какъв RegEx използва GA4 по подразбиране?
Към момента GA4 използва точно съвпадение (Exact Match), когато въвеждате RegEx – това означава, че търси стойности, които напълно съвпадат с въведения шаблон, а не просто го „съдържат“. Този тип съвпадение се използва навсякъде в платформата, с едно изключение – „Add filter“ в стандартните отчети, където е позволено и частично съвпадение (Partial Match).
С други думи – ако използвате RegEx в Explorations, Audience segments, DebugView, Events и други секции, имайте предвид, че ще се търси точно съвпадение с шаблона, не просто дали текстът го „съдържа“.
Ако RegEx шаблонът ви не връща никакви резултати, вероятно причината е в това, че GA4 очаква точно съвпадение, а не „съдържа“.
А защо е така?
GA4 използва RE2 синтаксис – това е олекотена и много по-бърза версия на RegEx, създадена от Google. Тя е оптимизирана за скорост и сигурност, но има някои ограничения, които е добре да знаете:
- Не може да се търси нещо, което се намира след конкретна дума – (?<=…)
Пример: Искаме да открием „thank-you“, но само ако преди това в URL-то има „checkout“.
Обикновен RegEx би изглеждал така: (?<=checkout)thank-you
Това обаче няма да проработи в GA4 – т.нар. „lookbehind“ не се поддържа.
- Може да се използва „lookahead“, но само ако дължината е фиксирана – (?=…)
Пример: Ако искаме да открием „product“, но само ако след него има „review“ или „details“, и то с различна дължина, това няма да проработи.
Примерен шаблон, който няма да работи: (?=product)(.*)(?=review|details)
- Не може да се използват „Backreferences“ – (\1, \2 и т.н)
Това е полезно, когато искате да проверите дали една дума се повтаря на различни места.
Пример: Представете си, че имате URL като: /shop/product/shoes/product и искате да намерите всички URL-и, където думата след /shop/ се повтаря по-нататък в адреса (в случая – product).
Обикновено това се прави с RegEx като: /shop/(.*)/.*\1/ – където \1 означава “използвай отново първата хваната част”.
- Ограничена поддръжка за т.нар. „по-мързеливи“ търсения (non-greedy)
Квантификаторите в RegEx показват колко пъти даден елемент може да се среща. По подразбиране те са „алчни“ (greedy) – т.е. опитват се да съвпаднат с възможно най-дългия текст. Понякога обаче ни трябва обратното – да хванем най-краткото възможно съвпадение. Именно тук идват така наречените мързеливи (или lazy) квантификатори.
В GA4 се поддържат само базовите lazy квантификатори, а именно:
+? – съвпада с едно или повече срещания, но спира при първа възможност
*? – съвпада с нула или повече пъти, но търси най-краткия вариант
Ако опитате да създадете по-сложна конструкция с lazy квантификатори, GA4 може да не я разпознае правилно или изобщо да не върне съвпадение. Това е едно от ограниченията на RE2 синтаксиса, който платформата използва.
- Няма пълна поддръжка на букви от различни езици
RE2 синтаксисът не поддържа Unicode property escape конструкции, като например \p{L}. Това са шаблони, с които можете да уловите всички буквени символи, включително такива с ударения, специални знаци или от други езици (напр. кирилица, китайски, арабски и др.).
Пример: Шаблонът \p{L}+ обикновено съвпада с думи като Café (тъй като é е буква с ударение). В GA4 това няма да проработи, защото RE2 не поддържа този синтаксис.
Ако все пак искате да ограничите съвпадението само до букви, може да използвате нещо такова: [a-zA-Záéíóúñü]+
Това ще хване стандартни латински символи и няколко често срещани символа с ударения – полезно, ако работите със съдържание на испански, португалски или френски. Този шаблон обаче няма да разпознае букви на кирилица, арабски, китайски и др. Ако имате съдържание на различни езици – това ще е пречка и ще трябва да използвате по-широки или custom решения.
- Не се поддържат т.нар. „possessive quantifiers“ – (пр.: *+, ++)
Това са подобрени версии на алчните (greedy) квантификатори, като * или +, но с едно важно отличие: веднъж щом намерят съвпадение, не позволяват връщане назад (backtracking), за да се пробва друга комбинация.
Пример: Нека разгледаме текста aab и шаблона a*+b
• a*+ ще се „вкопчи“ в двете „а“-та (aa)
• после ще потърси „b“
• ако няма „b“ точно след това, няма да върне назад, за да пробва с по-кратко съвпадение като a + b
Това поведение е направено с цел по-добра производителност, но изисква много прецизно написани шаблони.
- Условни проверки също не са възможни – (?(condition)then|else)
В по-мощните RegEx системи може да използвате условни проверки, които работят според това дали дадена част от шаблона вече е открила съвпадение. Това ви позволява да зададете „Ако X е вярно – направи едно, иначе – направи друго“.
Примерен RegEx: (?(1)dog\d*|cat)
Този шаблон проверява:
• ако група 1 вече е уловила нещо → търси dog + числа (напр. dog123)
• ако група 1 не е активна → търси cat
С други думи:
• cat ще се хване, ако преди това не сме открили определена част
• dog123 ще се хване, ако вече сме открили нещо друго по-рано в шаблона
- Няма поддръжка за сложно „междинно“ съвпадение (substring matching)
Понякога се налага да търсите част от текст (substring), но само ако тя се намира между други две конкретни думи или елементи. В по-мощните RegEx системи това може да се направи чрез конструкции като lookbehind и lookahead.
Пример: Представете си, че искате да откриете всички URL-и, които съдържат думата order, но само ако се намира между cart и confirmation, като например:
/cart/checkout/order123/confirmation
В стандартен RegEx бихте използвали шаблон като: (?<=cart).*order(?=confirmation)
Това обаче не работи в GA4, защото:
• (?<=…) – т.нар. lookbehind – не се поддържа
• сложни комбинирани условия със .* и динамична дължина също могат да създадат проблеми
Използвайте по-опростена, но ефективна алтернатива: ^/cart.*order.*confirmation$
Този шаблон ще открие всички URL адреси, които:
• започват с /cart
• съдържат order някъде по средата
• завършват с confirmation
Къде в Google Analytics 4 можете да използвате RegEx?
Нека да разгледаме основните места в GA4, където можете да използвате регулярни изрази – и защо би ви било полезно:
1. Стандартни отчети в GA4
Стандартните отчети (наричани още детайлни отчети) са тези, които виждате по подразбиране във вашия GA4 акаунт – например Acquisition, Engagement, Monetization и др.
GA4 ви дава няколко начина да филтрирате данните в тези отчети:
- Report filter – основният филтър в горната част на отчета
- Comparisons – функция в стандартните отчети, която ви позволява да сравнявате различни сегменти от потребители директно в една и съща визуализация
- Table filter – онова малко поле за търсене, което се намира точно под визуализацията и над таблицата с данни в стандартните отчети
От трите опции, единствено „Report filter“ поддържа RegEx.
За да го видите в действие, отидете в Reports → Acquisition → Traffic Acquisition, след това кликнете на бутона „Add filter“ в горната част на екрана под заглавието.
Можете да изберете и друг отчет, стига в горната част да виждате бутона „Add a filter“.
Имайте предвид, че тази опция не е налична за отчетите Overview, Conversions, In-app purchases и Publisher ads.
Интерфейсът за създаване на филтър (Build filter), който се появява вдясно, е мястото, където можем да използваме RegEx.
Пример: Ако искаме да видим представянето на трафика от Organic и Email канали:
- Избираме Session default channel group като dimension
- След това избираме тип съвпадение:
– matches regex (за точно съвпадение)
– или matches partial regex (ако искаме да се отчете всяко срещане на думата в текста)
В този случай ще използваме matches partial regex, тъй като няма chanel group, която съдържа само думата Organic.
В полето за стойност въвеждаме: Organic|Email
(знакът | действа като „или“ между двете думи)
След това натискаме синия бутон Apply, за да приложим филтъра.
Сега ще виждаме единствено резултатите за каналите, които съдържат Organic или Email, а всички останали ще бъдат скрити:
А какво да направите, ако не искате да виждате тези канали, а всички останали?
Просто повторете същите стъпки, но този път изберете does not match partial regex като тип съвпадение.
2. Explorations (персонализирани анализи)
Кликнете на Explore в страничното меню и отворете някой от готовите шаблони или анализ, по който вече работите.
В самия анализ, в колоната Settings, превъртете надолу и ще видите опция за добавяне на филтър.
Да кажем, че този път искаме да филтрираме по Source / Medium.
Преди да можете да го използвате като филтър (или пък в колони), първо трябва да го добавите от менюто вляво.
Ако директно кликнете върху „+ Drop or select dimension or metric“ в секцията Filters, без предварително да сте заредили съответното поле от секцията Dimensions вляво – то няма да се появи в списъка и бутонът ще остане неактивен.
Затова първо:
- Отидете в лявата част на интерфейса и натиснете „+“ до Dimensions.
- Изберете нужното поле (например Source / Medium) и го добавете.
- Едва след това можете да го използвате като филтър. Приплъзнете го или го изберете от списъка долу вдясно.
Да кажем, че този път искаме да филтрираме по Source / Medium.
Преди да можете да го използвате като филтър (или пък в колони), първо трябва да го добавите от менюто вляво.
Ако директно кликнете върху „+ Drop or select dimension or metric“ в секцията Filters, без предварително да сте заредили съответното поле от секцията Dimensions вляво – то няма да се появи в списъка и бутонът ще остане неактивен.
Затова първо:
- Отидете в лявата част на интерфейса и натиснете „+“ до Dimensions.
- Изберете нужното поле (например Source / Medium) и го добавете.
- Едва след това можете да го използвате като филтър. Приплъзнете го или го изберете от списъка долу вдясно.
След като добавите полето, остава само да изберете условието за филтриране.
Както ще забележите, тук има само опции за matches regex и does not match regex – но няма matches partial regex, което си е леко разочароващо.
Защо това е проблем?
Ами, ако искаме да филтрираме всички стойности в Source / Medium, които съдържат думата organic, филтърът няма да проработи, защото няма стойност, която е само “organic”.
Какво правим в такъв случай?
Ще трябва ръчно да изредим всички стойности, които искаме да включим – точно както се показват в отчета, включително празните интервали, в противен случай няма да има съвпадение.
Пример: За да филтрираме всички канали със стойности, съдържащи organic, RegEx-ът ще изглежда така: google / organic|instagram / organic| organic
Всеки елемент трябва да е изписан точно така, както се появява в GA4 – с интервалите, наклонената черта и малките букви.
Проблемът при този тип съвпадение е, че лесно можем да пропуснем стойности, особено ако не ги виждаме директно в списъка. А това се случва често, когато използваме RegEx.
Наример: в предишния филтър не включихме yahoo / organic, просто защото не се беше появил в данните, които разглеждахме в момента.
Затова в този случай RegEx не е особено полезен. Надяваме се, че Google в бъдеще ще добави опцията matches partial regex и тук.
Добрата новина? Има начин да заобиколим това ограничение – ще го разгледаме малко по-надолу в статията в секцията Common RegEx Characters.
3. Сегменти и аудитории
Сегментите могат да се използват само в секцията Explore, така че ще продължим с текущия анализ и ще създадем нов сегмент под колоната Variables.
След като влезем в интерфейса за създаване на сегмент, можем да зададем нужните условия.
Например: искаме да видим данни само за събития, при които типът устройство е mobile или desktop.
И тук отново имаме на разположение само опцията matches regex, така че трябва да въведем точните стойности – което в този случай е сравнително лесно.
След като запазим и приложим сегмента, той ще се появи в резултатите. Не забравяйте да добавите и съответнот поле в анализа – в случая device category.
При създаване на сегмент имаме възможност да изградим аудитория на базата на този сегмент.
Ако отворите сегмента, който току-що създадохме, ще видите три точки вдясно от бутона Apply. Кликнете върху тях, а след това изберете Create an audience, за да създадете аудитория на база на този сегмент.
С опцията Create an audience можете да добавяте и последователности (sequences) – нещо, което иначе е достъпно само при потребителски сегменти.
Важно е да знаете, че и тук, ако използвате RegEx, все още се прилагат същите ограничения, свързани с типа съвпадение matches regex.
4. Вътрешен трафик и нежелани реферали
Още едно място, където можем да използваме RegEx, е при дефиниране на вътрешен трафик и списък с нежелани реферали. Тези настройки се намират в: Admin → Data Streams → Configure tag settings
Там можете да използвате регулярни изрази, за да посочите домейни или IP адреси, които искате да се третират като вътрешни или да бъдат изключени от отчетите като източници на трафик.
Можем да използваме типа съвпадение IP address matches regular expression, за да зададем шаблон, който обхваща няколко IP адреса едновременно, както е показано в примера по-долу:
С други думи, казваме на системата: ако IP адресът започва с 90.204., а останалата част може да бъде каквато и да е – тогава този трафик да се отчита като вътрешен.
Що се отнася до нежеланите реферали, RegEx е особено полезен, защото позволява да изключим няколко домейна и всички техни варианти наведнъж.
Това е много удобно в ситуации като:
- изключване на външни платежни системи (напр. PayPal, Stripe и др.)
- пренасочване на потребители към друг домейн за смяна на парола или вход
След като кликнете на List unwanted referrals, ще се отвори интерфейсът за настройка, където можете да изберете типа съвпадение: Referral domain matches RegEx.
Следователно, RegEx шаблонът stripe|paypal\.com ще изключи всички реферали от Stripe и PayPal, тъй като няма логика те да се показват като източници на трафик – те са част от нормалната работа на бизнеса ви.
Затова е добре да ги добавите в списъка с нежелани реферали.
5. Създаване или модифициране на събития
В GA4 можете да създавате нови събития на базата на вече получаваните такива, както и да редактирате съществуващи, като използвате RegEx, за да си улесните работата.
Отидете в Admin → Events, за да започнете.
Ще изберем опцията Create event, тъй като RegEx работи по един и същи начин както при създаване, така и при модифициране на събитие. Налични са два типа съвпадения:
- matches regular expression
- matches regular expression (ignore case) – игнорира разликите между малки и главни букви
Съществува и вариант с does not match, но и тук няма възможност за частично съвпадение (partial match).
Да приемем, че искаме да създадем събитие с име requestonlinemeeting_visit, което се активира всеки път, когато потребител посети страницата Заяви онлайн среща на сайта ни.
Можем да го направим, като създадем ново събитие на база на съществуващото page_view, и използваме следния RegEx: https://admax\.bg\/meeting\/
Обърнете внимание, че трябва да изпишем цялата стойност, включително https://, защото в това поле системата очаква точно съвпадение от самото начало на URL адреса.
Предупреждението от Google е добър знак да не се използва RegEx, освен ако наистина не е необходимо. В нашия пример може и да не е задължително, но целта е просто да покажем къде и как може да се използва RegEx в GA4.
6. Персонализирани групи канали (Custom Channel Groups)
Последното място в този списък, където можете да използвате RegEx (поне засега), е при създаването на персонализирани групи канали.
За да стигнете до настройките, отидете на: Admin → Data Display → Channel Groups.
Предефинираната група канали в Google Analytics не може да бъде редактирана или изтрита, което всъщност е полезно – така се избягва рискът някой случайно да обърка входящия трафик.
Когато кликнете на бутона Create new channel group, ще се отвори интерфейс, в който можете да:
- добавите нов канал
- редактирате съществуващ
- направите копие на канал и да създадете нов на базата му
- или да изтриете вече съществуващ (но само ако не е част от предефинираната група)
Както ще забележите, не можете да използвате RegEx директно на този екран, но когато създавате нов канал, вече имате достъп до повече опции.
Този път е налична и опцията matches partial regex, което е особено важно при създаване на канални групи – тъй като ви позволява да обхванете повече варианти на трафик с един шаблон.
Да кажем, че искате да създадете нов канал за QR кодове, в който Medium съдържа qr или code – независимо от това в какъв формат или комбинация се появяват.
В този случай можете да използвате RegEx с частично съвпадение (matches partial regex) и въведете: qr|code
Така ще обхванете всички случаи, в които Medium съдържа някоя от двете думи – например qr_campaign, scan_code, social_qr_code и т.н.
След като запазим новата група, ще видим и новия канал, който току-що създадохме.
С това вече покрихме всички основни места в GA4, където може да се използва RegEx.
Разбира се, овладяването на RegEx изисква време и практика, но дори да познавате само някои от най-често използваните символи и как работят, може да ви бъде изключително полезно.
Често използвани символи в RegEx
Този списък не е изчерпателен, но включва най-често използваните RegEx символи в GA4, които си струва да познавате:
- | (pipe)
Използва се за ИЛИ – съвпадение с една от две или повече стойности.
Пример: mobile|desktop ще съвпадне с „mobile“ или „desktop“.
Не поставяйте | в края, напр. mobile|desktop| – това няма да работи.
- . (точка)
Съвпада с произволен един символ – буква, цифра или знак.
Пример: 0. ще съвпадне с 0.1, 0A, 0B и т.н.
- * (звездичка)
Означава, че предходният символ може да се повтори 0 или повече пъти.
Пример: 2* съвпада с 20, 22, 200, 2222.
Важно: * работи винаги върху символа точно преди него. Ако искате да прилагате звездичката върху цяла дума или група, трябва да използвате скоби – напр. (ab)*.
- + (плюс)
Съвпада с предходния символ, повторен един или повече пъти (за разлика от *, който допуска и нула пъти).
Пример: 11+ ще съвпадне с 11, 111, 1111.
- ? (въпросителен)
Прави предходния символ незадължителен – може да се срещне 0 или 1 път.
Пример: ^https? ще съвпадне с http и https.
Освен това, когато се използва заедно с квантификатори (*, +), въпросителният знак ги превръща в “мързеливи” (lazy) – т.е. те ще търсят най-краткото възможно съвпадение, а не най-дългото.
- .* (точка + звездичка)
Това е т.нар. wildcard – съвпада с всичко, което следва.
Пример: organic.* ще съвпадне с organic search, organic_campaign и т.н.
Ако използваме .*organic.*, ще съвпадне с всяка стойност, в която се среща думата organic, без значение къде в текста.
- \ (backslash, escape)
Използва се, за да укаже, че следващият символ трябва да се възприеме буквално, а не като част от RegEx синтаксиса.
Пример: www\.admax\.bg
Тук наклонената черта „избягва“ точките, така че те се третират като обикновени символи, а не като RegEx символ за “кой да е знак”.
Без \, шаблонът www.admax.bg би означавал:
„www“, последвано от който и да е символ, след това „admax“, отново който и да е символ, и „bg“.
- $ (долар)
Използва се, за да посочи края на низа – казва на RegEx израза, че шаблонът трябва да се намира точно в края.
Пример: \.pdf$ ще съвпадне само с файлове, които завършват на .pdf – например document.pdf, но няма да съвпадне с document.pdf.zip.
- ^ (caret)
Противоположно на $ – означава, че съвпадението трябва да започва от самото начало на низа.
Пример: ^192\.0\. ще съвпадне с IP адреси, започващи с 192.0. (напр. 192.0.2.1, 192.0.100.10)
- () (скоби)
Използват се за групиране. Това позволява да прилагате оператори върху цели групи, а не само върху отделни символи.
Пример: (mobile|desktop) ще съвпадне с „mobile“ или „desktop“ – т.е. една от двете думи.
Скобите могат да се използват и за комбиниране на различни класове символи: ([0-9]|[a-z]) ще съвпадне с една цифра или малка буква.
- [] (квадратни скоби)
Използват се за създаване на набор от допустими символи, като RegEx ще съвпадне с който и да е един от тях.
Примери:
• [abc] ще съвпадне с a, b или c
• [0-9] ще съвпадне с всяка цифра от 0 до 9
• [a-zA-Z] ще съвпадне с всяка буква – малка или главна
Този тип конструкции са особено полезни, когато искате да съвпаднете определен диапазон от знаци.
Пример: user[123] ще съвпадне с user1, user2, user3.
- – (тире)
Тирето се използва вътре в квадратните скоби, за да създаде диапазон от стойности – т.е. „от-до“.
Примери:
• [0-9] всяка цифра от 0 до 9
• [a-z] всяка малка буква
• [A-Z] всяка главна буква
Добри практики при използване на регулярни изрази в GA4
Ето няколко съвета, които ще ви помогнат да използвате RegEx по-лесно и ефективно в Google Analytics 4:
- Придържайте се към простото
В повечето случаи няма нужда от сложни RegEx изрази. Колкото по-ясна е целта ви и колкото по-просто е написан шаблонът – толкова по-лесно ще постигнете желания резултат.
Помислете първо какво точно искате да извлечете, и след това изградете израза стъпка по стъпка.
- Тествайте изразите си предварително
Ако не сте сигурни дали даден RegEx работи както трябва, използвайте сайт като RegEx101. Просто въведете израза си горе и примерен текст отдолу и ще видите веднага дали има съвпадение.
Така ще избегнете грешки, преди да го приложите в GA4.
Още един плюс на този сайт е, че ви дава обяснение как точно работи изразът – т.е. защо има (или няма) съвпадение. Освен това ще откриете и: кратко ръководство с основните символи; възможност да запазите шаблона си и избор на тип RegEx синтаксис (т.нар. „flavor“).
Ако искате да тествате RegEx точно както работи в GA4, изберете опцията “Golang” – тя използва RE2, същия механизъм, който Google Analytics 4 използва за регулярни изрази.
- Запазвайте често използвани изрази
Ако в екипа ви редовно се използват едни и същи RegEx шаблони, добра идея е да ги съхранявате на едно централизирано място, до което всички имат достъп.
Добавете кратки инструкции – кога и къде се използват, както и скрийншоти, ако е нужно. Така ще си спестите грешки и дублиране на работа.
- Не забравяйте да „избягвате“ специалните символи
Ако искате някой символ да се тълкува буквално (а не като RegEx оператор), използвайте обратна наклонена черта \.
Най-често това важи за точка (.) и наклонена черта (/) — те имат специална роля в RegEx и трябва да бъдат „избягвани“, когато ги използвате като обикновени символи.
- Избягвайте прекалено „алчни“ съвпадения
По подразбиране RegEx се държи “алчно” – т.е. опитва се да съвпадне с възможно най-дългата част от текста. Ако искате да сте по-прецизни, използвайте метасимволи като ^ (начало) и $ (край), за да ограничите търсенето.
В GA4 това не е голям проблем, когато използвате „matches regex“ – там се търси точно съвпадение. Но ако искате по-гъвкави или частични съвпадения, точността в израза ви е важна.
Тези съвети не са насочени към това да ви научат на RegEx от нулата, а по-скоро как да си улесните работата и да извлечете максимума от него в GA4. Може и да не сте „мастър“ в регулярните изрази (все още), но със сигурност можете да започнете да ги използвате все по-често и по-уверено.
Ако статията ви беше полезна – следете блога на AdMax за още полезни ръководства, свързани с анализи, оптимизации и дигитални кампании. И, разбира се, не се притеснявайте да питате – винаги сме насреща!





