Tại sao GA4 lại kết nối với BigQuery? Lợi ích của BigQuery là gì và nó tốn bao nhiêu chi phí? Bài viết này sẽ trả lời những câu hỏi này của bạn. Phiên bản chung của Google Analytics (GA) sẽ ngừng nhận dữ liệu vào cuối tháng 6 năm nay và được thay thế bởi phiên bản mới GA4. So với phiên bản GA cũ, phiên bản nâng cấp của GA4 có chức năng tối ưu hóa đáng kể trong những việc như thu thập dữ liệu đa nền tảng hay phân tích báo cáo tùy chỉnh. Tuy nhiên, giới hạn lưu giữ dữ liệu trong đến 14 tháng có thể trở thành một trong những vấn đề lớn nhất của nhà tiếp thị khi dùng GA4.
Như chúng tôi đã đề cập trong các bài viết trước, để đối phó với giới hạn về thời gian lưu trữ dữ liệu của GA4, giải pháp tốt nhất là kết nối nó với BigQuery. Điều này không chỉ giúp lưu trữ dữ liệu vô thời hạn mà còn tạo điều kiện thuận lợi cho việc lập chỉ mục và sử dụng sau này. Tuy vậy, nhiều nhà tiếp thị chỉ mới nghe đến công cụ BigQuery lần đầu và không tránh khỏi có nhiều nghi ngờ với công cụ này. Trong bài viết này, chúng tôi sẽ trả lời 8 câu hỏi thường gặp nhất của các nhà tiếp thị với GA4 và BigQuery.
I. Google BigQuery là gì?
BigQuery là hệ thống kinh doanh thông minh (BI) của Google Cloud và là sản phẩm của Google Cloud Platform (GCP). BigQuery không chỉ cung cấp dung lượng lớn để lưu trữ dữ liệu đám mây mà còn hỗ trợ tính toán và phân tích dữ liệu quy mô lớn, được biết đến là”công cụ phân tích dữ liệu bề nổi mạnh nhất” trong ngành. Người dùng có thể nhập và lưu trữ vĩnh viễn dữ liệu gốc từ GA4 hoặc các nguồn khác để tạo điều kiện thuận lợi cho các nhu cầu như truy vấn, xuất hay phân tích dữ liệu. Đối với việc lưu trữ dữ liệu đám mây thì đây là một lựa chọn tương đối rẻ và mạnh mẽ trên thị trường!
II. Lợi ích của việc kết nối GA4 với BigQuery là gì?
GA được nâng cấp lên GA4, tại sao nên kết nối với BigQuery? Trước đây người dùng GA cần bỏ ra hơn 3 tỷ đồng 1 năm để nâng cấp lên GA360 mới kết nối được BigQuery, nhưng phiên bản mới GA4 mở kết nối miễn phí cho tất cả người dùng. Dữ liệu trang web do GA4 thu thập sẽ được nhập đầy đủ vào hệ thống BigQuery và sẽ có thể mang lại nhiều lợi ích như sau:
- Hiệu suất phi thường, công tác truy vấn và phân tích dữ liệu giúp tiết kiệm thời gian và công sức!
BigQuery có thể xử lý dữ liệu nhanh như chớp, ngay cả đối với khối lượng dữ liệu lớn cấp TB/PB, các truy vấn có thể được hoàn thành trong chưa tới một phút. Ngoài ra, hệ thống sử dụng ngôn ngữ tương tự SQL, giúp giảm thiểu việc viết lại mã và giúp các nhà tiếp thị và phân tích dữ liệu càng dễ dàng sử dụng. - Tích hợp đơn giản, dễ dàng lọc dữ liệu và quan sát khách hàng!
Dữ liệu được nhập vào BigQuery có thể được tích hợp với dữ liệu khách hàng CRM và dữ liệu GA4 hiện có của thương hiệu để nắm bắt đầy đủ hành vi và sở thích tương tác của khách hàng. Đồng thời, bộ công cụ này cũng có thể phân tích sâu lịch sử sử dụng của người dùng để khám phá thêm các cơ hội kinh doanh. Trong BigQuery, người dùng cũng có thể chọn lọc hay thậm chí sửa đổi lượng dữ liệu khổng lồ để cải thiện độ chính xác của dữ liệu.
- Khả năng tương thích cao, dễ dàng kết nối nhiều bên và tạo báo cáo trực quan!
Sau khi có được dữ liệu GA đầy đủ và chính xác, người dùng có thể kết nối thêm BigQuery với các hệ thống như Google Looker Studio (trước đây là Data Studio) để trình bày dữ liệu dưới dạng biểu đồ trực quan nhằm tạo điều kiện cho việc phân tích và ra quyết định.
Đọc thêm: Tìm hiểu BigQuery và 4 lý do GA4 tích hợp công cụ này
III. Dữ liệu GA4 nào sẽ hiển thị trong BigQuery sau khi ghép nối?
Ngoại trừ giới tính và độ tuổi, tất cả dữ liệu do GA4 thu thập có thể được nhập vào BigQuery và lưu trữ vĩnh viễn ở dạng dữ liệu gốc. Ví dụ các trường dữ liệu sau đây sẽ được lưu trong BigQuery để dễ dàng truy vấn, phân tích và xuất bất kỳ lúc nào:
- Dữ liệu người dùng: user_id (ID người dùng), device.category (loại thiết bị)
- Dữ liệu lưu lượng truy cập: traffic_source (nguồn lưu lượng truy cập quảng cáo), traffic_source.medium (phương tiện lưu lượng truy cập quảng cáo)
- Dữ liệu sự kiện: event_name (tên sự kiện), event_params.value (giá trị thông số của sự kiện)
Vậy sự khác biệt giữa cái gọi là dữ liệu gốc và dữ liệu do GA4 thu thập là gì? Với GA4, để tạo điều kiện cho người dùng nhanh hiểu và nắm bắt được thông tin chi tiết, thì công cụ này sẽ thực hiện việc lấy mẫu, hợp nhất và đơn giản hóa dữ liệu. Dữ liệu được nhập vào BigQuery sẽ là dữ liệu chưa lấy mẫu, hoàn chỉnh và không bị chỉnh sửa, điều này sẽ thuận tiện và linh hoạt hơn khi ứng dụng.
Trừ độ tuổi và giới tính thì BigQuery có thể thu thập tất cả dữ liệu gốc.
IV. Có dữ liệu CRM rồi thì liệu có cần dữ liệu GA4/BigQuery nữa không và nó có những lợi ích gì?
CRM chủ yếu lưu trữ dữ liệu tĩnh được thu thập offline còn dữ liệu động được thu thập online bởi GA4; chúng có thể bổ sung cho nhau và giải mã được dữ liệu của bên thứ nhất. Nhập dữ liệu GA4 vào BigQuery không chỉ làm cho dữ liệu chi tiết hơn mà còn có thể hợp tác với các công nghệ như làm sạch dữ liệu, so sánh người dùng và tích hợp để thực sự đạt được hiệu quả tiếp thị và ra quyết định.
Trong giao diện GA4, việc phân tích chủ yếu dựa trên “lưu lượng truy cập trang web”. Dù là trang web hay ứng dụng thì tất cả dữ liệu đều được thu thập hoàn chỉnh, giúp các nhà tiếp thị thuận tiện nắm bắt được bức tranh toàn cảnh. BigQuery tập trung nhiều hơn vào ” người dùng” và sử dụng các cá nhân làm đơn vị quan sát, phân tích hành trình sử dụng toàn bộ kênh của từng người dùng cụ thể, sau đó phân chia người dùng và triển khai các chiến lược tiếp thị khác nhau.
BigQuery được ghép nối với dữ liệu CRM, bổ sung dữ liệu tĩnh và động, giúp người dùng nắm bắt được dữ liệu của bên thứ nhất.
V. Lợi ích của việc kết nối Looker Studio (trước đây là Data Studio) thông qua BigQuery là gì?
Mặc dù bản thân GA4 có chức năng “Khám phá” để tạo báo cáo trực quan nhưng các lựa chọn biểu đồ ít hơn nhiều so với Looker Studio nên nhiều người sẽ chọn xuất dữ liệu GA4 sang Looker Studio để tạo báo cáo. Tuy nhiên, nếu GA4 được liên kết trực tiếp với Looker Studio, GA4 sẽ gặp phải các hạn chế như số lượng liên kết, giới hạn thời gian dữ liệu và các chỉ số dữ liệu. Những vấn đề này đều có thể được giải quyết bằng BigQuery! Bằng cách liên kết GA4 với BigQuery, Looker Studio có thể nhập dữ liệu BigQuery để giải quyết các vấn đề sau:
- Vượt qua giới hạn hạn ngạch: Kể từ tháng 11 năm 2022, GA4 đã cập nhật giới hạn hạn ngạch API. Khi nhiều nhà tiếp thị truy cập vào dữ liệu GA4 trong Looker Studio, các thông báo lỗi như “hết hạn ngạch/quá nhiều kết nối” sẽ hiện lên, nhưng những tài liệu chính thức của Google đã xác nhận chính sách mới và giải thích chi tiết hạn chế số lượng Tokens. Những hạn chế như vậy có thể được khắc phục bằng BigQuery.
GA4 được liên kết với Looker Studio và từ năm 2022 sẽ bắt đầu giới hạn Tokens.
- Phạm vi thời gian linh hoạt: Looker Studio chỉ có thể truy cập phạm vi dữ liệu trong vòng 2 tháng hoặc 14 tháng trong giao diện GA4, nhưng điều này sẽ được giải quyết khi kết hợp với BigQuery. Dữ liệu có thể được lưu trữ vĩnh viễn và theo dõi trong phạm vi thời gian dài hơn.
- Đầy đủ chỉ số dữ liệu: Các chỉ số dữ liệu được nhập vào Looker Studio đã giảm từ hàng trăm trong phiên bản cũ GA xuống còn 50-60 trong GA4. Ví dụ như tỷ lệ thoát trang (bounce rate) mà các nhà tiếp thị thường thấy vốn không bao gồm trong kết quả phân tích, nhưng nếu nhập Looker Studio vào BigQuery thì sẽ không có giới hạn và các mục bắt buộc có thể được điều chỉng linh hoạt để có thể đạt được kết quả phân tích toàn diện hơn.
VI. Làm thế nào để tính chi phí kết nối GA4 với BigQuery?
Sau khi GA được nâng cấp lên GA4, người dùng có thể kết nối miễn phí GA4 và BigQuery, vậy sau khi kết nối thì có cần trả phí khi sử dụng BigQuery không? Ngày đầu bài viết đã nhắc đến BigQuery cung cấp hạn ngạch miễn phí hàng tháng, khá đủ cho hầu hết các doanh nghiệp vừa và nhỏ, ngay cả khi vượt quá hạn ngạch miễn phí thì cũng có thể định giá theo số lượng và không quá đắt đỏ.
Chi phí cho BigQuery chủ yếu được chia thành hai mục:
- Lưu trữ dữ liệu: người dùng được cấp 10 GB miễn phí mỗi tháng để lưu trữ dữ liệu đã được nhập vào BigQuery. Sau khi vượt quá hạn ngạch, bộ nhớ động được tính ở mức 0,02 USD mỗi GB (khoảng 470 đồng) và có thể truy cập dữ liệu được sửa đổi trong vòng 90 ngày. Bộ nhớ dài hạn được tính ở mức 0,01 USD mỗi GB (khoảng 236 đồng) và truy cập vào bất kỳ tài liệu gốc chưa sửa đổi nào trong vòng 90 ngày.
- Khối lượng truy vấn dữ liệu: Sử dụng truy vấn SQL, hàm do người dùng xác định, mã tập lệnh, v.v. để truy vấn dữ liệu và cung cấp miễn phí 1 TB mỗi tháng. Sau khi vượt quá hạn ngạch, phí sẽ được tính ở mức 5,75 USD (khoảng 135.000 đồng) cho mỗi TB.
VII. Làm thế nào để kết nối GA4 với BigQuery?
Bước 1: Vào GA4, mục Admin, chọn BigQuery Links
Bước 2: Chọn một project trong Big Query (cần tạo trước đó)
Bước 3: Chọn vị trí lưu dữ liệu.
Bước 4: Chọn dữ liệu cần ghép và tần suất xuất dữ liệu, nếu muốn lưu trữ nguồn dữ liệu bao gồm ứng dụng di động, bạn có thể tích vào “Include advertising identifiers for mobile app streams”.
Bước 5: Sau khi kiểm tra các thiết lập trên đã chính xác, nhấn Submit để hoàn tất kết nối. Bạn sẽ nhận được kết quả như hình bên dưới.
Sau khi đọc bài viết, bạn đã có câu trả lời cho những câu hỏi của mình chưa? Dù GA4 và BigQuery còn mới mẻ với nhiều người, TenMax tin rằng những bài viết của chúng tôi về chủ đề này sẽ hữu ích với bạn, giúp bạn làm chủ được bộ công cụ này và ứng dụng nó vào những kế hoạch tiếp thị của mình. Hãy đón đọc những bài viết tiếp theo của TenMax để được cập nhật tin tức về những công nghệ mới trong ngành tiếp thị số nhé!