A cloud full of data in the Arctic

#datapipeline: YouTube Analytics naar BigQuery met Airbyte

Je kunt niet simpelweg vertrouwen op YouTube zelf om maximale waarde voor je bedrijf te ontlenen. In feite heb je een combinatie van YouTube en Google’s BigQuery nodig, zodat je robuustere analytische inzichten kunt maken en op zijn beurt meer inkomsten en groei naar je YouTube-kanaal kunt genereren.

In deze gegevenspijplijn laten we zien hoe u Airbyte gemakkelijk kunt gebruiken om het werk te doen.

Waarom YouTube-gegevens centraliseren in een datawarehouse?

Laten we eens kijken naar enkele van de redenen waarom u uw YouTube-gegevens wilt centraliseren in een datawarehouse.

Out-of-the-box rapportage is niet voldoende

YouTube heeft enkele beperkingen op rapportage- en dashboardmogelijkheden, waardoor het inflexibel is om te gebruiken voor verschillende scenario’s.

Waarom Airbyte gebruiken om YouTube-gegevens te extraheren

Het schrijven van aangepaste ETL-scripts zal de snelheid van uw project vertragen. Als deze scripts niet goed geschreven zijn, bestaat het risico dat er constante zorg en tijd nodig is om deze scripts draaiende te houden.

Door een tool als Airbyte te selecteren, creëert u automatisering, waarmee u de complexe hardcoded scripts die omgaan met gegevensruzies en -planning kunt weggooien, zodat uw teams efficiënt kunnen werken. 

De Airbyte, connectoren zijn open-source en eenvoudig aan te passen, wat u het voordeel geeft om uw gegevens die zich in veel zakelijke apps en databases in uw datawarehouse bevinden, naadloos te integreren.

Met Airbyte bent u eigenaar van uw gegevens, geen tussenpersoonservice die uw gegevens doorlopen, in Airbyte worden uw gegevens ontdubbeld en kunnen ze on-the-fly worden getransformeerd op basis van aangepaste bedrijfslogicaregels met SQL.

Andere coole functies van Airbyte zijn dat Airbyte ingebouwde planning, orkestratie en monitoring heeft., u kunt met Airbyte scheduler gegevensreplicatie volledig of op een incrementele manier inschakelen.

Aan de slag met Airbyte

Je hebt het volgende nodig om aan de slag te gaan met het extraheren van je YouTube-gegevens naar je Google BigQuery.

  1. Volg de eenvoudige instructies in de documentatie hier om Airbyte te implementeren.
  2. Je hebt een YouTube-kanaalaccount nodig.
  3. U hebt ook een Google Cloud Platform-account nodig met de BigQuery-service ingeschakeld.
  4. YouTube API inschakelen in Google Cloud Platform

YouTube API inschakelen in Google Cloud Platform

Om de YouTube API’s te gebruiken die je moet inschakelen in je Google Cloud Platform Project, heb ik YouTube Reporting API ingeschakeld

Referenties maken voor OAuth-client-id

Om de referenties voor de YouTube API te verstrekken, moet u referenties maken, u moet dit doen omdat Airbyte-invoer voor YoutTube OAuth Client ID, OAuth Secret ID en Refresh Token vereist. hier zijn de stappen

Selecteer Webtoepassing als toepassingstype.

Om het Refresh Token te krijgen, gebruikt u de Google Developers OAuth Playground Tool 

Volg de instructies in het hulpprogramma en schakel de gewenste API in als bereik in uw Oauth. Klik vervolgens op API autoriseren en u krijgt dit scherm.

Selecteer het account dat je aan YouTube hebt gekoppeld. Voltooi alle authenticatiestappen en u bent terug op dit scherm.

De eerste keer dat u dit gebruikt, moet u op de knop Autorisatiecode voor tokens uitwisselen klikken. Wat we later in de Airbyte-opstelling willen gebruiken, is het Refresh-token. Eerst zullen we BigQuery opzetten.

Google BigQuery instellen

Maak een BigQuery-gegevensset en genereer een JSON-bestand met referenties dat nodig is om Airbyte te configureren. Log in op uw GCP-account en ga naar BigQuery.

Selecteer Een gegevensset maken en geef en voeg de vereiste informatie toe.

Ga vervolgens naar de pagina Serviceaccount en Maak een nieuw serviceaccount. Voer de vereiste gegevens in. Verleen het serviceaccount de rol BigQuery Data Owner.

Zodra het serviceaccount is gemaakt, gaat u naar Sleutels > Sleutel toevoegen en maakt u een nieuwe sleutel. U wordt gevraagd een referentiebestand te downloaden. Download de JSON-versie die later zal worden gebruikt.

YouTube instellen als uw Airbyte-bron

Stel de verbinding in voor de bron, dit zijn uw YouTube-gegevens die we in een vorige stap hebben gemaakt. Voer onder client_id onder client_secret invoeren en onder refresh_token het vernieuwingstoken in dat u aan het einde van stap 1 hebt verkregen.

BigQuery instellen als uw Airbyte-bestemming

Stel vervolgens Airbyte in om BigQuery te gebruiken als bestemming voor de gegevensreplicatie. Voer uw client-id en clientgeheim in die u hebt gemaakt bij het instellen van uw Oauth-client-id en nu is het tijd om het vernieuwingstoken te gebruiken dat u eerder hebt gemaakt.

Een Verbinding tussen YouTube en BigQuery maken

Eenmaal geconfigureerd een lijst met YouTube-streams waarvan een back-up van die gegevens kan worden gemaakt.

Blader door en selecteer de leadsstream die de voorbeeldgegevens bevat.  

Opmerking: U moet facturering hebben ingeschakeld in uw BigQuery-service om normalisatie zonder fouten te laten werken.

Eenmaal geconfigureerd, kunt u handmatig een synchronisatie activeren. Zodra dit is voltooid, wordt er een back-up van uw gegevens gemaakt in BigQuery.

Nu kunt u zien dat er veel tabellen zijn gemaakt in uw gegevensset, u kunt een voorbeeld van gegevens bekijken of SQL-query’s uitvoeren op uw YouTube-tabellen in BigQuery.

Conclusie

Nu u uw YouTube-gegevens hebt geëxtraheerd naar Google BigQuery, kunt u gebruikmaken van de rijke analytische mogelijkheden van BigQuery om meer inzichten uit deze gegevens te halen. U kunt uw BgQuery-tabellen ook koppelen aan Google Data Studio om rapporten voor uw doelgroep te maken.


by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *