Home » AI » Les nouvelles fonctionnalités d’AI et ML de BigQuery

Les nouvelles fonctionnalités d’AI et ML de BigQuery

BigQuery fait un saut quantique vers l’avenir avec ses nouvelles capacités en matière d’IA et de ML. La sortie de modèles tels que TimesFM et l’intégration de modèles open source transforment la manière dont nous abordons l’analyse des données. Plutôt que de patauger dans un océan de chiffres, vous pourrez littéralement prévoir l’avenir et générer des insights d’une simplicité déconcertante. Quels avantages en tirerez-vous ? C’est ce que nous allons explorer ensemble.

Modèle de prévision TimesFM

Ah, le modèle de prévision TimesFM ! Un bijou de sophistication technologique caché dans les recoins du BigQuery. D’abord, imaginez un oracle moderne, mais au lieu de s’adonner à la divination avec des feuilles de thé, ce modèle ingère des données. Le TimesFM, c’est un peu comme un cuisinier étoilé qui, malgré les meilleurs ingrédients, ne pourra jamais faire grand-chose si vous oubliez de lui donner la bonne recette. Bon, commençons par le commencement.

TimesFM, ou Time Series Forecasting Model, est un modèle prédictif spécialisé dans l’analyse des séries chronologiques. Vous savez, ces chronologies horriblement ennuyeuses que même un historien aurait du mal à lire, mais qui, quand c’est bien utilisé, peuvent prédire des sales coups avant qu’ils n’arrivent. En gros, il se base sur des données historiques pour repérer des tendances et des motifs, et tout cela avec une précision qui ferait rougir les astrologues.

Pour faire fonctionner ce modèle, il vous suffit de lui donner les bonnes données. Pas n’importe quelles données, je vous l’assure : des séries temporelles bien rangées, souvent avec un indice temporel impeccable. Tout cela peut paraître un peu trop simple, et c’est bien là tout le génie de l’affaire. Les avantages ? Parlons-en ! D’abord, vous pouvez prévoir les ventes, la fréquentation d’un site ou même le nombre d’absences dans une entreprise (on saurait enfin pourquoi le cousin Gérard a toujours une excuse à la mode).

Ensuite, et c’est fascinant, ce modèle peut être intégré directement dans BigQuery. Pas besoin de jongler avec des outils compliqués qui ressemblent à un logiciel de montage vidéo des années 90. BigQuery vous permet de tapisser tout ça avec du SQL presque comme si les chaînes de caractères étaient vos amis d’enfance. Voici un exemple SQL pour vous mettre dans le bain :

CREATE OR REPLACE MODEL my_dataset.timesfm_model
OPTIONS(model_type='timeseries',
        time_series_timestamp_col='timestamp_column',
        time_series_data_col='data_column',
        time_series_id_col='id_column') AS
SELECT timestamp_column, data_column, id_column
FROM my_dataset.my_table;

Si avec cela, vous ne réussissez pas à prévoir quelque chose, appelez-moi pour que je vous fasse la lecture de l’avenir dans un café. Ainsi, armez-vous de cette potentielle boule de cristal digitale qu’est le modèle TimesFM, et partez à l’aventure du monde fascinant de la prévision. Rendez-vous dans le futur, où vous en saurez plus que quiconque sur les tendances à venir. Juste un petit conseil, ne parlez pas trop de vos succès : ça pourrait énervé Gérard.

Découvrez-en plus sur l’utilisation de BigQuery avec l’IA ici.

Extraction et génération de données structurées avec les LLM

Ah, BigQuery et son petit bijou, l’AI.GENERATE_TABLE. On dirait presque le titre d’un film de science-fiction : « L’Extraction des Données », avec des effets spéciaux à couper le souffle. Sauf qu’ici, au lieu de lasers et de vaisseaux spatiaux, on parle d’extraction ou de génération de données structurées à partir de données non structurées, un peu comme faire de la limonade avec des citrons pourris. Cela semble absurde et pourtant, la magie opère.

Voici le principe : on a ce vaste océan de données non structurées, ces documents, ces articles de blog où l’on raconte la dernière mésaventure du chat du voisin. Et l’on se dit : « Tiens, pourquoi pas en extraire des données utiles ? » C’est là qu’intervient notre ami l’AI.GENERATE_TABLE, tel un super-héros masqué prêt à dégainer sa cape d’intelligence artificielle bien taillée.

Imaginons un exemple. Vous avez sous la main un tas de critiques de restaurants dans un format peu avenant. Avec AI.GENERATE_TABLE, vous pouvez balayer tout ça en SQL. Cela pourrait ressembler à ceci :


SELECT * 
FROM AI.GENERATE_TABLE(
    'restaurant_reviews',
    STRUCT(
        'name' AS restaurant_name,
        'rating' AS star_rating,
        'comment' AS review_text
    )
)

Dans cet exemple, voilà comment on transforme un bazar incompréhensible en une liste bien rangée de restaurants, charismatique et prête à être découpée en tranches pour une savoureuse analyse. On dirait presque un conte de fées data-driven, avec des princesses évanouies qui se réveillent sous le baiser de la magie de l’IA.

Mais ce n’est pas tout. En jouant avec AI.GENERATE_TABLE, vous avez aussi la possibilité de créer des données de toutes pièces, comme un chef pâtissier aléatoire qui laisserait libre cours à son imagination pour concocter le dessert parfait. Imaginez générer des résultats qui n’ont aucune source connue ! Certes, il ne faut pas obliger le bon sens à prendre des vacances, mais on vit dans un monde depuis peu en proie à l’absurde.

Retrouver ces données dans l’univers fantastique du BigQuery, c’est un peu comme chercher une aiguille dans une botte de foin, sauf que l’on a le droit d’utiliser un aimant géant, grâce à la magie de l’IA. Pour pousser l’absurde encore plus loin, vous pouvez découvrir d’autres astuces en suivant ce lien, qui pourrait bien rendre votre exploration encore plus croustillante.

Fonctions LLM pour le traitement ligne par ligne

Imaginez une machine qui analyse vos données avec l’aisance d’un sommelier choisissant un vin : précise, sans pression, et surtout, elle ne se plaint jamais d’une mauvaise année. Voilà ce que les nouvelles fonctions LLM (Large Language Model) de BigQuery nous promettent ! Mais qu’est-ce que cela signifie, à part la certitude que votre chat se fera encore ignorer par d’éventuels développeurs à la recherche de réponses sur Stack Overflow ?

Ces fonctions LLM sont comme un œil de faucon sur vos données : elles regardent, scrutent et relèvent les détails les plus subtils, ligne par ligne. Vous pourriez vous dire que c’est du chinois, mais rassurez-vous, même la plus rurale des campagnes peut s’y retrouver. En gros, BigQuery vous permet d’utiliser des modèles de traitement du langage naturel pour en tirer des insights, même si la seule chose que vous savez écrire est un SMS à votre cousin sur ce fameux barbecue raté.

Utiliser ces fonctions dans vos clauses SQL, c’est un peu comme avoir un génie à portée de main, sans les problèmes de poteau sur le chemin des souhaits. Prenons un exemple simple :


SELECT
  text,
  ai_model.sentiment_analysis(text) AS sentiment
FROM
  dataset.table
WHERE
  LENGTH(text) > 0;

Dans ce cas, vous demandez à BigQuery de faire une analyse de sentiment sur le texte de votre dataset. Qui aurait pensé que derrière ces lignes se cachait la possibilité de savoir si les avis clients sont aussi déprimants qu’un lundi matin ? Oui, avec les LLM, vous pouvez transformer des lignes de texte sans goût en données exploitables. Le tout, avec ce soupçon d’humour que seul un analyste de données peut apprécier, juste avant la première tasse de café bien serré.

Une autre fonctionnalité intéressante serait l’extraction d’entités, parce que pourquoi se contenter d’une seule information quand on peut en avoir une collection ? Vous pourriez par exemple écrire :


SELECT
  text,
  ai_model.entity_extraction(text) AS entities
FROM
  dataset.table;

Ici, chaque mention dans votre texte devient une opportunité de découverte. C’est permettre à vos données de révéler leurs secrets les plus intimes, sans que cela ne dérape dans une série d’interrogatoires dignes des plus grands thrillers policiers.

Alors, prêt à laisser cette nouvelle technologie transformer vos requêtes ? Bienvenue dans le futur, où la magie des LLM et SQL se rencontre dans une danse palpitante — et qui sait, peut-être que cela incitera même votre chat à se comporter de manière un peu plus humaine. Pour plus d’excursion dans ce dédale d’analyses, vous pouvez explorer plus en avant ici.

Analyse de contribution : d’un coup d’œil sur les données

Ah, l’analyse de contribution dans BigQuery, le Saint Graal des analystes qui se sont un jour demandé d’où venaient tous ces chiffres. Imaginez un banquet où chaque plat représente une métrique commerciale, mais au lieu de gouter des mets exquis, vous devez comprendre pourquoi l’un est plus digeste que l’autre. C’est là que l’analyse de contribution vient jouer les chefs étoilés, en nous aidant à démêler le vrai du faux et à révéler les facteurs qui façonnent nos performances commerciales.

Cette technique n’est pas simplement un luxe, c’est un besoin absolu, un peu comme de l’air après avoir oublié de respirer pendant une réunion. Les entreprises peuvent ainsi déceler les facteurs affectant des métriques clés : un coup d’œil dans le rétroviseur pour voir d’où viennent les fluctuations, avec en prime un avertissement sur les routes boueuses à éviter à l’avenir.

Pour faire les choses en grand, voici comment nous pourrions réaliser une analyse de contribution avec un petit brin de SQL :

SELECT
  metrics,
  contribution,
  SUM(contribution) OVER (PARTITION BY metrics ORDER BY contribution DESC) AS cumulative_contribution
FROM
  `votre_projet.votre_dataset.votre_table`;

Dans cette requête, nous additionnons les contributions des différentes métriques en un rien de temps. Des détails précis, on vous dit ! Chaque ligne répond à la question existentielle : « Pourquoi mon chiffre d’affaires de ce mois-ci ressemble-t-il à un film d’horreur ? ». Avec ce type de requêtes, on ne cherche pas seulement à connaître les chiffres, mais on plonge dans les abysses pour en comprendre les raisons, comme un archéologue examinant de vieux ossements de dinosaures commerciaux.

En somme, l’analyse de contribution dans BigQuery transforme des données chaotiques en une symphonie harmonieuse de chiffres compréhensibles, permettant aux entreprises de naviguer sur les mers tumultueuses des tendances du marché sans se noyer dans le désespoir. Pour des exemples pratiques qui pourraient vous faire développer des absences de sommeil à force d’excitation, visitez également cet article fascinant. Qui sait, cela pourrait encore vous donner envie d’y plonger à cœur perdu ?

Conclusion

Les récentes innovations de BigQuery en matière d’IA et de ML ne sont pas de simples mises à jour : elles transforment la dynamique de l’analyse des données. De la prévision de données à l’extraction d’informations précises, chaque nouvelle fonction est un outil de plus dans l’arsenal des professionnels. En déployant ces outils, les entreprises pourront non seulement comprendre le présent, mais aussi anticiper l’avenir avec une précision inédite. Préparez-vous à explorer les possibilités infinies.

FAQ

Qu’est-ce que le modèle TimesFM dans BigQuery ?

Le modèle TimesFM est un modèle de prévision avancé qui offre des prévisions précises pour les séries temporelles, sans nécessiter de formation ou d’ajustement de vos données.

Comment fonctionne la fonction AI.GENERATE_TABLE ?

Cette fonction simplifie l’extraction de données structurées à partir de données non structurées en utilisant des modèles de langage, en définissant simplement un schéma de sortie.

Quelles sont les nouvelles fonctions LLM pour l’analyse de données ?

Les fonctions LLM ligne par ligne permettent une manipulation flexible des données, en pouvant être utilisées dans différentes clauses SQL pour une analyse plus précise.

Comment utiliser l’analyse de contribution pour des données commerciales ?

L’analyse de contribution automatise l’identification des facteurs clés qui influent sur des changements de métriques, simplifiant ainsi l’analyse manuelle complexe.

Quelles modèles open source sont pris en charge par BigQuery ?

En plus des modèles Gemini de Google, BigQuery permet l’inférence à partir de modèles open-source et tiers, offrant une flexibilité accrue pour l’analyse de données.

Sources

Google Cloud; What’s new with BigQuery AI and ML? https://cloud.google.com/blog/products/data-analytics/bigquery-adds-new-ai-capabilities

Retour en haut
Vizyz