Le web scraping : utile pour l’eGov ?

Posté le 26/01/2021 par Vandy Berten
Le web scraping, parfois appelé web crawling ou web harvesting, reprend toutes les techniques d’extraction de contenu sur des sites web. Il a recours à différents outils : scripts, programmes, plugins… Le but ? Utiliser le contenu extrait dans un autre contexte.
Lire la suite sur le blog de Smals Research*

Differential Privacy

Posté le 12/01/2021 par Christophe Debruyne
Le Differential Privacy (DP) est une méthode qui consiste à injecter un bruit (notion mathématique) spécifique dans des données ou dans une réponse à une requête. Le but est d’empêcher que l’on puisse savoir si les données d’une personne spécifique sont présentes. Le DP permet ainsi de préserver la vie privée.

Malgré l’introduction du bruit, les propriétés statistiques des données d’origine sont, en gros, préservées. Bien que complexe, le DP peut être intéressant pour le partage de données statistiques ou même, pour la Business Intelligence (BI). Cet article explique le concept de DP. Il cite un certain nombre d’applications. Il est illustré par un exemple qui utilise un outil injectant le DP dans des requêtes SQL.
Lire la suite (en néerlandais) sur le blog de Smals Research*

Data Quality : “Anomalies & Transactions Management System”; prototype & work in progress

Posté le 08/12/2020 par Isabelle Boydens
En 2019, Smals Research annonçait le lancement d’un proof of concept relatif à la mise en place d’un service générique d’ATMS (Anomalies & Transactions Management System). Les auteurs du présent article rappellent les principales motivations en termes de qualité des données et de retour sur investissement.

Ils précisent les spécifications fonctionnelles. Ils illustrent leurs propos sur la base de use cases. Ils évoquent également les avancées sur le plan technique, de même que les perspectives de développement ultérieur.

Cet article est une contribution collective d’Isabelle Boydens (Data Quality Expert chez Smals Research), de Gani Hamiti (Data Quality Analyst chez Smals, Databases Team) et de Rudy Van Eeckhout (Databases R&D chez Smals, Databases Team).
Lire la suite sur le blog de Smals Research*

Lire d’autres articles sur le blog de Smals Research

* Ces articles sont des contributions personnelles de leurs auteurs. Ils ont été écrits en leur nom propre et ne prennent pas position au nom de Smals.

Plus d’infos sur l’équipe Smals Research


Les commentaries sont fermés.