De leden van het Smals Research-team

Smals Research deelt de resultaten van haar studies onder andere via artikelen op haar blog. Hier volgt een overzicht van de laatste publicaties. Wij stellen ze je voor in de taal van hun auteurs.

Dédoublonnage et couplage : comment ça marche ?

Gepost op  door Vandy Berten

Hoe gegevens linken met gegevens uit andere bronnen? Hoe dubbels detecteren in lijsten en databanken? In dit artikel beschrijft Vandy heel duidelijk hoe deze vragen kunnen worden aangepakt, zodat de gegevens vervolgens kunnen worden geanalyseerd.

Het artikel lezen

Web3 in Wonderland

Gepost op  door Kristof Verslype

In dit artikel bespreekt Kristof de belangrijkste kenmerken van het Web3. Hij kijkt kritisch naar deze nieuwe opkomende hype.

Het artikel lezen

De vier gezichten van EDA

Gepost op  door Koen Vanderkimpen

Event Driven Architecture (EDA) is niet meer weg te schrijven uit moderne software-architectuur. Maar wanneer ben je nu effectief EDA aan het gebruiken? In deze blog laten we ons licht schijnen op de 4 belangrijkste vormen van EDA.

Het artikel lezen

ChatGPT: een eerste indruk vanuit de publieke sector

Gepost op  door Joachim Ganseman

De stroom van indrukwekkende voorbeelden en creatieve toepassingen van ChatGPT (conversationele agent met behulp van Artificiële Intelligentie) die ons passeert op sociale media is haast eindeloos. Wat betekent dit nu voor de publieke sector? Waar kunnen we impact verwachten?

Het artikel lezen

Opportuniteiten voor het verbeteren van de klantenondersteuning

Gepost op  door Bert Vanhalst

Overal staan contactcenters onder druk om vragen van klanten, burgers en ondernemingen zo efficiënt mogelijk af te handelen. Wachttijden kunnen soms hoog oplopen. In dit artikel beschrijft Bert een aantal opportuniteiten om de werking van contactcenters efficiënter te laten verlopen.

Het artikel lezen

Typologie des anomalies, un cadre pour l’action : le cas du machine learning

Gepost op 18/10/2022 door Isabelle Boydens en Gani Hamiti

Ook gepost door ITdaily op 22/12/2022

“If your data is bad, your machine learning tools are useless” (Thomas C. Redman).

Het belang van een goede data quality mag ook in de context van machine learning dus zeker niet onderschat worden! De methoden en technieken die we vanuit Smals Research ingevoerd hebben om anomalieën te detecteren en de gegevenskwaliteit van databases te verhogen, zijn even goed toepasbaar op de gegevens waarmee we modellen voor machine learning trainen en testen.

Het artikel lezen

De weg richting kwantumresistente standaarden

Gepost op  door Kristof Verslype

Ook gepost door ITdaily op 03/01/2023

Zoals reeds uitgebreid toegelicht in eerdere blogposts, zouden krachtige kwantumcomputers ergens in de toekomst in staat zijn moderne publieke sleutelcryptografie te breken. Het NIST (National Institute for Standards & Technologies) heeft daarom in 2016 een standaardisatieprocedure opgestart. In juli 2022 kondigde dat NIST aan dat het de eerste vier algoritmes geselecteerd heeft: één voor key encapsulation mechanisms (KEM) en drie voor digitale handtekeningen. Wat betekent dit in de praktijk?

Het artikel lezen

Benaderingen voor het bouwen van conversationele toepassingen – custom assistant

Gepost op  door Bert Vanhalst

In een vorige blogpost hebben we de stopzetting besproken van Google Conversational Actions en wat dat precies inhoudt. We gaven drie alternatieven mee om een conversationele toepassing te voorzien. In deze blogpost gaan we dieper in op het derde alternatief, dat van de “custom assistant”.

Het artikel lezen

Benaderingen voor het bouwen van conversationele toepassingen

Gepost op 13/09/2022 door Bert Vanhalst

Het is al een hele tijd mogelijk om te spreken tegen je computer, smartphone of smart speaker. Virtuele assistenten als Alexa, Google Assistant en Siri bieden de mogelijkheid om laagdrempelig – handenvrij of met één druk op de knop – vragen te stellen. Hoewel spraak de meest natuurlijk interface lijkt, zien we dat het grote publiek (nog?) niet massaal gebruik maakt van deze interactievorm. In deze blog bespreken we welke opties er vandaag de dag zijn om een spraakinterface te voorzien.

Het artikel lezen

Améliorer le Machine Learning avec des données graphes

Gepost op 06/09/2022 door Vandy Berten

In zijn artikel legt Vandy kort en didactisch uit hoe de traditionele machine learning werkt en hoe graph analytics nieuw perspectief kan bieden.  Daarbij gaat Vandy in op een aantal technieken die toelaten om de resultaten van graph analytics te integreren in de gebruikte data (features) voor het bouwen van de machine learning modellen.

Het artikel lezen

Ecosysteem Architectuur: een Voorbeeld in de Sociale Sector

Gepost op 19/07/2022 door Koen Vanderkimpen

In een vorige blog bespraken we hoe een aantal principes rond APIs en Event Driven Architecture de architectuur van een applicatie-ecosysteem konden sturen. Het wordt nu tijd om deze zaken in een voorbeeld te gieten om alles iets duidelijker te maken (deze blog wordt best gelezen met de vorige blog vers in het geheugen). Vandaag zullen we het hebben over een fictieve “arbeidsmotor bij de sociale zekerheid”, binnen een ecosysteem rond werken, loon, prestaties, arbeidsrelaties, enz.

Het artikel lezen

Introduction aux systèmes de recommandation

Gepost op 28/06/2022 door Katy Fokou

Recommended for you…“, “Customers who bought this item also bought…“, “You may also like…

Nous retrouvons fréquemment ces messages lors de nos achats en ligne, quand nous consultons un article sur un site internet, quand nous écoutons de la musique ou que nous regardons un film sur des plateformes de streaming. Les systèmes de recommandation font partie de notre quotidien mais leur utilisation ne se limite pas nécessairement au commerce en ligne.

Het artikel lezen

Honey, I scraped the kids – over taalmodellen en privacy

Gepost op 17/06/2022 door Joachim Ganseman

Taalmodellen, die gebruikt worden voor applicaties zoals automatische vertaling, chatbots, en het genereren van teksten, worden steeds groter. […] Enorme taalmodellen moeten worden getraind met enorme datasets. […] Veel van die datasets zijn met eenvoudige webscraping scripts verzameld. Of dat allemaal wel mag volgens copyright- en privacywetgevingen allerhande, is een ingewikkelde vraag met een nog ingewikkelder antwoord.

Het artikel lezen

Bedreigen kwantumcomputers moderne cryptografie?

Gepost op 10/05/2022 door Kristof Verslype

Het artikel van Kristof is gepubliceerd op 20/10/2022 door ITdaily

Hoe hard moeten we ons zorgen maken dat kwantumcomputers de moderne cryptografie zullen ondergraven? Als we bepaalde schreeuwerige persberichten die een crypto-apocalypse prediken, mogen geloven, is het hoogtijd voor bestiale paniek. […]

In 2020 schreef ik uitgebreid over de kwantumcomputers ([1], [2]) en de dreiging die ervan uitgaat op de moderne cryptografie ([3], [4]). Ondertussen is het tijd voor een korte update op dat vlak. De stellingen van toen blijven onverkort geldig, maar kunnen nu wel concreter gemaakt worden.

Het artikel lezen

Natural Language Processing – Calcul de similarité entre deux textes

Gepost op 21/04/2022 door Katy Fokou

Une grande quantité de documents est traitée tous les jours dans les administrations. […] L’un des besoins exprimés par les clients est de disposer d’un système de filtrage de documents dans le cadre de l’analyse de dossiers. L’implémentation d’un système de filtrage s’appuie, entre autres, sur la recherche sur le contenu (information non-structurée).

Typiquement, la recherche se fait à partir d’une requête introduite par un utilisateur sur des contenus indexés. Un cas particulier de la recherche sur le contenu est de retrouver des documents dont le contenu est similaire. Ceci permet de retrouver et de consulter les traitements de dossiers portant sur des sujets similaires.

C’est ce dernier scénario que nous allons aborder ci-dessous en présentant une expérience que nous avons réalisée sur le calcul de similarité entre deux textes.

Het artikel lezen

Autocorrélation spatiale : qui se rassemble se ressemble ?

Gepost op 12/04/2022 door Vandy Berten

Lorsque l’on s’intéresse à la situation socio-économique d’un pays, on est souvent amené à comparer des indicateurs pour savoir s’ils sont corrélés. Existe-t-il, par exemple, une corrélation entre le niveau d’éducation et le revenu ?

Il peut également être révélateur d’évaluer à quel point un indicateur d’un territoire (une commune, un quartier…) est corrélé à la valeur de ce même indicateur dans les territoires voisins. C’est ce qu’on appelle l’autocorrélation spatiale : sachant qu’une commune a un salaire moyen élevé, à quel point ses communes voisines ont-elles une chance d’avoir également un salaire élevé ?

Dans cet article, accompagné d’un notebook Python, nous allons montrer plusieurs méthodes permettant d’évaluer cette dépendance spatiale. Pour ce faire, nous allons récolter une série d’indicateurs à propos des 581 communes de Belgique, disponibles en open source sur https://statbel.fgov.behttps://data.belgium.be ou encore https://www.census2011.be.

Het artikel lezen

Data scrambling: synthetische data in de praktijk

Gepost op 23/03/2022 door Joachim Ganseman

In dit artikel kijken we naar de praktische bekommernissen als we tools voor synthetische data inzetten: wat komt een data professional die hiermee aan de slag moet zoal tegen?

Het artikel lezen

Ecosysteem Architectuur

Gepost op 28/02/2022 door Koen Vanderkimpen

Bij het software bouwen, maken we meestal geen op zichzelf staande programma’s meer. We bouwen vandaag eerder Applicatie Ecosystemen. Wanneer we dus een stuk software schrijven, mogen we niet zomaar de ontwikkeling lokaal optimaliseren, maar moeten we ook continu rekening houden met het grotere geheel. In deze blog maken we een verkenning van een aantal zaken waar we rekening mee moeten houden bij het bouwen van een ecosysteem, en van concrete principes die we kunnen toepassen bij het uitbouwen van een erbij passende modulaire architectuur.

Het artikel lezen

Uitdagingen bij gedecentralizeerde digitale portefeuilles

Gepost op 26/01/2022 door Kristof Verslype

Het artikel van Kristof is gepubliceerd op 15/04/2022 door ITdaily

In oktober 2021 kondigde de Staatssecretaris voor Digitalisering Mathieu Michel (MR) aan dat hij voor elke Belg tegen 2023 een digitale portefeuille wil, wat voortvloeit uit een Europese regulering. […] Europa doet echter geen uitspraak over de onderliggende technologie. Dit kunnen de individuele lidstaten zelf bepalen. Er zijn inderdaad verschillende – al dan niet hybride – mogelijkheden, waaronder benaderingen gebaseerd op blockchain technologie. Dit artikel wil een bijdrage leveren aan het debat door een aantal uitdagingen te formuleren, die vooral voor de – nieuwere, nog relatief ongekende – gedecentraliseerde blockchain systemen pertinent zijn.

Het artikel lezen

Identiteitsverificatie op afstand

Gepost op  door Bert Vanhalst

Het artikel van Bert is gepubliceerd op 28/04/2022 door ITdaily

[…] In bepaalde situaties is het niet mogelijk of wenselijk voor iemand om zich fysiek te presenteren voor een identiteitsverificatie. De vraag is dan of die procedure ook van op afstand kan uitgevoerd worden, op een betrouwbare manier. Men spreekt dan over remote identity proofing of remote identity verification. Hoe gaat het in zijn werk?

Het artikel lezen

Governance volgens Mattheus

Gepost op  door Joachim Ganseman

Het artikel van Joachim is gepubliceerd op 12/05/2022 door ITdaily

Automatisering, zelfs digitalisering, is niet zomaar vrijblijvend, en al zeker niet bij overheden. Governance, vrij vertaald als deugdelijk bestuur, is een vaag begrip, maar het belang ervan illustreren we in dit artikel aan de hand van enkele voorbeelden.

Het artikel lezen

Data Quality Tools : retours d’expérience et nouveautés

Gepost op  door Isabelle Boydens, Isabelle Corbesier en Gani Hamiti

[…] Depuis plus de 10 ans, Smals a acquis un “Data Quality Tool” professionnel, toujours parmi les leaders du marché à l’heure actuelle, dans le cadre de son Data Quality Competency Center. Depuis lors, plus de trente projets d’envergure ont mobilisé cet outil dans le cadre de la sécurité sociale belge et en dehors de celle-ci.Nous proposons ici, sur la base de l’expérience acquise  : 

  • de rappeler et d’illustrer les fonctionnalités les plus usitées de l’outil, ainsi que quelques bonnes pratiques;
  • d’annoncer plusieurs nouveautés qui sont autant d’extensions de l’outil dans le courant de l’année 2021.

Het artikel lezen

Lees ook het wetenschappelijke artikel dat in Parijs is gepubliceerd door de Courrier des Statistiques (Parijs, INSEE, juli 2021): “Un service au cœur de la qualité des bases de données. Présentation d’un prototype d’ATMS*”, Isabelle Boydens, Professor, Université libre de Bruxelles en Data Quality Expert, Smals, Gani Hamiti, Data Quality Analyst, en Rudy Van Eeckhout, Database R&D, Smals.

* ATMS : Anomalies & Transactions Management System

Voorbij aan REST: Event-Driven APIs

Gepost op  door Koen Vanderkimpen

We hadden het op de Smals Research blog reeds uitvoerig over het gebruik van APIs als bouwsteen voor herbruikbare softwareRESTful APIs hebben uiteraard heel wat voordelen, maar toch moeten we opletten dat we ze niet altijd en overal gaan inzetten. Er zijn namelijk ook nadelen verbonden aan deze manier van werken. Met deze blog willen we er op wijzen dat asynchrone, Event-Driven communicatie tussen de systemen soms een veel beter resultaat oplevert, dan het zuivere gebruik van RESTful APIs.

Het artikel lezen

IA: L’éthique en pratique

Gepost op  door Katy Fokou

Dans un blog précédent, nous avons démontré l’importance d’adopter les principes d’éthique by design dans les projets d’intelligence artificielle dans le secteur public. […] Le but de ce blog n’est pas de fournir une description complète des méthodologies et technologies à adopter pour une IA éthique mais plutôt de décrire quelques bonnes pratiques et outils qui permettent d’intégrer l’éthique dans un projet d’IA.

Het artikel lezen

Privacybevorderende technologieën voor de publieke sector

Gepost op  door Kristof Verslype

Het wordt steeds makkelijker om grote hoeveelheden persoonsgegevens te verzamelen en te verwerken. Dit creëert enerzijds heel wat opportuniteiten, zoals het doen van statistische analyses ter verbetering van de gezondheidszorg. Tegelijkertijd moet echter rekening gehouden worden met de privacy van de burger, wat een juridische basis vindt in de GDPR. Met traditionele aanpakken en technologieën kan het omslachtig tot zelfs onmogelijk zijn om functionele noden en privacyvereisten met elkaar in balans te brengen. De behoefte naar meer geavanceerde technologieën groeit dan ook. Privacybevorderende technologieën, of privacy-enhancing technologies (PETs), kunnen hier een uitweg bieden en laten met behulp van cryptografie en/of statistiek zaken toe die zelfs intuïtief onmogelijk kunnen lijken.

Het artikel lezen

Peut-on toujours atteindre une maternité en 30 minutes ? (partie 2)

Gepost op  door Vandy Berten

Dans notre article précédent, nous avons montré comment il était possible de calculer la zone accessible dans un délai donné à partir d’un ensemble de points de départ (ou d’arrivée), comme une maternité, un départ SMUR ou un centre de vaccination Covid. […] Dans cet article, nous présenterons deux types de graphiques permettant de comparer objectivement deux scénarios (sous les hypothèses simplificatrices présentées dans notre article précédent). Le premier s’intéressera à la couverture territoriale, le second à la couverture populationnelle.

Het artikel lezen

Reactive: het Akka framework

Gepost op  door Koen Vanderkimpen

In een vorige blog gaven we reeds een uitvoerige inleiding van het “Reactive” paradigma. Vermits dit toch wel een belangrijke en invloedrijke zaak geworden is binnen de developer wereld, lijkt het ons nuttig om hier op terug te komen en wat dieper in te gaan op een voorbeeld van een Reactive framework: het Akka framework, één van de pioniers binnen de Reactive beweging.

Het artikel lezen

Smals KG Checklist: déterminer si un graphe de connaissances peut résoudre un problème concret

Gepost op  door Christophe Debruyne

Cette contribution se situe dans une série d’articles sur les graphes de connaissances (les « knowledge graphs » en anglais). Nous vous présentons le Smals KG Checklist, un outil qui vous aide à déterminer si un graphe de connaissances serait utile, voire indispensable, pour résoudre un problème dans votre organisation. Le Smals KG Checklist a été présenté au sein du SEMANTiCS 2021, un congrès scientifique et industriel autour des graphes de connaissances.

Het artikel lezen

Peut-on toujours atteindre une maternité en 30 minutes ?

Gepost op door Vandy Berten

Peut-on, de partout en Belgique, atteindre une maternité en moins de 30 minutes en voiture ? Si certaines maternités fermaient, quel en serait l’impact ? Le gouvernement Bruxellois a décidé de ne pas ouvrir de centre de vaccination Covid dans le sud-est de Bruxelles (Watermael-Boitsfort et Auderghem) : quel est l’impact en termes d’accessibilité ? C’est le type de question auxquelles nous allons tenter de répondre dans ce blog (et le suivant).

Het artikel lezen

De AI als auteur: een blik op Natural Language Generation

Gepost op  door Joachim Ganseman

Dit artikel is gepubliceerd op ITdaily op 26/10/2021

In deze blogpost kijken we naar twee categorieën van NLG systemen. De eerste moet het hebben van templates en grammaticale regels, en geeft een strikt deterministische output. De tweede is gebaseerd op machine learning met een scheut randomness, en benadert zo meer wat we “creatief schrijven” zouden kunnen noemen.

Het artikel lezen

Webinar by Smals Research: Natural Language Generation (october 28, 2021)

Secure multiparty computation – Collectieve berekeningen op verspreide gevoelige gegevens

Gepost op 08/06/2021 door Kristof Verslype
Kristof Verslype heeft dit jaar de “privacy enhancing technologies” grondig onderzocht. In het kader van die studie heeft Kristof een nieuw artikel gepubliceerd over Secure multiparty computation (SMC).

SMC maakt het mogelijk om berekeningen op een gedistribueerde manier te laten uitvoeren, dus zonder een centrale partij, en zonder dat de betrokken partijen inzage krijgen in gebruikte gegevens. SMC was lang een puur academische aangelegenheid, maar dat is de laatste jaren geëvolueerd.

In zijn artikel gaat Kristof kort in op een aantal cases waar SMC vandaag gebruikt wordt in de praktijk en licht hij een tipje van de sluier op van wat SMC in een overheidscontext zou kunnen betekenen.

Ook de onderzoeksgroep COSIC van KU Leuven (Computer Security and Industrial Cryptography) is actief bezig met SMC.
Lees het vervolg op de blog van Smals Research*

Naar een meer ethische kunstmatige intelligentie

Gepost op 31/05/2021 door Katy Fokou op de Smals Research-blog in het Frans
Gepubliceerd op 16/06/2021 op ITdaily in het Nederlands: Technologie en ethiek: kunnen we AI vandaag vertrouwen?
In dit nieuwe artikel gaat Katy dieper in op het risico van vooroordelen die mogelijk aanwezig zijn in tal van AI-modellen. Ethische vooroordelen in AI-algoritmen kunnen aanleiding geven tot verkeerde beslissingen of het onbewust discrimineren van bepaalde categorieën van mensen.

De Europese Unie heeft een kader uitgewerkt voor een “ethische AI”, en de Europese Commissie heeft in april een voorstel gepubliceerd voor een op risico’s gebaseerd rechtskader over AI. Katy licht beide initiatieven kort toe. Verder gaat ze op zoek naar de origine van de vooroordelen in de AI-algoritmes en hoe die kunnen voorkomen worden.

Kortom, er is een “ethiek by design” nodig, als we willen dat AI vandaag en in de toekomst daadwerkelijk ingezet én vertrouwd kan worden.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Virtual Knowledge Graphs

Gepost op 11/05/2021 door Christophe Debruyne
In het kader van zijn studie over ‘Knowledge Graphs’ heeft Christophe Debruyne verder onderzoek verricht naar het concept van de ‘Virtual Knowledge Graph’. Virtual Knowledge Graphs laten toe om op een haast transparante manier de gegevens in een relationele database als een graph te benaderen.

Christophe gaat concreet na aan welke beperkingen Virtual Knowledge Graphs onderhevig zijn en hoe het zit met de performantie. Hij vergelijkt twee producten (Ontop en Stardog) met een traditionele Knowledge Graph benadering.

Deze technologie is in volle evolutie maar biedt vandaag reeds mogelijkheden om bestaande databanken samen met andere bronnen te integreren in een Knowledge Graph.
Lees het artikel op de blog van Smals Research*

Spatial join, de sleutel tot geografische analyse

Gepost op 27/04/2021 door Vandy Berten
De meeste van onze klanten beschikken over geografische informatie: adressen van burgers, instellingen, bouwwerven, enz. Deze info wordt niet altijd maximaal benut.

Er zit er echter een enorm potentieel in, voor tal van sectoren: fraudebestrijding, optimalisatie toewijzing van inspecteurs, plaatsing van entiteiten zoals ziekenhuizen, impactanalyse in geval van sluiting / verplaatsing van diensten, gegevenskwaliteit, visualisatie, statistieken…

Een sleutelelement vanuit analytics oogpunt om met deze geografische gegevens te kunnen werken, is de “spatial join“.

In zijn artikel legt Vandy de werking van de spatial join uit en past hij deze techniek toe. Hij toont aan dat klassieke analysetechnieken te kort schieten als men geografische gegevens wil exploiteren. Hij bespreekt de voordelen van de spatial join bij het verrijken van een gegevensverzameling, maar ook bij het aan het licht brengen van fouten of onnauwkeurigheden.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Eventual Consistency – Een nog te weinig ontgonnen principe

Gepost op 12/04/2021 door Koen Vanderkimpen

‘Eventual Consistency’ kan een belangrijke rol spelen om de beschikbaarheid van toepassingen en systemen te verhogen. Het is vooral bekend door het gebruik in NOSql-databases, die kunnen blijven werken, zelfs al faalt het netwerk. Toch is het principe van Eventual Consistency nog niet voldoende ontgonnen.

Koen Vanderkimpen bespreekt in zijn blogartikel wat Eventual Consistency precies inhoudt, en wanneer dat principe nuttig wordt gebruikt. Daarnaast worden enkele voorbeelden uit drie verschillende sectoren aangehaald, en wordt beargumenteerd waarom het ook in overheidstoepassingen nuttig kan zijn.
Lees het volledige artikel op de blog van Smals Research*

Natural Language Processing in het Nederlands

Gepost op 31/03/2021 door Joachim Ganseman op de blog van Smals Research
Gepubliceerd op 22/06/2021 op ITdaily : NLP en Nederlands: waarom wereldtalen een streepje voor hebben
In dit blogartikel haalt Joachim een belangrijke problematiek aan in het Natural Language Processing-gebeuren in het Nederlands. Een problematiek waarmee wij – helaas – onvermijdelijk geconfronteerd worden in onze AI-projecten.

De spectaculaire vooruitgang in het Engels vinden we niet terug bij “kleine” talen zoals het Nederlands. Gelukkig zijn er omwegen om een en ander te verbeteren, en mogen we in de nabije toekomst structurele verbetering verwachten in het goed herkennen van het Nederlands.
Lees het vervolg op de blog van Smals Research*

SHACL: Logische- en vormcontroles met kennisgraaftechnologieën

Gepost op 18/03/2021 door Christophe Debruyne
SHACL laat toe om data te controleren en te valideren los van de programmeercode of het onderliggende databanksysteem. Het is een recente evolutie binnen het domein van de knowledge graphs en er zijn al tools voor beschikbaar.

Christophe legt in deze blogpost uit wat SHACL juist is en geeft enkel voorbeelden die duidelijk maken hoe je met SHACL data kan valideren. Hij bespreekt ook de mogelijkheden om deze technologie verder in te zetten, zoals bij gegevensbeheer en datakwaliteit.
Lees het vervolg op de blog van Smals Research*

Artificiële intelligentie in de publieke sector

Gepost op 25/02/2021 door Katy Fokou op de Smals Research-blog in het Frans
De laatste jaren is artificiële intelligentie (AI) een enorme rage geworden. Ondanks de onmiskenbare voordelen voor het functioneren van de overheidsdiensten en voor de burgers, is het echter beter ingeburgerd in de privésector dan in de publieke sector.
Gepubliceerd op 30/03/2021 op de ITdaily-website in het Nederlands: Is artificiële intelligentie de toekomst voor onze overheidssector?

In haar artikel legt Katy Fokou het belang van AI voor de publieke sector uit. Zij bespreekt mogelijke toepassingen en wijst op aandachtspunten.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Web scraping: nuttig voor eGov?

Gepost op 26/01/2021 door Vandy Berten
Web scraping, ook wel web crawling of web harvesting genoemd, herneemt alle technieken om inhoud van websites te extraheren. Hierbij worden verschillende tools aangewend: scripts, programma’s, plugins… Het doel? De geëxtraheerde inhoud in een andere context gebruiken.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Differential Privacy

Gepost op 12/01/2021 door Christophe Debruyne
Differential Privacy (DP) is een methode die erin bestaat specifieke ruis
(een wiskundig begrip) in gegevens of in een antwoord op een vraag te injecteren. De bedoeling is om te voorkomen dat men kan achterhalen of de gegevens van een bepaalde persoon aanwezig zijn. Zo kan de privacy gewaarborgd worden.

Ondanks de invoer van ruis blijven de statistische eigenschappen van de oorspronkelijke gegevens over het algemeen behouden. Hoewel DP complex is, kan het interessant zijn om statistische gegevens te delen of zelfs voor Business Intelligence (BI). Dit artikel beschrijft het begrip DP en stelt een aantal toepassingen voor. Het wordt geïllustreerd met een voorbeeld waarin een tool DP in SQL-queries injecteert.
Lees het vervolg op de blog van Smals Research*

Data Quality: “Anomalies & Transactions Management System”; prototype & work in progress

Gepost op 08/12/2020 door Isabelle Boydens
In 2019 kondigde Smals Research de lancering van een proof of concept aan voor de implementatie van een generieke ATMS-dienst (Anomalies & Transactions Management System). De auteurs van dit artikel herinneren aan de belangrijkste motivaties inzake data quality en return on investment.

Ze specificeren de functionele specificaties en illustreren hun uiteenzetting op basis van use cases. Ze bespreken eveneens de technische vooruitgang en de vooruitzichten voor verdere ontwikkeling.

Dit artikel is een gezamenlijke bijdrage van Isabelle Boydens (Data Quality Expert bij Smals Research), Gani Hamiti (Data Quality Analyst bij Smals, Databases Team) en Rudy Van Eeckhout (Databases R&D bij Smals, Databases Team).
Lees het vervolg (in het Frans) op de blog van Smals Research*

Lees nieuwe artikelen op de blog van Smals Research

* Deze artikelen zijn persoonlijke bijdragen van hun auteurs. Zij werden in eigen naam geschreven en nemen geen standpunt in namens Smals.

Meer info over het Smals Research-team


Comments are closed.