De leden van het Smals Research-team

Smals Research deelt de resultaten van haar studies onder andere via artikelen op haar blog. Hier volgt een overzicht van de laatste publicaties. Wij stellen ze je voor in de taal van hun auteurs.

Autocorrélation spatiale : qui se rassemble se ressemble ?

Gepost op 12/04/2022 door Vandy Berten

Lorsque l’on s’intéresse à la situation socio-économique d’un pays, on est souvent amené à comparer des indicateurs pour savoir s’ils sont corrélés. Existe-t-il, par exemple, une corrélation entre le niveau d’éducation et le revenu ?

Il peut également être révélateur d’évaluer à quel point un indicateur d’un territoire (une commune, un quartier…) est corrélé à la valeur de ce même indicateur dans les territoires voisins. C’est ce qu’on appelle l’autocorrélation spatiale : sachant qu’une commune a un salaire moyen élevé, à quel point ses communes voisines ont-elles une chance d’avoir également un salaire élevé ?

Dans cet article, accompagné d’un notebook Python, nous allons montrer plusieurs méthodes permettant d’évaluer cette dépendance spatiale. Pour ce faire, nous allons récolter une série d’indicateurs à propos des 581 communes de Belgique, disponibles en open source sur https://statbel.fgov.behttps://data.belgium.be ou encore https://www.census2011.be.

Het artikel lezen

Data scrambling: synthetische data in de praktijk

Gepost op 23/03/2022 door Joachim Ganseman

In dit artikel kijken we naar de praktische bekommernissen als we tools voor synthetische data inzetten: wat komt een data professional die hiermee aan de slag moet zoal tegen?

Het artikel lezen

Ecosysteem Architectuur

Gepost op 28/02/2022 door Koen Vanderkimpen

Bij het software bouwen, maken we meestal geen op zichzelf staande programma’s meer. We bouwen vandaag eerder Applicatie Ecosystemen. Wanneer we dus een stuk software schrijven, mogen we niet zomaar de ontwikkeling lokaal optimaliseren, maar moeten we ook continu rekening houden met het grotere geheel. In deze blog maken we een verkenning van een aantal zaken waar we rekening mee moeten houden bij het bouwen van een ecosysteem, en van concrete principes die we kunnen toepassen bij het uitbouwen van een erbij passende modulaire architectuur.

Het artikel lezen

Uitdagingen bij gedecentralizeerde digitale portefeuilles

Gepost op 26/01/2022 door Kristof Verslype

In oktober 2021 kondigde de Staatssecretaris voor Digitalisering Mathieu Michel (MR) aan dat hij voor elke Belg tegen 2023 een digitale portefeuille wil, wat voortvloeit uit een Europese regulering. […] Europa doet echter geen uitspraak over de onderliggende technologie. Dit kunnen de individuele lidstaten zelf bepalen. Er zijn inderdaad verschillende – al dan niet hybride – mogelijkheden, waaronder benaderingen gebaseerd op blockchain technologie. Dit artikel wil een bijdrage leveren aan het debat door een aantal uitdagingen te formuleren, die vooral voor de – nieuwere, nog relatief ongekende – gedecentraliseerde blockchain systemen pertinent zijn.

Het artikel lezen

Identiteitsverificatie op afstand

Gepost op  door Bert Vanhalst

[…] In bepaalde situaties is het niet mogelijk of wenselijk voor iemand om zich fysiek te presenteren voor een identiteitsverificatie. De vraag is dan of die procedure ook van op afstand kan uitgevoerd worden, op een betrouwbare manier. Men spreekt dan over remote identity proofing of remote identity verification. Hoe gaat het in zijn werk?

Het artikel lezen

Governance volgens Mattheus

Gepost op  door Joachim Ganseman

Automatisering, zelfs digitalisering, is niet zomaar vrijblijvend, en al zeker niet bij overheden. Governance, vrij vertaald als deugdelijk bestuur, is een vaag begrip, maar het belang ervan illustreren we in dit artikel aan de hand van enkele voorbeelden.

Het artikel lezen

Data Quality Tools : retours d’expérience et nouveautés

Gepost op  door Isabelle Boydens, Isabelle Corbesier en Gani Hamiti

[…] Depuis plus de 10 ans, Smals a acquis un “Data Quality Tool” professionnel, toujours parmi les leaders du marché à l’heure actuelle, dans le cadre de son Data Quality Competency Center. Depuis lors, plus de trente projets d’envergure ont mobilisé cet outil dans le cadre de la sécurité sociale belge et en dehors de celle-ci.Nous proposons ici, sur la base de l’expérience acquise  : 

  • de rappeler et d’illustrer les fonctionnalités les plus usitées de l’outil, ainsi que quelques bonnes pratiques;
  • d’annoncer plusieurs nouveautés qui sont autant d’extensions de l’outil dans le courant de l’année 2021.

Het artikel lezen

Lees ook het wetenschappelijke artikel dat in Parijs is gepubliceerd door de Courrier des Statistiques (Parijs, INSEE, juli 2021): “Un service au cœur de la qualité des bases de données. Présentation d’un prototype d’ATMS*”, Isabelle Boydens, Professor, Université libre de Bruxelles en Data Quality Expert, Smals, Gani Hamiti, Data Quality Analyst, en Rudy Van Eeckhout, Database R&D, Smals.

* ATMS : Anomalies & Transactions Management System

Voorbij aan REST: Event-Driven APIs

Gepost op  door Koen Vanderkimpen

We hadden het op de Smals Research blog reeds uitvoerig over het gebruik van APIs als bouwsteen voor herbruikbare softwareRESTful APIs hebben uiteraard heel wat voordelen, maar toch moeten we opletten dat we ze niet altijd en overal gaan inzetten. Er zijn namelijk ook nadelen verbonden aan deze manier van werken. Met deze blog willen we er op wijzen dat asynchrone, Event-Driven communicatie tussen de systemen soms een veel beter resultaat oplevert, dan het zuivere gebruik van RESTful APIs.

Het artikel lezen

IA: L’éthique en pratique

Gepost op  door Katy Fokou

Dans un blog précédent, nous avons démontré l’importance d’adopter les principes d’éthique by design dans les projets d’intelligence artificielle dans le secteur public. […] Le but de ce blog n’est pas de fournir une description complète des méthodologies et technologies à adopter pour une IA éthique mais plutôt de décrire quelques bonnes pratiques et outils qui permettent d’intégrer l’éthique dans un projet d’IA.

Het artikel lezen

Privacybevorderende technologieën voor de publieke sector

Gepost op  door Kristof Verslype

Het wordt steeds makkelijker om grote hoeveelheden persoonsgegevens te verzamelen en te verwerken. Dit creëert enerzijds heel wat opportuniteiten, zoals het doen van statistische analyses ter verbetering van de gezondheidszorg. Tegelijkertijd moet echter rekening gehouden worden met de privacy van de burger, wat een juridische basis vindt in de GDPR. Met traditionele aanpakken en technologieën kan het omslachtig tot zelfs onmogelijk zijn om functionele noden en privacyvereisten met elkaar in balans te brengen. De behoefte naar meer geavanceerde technologieën groeit dan ook. Privacybevorderende technologieën, of privacy-enhancing technologies (PETs), kunnen hier een uitweg bieden en laten met behulp van cryptografie en/of statistiek zaken toe die zelfs intuïtief onmogelijk kunnen lijken.

Het artikel lezen

Peut-on toujours atteindre une maternité en 30 minutes ? (partie 2)

Gepost op  door Vandy Berten

Dans notre article précédent, nous avons montré comment il était possible de calculer la zone accessible dans un délai donné à partir d’un ensemble de points de départ (ou d’arrivée), comme une maternité, un départ SMUR ou un centre de vaccination Covid. […] Dans cet article, nous présenterons deux types de graphiques permettant de comparer objectivement deux scénarios (sous les hypothèses simplificatrices présentées dans notre article précédent). Le premier s’intéressera à la couverture territoriale, le second à la couverture populationnelle.

Het artikel lezen

Reactive: het Akka framework

Gepost op  door Koen Vanderkimpen

In een vorige blog gaven we reeds een uitvoerige inleiding van het “Reactive” paradigma. Vermits dit toch wel een belangrijke en invloedrijke zaak geworden is binnen de developer wereld, lijkt het ons nuttig om hier op terug te komen en wat dieper in te gaan op een voorbeeld van een Reactive framework: het Akka framework, één van de pioniers binnen de Reactive beweging.

Het artikel lezen

Smals KG Checklist: déterminer si un graphe de connaissances peut résoudre un problème concret

Gepost op  door Christophe Debruyne

Cette contribution se situe dans une série d’articles sur les graphes de connaissances (les « knowledge graphs » en anglais). Nous vous présentons le Smals KG Checklist, un outil qui vous aide à déterminer si un graphe de connaissances serait utile, voire indispensable, pour résoudre un problème dans votre organisation. Le Smals KG Checklist a été présenté au sein du SEMANTiCS 2021, un congrès scientifique et industriel autour des graphes de connaissances.

Het artikel lezen

Peut-on toujours atteindre une maternité en 30 minutes ?

Gepost op door Vandy Berten

Peut-on, de partout en Belgique, atteindre une maternité en moins de 30 minutes en voiture ? Si certaines maternités fermaient, quel en serait l’impact ? Le gouvernement Bruxellois a décidé de ne pas ouvrir de centre de vaccination Covid dans le sud-est de Bruxelles (Watermael-Boitsfort et Auderghem) : quel est l’impact en termes d’accessibilité ? C’est le type de question auxquelles nous allons tenter de répondre dans ce blog (et le suivant).

Het artikel lezen

De AI als auteur: een blik op Natural Language Generation

Gepost op  door Joachim Ganseman

In deze blogpost kijken we naar twee categorieën van NLG systemen. De eerste moet het hebben van templates en grammaticale regels, en geeft een strikt deterministische output. De tweede is gebaseerd op machine learning met een scheut randomness, en benadert zo meer wat we “creatief schrijven” zouden kunnen noemen.

Het artikel lezen

Dit artikel is gepubliceerd op ITdaily op 26/10/2021

Webinar by Smals Research: Natural Language Generation (october 28, 2021)

Secure multiparty computation – Collectieve berekeningen op verspreide gevoelige gegevens

Gepost op 08/06/2021 door Kristof Verslype
Kristof Verslype heeft dit jaar de “privacy enhancing technologies” grondig onderzocht. In het kader van die studie heeft Kristof een nieuw artikel gepubliceerd over Secure multiparty computation (SMC).

SMC maakt het mogelijk om berekeningen op een gedistribueerde manier te laten uitvoeren, dus zonder een centrale partij, en zonder dat de betrokken partijen inzage krijgen in gebruikte gegevens. SMC was lang een puur academische aangelegenheid, maar dat is de laatste jaren geëvolueerd.

In zijn artikel gaat Kristof kort in op een aantal cases waar SMC vandaag gebruikt wordt in de praktijk en licht hij een tipje van de sluier op van wat SMC in een overheidscontext zou kunnen betekenen.

Ook de onderzoeksgroep COSIC van KU Leuven (Computer Security and Industrial Cryptography) is actief bezig met SMC.
Lees het vervolg op de blog van Smals Research*

Naar een meer ethische kunstmatige intelligentie

Gepost op 31/05/2021 door Katy Fokou op de Smals Research-blog in het Frans
Gepubliceerd op 16/06/2021 op ITdaily in het Nederlands: Technologie en ethiek: kunnen we AI vandaag vertrouwen?
In dit nieuwe artikel gaat Katy dieper in op het risico van vooroordelen die mogelijk aanwezig zijn in tal van AI-modellen. Ethische vooroordelen in AI-algoritmen kunnen aanleiding geven tot verkeerde beslissingen of het onbewust discrimineren van bepaalde categorieën van mensen.

De Europese Unie heeft een kader uitgewerkt voor een “ethische AI”, en de Europese Commissie heeft in april een voorstel gepubliceerd voor een op risico’s gebaseerd rechtskader over AI. Katy licht beide initiatieven kort toe. Verder gaat ze op zoek naar de origine van de vooroordelen in de AI-algoritmes en hoe die kunnen voorkomen worden.

Kortom, er is een “ethiek by design” nodig, als we willen dat AI vandaag en in de toekomst daadwerkelijk ingezet én vertrouwd kan worden.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Virtual Knowledge Graphs

Gepost op 11/05/2021 door Christophe Debruyne
In het kader van zijn studie over ‘Knowledge Graphs’ heeft Christophe Debruyne verder onderzoek verricht naar het concept van de ‘Virtual Knowledge Graph’. Virtual Knowledge Graphs laten toe om op een haast transparante manier de gegevens in een relationele database als een graph te benaderen.

Christophe gaat concreet na aan welke beperkingen Virtual Knowledge Graphs onderhevig zijn en hoe het zit met de performantie. Hij vergelijkt twee producten (Ontop en Stardog) met een traditionele Knowledge Graph benadering.

Deze technologie is in volle evolutie maar biedt vandaag reeds mogelijkheden om bestaande databanken samen met andere bronnen te integreren in een Knowledge Graph.
Lees het artikel op de blog van Smals Research*

Spatial join, de sleutel tot geografische analyse

Gepost op 27/04/2021 door Vandy Berten
De meeste van onze klanten beschikken over geografische informatie: adressen van burgers, instellingen, bouwwerven, enz. Deze info wordt niet altijd maximaal benut.

Er zit er echter een enorm potentieel in, voor tal van sectoren: fraudebestrijding, optimalisatie toewijzing van inspecteurs, plaatsing van entiteiten zoals ziekenhuizen, impactanalyse in geval van sluiting / verplaatsing van diensten, gegevenskwaliteit, visualisatie, statistieken…

Een sleutelelement vanuit analytics oogpunt om met deze geografische gegevens te kunnen werken, is de “spatial join“.

In zijn artikel legt Vandy de werking van de spatial join uit en past hij deze techniek toe. Hij toont aan dat klassieke analysetechnieken te kort schieten als men geografische gegevens wil exploiteren. Hij bespreekt de voordelen van de spatial join bij het verrijken van een gegevensverzameling, maar ook bij het aan het licht brengen van fouten of onnauwkeurigheden.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Eventual Consistency – Een nog te weinig ontgonnen principe

Gepost op 12/04/2021 door Koen Vanderkimpen

‘Eventual Consistency’ kan een belangrijke rol spelen om de beschikbaarheid van toepassingen en systemen te verhogen. Het is vooral bekend door het gebruik in NOSql-databases, die kunnen blijven werken, zelfs al faalt het netwerk. Toch is het principe van Eventual Consistency nog niet voldoende ontgonnen.

Koen Vanderkimpen bespreekt in zijn blogartikel wat Eventual Consistency precies inhoudt, en wanneer dat principe nuttig wordt gebruikt. Daarnaast worden enkele voorbeelden uit drie verschillende sectoren aangehaald, en wordt beargumenteerd waarom het ook in overheidstoepassingen nuttig kan zijn.
Lees het volledige artikel op de blog van Smals Research*

Natural Language Processing in het Nederlands

Gepost op 31/03/2021 door Joachim Ganseman op de blog van Smals Research
Gepubliceerd op 22/06/2021 op ITdaily : NLP en Nederlands: waarom wereldtalen een streepje voor hebben
In dit blogartikel haalt Joachim een belangrijke problematiek aan in het Natural Language Processing-gebeuren in het Nederlands. Een problematiek waarmee wij – helaas – onvermijdelijk geconfronteerd worden in onze AI-projecten.

De spectaculaire vooruitgang in het Engels vinden we niet terug bij “kleine” talen zoals het Nederlands. Gelukkig zijn er omwegen om een en ander te verbeteren, en mogen we in de nabije toekomst structurele verbetering verwachten in het goed herkennen van het Nederlands.
Lees het vervolg op de blog van Smals Research*

SHACL: Logische- en vormcontroles met kennisgraaftechnologieën

Gepost op 18/03/2021 door Christophe Debruyne
SHACL laat toe om data te controleren en te valideren los van de programmeercode of het onderliggende databanksysteem. Het is een recente evolutie binnen het domein van de knowledge graphs en er zijn al tools voor beschikbaar.

Christophe legt in deze blogpost uit wat SHACL juist is en geeft enkel voorbeelden die duidelijk maken hoe je met SHACL data kan valideren. Hij bespreekt ook de mogelijkheden om deze technologie verder in te zetten, zoals bij gegevensbeheer en datakwaliteit.
Lees het vervolg op de blog van Smals Research*

Artificiële intelligentie in de publieke sector

Gepost op 25/02/2021 door Katy Fokou op de Smals Research-blog in het Frans
De laatste jaren is artificiële intelligentie (AI) een enorme rage geworden. Ondanks de onmiskenbare voordelen voor het functioneren van de overheidsdiensten en voor de burgers, is het echter beter ingeburgerd in de privésector dan in de publieke sector.
Gepubliceerd op 30/03/2021 op de ITdaily-website in het Nederlands: Is artificiële intelligentie de toekomst voor onze overheidssector?

In haar artikel legt Katy Fokou het belang van AI voor de publieke sector uit. Zij bespreekt mogelijke toepassingen en wijst op aandachtspunten.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Web scraping: nuttig voor eGov?

Gepost op 26/01/2021 door Vandy Berten
Web scraping, ook wel web crawling of web harvesting genoemd, herneemt alle technieken om inhoud van websites te extraheren. Hierbij worden verschillende tools aangewend: scripts, programma’s, plugins… Het doel? De geëxtraheerde inhoud in een andere context gebruiken.
Lees het vervolg (in het Frans) op de blog van Smals Research*

Differential Privacy

Gepost op 12/01/2021 door Christophe Debruyne
Differential Privacy (DP) is een methode die erin bestaat specifieke ruis
(een wiskundig begrip) in gegevens of in een antwoord op een vraag te injecteren. De bedoeling is om te voorkomen dat men kan achterhalen of de gegevens van een bepaalde persoon aanwezig zijn. Zo kan de privacy gewaarborgd worden.

Ondanks de invoer van ruis blijven de statistische eigenschappen van de oorspronkelijke gegevens over het algemeen behouden. Hoewel DP complex is, kan het interessant zijn om statistische gegevens te delen of zelfs voor Business Intelligence (BI). Dit artikel beschrijft het begrip DP en stelt een aantal toepassingen voor. Het wordt geïllustreerd met een voorbeeld waarin een tool DP in SQL-queries injecteert.
Lees het vervolg op de blog van Smals Research*

Data Quality: “Anomalies & Transactions Management System”; prototype & work in progress

Gepost op 08/12/2020 door Isabelle Boydens
In 2019 kondigde Smals Research de lancering van een proof of concept aan voor de implementatie van een generieke ATMS-dienst (Anomalies & Transactions Management System). De auteurs van dit artikel herinneren aan de belangrijkste motivaties inzake data quality en return on investment.

Ze specificeren de functionele specificaties en illustreren hun uiteenzetting op basis van use cases. Ze bespreken eveneens de technische vooruitgang en de vooruitzichten voor verdere ontwikkeling.

Dit artikel is een gezamenlijke bijdrage van Isabelle Boydens (Data Quality Expert bij Smals Research), Gani Hamiti (Data Quality Analyst bij Smals, Databases Team) en Rudy Van Eeckhout (Databases R&D bij Smals, Databases Team).
Lees het vervolg (in het Frans) op de blog van Smals Research*

Lees nieuwe artikelen op de blog van Smals Research

* Deze artikelen zijn persoonlijke bijdragen van hun auteurs. Zij werden in eigen naam geschreven en nemen geen standpunt in namens Smals.

Meer info over het Smals Research-team


Comments are closed.