Naar inhoud
Faylo
Alle artikelenInzichten

Wat ‘deterministische pseudonimisering’ betekent — en waarom het de kwaliteit niet schaadt

Door Team Faylo1 min leestijd

Tokens vervangen namen en nummers — maar dezelfde waarde krijgt altijd hetzelfde token. Daarom behoudt het model context en redeneerkwaliteit zonder ooit te weten om wie het gaat.

“Pseudonimisering” klinkt technisch, maar het idee is eenvoudig: vervang elke herleidbare waarde door een neutraal label. “Jansen Bouw B.V.” wordt bijvoorbeeld [[ORG_4f9c2a]], en “P. van den Berg” wordt [[PERSON_9a3d]]. Het woord “deterministisch” is waar de kwaliteit vandaan komt.

Deterministisch betekent consistent

Deterministisch wil zeggen: dezelfde waarde krijgt binnen een sessie altijd hetzelfde token. Komt “Jansen Bouw B.V.” tien keer voor in een dossier, dan ziet het model tien keer exact [[ORG_4f9c2a]]. Daardoor weet het model nog steeds dat het telkens om dezelfde onderneming gaat — de relaties in de tekst blijven intact, alleen de identiteit erachter is weg.

Vergelijk dat met willekeurig vervangen, waarbij elke vermelding een ander label zou krijgen. Dan zou het model de samenhang verliezen en slechter redeneren. Determinisme voorkomt precies dat.

Waarom de cijfers blijven werken

Niet alles wordt getokeniseerd. Niet-herleidbare cijfers — omzet, salaris, saldi, percentages — gaan ongewijzigd door. Dat is juist wat een goede analyse nodig heeft. Het model rekent en redeneert op de echte getallen; alleen wíe erachter zit, is vervangen door een token.

En de weg terug?

De koppeling van waarde naar token staat in een kluis binnen uw eigen tenant. Komt het antwoord van het model terug — nog getokeniseerd — dan herstelt Faylo elk token lokaal, zodat uw team een schoon antwoord over de echte cliënt leest. De aanbieder heeft de oorspronkelijke waarden nooit gezien, en niemand buiten uw kantoor kan een token terugdraaien.

  • Zelfde token voor dezelfde waarde → context behouden.
  • Cijfers ongewijzigd → analyse blijft kloppen.
  • Kluis in uw tenant → alleen u kunt herleiden.

Het netto-effect: u krijgt de redeneerkracht van een toonaangevend model, op echte dossiers, zonder dat herleidbare gegevens uw omgeving verlaten.