Een bouwbedrijf krijgt aanbestedingen van tientallen documenten, vaak meer dan 100 MB, vol vertrouwelijke en concurrentiegevoelige informatie. Wij bouwden een agentic AI-systeem dat die stapel omzet in een conceptvoorstel, met een lokaal model als poortwachter dat eerst alles anonimiseert. Pas daarna komen de zware commerciële modellen in beeld. Dit is het waarom, het hoe en wat het oplevert.
Een offerteaanvraag in de bouw is geen briefje. Het is een doos vol documenten: bestekken, tekeningen, voorwaarden, planningen, bijlagen en addenda. Tientallen bestanden, samen vaak meer dan 100 MB. Een tenderteam is dagen kwijt aan lezen en samenvatten voordat het überhaupt aan het echte werk toekomt: het beste voorstel schrijven, met de scherpste prijs en de juiste risico-inschatting. En al die tijd tikt de deadline door.
AI kan dat leeswerk in een fractie van de tijd doen. Maar er zit een addertje onder het gras. Een RFP zit vol gevoelige en concurrentiegevoelige informatie: namen van partijen, locaties, prijsafspraken, calculaties. Die wil je niet zomaar door een commercieel cloudmodel halen, waar je niet precies weet waar de data terechtkomt of of die wordt bewaard. Tegelijk red je de deadline niet met handwerk. Twee eisen die op het eerste gezicht schuren: snel én vertrouwelijk.
We losten het op door het werk te splitsen, en de gevoelige stap lokaal te houden. De kern van het ontwerp:
Tientallen documenten, vaak 100 MB+, worden ingelezen en gestructureerd.
Een lokaal Qwen-model op een NVIDIA DGX Spark verwijdert namen, prijzen en locaties. Niets verlaat het pand.
Pas de geanonimiseerde tekst gaat naar zware commerciële modellen voor analyse en concept.
Het is bewust een agentic opzet: meerdere gespecialiseerde AI-agents verdelen het werk. De een haalt de eisen en gunningscriteria uit de stukken, de ander signaleert risico's en tegenstrijdigheden, een derde bouwt het conceptvoorstel op. En aan het eind staat altijd een mens: de tenderspecialist controleert, scherpt aan en beslist.
Het gevoelige werk blijft binnen. Alleen geanonimiseerde tekst gaat naar buiten.
Anonimiseren vraagt niet om het slimste of duurste model, het vraagt om een betrouwbaar model dat de data binnen houdt. Daarvoor is een sterk open model als Qwen, lokaal draaiend op een NVIDIA DGX Spark, ideaal. Het toestel is compact genoeg voor op kantoor, maar levert tot een petaFLOP aan rekenkracht en draait modellen die groot genoeg zijn om dit werk betrouwbaar te doen. De gevoelige documenten verlaten daarbij nooit het pand.
Daar komt een prettig neveneffect bij: kosten. Het bulkwerk, het zware inlezen en anonimiseren van honderden megabytes, draait lokaal zonder afrekening per token. Alleen het verfijnde denkwerk, het schrijven van een overtuigend voorstel, gaat naar een commercieel model. Zo betaal je het dure model alleen waar het echt waarde toevoegt.
Deze case laat een patroon zien dat veel verder reikt dan de bouw. De vraag is zelden "cloud of lokaal", maar "welke data mag in welke stap waarheen". Een lokale poortwachter die gevoelige gegevens binnenhoudt, gecombineerd met selectief gebruik van krachtige cloudmodellen, geeft je het beste van twee werelden: snelheid én controle. En precies dat is waar AI-governance over gaat: per stap bepalen wat mag, het vastleggen, en de regie houden.
Proud Nerds bouwt dit soort agentic systemen op maat. Vigil geeft je er vervolgens grip op: welke toepassing draait waar, welke data verlaat de organisatie en welke niet, wat kost het, en is het aantoonbaar compliant. Soeverein, in je eigen omgeving, met granulair beleid per toepassing.
Of het nu RFP's, dossiers of contracten zijn: we bouwen agentic AI die het zware werk doet, met de gevoelige stappen veilig binnen je eigen omgeving.