Van dikke RFP-stapel naar scherp voorstel: agentic AI in de bouw

Een offerteaanvraag in de bouw is geen briefje. Het is een doos vol documenten: bestekken, tekeningen, voorwaarden, planningen, bijlagen en addenda. Tientallen bestanden, samen vaak meer dan 100 MB. Een tenderteam is dagen kwijt aan lezen en samenvatten voordat het überhaupt aan het echte werk toekomt: het beste voorstel schrijven, met de scherpste prijs en de juiste risico-inschatting. En al die tijd tikt de deadline door.

De uitdaging: snelheid én vertrouwelijkheid

AI kan dat leeswerk in een fractie van de tijd doen. Maar er zit een addertje onder het gras. Een RFP zit vol gevoelige en concurrentiegevoelige informatie: namen van partijen, locaties, prijsafspraken, calculaties. Die wil je niet zomaar door een commercieel cloudmodel halen, waar je niet precies weet waar de data terechtkomt of of die wordt bewaard. Tegelijk red je de deadline niet met handwerk. Twee eisen die op het eerste gezicht schuren: snel én vertrouwelijk.

De oplossing: een agentic systeem met een lokale poortwachter

We losten het op door het werk te splitsen, en de gevoelige stap lokaal te houden. De kern van het ontwerp:

Stap 1

Inlezen

Tientallen documenten, vaak 100 MB+, worden ingelezen en gestructureerd.

→

Stap 2 · lokaal

Anonimiseren

Een lokaal Qwen-model op een NVIDIA DGX Spark verwijdert namen, prijzen en locaties. Niets verlaat het pand.

→

Stap 3 · cloud

Voorstel opbouwen

Pas de geanonimiseerde tekst gaat naar zware commerciële modellen voor analyse en concept.

Het is bewust een agentic opzet: meerdere gespecialiseerde AI-agents verdelen het werk. De een haalt de eisen en gunningscriteria uit de stukken, de ander signaleert risico's en tegenstrijdigheden, een derde bouwt het conceptvoorstel op. En aan het eind staat altijd een mens: de tenderspecialist controleert, scherpt aan en beslist.

100 MB+aan documenten per aanbesteding, tientallen bestanden

0niet-geanonimiseerde gegevens die naar externe modellen gaan

128 GBunified memory op de lokale DGX Spark, genoeg voor zware open modellen

1 PFLOPaan lokale AI-kracht, on-prem, voor de anonimisatiestap

Het gevoelige werk blijft binnen. Alleen geanonimiseerde tekst gaat naar buiten.

Waarom een lokaal model als poortwachter

Anonimiseren vraagt niet om het slimste of duurste model, het vraagt om een betrouwbaar model dat de data binnen houdt. Daarvoor is een sterk open model als Qwen, lokaal draaiend op een NVIDIA DGX Spark, ideaal. Het toestel is compact genoeg voor op kantoor, maar levert tot een petaFLOP aan rekenkracht en draait modellen die groot genoeg zijn om dit werk betrouwbaar te doen. De gevoelige documenten verlaten daarbij nooit het pand.

Daar komt een prettig neveneffect bij: kosten. Het bulkwerk, het zware inlezen en anonimiseren van honderden megabytes, draait lokaal zonder afrekening per token. Alleen het verfijnde denkwerk, het schrijven van een overtuigend voorstel, gaat naar een commercieel model. Zo betaal je het dure model alleen waar het echt waarde toevoegt.

Wat het oplevert

De opbrengst voor het bouwbedrijf

Sneller een voorstel. Het leeswerk dat dagen kostte, is in uren klaar. Het team houdt tijd over voor inhoud, prijs en marge.
Vertrouwelijkheid geborgd. Concurrentiegevoelige informatie blijft binnen; alleen geanonimiseerde tekst gaat naar externe modellen.
Lager kostenplaatje. Het zware bulkwerk draait lokaal, het dure model alleen waar het telt.
Meer aanbestedingen aankunnen. Met dezelfde mensen meer RFP's verwerken betekent meer kansen pakken.
Aantoonbaar en navolgbaar. Elke stap is gelogd: wat is geanonimiseerd, wat ging waarheen, wie keurde goed.

Wat dit breder betekent

Deze case laat een patroon zien dat veel verder reikt dan de bouw. De vraag is zelden "cloud of lokaal", maar "welke data mag in welke stap waarheen". Een lokale poortwachter die gevoelige gegevens binnenhoudt, gecombineerd met selectief gebruik van krachtige cloudmodellen, geeft je het beste van twee werelden: snelheid én controle. En precies dat is waar AI-governance over gaat: per stap bepalen wat mag, het vastleggen, en de regie houden.

Hoe dit aansluit op Vigil

Proud Nerds bouwt dit soort agentic systemen op maat. Vigil geeft je er vervolgens grip op: welke toepassing draait waar, welke data verlaat de organisatie en welke niet, wat kost het, en is het aantoonbaar compliant. Soeverein, in je eigen omgeving, met granulair beleid per toepassing.

Onder de motorkap

NVIDIA DGX Spark, compacte on-prem AI-computer (GB10 Grace Blackwell, 128 GB unified memory, tot 1 petaFLOP), voor het lokaal draaien van de anonimisatie.
Qwen, open-weight taalmodel (Alibaba), lokaal draaiend zodat gevoelige data het pand niet verlaat.
Agent-orkestratie voor het verdelen van eisen-extractie, risicosignalering en het opbouwen van het conceptvoorstel.
Commerciële modellen voor het zware denk- en schrijfwerk, uitsluitend op geanonimiseerde tekst.
Klant anoniem op verzoek, actief in de bouwsector.