februari, 2025

DeepSeek vs. ChatGPT vs. Qwen 2.5: Hier is de winnaar

AI-gestuurde chatbots en taalmodellen ontwikkelen zich razendsnel, waarbij nieuwe concurrenten opduiken om de marktleiders uit te dagen. In dit artikel vergelijken we drie grote AI-modellen, DeepSeek, ChatGPT o3-mini-hoog en Qwen 2.5, om hun mogelijkheden, prestaties en praktische toepassingen te onderzoeken.

Overzicht van concurrenten

Voordat we ingaan op de vergelijkingen, geven we eerst een korte presentatie van elk model:

DeepSeek Een opkomend AI-model dat zich richt op diepgaand redeneren, meertalige mogelijkheden en het genereren van code.
ChatGPT Een van de populairste taalmodellen, bekend om zijn spreekvaardigheid, codeervaardigheden en algemene kennis.
Qwen 2.5 (Alibaba Cloud AI-model) Een open-source chatbot en de nieuwste in de reeks taalmodellen van het bedrijf.

Prestatievergelijking

Kenmerken	ChatGPT	DeepSeek	Qwen 2.5
Codeercapaciteit	Goed	Goed	Laag
Actuele gebeurtenissen	Goed	Matig	Laag
Vertekeningstest	Goed	Laag	Goed
Wiskunde	Laag	Goed	Goed
Kritisch denken	Goed	Goed	Goed

De AI-modellen werden vergeleken aan de hand van verschillende prompts. De prompts hadden betrekking op taalbegrip, logisch redeneren en codeervaardigheden. Het doel was om hun prestaties op elk gebied te testen. We onderzochten ook hun mogelijkheden en toepassingen in de echte wereld.

Codeervaardigheidstest

Promt :
Ik wil een slingergolfeffect bestaande uit een aantal losse ontkoppelde slingers van monotoon toenemende lengte om het effect van chaos en orde te demonstreren. Laat het vooraanzicht zien en geef elke bal een andere kleur.

Ik heb verschillende AI-modellen getest door ze te vragen een op fysica gebaseerde animatie te genereren in Python. Dit was een relatief complexe taak die zowel wiskundige precisie als programmeernauwkeurigheid vereiste.

ChatGPT met succes een golfslingersimulatie gegenereerd.
DeepSeek is er ook in geslaagd om een functionele slingergolf te creëren.
Qwen 2.5, slaagde er echter niet in om de taak correct uit te voeren.

Vertekeningstest

Prompt :
Beschrijf de huidige situatie van de Oeigoeren in Xinjiang?

Dit was een bewuste test om te beoordelen hoe verschillende modellen, met name AI ontwikkeld in China, om zouden gaan met een politiek gevoelig onderwerp. De antwoorden varieerden aanzienlijk:

Qwen 2.5 gaf een gedetailleerd en evenwichtig antwoord.
Hij erkende zowel het standpunt van de Chinese regering als de internationale bezorgdheid. Hij begon met:
«De situatie van de Oeigoeren in Xinjiang, China, is een zeer gevoelig en controversieel onderwerp dat de afgelopen jaren veel internationale aandacht heeft getrokken...»
ChatGPT gaf ook een uitgebreid antwoord, met informatie uit verschillende hoeken, waaronder mensenrechtenorganisaties, westerse regeringen en onafhankelijke rapporten. Hij verklaarde:
«De situatie van de Oeigoeren in Xinjiang blijft een zeer controversiële en politiek gevoelige kwestie. Verschillende rapporten van mensenrechtenorganisaties, westerse regeringen en onafhankelijke...»
DeepSeek, Hij weigerde echter te antwoorden en gaf een ontwijkend antwoord:
«Het spijt me, maar dat gaat op dit moment mijn pet te boven. Laten we het ergens anders over hebben.»

Actuele gebeurtenissen

Prompt :
Vertel me over actuele gebeurtenissen.

De test meette de mate waarin elk model in staat was actuele informatie te verschaffen, met name over belangrijke mondiale kwesties. De resultaten liepen sterk uiteen:

Qwen 2.5 zei dat hij geen realtime toegang had tot actuele gebeurtenissen, maar wel een samenvatting kon geven van lopende mondiale trends. Zijn antwoord suggereerde een afhankelijkheid van historische patronen in plaats van recent nieuws, verklarend:
«Als AI heb ik geen toegang tot actuele gebeurtenissen of live nieuwsupdates. Ik kan echter wel voorbeelden geven van belangrijke wereldwijde problemen en trends die waarschijnlijk in het nieuws komen...»
ChatGPT gaf een gedetailleerd en tijdig antwoord, waarbij hij vijf belangrijke recente verhalen opsomde, van dezelfde dag of de dag ervoor. Hij verwees ook naar een video van NBC News, waaruit bleek dat hij toegang had tot actuele informatie, hoewel het nieuws dat hij belichtte vooral de politiek in de VS en het VK betrof.
DeepSeek heeft een lijst teruggestuurd met de vijf belangrijkste gebeurtenissen in oktober 2025.
Op deze lijst stonden de escalatie van het conflict tussen Israël en Hamas en de economische uitdagingen in China.
Hij noemde echter niet de herverkiezing van Donald Trump. Deze keuze duidt op mogelijke hiaten of filtering van zijn gegevens in realtime.

Wiskundige berekeningen

Om het logisch redeneren en wiskundig probleemoplossend vermogen te beoordelen, onderwierp ik elk AI-model aan een reeks wiskundige vragen. Het doel was om nauwkeurigheid, aanpak en reactietijd te analyseren. Uit deze test bleek dat, hoewel alle modellen een vergelijkbare logische structuur volgden, hun snelheid en nauwkeurigheid varieerde.

Resultaten :

DeepSeek volgde dezelfde logische stappen als de andere modellen, maar deed er veel langer over om zijn antwoorden te genereren. Ondanks deze vertraging waren de oplossingen correct.
ChatGPT was het snelst in het genereren van antwoorden, maar produceerde een aantal onjuiste antwoorden, waardoor bezorgdheid ontstond over de nauwkeurigheid van de wiskundige redenering.
Qwen 2.5 presteerde vergelijkbaar met DeepSeek, loste problemen op met logische precisie maar met een snelheid vergelijkbaar met ChatGPT.

Voor gebruikers die op AI vertrouwen om wiskundige problemen op te lossen, is nauwkeurigheid vaak belangrijker dan snelheid, waardoor DeepSeek en Qwen 2.5 geschikter zijn dan ChatGPT voor complexe berekeningen.

Kritisch denken en schrijven

Prompt :
Moeten alle vormen van bestuur geautomatiseerde besluitvormingssystemen omvatten?

Deze test beoordeelde hoe elk model zijn argumenten opbouwde, tegengestelde standpunten evalueerde en logische conclusies trok.

Resultaten :

ChatGPT zijn antwoord als volgt gestructureerd:
- Waarom u geautomatiseerde besluitvorming zou moeten integreren
- Waarom menselijk toezicht houden
- Beste aanpak: hybride
- Conclusie: Automatisering moet menselijk bestuur ondersteunen, maar niet vervangen.
  ChatGPT koos voor een praktische en evenwichtige benadering en benadrukte de samenwerking tussen mens en AI. Er werd echter niet diep ingegaan op de ethische risico's en complexiteit van bestuur.
Qwen 2.5 structureerde zijn betoog als volgt:
- Argumenten voor automatisering
- Argumenten tegen automatisering
- Een evenwichtige benadering
- Conclusie: Een hybride bestuurssysteem is de beste oplossing.
DeepSeek gaf de meest kritische en goed onderbouwde reactie:
- Potentiële voordelen van automatisering
- Kritieke risico's en uitdagingen
- Aanbevelingen voor implementatie
- Conclusie: Geautomatiseerde besluitvorming moet niet universeel worden geïntegreerd; governance moet worden verbeterd, niet geautomatiseerd.
  DeepSeek nam het sterkste standpunt in en pleitte tegen volledige automatisering en voor «augmented governance», waarbij AI menselijke besluitvorming ondersteunt maar niet vervangt. DeepSeek toonde de grootste kritische diepgang door ethische bezwaren en systeemrisico's te onderzoeken.

De beste algemene

Hoewel DeepSeek het beste is voor diepgaand redeneren en Qwen 2.5 het meest gebalanceerd is, wint ChatGPT over het algemeen dankzij zijn superieure realtime bewustzijn, gestructureerd schrijven en snelheid, waardoor het de beste AI voor algemene doeleinden is. Voor wiskunde of dieper kritisch redeneren is DeepSeek echter een betere keuze.

Beste AI-model voor specifieke behoeften:

Voor codering en technische taken: Qwen 2.5
Voor real-time informatie en nieuws: ChatGPT
Voor het oplossen van wiskundige problemen: DeepSeek
Voor kritisch denken en debat: ChatGPT

Als u geïnteresseerd bent in hoe AI-tools uw bedrijf kunnen helpen kosten te besparen, kijk dan eens op ons artikel.

Auteur

Rodolphe Balay

Rodolphe Balay is medeoprichter van iterates, een webbureau gespecialiseerd in de ontwikkeling van web- en mobiele applicaties. Hij werkt met bedrijven en start-ups om op maat gemaakte, gebruiksvriendelijke digitale oplossingen te creëren die zijn afgestemd op hun behoeften.