Cursus Data Science met R
De Data Science opleiding is een multidisciplinaire benadering om bruikbare inzichten te extraheren uit de grote en steeds groter wordende hoeveelheden gestructureerde en ongestructureerde gegevens, die worden verzameld en gecreëerd door hedendaagse organisaties. Data Science omvat het voorbereiden van gegevens voor analyse en verwerking, het uitvoeren van geavanceerde gegevensanalyses en het presenteren van de resultaten om patronen op een slimme manier te onthullen en stakeholders in staat te stellen geïnformeerde conclusies te trekken.
Data Science stelt ons in staat om een probleem op te lossen met een reeks goed gedefinieerde stappen.
In de Data Science Opleiding besteden we aandacht aa…
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.
De Data Science opleiding is een multidisciplinaire benadering
om bruikbare inzichten te extraheren uit de grote en steeds groter
wordende hoeveelheden gestructureerde en ongestructureerde
gegevens, die worden verzameld en gecreëerd door hedendaagse
organisaties. Data Science omvat het voorbereiden van gegevens voor
analyse en verwerking, het uitvoeren van geavanceerde
gegevensanalyses en het presenteren van de resultaten om patronen
op een slimme manier te onthullen en stakeholders in staat te
stellen geïnformeerde conclusies te trekken.
Data Science stelt ons in staat om een probleem op te lossen met
een reeks goed gedefinieerde stappen.
In de Data Science Opleiding besteden we aandacht aan de verschillende stappen van de Data science-levenscyclus. De levenscyclus bevat de belangrijkste fasen die projecten meestal doorlopen, vaak iteratief:
Stap 1: Problem identification
Stap 2: Business understanding
Stap 3: Collecting data
Stap 4: Pre-processing data
Stap 5: Analysing data
Stap 6: Data Modelling
Stap 7: Model Evaluation
Stap 8: Model Deployment
Stap 9: Driving insights and generating BI reports
Stap 10: Taking a decision based on insights
Data Science tool
Tijdens de Data Science opleiding wordt gewerkt met
de programmeertaal R: Een open source programmeertaal en
omgeving voor het ontwikkelen van statistische berekeningen en
grafische afbeeldingen. R is de meest populaire programmeertaal
onder datawetenschappers. R biedt een breed scala aan bibliotheken
en tools voor het opschonen en voorbereiden van gegevens, het maken
van visualisaties en het trainen en evalueren van machine learning
en deep learning-algoritmen.
Wil je liever aan de slag met Python, meld je dan aan voor de
5-daagse Opleiding Data Science met Python.
Doelgroep
De Data Science Opleiding met R is ontwikkeld voor Big Data projectmanagers, Business Intelligence managers en -consultants, IT managers, business development managers, data analisten, business analisten, datawarehouse analisten, informatie architecten, marketing (technology) managers, marketing (intelligence) managers, innovatie managers en Big data analisten die hun kennis willen opfrissen en uitbreiden.
Vereiste vooropleiding en vaardigheden
Om de Data Science Opleiding succesvol af te sluiten wordt van
de deelnemer een bepaald kennisniveau verwacht.
– Minimaal afgeronde HBO
– Basiskennis van ICT-systemen
– Basiskennis van één of meerdere programmeertalen is een pré maar
niet noodzakelijk.
Na afronding van de Data Science Opleiding
- Beschikt u over allround kennis die u nodig heeft om een realistische inschatting te maken van de impact en mogelijkheden van Big Data in uw organisatie.
- Heeft u kennis gemaakt met verschillende toepassingen en tools voor het verzamelen, opslaan, analyseren en visualiseren van grote en (on) gestructureerde databestanden
- Beschikt u over de juiste handvaten om als projectmanager Big Data uw eigen Big Data projecten te ontwerpen en te leiden.
- Kent u de meest recente ontwikkelingen op het gebied van business intelligence en big data.
- Kunt u vaststellen hoe Big Data kan worden omgezet in nieuwe kansen, diensten en verdienmodellen.
- Bent u in staat om te bepalen welke interne en externe databronnen nodig zijn om de gevraagde informatie te kunnen vervaardigen.
- Heeft u inzicht in methoden voor het analyseren van Big Data.
- Bent u in staat om een data science project in logische, onafhankelijke stappen op te delen.
- Bent u in staat om gegevens op te schonen, en om te gaan met missende gegevens.
- Kunt u een aantal veelgebruikte predictieve modellen toepassen.
Online & Klassikaal programma
De opleiding Data Science wordt zowel klassikaal als online aangeboden. Het online programma ook wel afstandleren genoemd, is geheel gelijkwaardig aan het klassikale programma en biedt dezelfde mogelijkheid tot het klassikaal stellen van vragen, het samenwerken in groepjes en het overleggen met medecursisten als in het reguliere programma. Daarenboven worden er speciaal voor het online programma extra sessies verzorgd, waarbij extra begeleiding wordt geboden. Deze extra sessies zijn vrijwillig en voorzien u van extra begeleiding door de docenten.
Module opbouw Data Science Opleiding
De wekelijkse opbouw van het programma stelt u in staat om deze opleiding eenvoudig te combineren met uw dagelijkse werkzaamheden. Daarbij creëert deze opbouw voor u de ruimte om vragen te stellen die tussentijds op de werkvloer naar boven zijn gekomen.
Inhoud
Dag 1: Huidige trends in Big Data en Data
Science
Overzicht van de huidige trends in (big data) tools en
werkwijzen.
Wat is een data scientist en wanneer is data ‘big’?
Data science projecten en de rollen in een data science team
Inleiding R en RStudio:
Inleiding R; de R community, hulp krijgen en R community
Werken met RStudio; workflow en Rstudio projects
Basis data typen en data manipulatie in R
Dag 2: Inleiding Data Science in R en R
studio
Meer over data import en export
Data summaries en eenvoudige visualisaties
Inleiding statistische modellen met R
Time series Forecasting en trendanalyse
Dag 3: Data management en data cleaning met
R
De data waardeketen
Datatypen, conversie,
Nette data en data validatie
Oefeningen met R
Dag 4: Modern predictive modeling methoden
Overzicht Statistical Learning en modelselectie
Random Forests en Gradient Boosted trees
Modelkeuze en interpretatie.
Oefeningen met R
Dag 5: Communicatie en vertaling naar de
praktijk
Datavisualisatie en informatievisualisatie
Automatic reporting
Dashboards
Interactieve visualisaties met plotly: oefeningen met
plotly:
Praktijk case: praktijkopdracht uitwerken en presenteren voor de
medecursisten.
Kosten en inschrijving
De kosten van de 5-daagse opleiding Data Science bedragen € 2750. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken en cursusmateriaal en toegang tot het e-learning platform van Tridata.
In-company en maatwerk (klassikaal/online)
De opleiding Data Science kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die op maat voor jouw organisatie wordt gemaakt. Hebben meerdere collega’s in jouw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s. Voor meer informatie kunt u contact met ons opnemen.
Waarom de cursus volgen bij Tridata?
– Tridata is het enige instituut wat een door de Vereniging voor
Statistiek & Operationele Research (VVS-OR) erkende opleiding
statistiek aanbiedt.
– De data science opleiding van tridata is een multidisciplinaire
opleiding die wordt gegeven door drie verschillende docenten met
ruime ervaring op het gebied van R, statistical modeling en machine
learning, statistical software development, tekstanalyse, big data,
Tekstmining, datavisualisatie en datamanagement & cloud
computing. De docenten hebben diverse wetenschappelijke artikelen
en boeken geschreven.
Dr. M. (Mark) van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Na zijn promotie op een onderwerp uit de quantumfysica is hij werkzaam als statistisch onderzoeker bij het CBS met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, python, en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipedia paginas. Mark werkt sinds 2012 als consultant en docent voor Tridata.
Drs. E(Edwin) de Jonge Studeerde af in de
theoretische natuurkunde aan de Katholieke Universiteit Nijmegen.
Na zich enkele jaren the hebben gespecialiseerd in
softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS
met als specialiteit statistical computing and modeling, data
management en data visualisatie. Over dit laatste onderwerp
publiceerde Edwin onder andere een paper voor de prestigieuze IEEE
VisWeek conferentie. Edwin is expert op het gebied van
verschillende programmeertalen waaronder C++, javascript, python en
R. In die laatste taal ontwikkelde hij een package wat inmiddels
meer dan 120.000 maal per maand wordt gedownload van de CRAN
servers. Edwin werkt sinds 2012 als consultant en docent voor
Tridata.
Edwin en Mark zijn auteur van het boek ‘Learning R Statistical
Computing with Rstudio’ (Packt publishing, 2012) en werken
momenteel, aan een boek over ‘Statistical Data Cleaning with
Applications in R’ (te verschijnen bij Wiley). In 2013 gaven zij
een tutorial op de grootste R conferentie ter wereld (useR!2013)
getiteld “an introduction to data cleaning with R”.
Dr. ir. J.(Jan) van der Laan
Dr. ir. J.(Jan) van der Laan studeerde af op het gebied van
signaalverwerking bij de de faculteit technische natuurkunde aan de
Technische Universiteit Delft. Na zijn promotie op het gebied van
medical physics is hij als statistisch onderzoeker werkzaam bij het
CBS. Op het CBS houdt hij zich onder andere bezig met statistische
analyse en regressietechnieken, data visualisatie en het verwerken
en koppelen van grote bestanden. Over deze onderwerpen publiceert
hij op conferenties en peer reviewed journals. Jan is expert op het
gebied van meerdere programmeertalen waaronder C++,
Javascript, D3.js en R. Hij heeft bijdragen geleverd aan meerdere R
packages op CRAN. Jan werkt sinds 2015 als consultant en docent bij
Tridata.
Er zijn nog geen veelgestelde vragen over dit product. Als je een vraag hebt, neem dan contact op met onze klantenservice.

