Universiteit Leiden

nl en

Tools & software

Deze pagina biedt een overzicht van de meest voorkomende tools en software voor digitale onderzoeksmethoden.

Algemene portals (inclusief TDM software & tools)

  • DiRT (Digital Research Tools)
    De DiRT Directory is een register voor digitale onderzoekstools.
    De inhoud varieert van content management systemen tot  OCR voor muziek, van pakketten voor statistische analyse tot software voor mindmapping.
    De DiRT directory wordt ondersteund door de Andrew W. Mellon Foundation

  • PORT (Postgraduate Online Research Training)
    PORT is een openbaar platform voor training op onderzoeksgebied van de School of Advanced Study of the University of London. Het platform bevat een gevarieerd aanbod aan trainingsmateriaal gericht op postgraduate studie in the humaniora. De meeste van deze materialen worden gratis beschikbaar gesteld. 
    Quantitative Methods bevat tools op het gebied van:  semantische data, text mining, visualisatie, linked data, cloud computing. Bij iedere tool wordt naast een beoordeling ook een aantal toepassingen getoond. Gratis login.

  • TaPOR
    Text Analysis Portal for Research

Tools & software

  • Matrix met de meest gebruikte tools voor text analyse
    De UBL heeft deze lijst samengesteld in samenwerking met Book & Digital Media Studies, Universiteit Leiden

  • Ngram Viewers
    Tool waarmee het gebruik van een woord of woordengroep in teksten kan worden gevisualiseerd
    Enkele voorbeelden zijn: Google Ngram Viewer, DBNL Ngram Viewer, Hathi-Time

  • AntConc
    Een freeware toolkit voor analyse van tekstcorpora en het maken van concordantielijsten.

  • Voyant
    Een webgebaseerde omgeving om digitale teksten te lezen en te analyseren.
    Voyant tools

  • Stanford topic modelling toolbox 
    Topic modelling tools voor sociale wetenschappers en anderen die datasets met een grote tekstuele component willen analyseren.
     
  • NaCTeM Service Systems & Software Tools
    Text mining tools voor biomedisch onderzoek, die worden gebruikt door   NaCTeM (The National Centre for Text Mining)

  • Textpresso    
    Een pakket waarmee informatie uit biomedische en biologische literatuur wordt geëxtraheerd en verwerkt.
    Textpresso is een onderdeel van WormBase, California Institute of Technology in Californië, en ontvangt subsidie van de National Human Genome Research Institute van de US National Institutes of Health 

  • GATE (General Architecture for Text Engineering)
    Ontwikkeld door de University of Sheffield

  • Ontotext
    Stelt tools voor textmining, data integratie en semantische annotatie en curatie ter beschikking

  • WMatrix
    Campus licentie via de Universiteit Leiden

    Parsers

  • PDFMiner-Python PDF parser and analyzer
    Een tool waarmee informatie uit pdf bestanden kan worden geëxtraheerd. Er zit een PDF converter in, waarmee PDF bestanden omgezet kunnen worden naar andere tekstformaten.

  • Stanford parser
    Statistische parser

  • Alpino
    'Dependency parser' voor het Nederlands, die ontwikkeld is in de context van het PIONIER project Algorithms for Linguistic Processing.

Een selectie van de meest gebruikte tools en software in (open source of via een universitaire licentie)

Populaire  progammeertalen die gebruikt worden bij TDM

  • Python
    Een breed inzetbare en veel gebruikte programmeertaal. Python heeft een grote library met tools voor dataanalyse en datamodellering. De Python Tutorial biedt een introductie tot de eerste concepten en mogelijkheden van de taal en het systeem.

  • Perl
    Bevat krachtige tools om tekst te verwerken, waardoor het ideaal is om te werken met HTML, XML en alle andere vormen van mark-up toegepast bij natuurlijke taal.

  • Deel je code via GitHub


Quantitative data analysis software
 

  • R
    Voor statistische bewerkingen en grafieken

  • Mallet
    Dit pakket is gebaseerd op Java en wordt gebruikt voor de statistische verwerking van natuurlijke taal, het classificeren van documenten, het clusteren en extraheren van informatie, 'topic modeling', en andere applicaties om 'machine learning' toe te passen op tekst.

  • WinStats

  • SPSS


Qualitative data analysis software

  • Atlas ti
    Tool voor data-analyse en datamanagement
    Tutorial van de University Library, University of Illinois in Urbana-Champaign.
    Campus licentie Universiteit Leiden


Data cleaning


OCR


Visualisatie

  • Textexture
    Netwerkvisualisatie van tekst

  • Gephi 
    Visualisatie en netwerkanalyse
    Introduction to Network Visualization with Gephi door Martin Grandjean, Universiteit van Lausanne

  • QGIS

  • Tableau public
    Gratis versie van het commerciële pakket Tableau Desktop voor data-analyse en visualisatie. Het programma maakt interactieve diagrammen, grafieken en kaarten van de data.

  • OpenHeatMap
    Tool waarmee data gebruikt worden om statische and interactieve kaarten te maken. 

  • Spreadsheets uit Excel of Google Docs worden gebruikt om een dataset met geografische locaties, zoals straatnamen, lengte- en breedtecoördinaten of zelfs IP adressen in een kaart weer te geven.

  • Google Fusion Tables
    Diagrammen, kaarten en netwerkgrafieken.

Deze website maakt gebruik van cookies. Meer informatie