groupdata2

groupdata2 er min første R-pakke. Den indeholder funktioner og metoder til at gruppere / splitte data og kan bl.a. skabe balancerede folds til cross-validation.

Funktioner

  • group_factor
  • group
  • splt
  • fold

group_factor() laver en grouping factor med 1-taller for gruppe 1, 2-taller for gruppe 2, osv.
Denne funktion bliver også brugt af de andre funktioner.

group() tager data (dataframe / vector) og returner dataframe med grouping factor, grupperet (med dplyr::group_by) efter denne grouping factor.

splt() tager data (dataframe / vector), laver de specificerede grupper og returner de forskellige grupper i en liste.

fold() laver balancerede folds til cross-validation. Man kan balancere på en kategorisk variabel samt sørge for at alle samples med et delt id (f.eks. deltager id) bliver placeret i den samme fold.

Metoder

Der er en del metoder til at lave grupperne. Man kan f.eks. angive hvor mange grupper man vil have, eller hvilken størrelse grupperne skal have. Målet er, at man kan bruge groupdata2 i langt de fleste tilfælde, hvor man skal lave grupper. Nye metoder (og funktioner) er på vej.

Hvor?

Du kan finde groupdata2 på CRAN eller GitHub (dev. version).

 

Date: januar 2017
Skills: Programmering, R