The dataset is ~1.7 billion JSON objects

^ falls es jemanden juckt: es gibt ein dataset mit allen öffentlichen kommentaren auf reddit.