Vyskum hovorenej podoby slovenciny ma takmer 50-rocnu historiu, ktoru
tvoria skor jednotlive sondy ako kontinualny zaujem. Problemom sond je aj
roztrusenost, resp. nezachovanost nazbieraneho a analyzovaneho materialu. V ramci Slovenskeho narodneho korpusu sa od r. 2007 vytvoril priestor na vypracovanie koncepcie vedecko-vyskumneho projektu Slovenskeho hovoreneho
korpusu, ktoreho prva verzia (textovy prepis zlinkovany so zvukom) v rozsahu takmer 130 tisic tokenov bola spristupnena koncom r. 2008. Cielom je pripravit do r. 2011 dvojmilionovu databazu, ktora bude obsahovat
neformalne spontanne i polooficialne rozhovory a dalsie formy hovorenych
prejavov z celeho uzemia Slovenska a od predstavitelov roznych generacii,
pohlavi, vzdelanostnych a zamestnaneckych kategorii. Zameranie
predovsetkym na lingvisticke vyuzitie ovplyvnilo aj sposob ziskavania
nahravok, ich prepisu a anotacie. Osobitnu problematiku predstavuje
dodrzanie relevantnych pravnych noriem.