RSScrawler é un creador de corpus a partir de RSS incompletos (resumidos). Esta ferramenta utiliza a extracción por xPath do contido relevante das páxinas, que son apañadas mediante o RSS. É un programa preparado para executarse máis dunha vez por dia, para o que recomendamos a execución median as terfas do cron.