Se su un sistema operativo Linux volessimo filtrare una wordlist in base ad alcune regole, ci può venire in aiuto il comando sed.

Per esempio se dal file wordListFile volessimo estrapolare solo le parole di lunghezza da 5 a 6, formate sia da cifre che da lettere:

[cc lang=”bash” escaped=”true”]

sed -nr ‘/^[[:print:]]{5,6}$/p’ wordListFile > wordListFiltered

[/cc]

Il comando è costituito da:

  • -n   per non stampare le linee di default
  • -r   per usare la verstione estesa delle espressioni regolari
  • /……/   Quando si incotnra ciò che è contenuto qui dentro…
  • ^…..$   Per tutta l’intera riga
  • [[:print:]]   seleziona qualsiasi parola stampabile
  • {5,6}   di lunghezza tra 5 e 6
  • p   in fine stampa

Sicuramente ci saranno altri svariati modi, ma questo mi sembra già più che soddisfacente.