středa 15. února 2012

Regulární výraz

Pro začátek jen jeden:

 " -.*$"
Najde text začínající řetězcem " -" potom následuje libovolný text a končí koncem řádku.
Výraz najde řádek ve kterém se nachází číslo s českou předvolbou.
[+]420 [0-9]* [0-9]* [0-9]*.*$

Tento výraz naopak vyzobne e-mailovou adresu s příponou .cz, hledá více výskytů libovolného znaku s výjimkou mezery, potom zavináč, znovu libovolný počet libovolných znaků a řetězec tečka cézet.
[^ ]*@.*\.cz

. nahrazuje libovolný znak
* výraz před hvězdičkou se může libovolně-krát opakovat
 .* hledá tedy libovolný řetězec
$ hledá konec řádku
[^1-9] znamená negaci výčtu, najde řetězec který neobsahuje číslice
\. vyřadí speciální možnosti znaku, hledá tedy tečku místo libovolného znaku


+420 423 679 911 Pepa Vomáčka 1@mc.ccp
+420 423 679 913 Franta Vomáčka xpx@mc.cz
+420 423 679 913 Franta Vomáčka xpx@mccz
+420 423 679 913 Franta Vomáčka x.p.x@.mccz
+420 423 679 913 Franta Vomáčka x.p.x@m.c.cz
+419 423 679 912 Lojza Smrček Xi@mc.sk
+420 423 679 915 Pepa Novák che@mc.eu
+420 423 679 914 Jenda Vomáčka cha@mc.org
+419 423 679 918 Petr Smrček chi@mc.com
+419 423 679 917 Jarda Vomáčka Bat@mc.gov
+419 423 679 919 Máňa Vomáčková FLASH@mc.pl

Další příklad, nahrazení všech tagů určitého formátu (s datumem):
Původní řetězec: <td class="tc-3">02.08.2012</td>
Výsledný řetězec: <td class="tc-3"></td>
Formát výrazu: <td class=\"tc-3\">[0-9]{2}.[0-9]{2}.[0-9]{4}</td>
\" zastupuje znak uvozovek "
[0-9] hledá číslici nula až devět
{2} předchozí výraz hledá dvakrát za sebou

Hledáme-li letopočet stačí zadat [0-9]{4}, vyhovuje pro letopočty ve formátu XXXX (2012)


Žádné komentáře:

Okomentovat