Har lite problem med regexp parsning.
Använder PHP och PCRE (preg_match osv.)
Så här ser det ut nu:
$raw_urltime = implode (' ', file ('http://www.aftonbladet.se/telegram/nyhetsbevakaren/0,1195,___,00.html'));
preg_match_all ("'( (.*?)<\/b><\/font>.*?){0,1}p.gif\" alt=\"\" /><a href=\"(.*?)\".*?\>(.*?)<.*?([0-9]{2}:[0-9]{2})'is", $raw_urltime, $urltime);
Det funkar, för det mesta. Men ibland
är det någon av kategorierna som inte har några artiklar, då
fungerar det inte som de ska längre.
I det fall då det inte fungerar kan det se ut så här:
http://www.dominerar.nu/~gribber/data.php
I det fallet matchar den "Sport" eftersom det kommer först men jag
vill att den ska ta "Ekonomi" istället eftersom det är dit nyheterna hör.
Detta resultat får jag nu:
http://www.dominerar.nu/~gribber/afton2.php
och det kommer från denna:
http://www.aftonbladet.se/telegram/nyhe … __,00.html
För det mesta är det artiklar under "Sportresultat som saknas, därav får
alla artiklar under "Ekonomi" istället "Sportresultat" som kategori.
Måste ju finnas någon lösning så jag kan plocka allt detta direkt :)