tirsdag 7. oktober 2008

Uthenting av data fra nettsteder

Etter en ganske rolig helg, begynte jeg søndag med å implementere grunnfunksjonaliteten til Leep, nemlig å hente data fra andre nettsteder. Heldigvis har folk i våre dager vett nok til å bruke RSS, slik at jobben ble betydelig lettere. Problemet er dog at ikke alle sider liker å følge standarder på Internet. Noen liker å skrive <img src="hei.jpg" alt=""> mens andre liker å skrive <img src='hei.jpg' alt=''>. Etter min oppfatning kvalifiserer sistnevnte til nakkeskudd.

Misforstå meg rett, når man programmerer er det å bruke '' over "" veldig nyttig til tider. I PHP er det slik at om man skriver en tekst inni '', vil ikke escape characters fungere:
print "Hei, dette er en test\n";

gir
Hei, dette er en test

mens
print 'Hei, dette er en test\n';

gir
Hei, dette er en test\n

Det er også veldig nyttig om du skal spytte ut litt HTML med attributter:
print '<a href="http://s.voltage.nu/~robert/leep">'; 
print '<img src="leep-logo.png" alt="Logo" /></a>';

Men å skrive <img src='leep-logo.png' alt='' /> er bare galt. Galt, galt, galt.

Siden inneholder nå funksjonalitet til å hente ut data fra ITavisen, Digi og Hardware.no. Det er dog ikke bestemt at disse er de vi kommer til å ende opp med, jeg bare valgte tre lovende norske sider.

Videre arbeid vil være avhengig av enighet mellom gruppemedlemmene ang. databaselayout.

1 kommentar:

Per Rommetveit sa...

Databaselayout har jeg argumentert i for med en post til leep-adressen. Les den og se hva du/dere mener.

"mens andre liker å skrive ...kvalifiserer sistnevnte til nakkeskudd. "

Hoho... Men forøvrig enig med deg, og jeg lo godt som pokker!