-- Leo's gemini proxy

-- Connecting to idiomdrottning.org:1965...

-- Connected

-- Sending request

-- Meta line: 20 text/gemini; lang=sv

Text-TV blir dålig


Den nya versionen av SVTs text-tv kom upp idag.


Jag har uppdaterat min scraper att klara det nya formatet.


Jag hade rätt låga förväntningar och tyvärr är den nya versionen mycket riktigt så otroligt dålig!


Den har gått från att vara pre-block med länkade sidnummer till att vara giffar!


Det går alltså inte att följa länkarna längre, i den gamla gick det att klicka sig runt på sidnumren men i den nya måste man skriva in. Dvs man måste alltså använda tangentbord! Och man kan inte längre ställa in vanlig fontsize osv utan det är “hoppas du gillar retropixelblock” som gäller.


Giffarna är dessutom inbäddade i sidorna i base64. Färre TLS-roundtrips på det sättet och det är ju mysigt, men går å andra sida inte att slippa ladda ner dom för oss som bara vill ha texten.


Med en skärmläsare för synskadade är den nya också rätt så wack eftersom den inte kan skilja ut nya rader på nåt bra sätt. Det finns ingen semantik som hjälper en att höra skillnad på rubrik, sidhuvud, sidfot, och själva texten, utan den mal bara på.


Det är självklart också betydligt mer tracing, cookies och analytics på den nya. Håhåjaja…


Den gamla hemsidan var helt OK, men jag gjorde en scraper för att jag tyckte det var lite jobbigt att nya rubriker inte kom längst fram. Av begripliga skäl: det gör att sidnumren inte byts ut i onödan utan att nyhet nummer 110 (eller vad det nu är) ligger på 110 lite längre än om allt hela tiden skulle skyfflas runt när det kom en nyhet. Men med min scraper så är det meningen att dom nyaste sakerna ska komma överst.


Den gör ju så gott den kan att klara av det… Ett problem är att sidorna ibland randomly inte dyker upp. “Sidan är ej i sändning” står det, trots att den fanns där nyss och om jag reloadar finns den där igen. Det kan innebära att scrapern “glömmer bort” att den har sett en viss sida och tror att det är en nyhet. Och om dom gör typofixes så tror den också att den är en helt ny (dvs jag har ingen Levenshtein-tröskel, kanske vore en bra idé, iofs). Eller om dom flyttar en rubrik från huvudrubrik till notis, eller om dom tar bort och sen återinsätter en nyhet, eller om den faller bort från innehållsförteckningen. Men allt det är väl OK.


Den nya versionen däremot… nu känns min scraper så sjukt mycket mer berättigad! För det har blivit en total pain att använda den officiella.


Det var lite knepigt att göra den nya; med den gamla behövde jag bara köra sxpath a href för att plocka ut alla relevanta sidnummer från innehållssidorna, med den nya är det en… sjutton rader lång named let. Uj…


Men det konstiga


Det konstiga är: varför?


Varför blir webben bara sämre och sämre?


Ska det vara så svårt för dom att trycka View Source på sin egen kod istället för att koka ihop en ohemul gegga?


Ja, jo, den nya har väl en högre “retroleksaksfaktor” dvs det ser ut som det gjorde på 90-talet, när Text-TV hade sin största publik. (Den stora GDPR-blobban förtar ju en hel del av det intrycket…) Som sagt, mer tracing och tracking och cookies för det är väl urviktigt för dom att få veta hur folk använder Text-TV.


Men jag orkar inte…!

-- Response ended

-- Page fetched on Fri Apr 19 05:27:26 2024