Hugi Þórðarson

Strimillinn

Ég er búinn að ganga með hugmynd í maganum um nokkurt skeið. Um sexleytið í gærkvöldi hófust svo loks kröftugar hríðir með tilheyrandi útvíkkun, og ég hrinti henni í framkvæmd.

Hugmyndin gengur undir nafninu Strimillinn og hér er stutt skýring á henni eins og ég skrifaði hana á vefinn - ég skrifa svo eitthvað skemmtilegra og gáfulegra um þetta þegar fram í sækir.

Þökk sé algjöru hruni krónunnar hefur vöruverð á Íslandi undanfarið farið hratt hækkandi.

ASÍ og Neytendasamtökin gera reglulega verðkannanir í verslunum og þær kannanir eru allra góðra gjalda verðar. En stundum hefur hent að þar koma upp villur, eða að eigendur verslunar rengja tölurnar sem birtar eru í könnunum - þegar þetta hendir þá er erfitt fyrir þá sem annast verðkannanir að hrekja staðhæfingar verslunareigenda.

Á hverjum degi verða hinsvegar til margir kílómetrar af óhrekjanlegum verðkönnunargögnum í verslunum landsins. Þetta eru kassakvittanirnar, strimlarnir, sem sýna svart á hvítu hvað við greiðum fyrir vörur.

Hugmyndin að baki Strimlinum er að virkja almenning í landinu til að veita verslunareigendum aðhald við verðlagningu. Einnig verður, þegar fram í sækir, fróðlegt að safna tölfræði úr þessum gögnum og bera saman vöruverð á milli verslana, landshluta, þéttbýlis og dreifbýlis - og jafnvel verslana erlendis.

Þú getur stutt þetta prufuverkefni með því að senda inn þína eigin innkaupastrimla, sérstaklega þætti mér áhugavert að fá í grunninn gögn af landsbyggðinni og erlendis frá.

Gjörið þið svo vel: http://strimillinn.karlmenn.is/

Daníel

Glæsilegt! Á svo að vinna úr gögnunum eitthvað frekar?

Hugi

Já, ekki spurning, tölfræðin sem kemur út úr þessu ef vel heppnast gæti orðið mjög spennandi :). Ég er að skoða nokkur OCR-söfn og líst vel á tesseract-ocr, hér má sjá útkomuna úr þeirri maskínu - nokkuð gott hjá algjörlega óþjálfaðri, ófínstilltri, enskumælandi OCR-vél. http://hugi.karlmenn.is/d/ocr/original.jpg http://hugi.karlmenn.is/d/ocr/result.txt Svo var Gunnlaugur hjá DataMarket að benda mér á OCRopus sem góðan valkost til að OCR-a gögn sem fylgja föstum strúktúr, ég á þó eftir að skoða það aðeins betur. En ég hafði hugsað mér að byrja með einfalt tagging til að byrja með - kjötvara/mjólkurvörur/álegg o.s.frv. - hjálpar fólki vonandi ágætlega að finna það sem verið er að leita að í upphafi. Og þú veist að þú ert auðvitað velkominn með í þetta - þetta er jú allt gert til gagns og gamans, og ég var helst að spá í að setja kóðann að þessu öllu bara inn á Google Code :-).

Logi Helgu

Frábært framtak, ég mun leggja til strimla...lofa engu hvort ég leggi til einhverja vinnu en væri frábært að skella þessu á Google Code þannig að fleiri getið tekið þátt í þessu með þér ;)

Íris Hlín

Flott framtak

Hugi

Allir strimlar eru alveg einstaklega gríðarlega velkomnir :).

Siggi Árni

Góð barátta :) Það væri töff í framtíðini þegar þú ert búinn að þróa þetta lengra, að maður gæti jafnvel slegið inn innkaupalistann sinn og strimillinn gæti látið mann vitar hvar væri ódýrast að kaupa það sem væri á listanum :)

Hugi

Já, það væri vissuelga algjör brilli :). Ég ætla að byrja á að OCR-a strimlana með einföldum hætti þannig að hægt sé að gera textaleit í þeim. En það verður aðeins flóknara mál að útbúa þetta þannig að hægt sé að ná út verði hverrar vöru um sig, uppsetning strimlanna er talsvert mismunandi eftir verslunum, vöruheitin stytt o.s.frv. Jafnvel líklegt að crowdsourcing verði málið fyrir gagnaúrvinnslu á strimlum sem skráðir eru í grunninn.

Villi

Glæsilegt framtak þú fallegi rauðhærði maður. Ég er byrjaður að safna strimlum.

Hugi

Þakka þér kærlega fyrir það, skolhærða gríska goð :).