helaas nog zoeken

Ik had het eerder over een ‘you know what I mean’-factor bij het vinden van dingen op het Internet. Nu zijn er wat mensen die al een tijd bezig zijn dat te bereiken met een semantisch web, een redactionele hel.

Hulk

Wat is de aanleiding als je iets wilt vinden op het Internet? Juist, het ‘hoe zat het ook alweer’-gevoel, gevolgd door het ‘waar stond het ook alweer’-moment. Je zoekt practisch altijd in het verleden. Vaak vind je bij het zoeken niet omdat je niet exact kan aangeven in welke context je zoekt. Voorbeeld: je zoekt een foto van die acteur die de groene superschurk (of was het nou een held?) speelde in de originele televisie serie rond 1980, maar niet de meervoudige mr. Universe. Je gaat dus zoeken op “green villan 1980s”, ofzo. Nu zal je alleen iets vinden als deze woorden toevallig bijelkaar staan in een artikel, wat gaat over Lou Ferrigno, of over de film die een paar jaar totaal flopte, dat samen met heel erg veel links naar websites die wellicht ook terzake doen. Dat komt omdat “1980s” niet geinterpreteerd wordt als ‘ergens rond 1980’, dus 1978, 1979, etc en green en villan is misschien niet de letterlijke bewoording van een redacteur. Dat werkt dus niet.

Je wilt dus eigenlijk dat al die steekwoorden gekoppeld worden aan het artikel wat je wilt lezen. Op die manier is de kans immers het grootst dat iets gevonden word. Dat is het populaire taggen. Het werkt, maar niet helemaal. Dan is er nog een semantisch web, wat een redactioneel concept is, het absoluut beschrijven van een artikel, plaatje, geluidje, video (auteur, eigenaar, datum, oorsprong, afmetingen, onderwerp, locatie, links naar relevante andere objecten, noem maar op (zogenaamde metadata)). De manier en de inhoud van dat redigeren en annoteren is vastgelegd in strikte regels, waardoor de zekerheid van het vinden hoger is dan als je zomaar wat woorden eraan zou hangen zoals dat bij ‘tagging’ (taxonomie) gebeurd.

Je kan je voorstellen dat er niemand is die het Internet met terugwerkende kracht gaat ‘determineren’. Stel dat dit zou gebeuren, dan zou je een wolk krijgen met objecten die eigenschappen (metadata) en tags delen, waardoor ze bij een zoektocht relevantie krijgen. Dus omdat er een artikel is wat door mij is geschreven over semantische webben, worden andere artikelen van mij relevant bij het zoeken naar semantiesche webben. De objecten zijn dus niet gekoppeld, maar hun metadata. Dus als een object verkeerd, onnauwkeurig of ‘subjectief’ worden geannoteerd, verliest het waarde in een zoektocht.

Dus op die manier koppelen is wel leuk en als het goed gebeurd, erg waardevol, maar het meeste van het internet is door navelstaarders en onkundigen geschreven. Deze mensen houden geen rekening met de vindbaarheid van hun werk, of weten niet hoe. Daarom kunnen we ervan uitgaan dat het niet lukt, of voor slechts een heel klein deel. Alternatieven is: een metawolk kweken. Het is zoiets als het samenstellen van een encyclopedie door eerst de bibliotheek van de Haagse Bibliotheek te fotograferen en te sorteren op de hoeveelheid letters op elke boekpagina.

Dat werkt dus niet, je moet de inhoud begrijpen om er waarde aan te hechten. Je moet bijwijze van spreken de ‘tags’ van elk boek, een context geven zodat ze een verband aangaan met andere tags. Dus niet omdat ze hetzelfde zijn, maar omdat ze hetzelfde betekenen in de juiste context. In het voorbeeld uit het begin: als ik zeg ‘green’ dan heb ik alleen dat het een kleur is, als ik het een context geef met ‘villan’, dan zijn de kansen al groot dat ik in de mythische verhalen terecht kom. Als ik als laatste ‘1980s’ erbij voeg (en dit is wat je eigenlijk bedoeld als je het intypt), dan wordt er direct een periode aan gekoppeld. Jouw zoekopdracht wordt zeg maar een wolk van zichzelf, een wolk van groene mytische figuren die ‘leefden’ in de jaren 80. Als elk object (artikelen, fotos en videos) in een zoekmachine ook zo’n wolkje heeft, doordat de inhoud begrepen word, kan je dingen vinden, de wolkjes zullen immers op elkaar lijken. Maar dan wordt het dus moeilijk. Er is nog niet genoeg rekenkracht om al die gegevens op het Internet te ‘begrijpen’, of om overal zo’n wolkje erbij te maken.

podspinsels III met Leon!

Leon is een collega, een die soms ook wel eens nadenkt over media, met name TV en wat we ervan willen. Ik heb in een chat met hem e.a. verteld hoe ik erover denkt en geluisterd naar zijn ideeën. Hieronder het verslag. Er zijn delen van de chat weggehaald wegens het ontbreken van relevantie of gevoelige persoonlijke informatie. Net als de rest van de inhoud van deze site, is het volgende intellectueel eigendom van de schrijver en betrokkenen.

Leon!
says: (21:41:08)

tijd
voor content peet

Leon!
says: (21:48:16)

geweldige
producties maken ondanks beperkingen

Leon!
says: (21:48:21)

of

Leon!
says: (21:48:43)

geweldig
los gaan zonder grenzen

Peet
says: (21:48:48)

B!

Leon!
says: (21:49:18)

ik geloof
dat kwaliteit komt bij beperkingen

Peet
says: (21:49:18)

weet
je … ik wil mensen blij maken, maar geld beperkt de geest

Peet
says: (21:49:30)

geld
beperkt ook kwaliteit

Peet
says: (21:49:54)

veel
voor weinig en veel af voor morgen

Peet
says: (21:50:22)

doel
is: op schoot bij een coole klant en samen iets moois maken

Leon!
says: (21:50:26)

wij
moeten maar eens een cola gaan drinken ergens

Peet
says: (21:50:37)

en
dan de geldmeneren het onderling laten uitvechten

Peet
says: (22:09:03)

ja,
ik ken het … TV is echt backstabbing

Peet
says: (22:09:38)

allemaal
van die lulletjes die alleen geld verdienen door op TV te verschijnen

Peet
says: (22:10:01)

in
het landschap van zenderverdeling is er geen andere keuze

Peet
says: (22:10:19)

maar
als je ziet wat voor leuke dingen mensen maken zonder budget …

Peet
says: (22:10:41)

voor
podcasts, of video.google.com

Leon!
says: (22:10:46)

en dit
is op zich het moment

Peet
says: (22:10:48)

echt
heel slim soms

Leon!
says: (22:11:05)

om
kanalen te maken

Peet
says: (22:11:26)

ja,
kanalen met maar 1 content provider …

Leon!
says: (22:11:45)

hoeft
niet eens hoor

Peet
says: (22:11:46)

1
persoon die verantwoordelijk is om kijkers te behouden

Leon!
says: (22:12:10)

ik heb
ook wel eens gedacht om allerlei internet radio amateurs te bundelen

Leon!
says: (22:12:23)

24 uur
per dag vullen kunnen ze niet

Leon!
says: (22:12:36)

en doen
dan 23 uur pulp en 1 uur klasse

Leon!
says: (22:13:03)

wat nu
als ik 24 van die idioten bij elkaar voeg

Peet
says: (22:14:30)

nou
ik denk dat het fijn korrelig fragmenteren van alle content en dan eclectisch
samen laten stellen door de kijker dé formule is … als er behoefte voor is
zullen mensen zelf ook programma’s samenstellen voor anderen, zodat je toch een
soort kanaal/ zender krijgt …. of mensen doen het zelf … dan krijg je pas
echt: waar voor je geld .. je krijgt alleen wat je wilt .

Leon!
says: (22:15:32)

ok

Peet
says: (22:15:43)

en
de aanbieder valt dan weg … dus geen talpas en van de endes meer … maar iedereen
die de klant vast weet te houden … voor zijn kleine fragmentje

Peet
says: (22:16:11)

maar
het kan natuurlijk best zijn datn een talpa uiteindleijk zelf ook dingen gaat
maken voor die markt …

Leon!
says: (22:16:33)

ik ben
bang dat mensen behoefte hebben aan een pakket, zelfs als het rukt

Leon!
says: (22:17:03)

gewoon
uit gebrek aan fantasie

Peet
says: (22:17:12)

ja,
maar dat is geen probleem. maar je ziet dat de aanbieders nu niet flexibel
genoeg zijn … zij investeren te veel in content

Leon!
says: (22:17:22)

er
kijken nog steeds mensen naar de tros

Leon!
says: (22:17:44)

tja

Peet
says: (22:18:05)

wat
je wilt is dat er echt geinvesteerd word in het aanbieden van pakketten,
veeeeeel pakketten die op iedereen past, zodat je als conglomeraat of aanbieder
de klant vasthoud

Leon!
says: (22:19:00)

ok

Peet
says: (22:19:07)

de
verzuiling bestaat alleen bij de gratie van "die mensen zijn onze
mensen", inderdaad niet om de content… maar als Balkenende nou eens een
kanaal samen zou stellen … dat moet een succes worden

Leon!
says: (22:19:09)

daar
kan ik me wel in vinden

Peet
says: (22:19:30)

of
als er een "ruud de wild" kanaal komt .. dan stap je weer een beetje
in de branding …

Leon!
says: (22:19:40)

normen
en waarden radio

Peet
says: (22:20:09)

ja,
of het christenen kanaal met alleen maar herhalingen van het huisje op de
prairie

Peet
says: (22:20:46)

whatever
.. doel is totale dekking van alle ‘doelgroepen’ zonder meer geld uit te hoeven
geven

Peet
says: (22:21:07)

en
dan komt het … want als je niet meer investeert in de aanschaf van content,
wat moet je dan

Peet
says: (22:22:03)

Je
kan dan de makers van content prikkelen door te sponseren … zo’n voort wat
hoort wat contract is veel stimulerender .. het stop echter als de content stom
is …

Peet
says: (22:22:37)

en
doordat je weet wie welk pakket heeft en welk deel ervan geconsumeerd word, kan
je gedetailleerd investeren.

Peet
says: (22:23:00)

je
krijgt immers betaald voor je selectie, niet voor de content .. dat doen de
makers wel

Leon!
says: (22:23:02)

dan zit
je 100% op marktwerking en is het vraag of dingen in de marge nog wel komen

Peet
says: (22:24:34)

nou,
jawel …

Peet
says: (22:25:00)

er
zijn dan ook geen dingen in de marge … hoe klein een publiek ook is, het is
bijna altijd rendabel

Peet
says: (22:25:31)

knullige
tv heeft maar een klein publiek nodig .. en dure producties zullen meer als een
film werken

Peet
says: (22:25:40)

pay
per view

Peet
says: (22:26:21)

bovendien
bied deze manier van werken een bizar gedetailleerd sponsering plan

Peet
says: (22:26:35)

je
weet wie wat kijkt (pakket profielen, etc)

Peet
says: (22:26:56)

en
daarop kan de slager van de hoek een buurt programma sponseren

Leon!
says: (22:27:19)

ok

Peet
says: (22:27:32)

of
vodafoon kan een miniserie goedkoper maken zodat het eerder gekocht wordt

Peet
says: (22:27:50)

een
sponsor koopt met content eigenlijk zijn image

Peet
says: (22:28:35)

zoals
ze nu nogal klungelig op TV doen: Het weer wordt aangeboden door profile-tire
center

Peet
says: (22:29:20)

dat
soort dingen, product placement, reviews, spellen met prijzen … je kent de
drill, dat veranderd niet echt, maar de markt voor een sponsor wordt ook veel
groter

Peet
says: (22:29:37)

meer
keuze in ‘doelgroepen’

Leon!
says: (22:29:55)

nou
peet, bel john

Peet
says: (22:29:58)

maak
je notities?

Peet
says: (22:30:21)

ik
ben op dreef .. maar ik zet dit ook even op mijn blog als je het niet erg vind

Peet
says: (22:30:41)

ik
kan je naam fingeren, of juist doorlinken naar je site

Leon!
says: (22:30:59)

leef je
uit

Peet
says: (22:31:05)

cool

Leon!
says: (22:31:07)

en
altijd linken naar leonleon.com

de ‘you know what I mean’-factor voor zoeken

Bij google heb je er het meeste last van. Je zoekt op een woord, maar het synoniem of met een extra bijwoord blijkt het zoeken beter te werken. Dat weet je pas als je het probeert. Waarom heeft software niet de ‘je weet toch’-factor. Zo van: oh, je bedoeld zeker … En niet qua spelling, maar qua semantiek.

Ik zocht een apparaat met behulp van google; een zogenaamde compressor, wat gebruikt wordt om je stemgeluid te optimaliseren voor opname. Maar het moest wel een kleine zijn, in tegenstelling tot de meest voorkomende 19′ variant. Dus ik zoek op ‘Compressor mini’ en ‘compressor tiny’ en ‘compressor portable’, zonder al te veel geluk. Pas toen ik zocht op ‘compressor half rack’ had ik beet, maar wie verzint dat dan?

‘half rack’ is een term in radioland wat staat voor ‘de helft kleiner dan normaal’, bij mij heet dat ‘daagbaar’ of ‘klein’, maar google begreep dat niet. De semantische betekenis van draagbaar (portable) is niet bekend bij google, die controlleerd hooguit of je zoekterm statistisch relevant is (daarom kan google ook hier en daar tips geven als: ‘je bedoeld zeker broodrooster, i.p.v. bloodrooster). Wat google niet kan is kijken wat het woord betekend en dan bepalen of er semantische (in de zelfde betekenis) alternatieven zijn. En dat is wel gewenst

Je wilt natuurlijk uiteindelijk ‘vinden’ en niet ‘zoeken, filteren, lezen, verfijnen en misschien vinden’. Wat daarom nog gewenster is, is het bepalen van semantische waarde in de context (de andere woorden) van de zoekopdracht. Als ik zeg ‘klein olifantje’, dan bedoel ik eigenlijk een beest van een paar honder kilo, maar slechts drie jaar oud (dus jong). Als ik zeg ‘kleine computer’, dan bedoel ik veel kleiner dan andere computers, of misschien wel laptop (dat is immers ook een kleine computer). Als google dat zou weten, dan zou hij kunnen suggereren: je bedoelt een jonge olifant, of een portable computer, waarmee de kans dat je iets vind ook veel groter is.

semantisch netwerkSematisch web © Aidministrator

Bovenstaande is een beetje moeilijk te maken en impliceerd het gebruik van zogenaamde semantische netwerken. Dat zijn een heleboel woorden in een database, die op basis van hun betekenis een relatie aangaan met andere woorden. Artikelen met bepaalde woorden kunnen daardoor gekoppeld worden aan artikelen met andere woorden, maar dezelfde betekenis.

peter podcast! op sneaker.fm (beta)

sneaker.fm logo

Al sinds december vorig jaar onderzoek ik het fenomeen ‘podcasten’. Om daar echt ín te zitten ben ik zelf gaan podcasten. Het resultaat is sneaker.fm, een eigen podcast.

Ik heb het podcasten eerst geheim gehouden, om mezelf tijd te gunnen om goed te onderzoeken en om ook een zeker niveau te bereiken. Bovendien wil ik dat er iets gepubliceerd staat wat de moeitewaard is. Slechts een paar vrienden wisten ervan.

Nu is dat niveau van mijn eigen podcasts nog lang niet wat het moet zijn, maar ik begin er zo langzamerhand lol in te krijgen. Daarbij is het ook fijn eens een verhaal te vertéllen, wat voor mij meer kracht heeft dan een artikel schrijven.

Grappig genoeg is bij het maken van podcasts de techniek niet de drempel, wat mij eerst wel logisch leek. Het opbouwen van een podcast en het vocaal brengen van emoties is wel veel moeilijker dan ik dacht. Het is rete moeilijk om gestructureerd over te brengen wat je wilt vertellen en daarbij ook boeiend te blijven klinken. Daar is een script voor nodig, of in elk geval een goed idee van wat je wilt vertellen.

Tot nu toe ‘doe ik maar wat’ bij het maken van de podcasts, wat resulteert in veel ‘uhm’ momenten, maar ik ben van plan mezelf te verbeteren en van sneaker.fm een leuke podcast te maken die de moeite waard is. Luister zelf maar op sneaker.fm en laat me weten wat je ervan vind.

Overigens, de podcast is voornamelijk in het Engels. Ik heb daarvoor gekozen omdat er test-luisteraars waren die alleen engels spraken, bovendien hoop ik daarmee ook een iets groter publiek te bereiken. Of ik in het Engels doorga, weet ik niet zeker.