Petr Hejl: Za investici 1 milion Kč polovinu práv k projektu Nový hledač
Ing. Petr Hejl, CSc. je na českém Internetu známý především díky svému projektu Nový Hledač, pro který již nějakou dobu hledá investici. Vystoupil v televizním pořadu Den D, účastní se diskuzí, komentuje související články a snaží se sehnat jeden milion korun na vytvoření prototypu, jímž by prokázal skutečnou funkčnost nového vyhledávače.
Petře, stručně napřed shrnu celou situaci. Váš hledač má být postaven na zcela novém způsobu hodnocení webů, podle něhož se pak tyto budou na základě dotazu uživatele zobrazovat na stránce s výsledky hledání. Myšlenka tohoto převratného algoritmu je postavena na hodnocení určitých objektů v rámci webových stránek, objektů jiných, než hodnotí třeba Google. Proč zrovna tyto objekty mají poskytnout relevantnější výsledky? Vypovídají třeba více o obsahu?
Zdravím čtenáře Netzinu.
Většina informací o mém projektu je na WWW adrese: milionovastranka.net
Rozdíl mezi stávajícími hledači a mnou je tento: Stávající hledače hodnotí WWW stránky, já hodnotím jiné objekty. Jiné objekty jsou tématicky spojené množiny komponent Netu (WWW stránky, dokumenty, obrázky, audio, video…). Pořadí WWW stránek je odvozeno od pořadí jiných objektů, ve kterých jsou tyto WWW stránky obsaženy. Jiné objekty jsou větší než WWW stránky a navzájem se více liší než WWW stránky. Proto je pro můj algoritmus snažší stanovit relevantní pořadí nalezených WWW stránek. Odhadem by mělo být moje pořadí o 10 procent lepší, než je pořadí Google. Používám selský rozum, statistiku a pravděpodobnost, nepoužívám umělou inteligenci (sémantiku).
Teďka jsme četl Vás článek www.netzin.cz/clanky/ma-vyse-pageranku-vliv-na-pozici-v-serp, se kterým souhlasím. I když někteří rádoby SEO experti říkají opak, bylo by nelogické, aby Gúgláci zahodili to základní, co vymysleli.
Snad bych jen doplnil, že podle mého odhadu je váha tohoto kriteria v současné době 0.2.
Ještě jsme si přečetl Váš článek o duplicitě:
http://www.netzin.cz/clanky/unikatni-obsah
Taky mám z praxe jednu zajímavou poznámku.
Zdá se, že Google dokáže rozlišit nezprávy od zpráv.
U nezpráv mírně preferuje starší data WWW stránek, u zpráv naopak novější.
Já jsem se právě začetl do diskuze, kterou vedete na fóru Lupa.cz. Je asi zbytečné snažit se dopracovat k informaci, kterou nechcete prozradit. Nicméně pochopil jsem, že váš hledač bude pracovat s dynamickým rankem (hodnocením) závislým na tématu webu. Například turistický dotaz tak bude pracovat s množinou webů zaměřených na turistiku. Mýlím se?
Nemýlíte se, je to tak. Snad jen dvě poznámky. Ty diskuze na Webtrhu i Lupě nejsou nijak relevantní, slouží mně i ostatním k zábavě. A druhá, trošku vážnější. Klíčem k mému principu a algoritmu hledání nejsou v zásadě ty množiny, to prozrazuji, ale způsob, jak jejich komponenty tématicky spojuji.
Na příkladě Ranku mohu dokázat, že se můj Rank liší od PageRanku. Jak všichni vědí, PageRank je veličina statická a nezávisí na hledaném klíčovém slově (stačí jít na ranky.cz a vidíte, že se tam klíčové slovo nevyskytuje). Můj Rank je veličina dynamická a závisí na hledaném klíčovém slově. Počítá se třístupňovou iterací, na více by při odpovědi nebyl čas. Omlouvám se, že ten vzorec tady z pochopitelných důvodů nezveřejním, ale investorovi jsem při osobním jednání ochoten ten vzorec pro můj Rank zhruba napsat, a tak ukázat, že se liší od PageRanku i že je lepší.
Ještě malé vysvětlení: Rank i PageRank je určitá váha stránky, kterou příspívá ostatním stránkám, na které ukazuje. Je to jedno z N kriterií hledání, v současném Google má podle mého odhadu váhu 20 procent – je to jedno z důležitých kriterií, ale nikoli majoritní. Google má těch kriterií zhruba 108, někdo říká že až 200, já jich mám cca 30.
Ještě doplněk k předchozí odpovědi, aby nevznikl špatný dojem, že měním jen Rank. Můj princip hledání se promítá prakticky do všech kriterií algoritmu, dá se to představit tak, že si klasický algoritmus hledání natáhnete do Wordu a dáte funkci Nahraď „WWW stránky“ / „jiné objekty“. Ten Rank je akorát příklad kriteria, na kterém se to dá názorně ukázat.
Nerad bych se pouštěl do dalších spekulací a proto odbočím rovnou k té finanční otázce. Na zmíněném Webtrhu i Lupě máte své příznivce i odpůrce. Je ale na obzoru nějaký skutečný investor? Jednáte s někým?
Na WWW stránkách mám také rozpočet, v minimální i maximální variantě.
Přiznávám, že přesně nevím, jakou část Netu budu muset pro kvalitní optimalizaci vah kriterií stáhnout. Jedná se o zpětné linky (tedy ty, které míří z jiných WWW stránek na stránky hodnocené). Podstatné je, že v obou variantách s rozpočtem vyjdu.
Co se týče investorů, ano, měl jsem a mám několik jednání. Musím přiznat, že jsem trochu zklamán, čekal jsem, že na tak kvalitní projekt budou investoři stát frontu. Leč zatím se tak nestalo. Do dneška jsem získal 2 investory, celkem 110 tisíc Kč. Nyní jednám s cca 4 velkými investory a několika malými, ovšem nic dalšího není uzavřeno. Přemýšlel jsem, čím to je, udělal jsem relativně kvalitní stránky projektu a trošku poodhalil můj princip hledání (Kuličky a míče pro laiky i Grafické vysvětlení pro odborníky). Možná je to také tím, že mám na investory poměrně přísná kriteria a určitým způsobem si mezi nimi vybírám, nechci investici za každou cenu.
Zbytek dosavadního neúspěchu přičítám přece jen určité rizikovosti investice a také současné krizi (v ČR meziročně klesly investice rizikového kapitálo 10x). Třeba se pomocí Netzinu ten správný investor najde.
Vystoupil jste v televizním pořadu Den D. Jak tento pokus zpětně hodnotíte?
Velice neslavně. Kdybych to byl věděl, tak bych tam nechodil. Příčiny byly dvě. Já jsem nebyl dostatečně připraven, předem jsem si neprostudoval protivníka (tamní investoři nic jiného nebyli), hlavně jsem si ale v té době ještě neuvědomil, jak je moje myšlenka velká, a byl jsem tudíž spíše v obraně, než v útoku.
Druhou příčinou bylo, že investoři se mne vůbec neptali na podstatné věci (princip hledání, algoritmus hledání, jak jsem to vymyslel, obchodní model apod.). Místo toho se mne ptali na hezké ženy, vinné sklepy, případně dělali nejapné poznámky o nějakých Kanaďanech, které jsem neznal a nemohl znát.
Výrok jedné investorky „já ten milion mám, ale Vám ho nedám“ byl typickou ukázkou jejich arogance. Takže, suma sumárum, „trapas soutěž“. To by ještě tak nevadilo, oni dávali investici tak zhruba každému pátému, ale ten pořad mne hodně poškodil v očích dalších investorů.
Dovolte mi, abych zde citoval názor jedné Moravanky, který jsem dostal mailem (je to na adresu investorů ve Dni D):
„Takové aroganty jsem snad ještě neviděla a nezažila a tu šupu bych jim klidně dala. Skoro mám chuť tam něco napsat. Co si myslí, že tady jsme nějací pralesní lidé na Moravě? Že jen chlastáme a ještě tak chodíme do televize? Jsem ted docela v ráži, tak se mohou dočkat ještě hezkého článku.“
A nyní jste připraven? Co máte připraveno pro investora? Jak zní vlastně Vaše nabídka?
Ano, teďka jsem připraven. Sebekriticky znovu uznávám, že na Den D jsem nebyl.
Především mám ta dvě vysvětlení, Kuličky a míče pro laiky a Grafické vysvětlení pro odborníky. Říkám, co jsou to ty jiné objekty (tématicky spojené množiny komponent Netu), akorát neříkám, jak je konstruuji.
A, last but not least, mám připravenu náhradní variantu pro případ, že by to s prodejem algoritmu (Microsoftu) nevyšlo.
Investorovi nabízím za investici 1 milion Kč polovinu práv k projektu (fifty:fifty), případně menším investorům odpovídající podíly. Primárnám cílem, pro který bude investice použita, je realizovat minihledač, na něm můj algoritmus ověřit a tento algoritmus následně prodat Microsoftu pro Bing.
Pokud by toto nevyšlo, je sekundárním (alternativním) cílem realizovat a provozovat Nový český hledač, pro což mám připravenu finanční rozvahu.
Nezbývá než popřát hodně štěstí. A děkuju za rozhovor.
—-
S Petrem Hejlem můžete diskutovat na fóru Lupa.cz
Autor: Luboš Kudláček
Provozovatel Netzinu, autor knihy o WordPressu, publicista, blogger. Více na LubosKudlacek.cz