Google använder sig av maskininlärningsteknik för att förbättra sökresultaten de levererar. Konceptet går under namnet RankBrain och är en del av Googles övergripande rankningssystem.

RankBrain är ett AI-system som använder sig av maskininlärning. Den går igenom stor mängd data relaterat till sökningar gjorda på Google och analyserar dem för att i ett senare led kunna förbättra sökresultaten.

Infon samlad i den här texten kommer från olika ställen. Dels storyn från Bloomberg som först släppte nyheten om RankBrain. Google har också släppt viss information till Search Engine Land. Där informationen lämnar gråzoner får vi förlita oss på rimliga antaganden och kvalificerade gissningar.

 

Vad är RankBrain?

Det är Googles namn för en artificiell intelligens som använder maskininlärning. RankBrain bearbetar och analyserar sökresultat, så som rapporterats av Bloomberg och som senare bekräftats av Google.

 

Vad är maskininlärning?

Det är när en dator lär sig någonting själv istället för att lära sig av människor eller förlita sig på detaljerad programmering. Genom att studera exempel kan AIn göra förutsägelser gällande data. Den kan då genom analys av tidigare bearbetad data framställa egna prognoser eller beslut.

 

Vad är artificiell intelligens?

En sann AI är potentiellt lika smart som en människa, om inte smartare. Maskininlärning är ett av områdena inom artificiell intelligens och AI används ofta för att beskriva ett system som använder sig av just maskininlärning. Systemet hämtar alltså information och lär sig genom att se samband och kopplingar inom datan.

 

Ersätter RankBrain Googles tidigare rankningssystem?

Nej, RankBrain är designat som en del av Googles övergripande algoritm. Algoritmen sorterar fram sökresultat bland de miljarder av sidor den känner till. Därifrån plockar den fram den information som bedöms vara mest relevant för sökningen. RankBrain är en del i den här stora processen.

 

Men vad heter algoritmen då?

Den heter Hummingbird. Länge hade algoritmen inte något officiellt namn, men i samband med en stor genomgång och uppdatering under 2013 blev den också döpt!

 

Är RankBrain en del av Hummingbird?

Ja, så vitt vi vet är det så. Precis som ett kugghjul har många piggar för att det ska kunna driva framåt så har också Hummingbird många delar. Google förlitar sig på över 200 signaler för att sortera fram rätt resultat. Vi kan utröna att RankBrain är en del bland många eftersom artikeln från Bloomberg förklarar att RankBrain inte hanterar alla sökningar som görs. En övergripande algoritm skulle ha hanterat allt.

För de som jobbar med SEO är en del av namnen på Hummingbirds olika delar välbekanta; Panda, Penguin och Payday jobbar med att motverka spam. Pigeon används för att förbättra lokalt sök. Top Heavy är designad för att degradera sidor med allt för mycket reklam. Mobile Friendly belönar mobilvänliga sidor och Pirate jobbar mot de som bryter mot copyrightlagar.

Tillsammans bildar många delar och signaler algoritmen Hummingbird och alla delarna behövs för att få maskineriet att snurra.

 

Heter inte algoritmen PageRank?

PageRank är en annan del av Hummingbird som på ett speciellt sätt rankar webbplatser baserat på vad som länkar till webbplatsen i fråga. PageRank var den första algoritmen som fick ett alldeles eget namn av Google och därför har den blivit extra känd.

 

Vad betyder det där med ”signaler” som Google använder för rankning?

Signaler är olika delar som Google använder för att ranka en sida. Till exempel så läser Google av och identifierar orden på hemsidor – så själva orden är i sig en signal. Om ett ord är markerat i fetstil kan det också räknas som en signal. Beräkningar från PageRank-algoritmen är ännu en och det finns ytterligare signaler som handlar om mobil användarvänlighet. Alla de här olika signalerna används sedan inom Hummingbird för att sålla fram det mest relevanta sökresultatet.

 

Hur många signaler finns det egentligen?

Google har ganska konsekvent pratat om ”över 200 signaler”. De kan i sin tur ha otroligt många variationer eller sub-signaler och det kan resultera i en total summa på uppemot 10000 olika faktorer.

 

Hur viktig är RankBrain i förhållande till andra signaler?

RankBrain seglar rakt in på en tredjeplats. Enligt Bloombergartikeln har RankBrain stigit till den här graden under det fåtal månader den har varit igång.

 

Vilka är de två viktigaste signalerna?

Det enda som just nu toppar RankBrain är bra content och kvalitativa länkar.

 

Vad, exakt, är det RankBrain gör?

Den används för att gå igenom och analysera sökningar som gjorts på Google. RankBrain letar till exempel efter sidor som är relevanta, men som kanske inte innehåller den exakta ordalydelsen som sökts på.

 

Har inte Google redan sätt att hitta sidor relaterade till sökningen, men som inte innehåller exakt samma ord?

Till en viss grad har Google kunnat lista ut vad det är du letar efter. De har använt sig av listor med snarlika ord; jämför strumpa och strumpor. Från början förstod sökmotorn inte att det är i stort sett samma ord. Det här kallas stemming  och det gjorde sökmotorn mycket smartare. Numer är vi vana vid att Google förstår variationer av ord och fixar till sökningen åt oss. Sökmotorn förstår också synonymer och kan hantera och förstå vissa koncept. Till exempel förstår den att det är skillnad på tomten som marken kring ditt hus och tomten som gubben i röd luva som dyker upp vid jul.

 

Visar inte Googles Knowledge Graph redan information utan att du använt exakt ordföljd?

2012 dök Googles Knowledge Graph upp och påvisade ännu ett sätt som sökmotorn blivit smartare på. Själva beskrev företaget det som ”things not strings” där strings betyder att du söker efter vissa trådar av bokstäver. Med strings måste sökningen alltså matcha med exakt rätt ord.

Googles Knowledge Graph är istället en databas med fakta om saker i världen och hur de hänger ihop. Den låter dig få reda på information även om du inte träffar exakt rätt ord, eller som i exemplet här, rätt namn; Om du söker på ’birthday of wife of zlatan’ så kommer Helena Segers information att dyka upp. I toppen av inforutan dyker hennes födelsedag upp i stor teckenstorlek. Utan att du vet det rätta namnet så söker Google sig ändå fram till rätt svar.

 

Hur hjälper RankBrain till att förbättra sökresultaten?

Idag baseras till stor del Googles metoder på mänskligt arbete. Själva sökningen är automatiserad, men någon har lagt till saker som stemming lists och synonymordlistor. Allt sådant har Google investerat en otrolig mängd tid i, men det finns ändå alltid mer jobb att göra.

Google hanterar mer än tre miljarder sökningar per dag och de säger själva att upp till 15 % av sökningarna är helt nya sökningar som inte setts tidigare. Det blir alltså uppemot 450 miljoner sökningar per dag som är nya för systemet. Många av dem är unika på det viset att de innehåller flertalet ord.

RankBrain är designad för att analysera de här sökningarna för att på ett mer effektivt sätt kunna översätta dem till saker som sökmotorn redan känner till så att den lättare kan hitta vad användaren vill ha. RankBrain kan se extremt komplexa mönster mellan till synes orelaterade sökningar. Genom att analysera de sökningar som görs får AIn en bättre förståelse för möjliga framtida sökningar. Analyserandet och sammankopplandet av information gör i slutändan att användaren får ett mer relevant sökresultat.

 

Kan Bing också göra detta med RankNet?

Redan 2005 startade Microsoft maskininlärningsprogrammet RankNet som en del av vad som senare blev Bing. Microsoft har under årens lopp sällan nämnt RankNet, men vi förväntar oss att det blir ändring på det nu. Även om både Microsoft och Google har artificiell intelligens som jobbar med maskininlärning så är det otroligt svårt att på riktigt jämföra RankNet och RankBrain. Företagen vill, av uppenbara skäl, inte ge ut för mycket detaljer. Det vi kan se är att samma ’long string searches’ producerar liknande resultat i båda sökmotorerna.

 

Gör RankBrain verkligen någon skillnad?

Det är svårt att säga exakt hur mycket skillnad den gör, men Google har traditionellt varit mycket försiktiga med vad som används för deras rankningsalgoritm. De testar småsaker hela tiden, men genomför bara stora förändringar när de är mycket säkra på ett positivt resultat. Eftersom de integrerat RankBrain i algoritmen så till den grad att den nu är den tredje viktigaste faktorn så visar det att Google själva sett stor nytta med systemet.

 

När startade RankBrain?

Enligt Google startades RankBrain upp gradvis under en längre tidsperiod i början på 2015. Nu har den dock varit live på den globala sökmarknaden i minst ett halvår.

 

Vilka sökningar påverkas?

I oktober 2015 sa Google till Bloomberg att en stor del av de 15 % nya sökningar som dyker upp passas vidare till RankBrain. Då var det alltså 15 % eller mindre som hanterades av RankBrain. I juni 2016 kom däremot nyheten att RankBrain nu på ett eller annat vis är involverad i alla sökningar som görs på Googles sökmotor. Det här är ännu ett tecken på varför RankBrain kvalar in som tredje viktigaste signal.

 

Lär sig RankBrain hela tiden?

Enligt Google så får RankBrain data att analysera i omgångar. Det är historisk sökdata eftersom AIn jobbar offline. RankBrains lärdomar testas och om de visar sig fungera bra så uppdateras Hummingbird utifrån det RankBrain lärt sig.

 

Var kan jag lära mig mer?

Spana på det här inlägget angående hur maskininlärningen fungerar och omsätts praktiskt. Google har också tipsat om att lära sig mer om ’vectors’ – sättet på vilket ord och fraser matematiskt kan kopplas ihop.

Du kan prova maskininlärning själv med Googles verktyg word2vec.

Google har en sida med artiklar om maskininlärning och AI. Naturligtvis kan du också titta på Microsofts motsvarande sida med artiklar inom samma ämne.