Kaj je Google DeepMind?

by Jeremy Laukkonen

Kako poglobljeno učenje je vgrajeno v izdelke, ki jih uporabljate

DeepMind se lahko nanaša na dve stvari: tehnologijo za Googlovo umetno inteligenco (AI) in podjetje, ki je odgovorno za razvoj te umetne inteligence. Družba DeepMind je hčerinska družba Alphabet Inc., ki je tudi Googlova matična družba in tehnologija umetne inteligence podjetja DeepMind je našla pot v številne Googlove projekte in naprave .

Če uporabljate Google Home ali Google Assistant , se je vaše življenje že presenetilo z Google DeepMindom na nekaj presenetljivih načinov.

Kako in zakaj je Google kupil DeepMind?

DeepMind je bil ustanovljen leta 2011 s ciljem "reševanja inteligence in nato z uporabo tega rešiti vse ostalo." Ustanovitelji so se lotili problema strojnega učenja, oboroženega z vpogledi v nevroznanost, s ciljem ustvarjanja močnih algoritmov splošnega namena, ki bi lahko da se naučijo in ne potrebujejo programiranja.

Več velikih igralcev na področju AI je zaznamovalo ogromno talentov, ki jih je DeepMind združil v obliki strokovnjakov za umetno inteligenco in raziskovalce, družba Facebook pa je igrala igro za pridobitev leta 2012.

Dogovor na Facebooku se je razčlenil, Google pa je v letu 2014 prodal DeepMind in ga kupil za okoli 500 milijonov dolarjev. DeepMind je nato postal hčerinsko podjetje Alphabet Inc. med prestrukturiranjem podjetja Google, ki je potekal leta 2015 .

Googlov glavni razlog za nakup DeepMind je bil, da skoči na začetek lastnih raziskav umetne inteligence. Medtem ko je DeepMind glavni kampus ostal v Londonu v Angliji po prevzemu, je bila uporabljena ekipa poslana na Googlov sedež v Mountain Viewu v Kaliforniji, da bi se ukvarjal z vključevanjem DeepMind AI z Googlovimi izdelki.

Kaj je Google Doing With DeepMind?

Cilj DeepMind za reševanje inteligence se ni spremenil, ko so ključe predali Googlu. Delo se je nadaljevalo na globokem učenju , kar je vrsta strojnega učenja, ki ni specifična za nalogo. To pomeni, da DeepMind ni programiran za določeno nalogo, za razliko od prejšnjih AI.

Na primer, IBM-ova Deep Blue znano je premagal šahovski velemajstor Gary Kasparov. Vendar je bila Deep Blue zasnovana za izvajanje te posebne funkcije in ni bila uporabna zunaj tega cilja. Po drugi strani pa je DeepMind zasnovan tako, da se učijo iz izkušenj, kar teoretično pomaga pri številnih različnih aplikacijah.

Umetna inteligenca DeepMinda se je naučila, kako igrati zgodnje video igrice, kot je Breakout, boljša od najboljših človeških igralcev, in računalniški program Go, ki ga poganja DeepMind, je uspel premagati prvaka Go igralec pet na nič.

Google poleg čistih raziskav vključuje DeepMind AI v svoje vodilne izdelke za iskanje in potrošniške izdelke, kot so domači in Android telefoni.

Kako Google DeepMind vpliva na vaše vsakodnevno življenje?

Globalni učni pripomočki podjetja DeepMind so bili implementirani v celotnem spektru Googlovih izdelkov in storitev, zato če uporabljate Google za vse, obstaja velika verjetnost, da ste na nek način sodelovali z DeepMindom.

Nekatera najvidnejša mesta DeepMind AI so bila uporabljena za prepoznavanje govora, prepoznavanje slik, odkrivanje goljufij, odkrivanje in prepoznavanje neželene pošte, prepoznavanje rokopisa, prevajanje, pogled ulic in celo lokalno iskanje.

Googleovo natančno prepoznavanje govora

Prepoznavanje govora ali zmožnost računalnika za tolmačenje govorjenih ukazov je že dolgo časa, vendar jih je Siri , Cortana , Alexa in Google Assistant všeč vedno bolj v naše vsakodnevno življenje.

V primeru Googlove lastne tehnologije za prepoznavanje govora je bilo dobro učenje uporabljeno za velik učinek. Dejansko je strojno učenje omogočilo Googlovemu prepoznavanju govora, da doseže presenetljivo raven natančnosti za angleški jezik, do točke, kjer je ravno tako točna kot človeški poslušalec.

Če imate katero koli Googlovo napravo, na primer Android Phone ali Google Home, ima to v vaši življenjski ravni neposredno aplikacijo v realnem svetu. Vsakič, ko pravite: "V redu, Google", ki mu sledi vprašanje, DeepMind prilagaja svoje mišice, da pomaga Googlovemu pomočniku, da razume, kaj govoriš.

Ta uporaba strojnega učenja v prepoznavanju govora ima dodaten vpliv, ki velja posebej za Googlov dom. Za razliko od Amazonove Alexe, ki uporablja osem mikrofonov za boljše razumevanje glasovnih ukazov, je za prepoznavanje glasu v Googlovi dom DeepMind pogon potreben samo dva.

Googlova domača in pomoč pri generaciji glasu

Tradicionalna sinteza govora uporablja nekaj, kar imenujemo konkatenativni tekst-v-govoru (TTS). Ko komunicirate z napravo, ki uporablja to metodo sinteze govora, se posvetuje z zbirko podatkov, polnih fragmentov govora, in jih sestavlja v besede in stavke. To ima za posledico čudno prepletene besede in ponavadi je zelo jasno, da za glasom ni človeka.

DeepMind se je lotil generacije glasov s projektom WaveNet. To omogoča umetno ustvarjene glasove, kot je tisto, ki jo slišite, ko se pogovarjate z vašim Googlovo domačo hišo ali Google Asistentom v vašem telefonu, da zvok postane bolj naraven.

WaveNet se opira tudi na vzorce resničnega človeškega govora, vendar jih ne uporablja za sintezo ničesar neposredno. Namesto tega analizira vzorce človeškega govora, da bi izvedel, kako delujejo surovi zvoki valovnih oblik. To omogoča, da se usposobi za govorjenje različnih jezikov, uporabo naglasov ali celo usposabljanje, da zveni kot določena oseba.

Za razliko od drugih sistemov TTS, WaveNet ustvarja tudi ne-govorne zvoke, kot sta dihanje in ušesanje ustnic, kar se lahko zdi še bolj realistično.

Če želite slišati razliko med glasom, ustvarjenim s pomočjo konkatenativnega besedila v govor, in tistega, ki ga generira WaveNet, ima DeepMind nekaj zelo zanimivih glasovnih vzorcev, ki jih lahko poslušate.

Globoko učenje in iskanje fotografij v Googlu

Brez umetne inteligence se iskanje slik nanaša na kontekstne sledi, kot so oznake, okoliško besedilo na spletnih mestih in imena datotek. S DeepMind-jevimi globokimi učnimi orodji je bilo mogoče iskanje Google Foto dejansko spoznati, kakšne so izglede, kar vam omogoča iskanje lastnih slik in doseganje ustreznih rezultatov, ne da bi morali označevati ničesar.

Na primer, lahko iščete "psa" in bo fotografiral vašega psa, ki ste ga vzeli, čeprav jih nikoli niste označili. To je zato, ker je bilo mogoče naučiti, kaj psi izgledajo, na podoben način, da se ljudje naučijo, kaj izgledajo. In za razliko od Googlovega globokega sanja, ki je obseden z psom, je več kot 90 odstotkov natančnih pri prepoznavanju vseh vrst različnih slik.

DeepMind v Google Objektivu in vizualnem iskanju

Eden od najbolj osupljivih učinkov, ki jih je DeepMind naredil, je Google Lens. To je v bistvu vizualni iskalnik, ki vam omogoča, da posnamete sliko o nekaj v realnem svetu in takoj vzamete informacije o njem. In brez DeepMinda ne bi delovalo.

Čeprav je izvajanje drugačno, je to podobno načinu, kako se globoko učenje uporablja pri iskanju slik v storitvi Google+. Ko fotografirate, lahko Google Lens pogleda in razkrije, kaj je. Na podlagi tega lahko opravlja različne funkcije.

Če na primer vzamete sliko znamenitega mejnika, vam bo dala podatke o mejnem stiku ali pa, če posnamete sliko lokalne trgovine, lahko vzpostavi informacije o tej trgovini. Če je v sliki vključena telefonska številka ali e-poštni naslov, ga lahko prepoznate tudi Google Lens, in vam bo dala možnost, da pokličete številko ali pošljete e-poštno sporočilo.