Google AI posluša 15 let zaporednih posnetkov za skrite kitove pesmi – TechCrunch


Google in skupina cetologov, ki so se ukvarjali s igro, so izvedli raziskavo o letih podvodnih posnetkov, ki je temeljila na AI, v upanju, da bo ustvaril model strojnega učenja, ki bi lahko zaznal klicev kita pri grbu. Je del novega programa AI za socialno dobro, ki je precej očitno postavljen v nasprotju z pripovedjo, da se AI uporablja predvsem za prepoznavanje obrazov in ciljanje na oglase.

Kiti potujejo precej, ko iščejo boljše hranilne površine, tople vode in družabna srečanja. Seveda pa je ta gibanja težko slediti. Na srečo kiti kličejo drug drugega in pojejo na posamično prepoznavne načine in te pesmi lahko pod vodo potujejo na velike razdalje.

Torej, s svetovno mrežo poslušalnih naprav, zasajenih na oceanskem dnu, lahko spremljate gibanja kitov – če želite poslušati več let hrupa v ozadju in ročno izbrati klice. In tako smo že nekaj časa to storili, čeprav so računalniki pripomogli k zmanjšanju obremenitve. Googlova ekipa, v sodelovanju z NOAA, se je odločila, da se je to dobro ujemalo s talenti sistemov strojnega učenja.

Ti AI (tukaj smo uporabili izraz ohlapno tukaj) so odlični pri nabiranju tone hrupnih podatkov za določene vzorce, zato se uporabljajo za obsežne podatke, kakršne so iz radijskih teleskopov in CCTV kamer.

V tem primeru so bili podatki zapisi leta od desetih hidrofonov, ki so bili nameščeni po celotnem Pacifiku. Ta zbirka podatkov je bila v veliki meri raziskana, vendar so Googlovi raziskovalci želeli ugotoviti, ali lahko agent AI naredi zahtevno in dolgotrajno delo, da se prvič prenese na to in označi obdobja zanimivega zvoka z imenom vrste – v tem primeru hrbtenice , vendar bi lahko tako enostavno drugačen kita ali nekaj drugega.

Spektrogrami pesmi kitov, levi, neznan "ozkopasovni" šum, center in lasten trdi disk snemalnika, desno.

Zanimivo, a ne presenetljivo v poznejšem času, avdio ni bil analiziran kot tak – namesto tega je bil avdio pretvorjen v slike, ki bi jih lahko poglej za vzorce v. Ti spektrogrami so zapis o moči zvoka v različnih frekvencah skozi čas in se lahko uporabijo za vse vrste zanimivih stvari. Tako se zgodi, da jih dobro preučujejo tudi strojno učenje in raziskovalci računalniške vizije, ki so razvili različne načine za njihovo učinkovito analizo.

Model strojnega učenja je bil opremljen s primeri klicev kite s hrbtiščem in se naučil, kako jih z razumno natančnostjo identificirati v nizu vzorčnih podatkov. Različni poskusi so bili izvedeni, da bi ugotovili, katere nastavitve so bile optimalne – na primer, kakšna dolžina posnetka je bila enostavna za obdelavo in ne preveč, ali katere frekvence je mogoče varno prezreti.

Končni napor je razdelil leta podatkov v 75-sekundne posnetke, model pa je s 90-odstotno natančnostjo določil, ali je posnetek vseboval "humpback enoto" ali ustrezen zvok kita. Seveda to ni majhna napaka, če pa malo verjamete v stroj, pa prihranite kar nekaj časa – ali pa je čas vašega laboratorijskega pomočnika.

Drugi napor se je opiral na to, kar se imenuje nenadzorovano učenje, kjer je sistem določil svoja pravila o tem, kaj je bila podobna zvokom kitov in zvokih kitov, ki ustvarjajo ploskev, ki bi jo raziskovalci lahko razvrstili in poiskali ustrezne skupine.

Vizualizacija tega, kako je nenadzorovani model razvrstil različne zvoke. Modre označujejo hrbtne klice.

Za bolj zanimive vizualizacije je to težko razložiti, vsekakor pa se zdi, da ni uporaben niz klasifikacij kot bolj tradicionalna metoda.

Kot pri podobnih aplikacijah strojnega učenja na različnih znanstvenih področjih to ne bo nadomestilo skrbnega opazovanja in dokumentacije, temveč jih bo povečalo. Če nekaj naučimo iz znanstvenega dela, se raziskovalci osredotočajo na njihove posebnosti, ne pa na zasidranje v ponavljajočih se statističnih podatkih in v več urnih analizah podatkov.