Pagrindiniai pasiėmimai
- „Google“pristatė naują įrankį, leidžiantį naudotojams ieškoti dainų niūniuojant, dainuojant ar švilpaujant.
- Naujasis įrankis naudoja mašininį mokymąsi, kad suderintų skambantį takelį su daugiau nei pusės milijono dainų duomenų baze, kuri nuolat atnaujinama.
- „Google“naudotojai klausia, kuri daina grojama beveik 100 kartų per mėnesį.
„Google“pristatė naują funkciją „Hum to Search“, kad išspręstų varginančią problemą: galvoje įstrigo daina ir negalite suprasti, kaip ji vadinasi.
Idėja niūniuoti ieškant dainos atrodo neįtikėtinai paprasta, tad kodėl „Google“šią funkciją pristato tik 2020 m.? Na, pasirodo, kad tokiu būdu atpažinti dainas iš tikrųjų gana sudėtinga, iš dalies dėl to, kad mūsų niūniuojamos versijos paprastai gerokai skiriasi nuo originalaus takelio. Neseniai paskelbtame savo AI tinklaraščio įraše „Google“paaiškina, kaip ji naudojo mašininį mokymąsi, kad išspręstų šią problemą ir galiausiai padėtų žmonėms rasti dainą niūniuojant, švilpiant arba dainuojant melodiją, net kai jos perteikimas nėra toks tikslus.
„Mūsų tikslas Hum to Search padėti žmonėms atpažinti ir rasti muziką, kuri įstrigo jų galvoje“, – el. laiške Lifewire sakė „Google“atstovas.
Tiesiog pradėkite niūniuoti
„Google“naudotojai klausia, kuri daina grojama beveik 100 milijonų kartų kiekvieną mėnesį, Aparna Chennapragada, „Google“viceprezidentas ir vartotojų apsipirkimo generalinis direktorius, sakė vaizdo įraše, kuriame pristatomos kelios naujos paieškos funkcijos. Dabar yra būdas tai sužinoti.
Funkcija „Hum to Search“integruota į „Google“programą mobiliesiems, „Google“paieškos valdiklį ir „Google“padėjėją. Norėdami ją pasiekti naudodami programą, bakstelėkite mikrofono piktogramą ir pasakykite „What’s this song? Taip pat veikia mygtuko „Ieškoti dainos“pasirinkimas.
Kad ši funkcija veiktų tinkamai, reikia niūniuoti bent 10–15 sekundžių. „Android“naudotojai gali niūniuoti ieškodami dainų daugiau nei 20 kalbų, o „iPhone“įrenginiuose veikia tik angliškos dainos. Įrankis ne visada gali iš karto atpažinti dainą, bet kai tai pavyksta, rezultatai yra gana geri.
"Daugiau nei pusę įvairių kintamųjų (tono, tono, garsumo ir kt.) dainų atpažįsta mūsų algoritmai, tačiau, žinoma, tikslumas priklauso nuo dūzgimo kokybės, garso tipo. daina ir dar daugiau“, – el. laiške Lifewire sakė „Google“atstovas. "Tačiau kai tai atpažįstama, maždaug keturi iš penkių atsakymų yra teisingi."
Tačiau tai ne pirmas kartas, kai dūzgimas naudojamas muzikos atpažinimo programoje.„SoundHound“siūlo panašią funkciją, kaip pažymėjo CNN Business, ji taip pat pasiekiama „Android“ir „iOS“. Pasak „Google“atstovo, naujoji funkcija nekelia jokių rūpesčių dėl privatumo ir „nekeičia būdo, kaip „Google“tvarko su garsu pagrįstą sąveiką“, jie sakė „Lifewire“el. laiške.
Mašininis mokymasis
Nepaisant koncepcijos paprastumo, niūniuoti melodiją norint rasti studijinį įrašą techniškai gana sunku. Tam yra keletas priežasčių, lapkričio 12 d. tinklaraščio įraše aiškina Christianas Frankas iš Google tyrimų. Visų pirma, niūniuota dainos versija gali labai skirtis nuo tikrojo įrašo, todėl jas sunku suderinti. Taigi, nors „Shazam“ir daugybė kitų programų jau egzistuoja, kad būtų galima identifikuoti tą dainą, kurią girdite restorane ar kitoje viešoje vietoje, niūrią melodiją kaip pagrindą ieškoti gali būti sudėtingiau.
„Su dainų tekstu, foniniu vokalu ir instrumentais miuziklo ar studijinio įrašo garsas gali visiškai skirtis nuo niūniuojamos melodijos“, – rašo Frankas.„Dėl klaidos ar sumanymo, kai kas nors niūniuoja savo dainos interpretaciją, dažnai tonas, klavišas, tempas ar ritmas gali šiek tiek ar net labai skirtis“.
Kadangi niūniuojamos dainų versijos gali labai skirtis nuo originalių, Frankas pažymi, kad daugelis praeities metodų reikalavo suderinti žmogaus dūzgimą su dainos versija, kurioje yra tik melodija, arba takeliu, kuriame yra niūniavimas. Dėl to naudojimo realiame pasaulyje atvejai tapo sudėtingi, nes tų dainų duomenų bazės gali būti ribotos ir jas reikia atnaujinti rankiniu būdu.
„Google“paaiškina, kad funkcijai „Hum to Search“ji naudoja mašininio mokymosi modelius, kad paverstų garsą „skaičiais pagrįsta seka“, kuri atspindi dainos melodiją – tai, ką ji sako, gali būti laikoma „piršto atspaudu“."
Patogesnis vartotojui
Naudojant mašininį mokymąsi „Google Hum to Search“funkcijoje, įrankį daug lengviau naudoti realiame pasaulyje. Kadangi Hum to Search suderina ieškotojo niūniuojamą melodiją su tikrąja daina, įrankis gali dirbti su naujomis dainomis, kai jos išleidžiamos, o ne duomenų bazėje, kurią reikia nuolat atnaujinti su niūniuojamomis kiekvieno takelio versijomis. Be to, norint jį naudoti, nereikia tobulo tono.
„Dabartinė sistema pasiekia aukštą tikslumo lygį dainų duomenų bazėje, kurioje yra daugiau nei pusė milijono dainų, kurias nuolat atnaujiname“, – teigiama „Google“pranešime „Hum to Search“. „Šis dainų korpusas dar turi kur augti, kad įtrauktų daugiau daugelio pasaulio melodijų.“