Microsoft forskere arbejder på AI-nøjagtighed, da det bliver smartere hver dag

Kunstig intelligens har hjulpet menneskeheden med at drømme om at gøre ting, der ser ud til at være umulige for bare et årti. Folk i dag forkæler sig mere med at bruge systemer, bygget ved hjælp af teknologier, der direkte opslynges Maskinelæring. Dette kræver et behov for en realitetskontrol af de testværktøjer, som sådanne systemer bruger, algoritmerne, træningssættene osv., Så vi ved, at de systemer, vi er afhængige af, for vores daglige aktiviteter er nøjagtige og som ligehåndede som muligt.

microsoft ai

Træningsdatasæt i AI: Hvor stærkt er grundlaget?

Ece Kamar, en forsker i Microsofts adaptive systemer og interaktionsgruppe, arbejder på at bruge en kombination af algoritmer og menneskelig ekspertise for at eliminere data- og systemfejl. Kamar siger, at folk allerede har tillid til AI for vigtige opgaver i deres daglige liv, hvorfor det er lige så vigtigt for os - udviklerne og forskerne at spore tilbage og se, hvor systemerne begår fejl.

Kamar har påpeget nogle praktiske mangler ved træningsdatasættet, som udviklerne bruger til at lære systemet at udføre en bestemt opgave. Sådanne træningsdatasæt kan have blinde pletter, der kan føre til, at systemet leverer falske resultater. Mange udviklere og forskere er afhængige af sådanne træningsdatasæt i stedet for at bygge et selv, baseret på systemkrav, hvilket kan resultere i manglende læring af den specifikke opgave, der er til rådighed. Kamar og hendes kolleger har således arbejdet på en algoritme, der kan bruges til at identificere sådanne blinde pletter i forudsigelige modeller, hvilket giver udviklere og forskere mulighed for at udfylde revnerne, før de frigøres systemet.

I et andet forskningsdokument siger Kamar og teamet at vise den direkte korrespondance mellem de forskellige type fejl i et komplekst AI-system og de forkerte resultater, der smides ud af sådanne systemer. Med en defineret metodologi sigter Kamar at hjælpe forskerne med at identificere problemerne, fejlfinde dem og udrydde muligheden for potentiel systemsvigt.

Microsoft Speech Language Translation Corpus

I et andet forsøg på at afprøve nøjagtigheden af ​​samtaleoversættelsen har Christian Federmann, en senior programleder, der arbejder med Microsoft Translator-teamet, udviklet sammen med sine kolleger, Microsoft Speech Language Translation (MSLT) Corpus der fungerer som et standardiseret datasæt til test af tosprogede samtaleoversættelsessystemer. Udgivet nu til offentlig brug indeholder MSLT Corpus samtale-, tosprogede taletest- og indstillingsdata for engelsk, fransk og tysk indsamlet af Microsoft Research.

Corpus, der stammer fra behovet for et datasæt af høj kvalitet, mens det sigter mod en test af høj kvalitet, og fokuserer på at skabe en standard, som folk kan måle, hvor godt deres oversættelsessystem til samtale fungerer. Forskere og udviklere, der arbejder inden for konversationsoversættelsessystemer, stoler normalt på data, der er frit tilgængelige, men ikke op til mærket til test af sådanne avancerede systemer.

Holdet på microsoft håber, at Corpus vil gøre det godt med oversættelsesfeltet til samtale og hjælpe med at skabe endnu mere standardiserede benchmarks. Begge disse forskningsartikler vil blive præsenteret på AAAI-konference om kunstig intelligens, der i øjeblikket afholdes i San Francisco og hjælper udviklere og forskere, der arbejder inden for de relevante felter, med at drive fremad.

Kilde

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.