Це (не) елементарне: як працює Уотсон

Що робить комп'ютер, щоб зрозуміти світ через чуття, навчання та досвід, як це говорить IBM, як робить Уотсон? Перш за все, тонн і тонн даних.

Для того, щоб побудувати тіло знань, для роботи Уотсона з Jeopardy, дослідники об'єдналися 200 мільйона сторінок контент, як структурований, так і неструктурований, у тому числі словники та енциклопедії. Коли його задають питання, Уотсон спочатку аналізує його, використовуючи більше алгоритмів 100, ідентифікуючи будь-які імена, дати, географічні розташування або інші об'єкти. Вона також вивчає фразову структуру та граматику питання, щоб краще визначити, про що запитується. Загалом, він використовує мільйони логічних правил для визначення найкращих відповідей.

Сьогодні Уотсон часто застосовується до нових областей, а це означає вивчення нових матеріалів. Дослідники починають завантажувати документи Word, PDF-файли та веб-сторінки в Уотсон, щоб накопичити свої знання. Потім питання і відповіді пар додаються, щоб тренувати Уотсон з цього питання. Щоб відповісти на запитання, Уотсон шукає мільйони документів, щоб знайти тисячі можливих відповідей. По дорозі він збирає докази і використовує алгоритм підрахунку для оцінки якості кожного товару. Виходячи з цього балів, він містить всі можливі відповіді і пропонує найкращий. Нижче наведено опис процесу більш докладно.

З часом Уотсон дізнається з його досвіду. Він також оновлюється автоматично, коли публікується нова інформація. З точки зору горіхів і болтів, Уотсон використовує Програмне забезпечення IBM DeepQA, а також різноманітні інші технології із власними та відкритими джерелами. У його оригінальній формі, в тому числі Hadoop і Apache UIMA (Unstructured Information Management Architecture), і кластер комп'ютерів 90 Power 750, що упаковують загальну кількість ядра процесорів 2880.

Сьогодні Watson поставляється через хмару, але, коли посилюється конкуренція, IBM замовчує основні специфіки.

"Наші міркування DeepQA та інші фундаментальні пізнавальні навички використовують методи глибокого вивчення, фірмові алгоритми та ядра відкритого коду та структури, які використовують апаратні технології, оптимізовані для цих робочих навантажень", - заявив віце-президент IBM Watson і директор компанії Rob High.

джерело

Залишити коментар

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.