На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Суперкомпьютер IBM Watson отучат употреблять ненормативную лексику

Фото: ibm.com

Суперкомпьютер BM Watson способен распознавать смысл предложений/вопросов, а также отвечать на них, используя усвоенные массивы неструктурированных данных (data mining). Устройство стало известным благодаря победе над чемпионами телевикторины «Своя игра» (Jeopardy) в 2011 году. И недавней инициативой учёных стало закачивание в его память словаря уличного жаргона с сайта Urban Dictionary.

IBM выпустит мобильного голосового помощника на базе суперкомпьютера

Однако после закачки выяснилось, что уличный жаргон вредит IBM Watson, который бесконтрольно воспроизводит нецензурные выражение. Так, на один из вопросов в какой-то момент компьютер ответил ненормативным словом «Bullshit». Как объяснил один из создателей устройства, компьютер не может определять, какой смысл слова является приличным, а какой — нет.

Удалить словарь из памяти оказалось недостаточным, поскольку суперкомпьютер вычитывает информацию в «Википедии». Поэтому было принято решение очистить память суперкомпьютера от сленга и поставить фильтр на выдаваемые слова, пишет Habrahabr.

Картина дня

наверх