Суперкомпьютер BM Watson способен распознавать смысл предложений/вопросов, а также отвечать на них, используя усвоенные массивы неструктурированных данных (data mining). Устройство стало известным благодаря победе над чемпионами телевикторины «Своя игра» (Jeopardy) в 2011 году. И недавней инициативой учёных стало закачивание в его память словаря уличного жаргона с сайта Urban Dictionary.
IBM выпустит мобильного голосового помощника на базе суперкомпьютераОднако после закачки выяснилось, что уличный жаргон вредит IBM Watson, который бесконтрольно воспроизводит нецензурные выражение. Так, на один из вопросов в какой-то момент компьютер ответил ненормативным словом «Bullshit». Как объяснил один из создателей устройства, компьютер не может определять, какой смысл слова является приличным, а какой — нет.
Удалить словарь из памяти оказалось недостаточным, поскольку суперкомпьютер вычитывает информацию в «Википедии». Поэтому было принято решение очистить память суперкомпьютера от сленга и поставить фильтр на выдаваемые слова, пишет Habrahabr.