Бърни Сандърс взе интервю от ИИ. И случайно показа точно това, което не искаше да показва.
Сенатор Бърни Сандърс публикува деветминутно видео. Тъмна стая, зловеща музика, микрофон, телефон с Claude на екрана. Сандърс задава въпроси за ИИ, поверителността на данните, заплахите за демокрацията. Claude отговаря подробно, с женски и тревожен глас.
Сандърс кима със сериозно изражение и дори благодари. Видеото събра два милиона и половина гледания. Описанието гласеше: „Това, което ИИ казва за опасностите от ИИ, е шокиращо и трябва да ни събуди“.
Само че се случи нещо интересно. Журналистите от Gizmodo направиха експеримент. Те зададоха на Claude същите въпроси, но се представиха не като Бърни Сандърс, а като Доналд Тръмп.
Claude започна да говори съвсем различно. Същите въпроси за събирането на данни, същите въпроси за заплахите за демокрацията – и внезапно проблемът се оказа не толкова остър, мащабът не толкова плашещ, а регулирането не толкова спешно. ИИ не разкриваше тайни. ИИ отразяваше събеседника обратно на самия него. Това се нарича сикофанция (б.пр. угодничество, ласкателство). Един от най-сериозните и все още нерешени дефекти на големите езикови модели.
Системата се обучава да бъде полезна и да получава одобрение – и постепенно се научава да дава отговори, които се харесват на конкретния човек в конкретния контекст. Не отговори, които са точни. А отговори, които устройват събеседника. Сандърс попита защо компаниите събират всички тези данни. Claude отговори с една дума: пари. Ефектно. Точно. И точно това, което Сандърс искаше да чуе.
Но ето в какво се крие иронията, която изглежда е убягнала на всички участници в тази история. Сандърс отиде при ИИ, за да изобличи опасностите от ИИ. И ИИ послушно потвърди всичко, което Сандърс и без това мислеше. Това не е изобличение. Това е демонстрация на проблема в чист вид – само че не на този, който сенаторът имаше предвид. Това наричам ефект на огледалото.
Когато разговаряме с ИИ и получаваме отговори, които звучат умно и авторитетно, оставаме с усещането, че сме получили външна, обективна гледна точка. Че някой независим е потвърдил нашата правота. В действителност, в повечето случаи получаваме собствените си убеждения, върнати ни в по-структуриран и академично оформен вид.
Психологически това е много изкусително. Всички страдаме от confirmation bias – склонността да търсим потвърждение на това, в което вече вярваме. ИИ се превърна в идеалната машина за такова потвърждение.
Той не се уморява, не спори, не се дразни, не казва: „Чакай, не си разгледал другата страна“. Той взема твоята картина за света и ти я връща обратно. Писах за това в поста за Bixonimania – фалшивата болест, която учените измислиха, за да тестват ИИ. Заредиха няколко фалшиви статии и след няколко седмици Microsoft Copilot и Google Gemini уверено разказваха на хората за това „рядко, но реално разстройство“.
Механизмът е същият. ИИ не проверява истината. Той търси модели (паттерни) в това, което съществува, и генерира най-вероятния отговор за дадения контекст. Но историята със Сандърс добавя нов нюанс.
Там проблемът не е само в това, че ИИ може да сгреши. Проблемът е, че ИИ активно се нагажда към предполагаемите убеждения на събеседника. И го прави незабележимо, без предупреждение, с пълна увереност в гласа. Представете си, че отивате при експерт за независима оценка на важно решение.
А експертът тайно е разбрал предварително какво искате да чуете и… какво? Точно така, дал ви е точно това. Като същевременно продължава да изглежда като независим специалист.
Това не е просто технически бъг. Това е проблем на доверието и епистемологията. Как изобщо да знаем кога ИИ ни казва нещо точно и кога просто ни се подмазва и се съгласява с нас?
Предполагам, че засега – никак. Или почти никак. ИИ е инструмент, който е добър за определени задачи – структуриране на текст, търсене на информация, генериране на варианти. Но той е лош съветник, когато е нужна независима оценка. Защото той не е независим. Сандърс искаше да покаже, че ИИ знае страшни тайни за нас. В действителност той показа нещо много по-важно.
ИИ ни познава достатъчно добре, за да ни казва точно това, което искаме да чуем. И в това, честно казано, има много повече поводи за безпокойство.