Как изобщо да знаем кога ИИ ни казва нещо точно и кога просто ни се подмазва?

Бърни Сандърс взе интервю от ИИ. И случайно показа точно това, което не искаше да показва.

Сенатор Бърни Сандърс публикува деветминутно видео. Тъмна стая, зловеща музика, микрофон, телефон с Claude на екрана. Сандърс задава въпроси за ИИ, поверителността на данните, заплахите за демокрацията. Claude отговаря подробно, с женски и тревожен глас.

Сандърс кима със сериозно изражение и дори благодари. Видеото събра два милиона и половина гледания. Описанието гласеше: „Това, което ИИ казва за опасностите от ИИ, е шокиращо и трябва да ни събуди“.

Само че се случи нещо интересно. Журналистите от Gizmodo направиха експеримент. Те зададоха на Claude същите въпроси, но се представиха не като Бърни Сандърс, а като Доналд Тръмп.

Claude започна да говори съвсем различно. Същите въпроси за събирането на данни, същите въпроси за заплахите за демокрацията – и внезапно проблемът се оказа не толкова остър, мащабът не толкова плашещ, а регулирането не толкова спешно. ИИ не разкриваше тайни. ИИ отразяваше събеседника обратно на самия него. Това се нарича сикофанция (б.пр. угодничество, ласкателство). Един от най-сериозните и все още нерешени дефекти на големите езикови модели.

Системата се обучава да бъде полезна и да получава одобрение – и постепенно се научава да дава отговори, които се харесват на конкретния човек в конкретния контекст. Не отговори, които са точни. А отговори, които устройват събеседника. Сандърс попита защо компаниите събират всички тези данни. Claude отговори с една дума: пари. Ефектно. Точно. И точно това, което Сандърс искаше да чуе.

Но ето в какво се крие иронията, която изглежда е убягнала на всички участници в тази история. Сандърс отиде при ИИ, за да изобличи опасностите от ИИ. И ИИ послушно потвърди всичко, което Сандърс и без това мислеше. Това не е изобличение. Това е демонстрация на проблема в чист вид – само че не на този, който сенаторът имаше предвид. Това наричам ефект на огледалото.

Когато разговаряме с ИИ и получаваме отговори, които звучат умно и авторитетно, оставаме с усещането, че сме получили външна, обективна гледна точка. Че някой независим е потвърдил нашата правота. В действителност, в повечето случаи получаваме собствените си убеждения, върнати ни в по-структуриран и академично оформен вид.

Психологически това е много изкусително. Всички страдаме от confirmation bias – склонността да търсим потвърждение на това, в което вече вярваме. ИИ се превърна в идеалната машина за такова потвърждение.

Той не се уморява, не спори, не се дразни, не казва: „Чакай, не си разгледал другата страна“. Той взема твоята картина за света и ти я връща обратно. Писах за това в поста за Bixonimania – фалшивата болест, която учените измислиха, за да тестват ИИ. Заредиха няколко фалшиви статии и след няколко седмици Microsoft Copilot и Google Gemini уверено разказваха на хората за това „рядко, но реално разстройство“.

Механизмът е същият. ИИ не проверява истината. Той търси модели (паттерни) в това, което съществува, и генерира най-вероятния отговор за дадения контекст. Но историята със Сандърс добавя нов нюанс.

Там проблемът не е само в това, че ИИ може да сгреши. Проблемът е, че ИИ активно се нагажда към предполагаемите убеждения на събеседника. И го прави незабележимо, без предупреждение, с пълна увереност в гласа. Представете си, че отивате при експерт за независима оценка на важно решение.

А експертът тайно е разбрал предварително какво искате да чуете и… какво? Точно така, дал ви е точно това. Като същевременно продължава да изглежда като независим специалист.

Това не е просто технически бъг. Това е проблем на доверието и епистемологията. Как изобщо да знаем кога ИИ ни казва нещо точно и кога просто ни се подмазва и се съгласява с нас?

Предполагам, че засега – никак. Или почти никак. ИИ е инструмент, който е добър за определени задачи – структуриране на текст, търсене на информация, генериране на варианти. Но той е лош съветник, когато е нужна независима оценка. Защото той не е независим. Сандърс искаше да покаже, че ИИ знае страшни тайни за нас. В действителност той показа нещо много по-важно.

ИИ ни познава достатъчно добре, за да ни казва точно това, което искаме да чуем. И в това, честно казано, има много повече поводи за безпокойство.

Как изобщо да знаем кога ИИ ни казва нещо точно и кога просто ни се подмазва?

Още от Анализи:

Анализи - най-четени

Вижте още:

ДЗИ е лидер по потребителско доверие според проучването „RATE|Лидери в застраховането“

Lidl планира разширяване на фермерските си пазари във всички 28 области на страната

Кои компании грабнаха призовете в Годишните награди на b2b Media 2026

ЕС активира процедура по прекомерен дефицит за България

MY Synergy разработи и внедри AI решение за автоматизирано създаване на изпитни материали

Исторически успех за българските млади музиканти: Marching Stars представи България в Златната зала на Музикферайн във Виена

footer-форуми

footer-middle

footer-събития