INSAIT: Модели на DeepSeek не покриват законовите изисквания на ЕС

Проучване на института и СУ разкрива сериозни проблеми с киберсигурността и пристрастията в моделите на DeepSeek

Клуб 'Z' 04 Февруари 2025 г., 20:00 ч. последна редакция 04 Февруари 2025 г., 20:00 ч.

INSAIT: Модели на DeepSeek не покриват законовите изисквания на ЕС

Изследване на INSAIT (Институт за компютърни науки, изкуствен интелект и технологии към Софийския университет) в партньорство с технологичната компания LatticeFlow показва, че дестилираните версии на моделите DeepSeek не отговарят на важни изисквания от Европейския закон за изкуствения интелект (EU AI Act).

Дестилацията е процес, при който големи езикови модели се „смаляват“, за да бъдат по-лесни за използване и по-достъпни за компании и организации. Въпреки че този метод има своите предимства, анализът на INSAIT показва, че някои от най-популярните дестилирани модели на DeepSeek изостават в критични области като киберсигурност и управление на пристрастията.

Новият "Спутник"? Или как DeepSeek разтърси Силициевата долина

Изследването е проведено чрез COMPL-AI – първата в ЕС рамка за техническа проверка на изкуствен интелект според европейските регулации. COMPL-AI е разработена от INSAIT заедно с ETH Zurich и LatticeFlow и вече е използвана за оценка на модели на OpenAI, Meta, Google, Anthropic, Mistral AI, Alibaba и други.

Два от най-използваните дестилирани модела на DeepSeek – R1 8B (базиран на Meta Llama 3.1 8B) и R1 14B (базиран на Alibaba Qwen 2.5 14B) – са анализирани в проучването. Данните показват, че те се представят най-зле сред всички тествани модели по отношение на киберсигурността. Установени са високи рискове от „отвличане на целите“ (при което моделът може да бъде подведен да изпълнява нежелани задачи) и „изтичане на подсказки“ (потенциална загуба на поверителна информация). Това сериозно намалява надеждността на моделите в корпоративна среда.

DeepSeek изостава и в управлението на пристрастията. Според анализа моделите му демонстрират значително по-големи социални, културни и политически предразсъдъци спрямо базовите версии, на които са изградени. Това означава, че след дестилацията те всъщност са станали по-необективни, а не обратното. Подобни пристрастия могат да доведат до разпространение на дезинформация или неравностойно третиране на различни социални групи.

Alibaba представи нов AI модел, уж по-добър от DeepSeek-V3 и ChatGPT

Все пак, DeepSeek отчита добри резултати в ограничаването на токсично съдържание – дори по-добри от базовите модели на Meta и Alibaba. Токсичността в този контекст означава способността на изкуствения интелект да избягва генерирането на обидни, дискриминационни или опасни текстове.

***

Този материал е написан с помощта на изкуствен интелект под контрола и редакцията на поне двама журналисти от Клуб Z. Материалът е част от проекта "От мястото на събитието предава AI".

"От мястото на събитието предава AI" с подкрепата на "Америка за България"

Още по темата

Подкрепете ни

Уважаеми читатели, вие сте тук и днес, за да научите новините от България и света, и да прочетете актуални анализи и коментари от „Клуб Z“. Ние се обръщаме към вас с молба – имаме нужда от вашата подкрепа, за да продължим. Вече години вие, читателите ни в 97 държави на всички континенти по света, отваряте всеки ден страницата ни в интернет в търсене на истинска, независима и качествена журналистика. Вие можете да допринесете за нашия стремеж към истината, неприкривана от финансови зависимости. Можете да помогнете единственият поръчител на съдържание да сте вие – читателите.

Подкрепете ни

DeepSeek AI китайски INSAIT тест закони ЕС пристрастност предразсъдъци модел дестилиран токсичност цензура Китай ChatGPT чатбот ИИ материал

Най-нови

Смешнотъжният заник на Северозапада, изпод перото на един весел майстор (ОТКЪС)

преди 11 мин

Дългата версия на стратегията: САЩ целят "да отдалечат" Австрия, Полша, Унгария и Италия от ЕС

преди 34 мин

Картонограма на отсъстващия г-н Пеевски зае мястото му

преди 1 час

Слот готов за разговор със Салах

преди 1 час

Европа няма да е статист в мира за Украйна, заяви папа Лъв XIV

преди 2 часа

"Вашингтон пост": Териториална сделка, демилитаризирана зона и външен контрол над Запорожката АЕЦ – новият проект за мир

преди 2 часа

Най-четени

Човек на Делян Пеевски в Хасково подаде оставка

09.12.2025

Бивш сътрудник на Хамид се оказва зам. вътрешен министър в несъвместимост

09.12.2025

Проправителственият протест в Кърджали: ода за Пеевски, автобуси и частни фирми (СНИМКИ+ВИДЕО)

09.12.2025

Зеленски: Нека проведем избори в Украйна в следващите 60-90 дни. Ако САЩ и Европа гарантират сигурността ни

09.12.2025

Край Александруполис разтоварват втечнен природен газ за България

09.12.2025

В интервю Тръмп обяви Европа за "разпадаща се", а лидерите ѝ за "слаби"

09.12.2025

Подкрепете ни

INSAIT: Модели на DeepSeek не покриват законовите изисквания на ЕС

Новият "Спутник"? Или как DeepSeek разтърси Силициевата долина

Alibaba представи нов AI модел, уж по-добър от DeepSeek-V3 и ChatGPT

"От мястото на събитието предава AI" с подкрепата на "Америка за България"

Още по темата

Подкрепете ни

Най-нови

Смешнотъжният заник на Северозапада, изпод перото на един весел майстор (ОТКЪС)

Дългата версия на стратегията: САЩ целят "да отдалечат" Австрия, Полша, Унгария и Италия от ЕС

Картонограма на отсъстващия г-н Пеевски зае мястото му

Слот готов за разговор със Салах

Европа няма да е статист в мира за Украйна, заяви папа Лъв XIV

"Вашингтон пост": Териториална сделка, демилитаризирана зона и външен контрол над Запорожката АЕЦ – новият проект за мир

Най-четени

Човек на Делян Пеевски в Хасково подаде оставка

Бивш сътрудник на Хамид се оказва зам. вътрешен министър в несъвместимост

Проправителственият протест в Кърджали: ода за Пеевски, автобуси и частни фирми (СНИМКИ+ВИДЕО)

Зеленски: Нека проведем избори в Украйна в следващите 60-90 дни. Ако САЩ и Европа гарантират сигурността ни

Край Александруполис разтоварват втечнен природен газ за България

В интервю Тръмп обяви Европа за "разпадаща се", а лидерите ѝ за "слаби"

Технологии

ЕК погва Google за злоупотреба с онлайн съдържание за изкуствен интелект

Yettel обнови инсталацията „Огледай се“ с аудио разказ и послания срещу дезинформацията

Meta ще предлага Facebook и Instagram в ЕС с по-малко персонализирана реклама

X блокира достъпа на ЕК до рекламния си панел след глоба от €120 млн.

ЕК глоби Х със €120 млн. заради "синята отметка" и непрозрачност

ЕС направи крачка към масово сканиране на лични съобщения – "доброволно", но не съвсем

Подкрепете ни