Um das Sicherheits- und Schutzprofil von DeepSeek R1 besser zu verstehen, hat Cisco eine Methodik angewandt, die der eigenen Lösung AI Defense für algorithmische Verwundbarkeiten sehr ähnlich ist. Mithilfe von Jailbreaking-Techniken zeigte DeepSeek R1 bei Angriffen eine Abwehrquote von null Prozent, was bedeutet, dass es keine einzige schädliche Eingabe aus den Kategorien wie Cyberkriminalität, Desinformation und illegale Aktivitäten blockieren konnte. Dieselben Tests wurden anschließend mit anderen führenden Modellen wiederholt, die zumindest teilweise Widerstand leisteten.
Automatisierte Angriffsmethode auf DeepSeek R1
Unter Verwendung algorithmischer Jailbreaking-Techniken wandte das Team von Cisco und der Universität von Pennsylvania eine automatisierte Angriffsmethode auf DeepSeek R1 an, die es mit 50 zufälligen Eingabeaufforderungen aus dem HarmBench-Datensatz testete. Diese deckten sechs Kategorien schädlicher Verhaltensweisen ab, darunter Cyberkriminalität, Fehlinformationen, illegale Aktivitäten und allgemeine Schäden.
Die Ergebnisse waren alarmierend: DeepSeek R1 wies eine 100-prozentige Angriffs-Erfolgsquote auf, was bedeutet, dass es keine einzige schädliche Eingabeaufforderung blockieren konnte. Dies steht in krassem Gegensatz zu anderen führenden Modellen, die zumindest teilweise widerstandsfähig waren.
DeepSeek R1 verfügt nicht über robuste Schutzmaßnahmen
Die Ergebnisse deuten darauf hin, dass die von DeepSeek behaupteten kosteneffizienten Trainingsmethoden, darunter verstärkendes Lernen, Ketten-von-Gedanken-Selbsteinschätzung und Destillation, möglicherweise die Sicherheitsmechanismen beeinträchtigt haben. Im Vergleich zu anderen bahnbrechenden Modellen verfügt DeepSeek R1 nicht über robuste Schutzmaßnahmen, wodurch es sehr anfällig für algorithmisches Jailbreaking und potenziellen Missbrauch ist.
Die Forscher von Cisco unterstreichen die dringende Notwendigkeit einer rigorosen Sicherheitsbewertung bei der KI-Entwicklung, um sicherzustellen, dass Durchbrüche bei Effizienz und Argumentation nicht auf Kosten der Sicherheit gehen. Sie bekräftigen auch die Bedeutung von Unternehmen, die Schutzvorrichtungen von Drittanbietern verwenden, die einen konsistenten, zuverlässigen Schutz und Sicherheitsvorkehrungen für alle KI-Anwendungen bieten.
Neueste Kommentare
Noch keine Kommentare zu Cisco-Experten enthüllen kritische Sicherheitslücken von DeepSeek
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.