Modul zur Suche nach KI-generierten Inhalten

Wir haben festgestellt, dass Studierende und Lehrkräfte aktiv verschiedene Mechanismen und Werkzeuge zur Inhaltserstellung nutzen, darunter auch KI-gestützte Tools.

KI-Tools sind mittlerweile ein fester Bestandteil des Bildungsprozesses, obwohl sie erst vor Kurzem eingeführt wurden. Studierende und Lehrkräfte setzen sie ein, da sie äußerst effizient, schnell und in der Lage sind, auf große Mengen an Informationen zuzugreifen. Dennoch sind mit der Nutzung von KI-Tools gewisse Risiken verbunden.

Unser Unternehmen hat sich entschieden, ein Modul zu entwickeln, das den Bedürfnissen von Bildungseinrichtungen, Organisationen und Verlagen gerecht wird. Eine Bildungseinrichtung, die über ein effektives Werkzeug zur Bekämpfung von Missbrauch beim Einsatz von ChatGPT, Bard und anderen KI-Tools verfügt, kann Studierende besser davor schützen, gegen die Prinzipien der akademischen Integrität zu verstoßen, und gleichzeitig die Qualitätsstandards der Bildung bewahren.

Der Bericht über KI-generierte Inhalte ist direkt in den interaktiven Ähnlichkeitsbericht integriert, was die Analyse besonders komfortabel macht. Zudem ermöglicht es eine gleichzeitige Bewertung des Dokuments anhand zweier Kriterien sowie das Hinterlassen von Kommentaren sowohl zu KI-generierten Inhalten als auch zu Plagiaten.

Durch Klicken auf Details im Abschnitt KI-Content-Suche lässt sich der zweite Bericht öffnen.

Farben im KI-Wahrscheinlichkeitsbericht


Unser Bericht erfasst sowohl das KI-Wahrscheinlichkeitsverhältnis als auch die KI-Wahrscheinlichkeit für einzelne Textfragmente durch eine farbliche Markierung der jeweiligen Abschnitte. Jede Farbe steht für die Wahrscheinlichkeit, ob der Text von einer KI oder einem Menschen verfasst wurde. Der Bericht zeigt eine Liste der Textfragmente sowie den KI-Wahrscheinlichkeitskoeffizienten für jedes Fragment.

🔹 Grün: Die Wahrscheinlichkeit, dass der Text von einer KI erstellt wurde, ist minimal.
🔹 Rot: Die Wahrscheinlichkeit, dass der Text von einer KI erstellt wurde, ist maximal.

Diese Farben können nicht manuell geändert, akzeptiert oder abgelehnt werden. Die Einschätzung der KI-Generierung erfolgt durch spezialisierte Module und Algorithmen, die derzeit zu den besten ihrer Art gehören.

Mehrsprachige KI-Inhaltserkennung

StrikePlagiarism.com erkennt KI-generierte Inhalte in über 100 Sprachen, darunter Englisch, Chinesisch (Mandarin), Hindi, Spanisch, Französisch, Arabisch, Portugiesisch, Indonesisch (Bahasa), Urdu, Deutsch, Vietnamesisch, Filipino (Tagalog), Malaiisch, Tamil, Italienisch, Khmer, Polnisch, Niederländisch, Rumänisch, Griechisch, Ungarisch, Tschechisch, Schwedisch, Dänisch, Slowakisch, Norwegisch, Finnisch, Litauisch, Estnisch usw., und gewährleistet beispiellose analytische Präzision sowie die Wahrung akademischer Integrität.

Was bedeutet die KI-Content-Wahrscheinlichkeit (Wahrscheinlichkeitskoeffizient)?

Der KI-Content-Wahrscheinlichkeitskoeffizient ist eine Vorhersage darüber, wie wahrscheinlich es ist, dass ein vollständiger Text von einer KI generiert oder von einem Menschen verfasst wurde. Dieser Koeffizient gibt jedoch nicht das Verhältnis von KI-generierten Texten zum Originalinhalt des Dokuments an.

Falls ein Dokument einen niedrigen Ähnlichkeitskoeffizienten aufweist, aber gleichzeitig einen hohen KI-Content-Wahrscheinlichkeitskoeffizienten, handelt es sich höchstwahrscheinlich um eine Fehleinschätzung des Systems. In solchen Fällen sollte das Dokument genauer analysiert werden.

KI-Content-Indikator


Um im Bericht gezielt nur diejenigen Textfragmente mit hoher KI-Wahrscheinlichkeit zu sehen, wurde ein spezielles Analysewerkzeug entwickelt. Mit dieser Funktion können Nutzer gezielt nur die interessantesten Fragmente anzeigen lassen, beispielsweise solche, bei denen der KI-Wahrscheinlichkeitskoeffizient 60 % oder 80 % überschreitet.

Zusätzlich nutzen wir einen Schwellenwert für den KI-Content-Indikator. Wird dieser aktiviert, hebt das System ausschließlich die Textfragmente hervor, deren Wahrscheinlichkeit den definierten Schwellenwert überschreitet.


Wie funktioniert die KI-Erkennung?


Unser Modul nutzt überwachtes Lernen mit mehreren Modellen, darunter eine modifizierte BERT-Architektur, um vorherzusagen, ob ein Text künstlich oder original ist. Die Künstliche Intelligenz wurde mit Millionen von Texten – sowohl KI-generierten als auch von Menschen verfassten – trainiert, um die Unterschiede zwischen beiden Kategorien zu erkennen. Nach jeder Trainingsphase wird ein umfangreicher Testdatensatz verwendet, um zu prüfen, ob das verbesserte Modell zuverlässigere Ergebnisse liefert.

Linguistische Analyse
Da KI-generierte Inhalte auf vordefinierten Mustern basieren, weisen sie oft charakteristische Merkmale auf, darunter wiederholte Phrasen, ungewöhnliche Syntax oder das Fehlen von Nuancen, die typisch für menschliches Schreiben sind.

Statistische Analyse
Viele Erkennungssysteme verwenden statistische Modelle, um die Textkomplexität, Satzstruktur und Wortwahl zu bewerten und festzustellen, ob ein Text von einer KI verfasst wurde. KI-generierte Texte zeichnen sich häufig durch eine gleichmäßige Satzstruktur und -länge aus, was sie von menschlichen Texten unterscheidet.

Maschinelles Lernen
Maschinelle Lernmodelle, beispielsweise Originality.AI, sind speziell darauf trainiert, menschliche und KI-generierte Texte zu unterscheiden. Diese Modelle nutzen verschiedene Merkmale des Textes – darunter die oben genannten Methoden –, um charakteristische Eigenschaften zu erkennen, die auf eine KI-Erstellung hinweisen.

Wichtige Hinweise zur KI-Erkennung

Das Modul erkennt mit einer Genauigkeit von über 94 % Texte, die mit GPT-3, GPT-3.5, GPT-4.0, GPT-Plus, GPT-Search und ChatGPT generiert wurden. Allerdings ist es nicht perfekt, und Fehler sind immer möglich.

Es ist viel besser, korrekter und sicherer, eine Reihe von Autorendokumenten zu analysieren, als eine Entscheidung basierend auf einem einzelnen Dokument zu treffen.

Die Länge des Dokuments spielt eine Rolle – je länger das Dokument, desto genauer das Ergebnis.
Der empfohlene Wert für den KI-Wahrscheinlichkeitskoeffizienten beträgt mehr als 60 %. Wenn der AIPC über 80 % liegt und der SC unter 20 %, sollte das Dokument sorgfältig analysiert werden.