Module de recherche de contenu IA

Nous avons remarqué que les étudiants et les enseignants utilisent activement divers mécanismes et outils pour la création de contenu, y compris les outils d'IA.

Les outils d'IA sont devenus une partie intégrante du processus éducatif, bien qu'ils ne soient apparus que récemment. Les étudiants et les enseignants les utilisent car ils sont très efficaces, rapides et ont accès à une grande quantité d'informations. Cependant, l'utilisation des outils d'IA comporte certains risques.

Notre entreprise a décidé de créer un module qui répondrait aux besoins des institutions éducatives, des organisations et des maisons d'édition. Une institution éducative, disposant d'un outil efficace pour lutter contre les abus qui peuvent survenir lors de l'utilisation de ChatGPT, Bard et d'autres outils d'IA, sera en mesure de mieux protéger les étudiants contre les violations des principes d'intégrité académique et de préserver les normes de qualité de l'éducation.

Le rapport de contenu IA est intégré dans le rapport interactif sur la similarité, ce qui facilite grandement l'analyse. Il est également pratique d'évaluer le document sur deux critères à la fois et de laisser des commentaires concernant à la fois l'IA et le plagiat.

En cliquant sur Détails dans la section Recherche de contenu IA, vous pourrez ouvrir le deuxième rapport.

Couleurs dans le rapport de probabilité IA

Notre rapport trace à la fois le ratio de probabilité IA et la probabilité IA pour chaque fragment de texte en coloriant les fragments. Chaque couleur représente la probabilité que le texte soit écrit par une IA ou par un humain. Le rapport affiche une liste de fragments et le coefficient de probabilité IA pour chaque fragment.

Si le texte est vert, la probabilité qu'il soit écrit par une machine est minimale. S'il est rouge, la probabilité qu'il soit écrit par une machine est maximale.

Ces couleurs ne peuvent pas être modifiées manuellement, acceptées ou rejetées. La probabilité que le texte soit écrit par une machine est vérifiée par les modules et les algorithmes les plus performants à ce jour.

Détection multilingue de contenu généré par IA

StrikePlagiarism.com détecte du contenu généré par IA dans plus de 100 langues, dont l’anglais, le chinois (mandarin), l’hindi, l’espagnol, le français, l’arabe, le portugais, l’indonésien (bahasa), l’ourdou, l’allemand, le vietnamien, le filipino (tagalog), le malais, le tamoul, l’italien, le khmer, le polonais, le néerlandais, le roumain, le grec, le hongrois, le tchèque, le suédois, le danois, le slovaque, le norvégien, le finnois, le lituanien, l’estonien, etc., garantissant une précision analytique inégalée et préservant l’intégrité académique.

Qu'est-ce que signifie le coefficient de probabilité de contenu IA?

Le coefficient de probabilité de contenu IA est une prévision de la probabilité que l'intégralité du texte ait été générée par une IA ou écrite par un humain. Ce coefficient ne mesure pas le ratio de texte généré par l'IA par rapport au contenu original du document.
Si l'auteur d'un document a un faible coefficient de similarité mais un coefficient de probabilité de contenu IA élevé, cela correspond probablement à une fausse réponse du système, et le document doit être analysé en détail.

Indicateur de contenu IA

Pour voir dans le rapport uniquement les fragments présentant une forte probabilité d'IA, nous avons conçu un outil supplémentaire. L'utilisateur peut désormais facilement afficher uniquement les fragments qui sont principalement intéressants pour l'analyse, par exemple ceux où le coefficient de probabilité IA dépasse 60 % voire 80 %. En attendant, nous utilisons une valeur seuil pour l'indicateur de contenu IA. Après l'avoir activé, le système met en évidence uniquement les fragments dépassant cette valeur seuil.


How does AI-generated text detection work?



The module uses supervised learning, applying several models, including a modified BERT model, to predict whether the content is artificial or original. The AI was trained with millions of texts generated both by AI and human authors, learning to differentiate between the two. After each training session, a large test dataset is used to evaluate whether the updated model represents an improvement.

Linguistic Analysis
Since AI-generated content is created from templates, it is common to observe repetitive phrases, strange syntax, or the absence of nuances characteristic of human writing. These peculiarities make it easier to identify AI-generated content.

Statistical Analysis
Many platforms use statistical models to assess the complexity of the text, sentence structure, and vocabulary usage. Texts generated by AI tend to have uniform sentence structures and lengths, distinguishing them from human writing.

Machine Learning Models
Machine learning models (e.g., Originality.AI) are designed to differentiate between human-written and AI-generated texts. They use various features of the text, including those mentioned above, to identify characteristic patterns that indicate the text was written by artificial intelligence.

Es importante recordar:

El módulo tiene una precisión superior al 94% para detectar textos generados por GPT-3, GPT-3.5, GPT-4.o, GPT-Plus, GPT-Search y ChatGPT. Sin embargo, no es perfecto y siempre existe la posibilidad de errores.

Es mucho mejor, más correcto y más seguro analizar una serie de documentos del autor en lugar de tomar una decisión basada en un solo documento.

La longitud del documento importa: cuanto más largo sea el documento, más precisa será la evaluación. El valor recomendable del Coeficiente de Probabilidad de IA (AIPC) es superior al 60%. Si el AIPC es superior al 80% y el Coeficiente de Similaridad (SC) es inferior al 20%, el documento debe ser analizado detenidamente.

politique de confidentialité pour continuer.">